eygle.com   eygle.com
eygle.com eygle
eygle.com  
 

« 接受邀请 成为CSDN专家顾问 | Blog首页 | 进京四周年记 »

EMC-有多少硬盘可以再坏?
modb.pro

昨晚,在具体故障尚未定位的情况下,EMC的硬盘坏了2块。

首先是一块RAID 5的硬盘坏了一块,然后一块Hot Spare硬盘顶上。
# navicli -h 172.16.9.5 getdisk 0_0_14
Bus 0 Enclosure 0  Disk 14
Vendor Id:              SEAGATE
Product Id:              ST373307 CLAR72
Product Revision:        7A10
Lun:                    101
Type:                    101: Hot Spare
State:                  Enabled
Hot Spare:              101: YES
Hot Spare Replacing:    0_1_8
Prct Rebuilt:            101: 100
Prct Bound:              101: 100
Serial Number:          3HZ9E674
Sectors:                139681792 (68204)
Capacity:                68238
Private:                101: 69704
Bind Signature:          0x80bd, 0, 14
Hard Read Errors:        0
Hard Write Errors:      0
Soft Read Errors:        6
Soft Write Errors:      6
Read Retries:    N/A
Write Retries:    N/A
Remapped Sectors:        N/A
Number of Reads:        20816685
Number of Writes:        4047067
Number of Luns:          1
Raid Group ID:          101
Clariion Part Number:    DG118032459 
Request Service Time:    N/A
Read Requests:          20816685
Write Requests:          4047067
Kbytes Read:            970975457
Kbytes Written:          105995802
Stripe Boundary Crossing: 0

未几,Hot Spare盘又挂掉了,然后数据开始向原来坏掉的硬盘Equalizing。
这个Equalizing能否正确完成显然是个未知数:
bash-2.03# navicli -h 172.16.9.5 getdisk 0_1_8
Bus 0 Enclosure 1  Disk 8
Vendor Id:              SEAGATE
Product Id:              ST314680 CLAR72
Product Revision:        7A0A
Lun:                    14 15
Type:                    14: RAID5 15: RAID5
State:                  Equalizing
Hot Spare:              14: NO 15: NO
Prct Rebuilt:            14: 100 15: 100
Prct Bound:              14: 100 15: 100
Serial Number:          3HY6RV4L
Sectors:                104857600 (51200)
Capacity:                68238
Private:                14: 69704 15: 104927304
Bind Signature:          0xc3de, 1, 8
Hard Read Errors:        0
Hard Write Errors:      0
Soft Read Errors:        0
Soft Write Errors:      0
Read Retries:    N/A
Write Retries:    N/A
Remapped Sectors:        N/A
Number of Reads:        3922772
Number of Writes:        6092245
Number of Luns:          2
Raid Group ID:          9
Clariion Part Number:    DG118032458 
Request Service Time:    N/A
Read Requests:          3922772
Write Requests:          6092245
Kbytes Read:            472965617
Kbytes Written:          403726059
Stripe Boundary Crossing: 392467

马上Call EMC,喊人连夜换掉了两块硬盘。

坏掉的硬盘和并不属于前几日故障LUN,但是同在一个Storage Group之中,与先前的故障应该没有直接的关联。
目前发现一台主机的PowerPath存在问题,这个问题导致一路光纤通道出现问题,这个故障导致部分LUN的Trespass。

-The End-

历史上的今天...
    >> 2019-04-01文章:
    >> 2017-04-01文章:
    >> 2016-04-01文章:
    >> 2013-04-01文章:
           北京十年 感谢有你
    >> 2012-04-01文章:
           花开时节 北京10年
    >> 2011-04-01文章:
    >> 2010-04-01文章:
    >> 2009-04-01文章:
    >> 2008-04-01文章:
           我的新家 我的北京五年
    >> 2006-04-01文章:
           孔府里发现的好东西
    >> 2005-04-01文章:
    >> 2004-04-01文章:

By eygle on 2007-04-01 16:32 | Comments (2) | System | 1395 |

2 Comments

万幸,没有丢数据!

碰到过EMC CX600频繁坏盘,半年中一个月1个,尽是Softmedia error .现在似乎好了,有可能升级firmware解决一些问题。


CopyRight © 2004~2020 云和恩墨,成就未来!, All rights reserved.
数据恢复·紧急救援·性能优化 云和恩墨 24x7 热线电话:400-600-8755 业务咨询:010-59007017-7040 or 7037 业务合作: marketing@enmotech.com