eygle.com   eygle.com
eygle.com  
 

« 接受邀请 成为CSDN专家顾问 | Blog首页 | 进京四周年记 »

EMC-有多少硬盘可以再坏?

作者:eygle |【转载时请务必以超链接形式标明文章和作者信息及本声明
链接:
昨晚,在具体故障尚未定位的情况下,EMC的硬盘坏了2块。

首先是一块RAID 5的硬盘坏了一块,然后一块Hot Spare硬盘顶上。
# navicli -h 172.16.9.5 getdisk 0_0_14
Bus 0 Enclosure 0  Disk 14
Vendor Id:              SEAGATE
Product Id:              ST373307 CLAR72
Product Revision:        7A10
Lun:                    101
Type:                    101: Hot Spare
State:                  Enabled
Hot Spare:              101: YES
Hot Spare Replacing:    0_1_8
Prct Rebuilt:            101: 100
Prct Bound:              101: 100
Serial Number:          3HZ9E674
Sectors:                139681792 (68204)
Capacity:                68238
Private:                101: 69704
Bind Signature:          0x80bd, 0, 14
Hard Read Errors:        0
Hard Write Errors:      0
Soft Read Errors:        6
Soft Write Errors:      6
Read Retries:    N/A
Write Retries:    N/A
Remapped Sectors:        N/A
Number of Reads:        20816685
Number of Writes:        4047067
Number of Luns:          1
Raid Group ID:          101
Clariion Part Number:    DG118032459 
Request Service Time:    N/A
Read Requests:          20816685
Write Requests:          4047067
Kbytes Read:            970975457
Kbytes Written:          105995802
Stripe Boundary Crossing: 0

未几,Hot Spare盘又挂掉了,然后数据开始向原来坏掉的硬盘Equalizing。
这个Equalizing能否正确完成显然是个未知数:
bash-2.03# navicli -h 172.16.9.5 getdisk 0_1_8
Bus 0 Enclosure 1  Disk 8
Vendor Id:              SEAGATE
Product Id:              ST314680 CLAR72
Product Revision:        7A0A
Lun:                    14 15
Type:                    14: RAID5 15: RAID5
State:                  Equalizing
Hot Spare:              14: NO 15: NO
Prct Rebuilt:            14: 100 15: 100
Prct Bound:              14: 100 15: 100
Serial Number:          3HY6RV4L
Sectors:                104857600 (51200)
Capacity:                68238
Private:                14: 69704 15: 104927304
Bind Signature:          0xc3de, 1, 8
Hard Read Errors:        0
Hard Write Errors:      0
Soft Read Errors:        0
Soft Write Errors:      0
Read Retries:    N/A
Write Retries:    N/A
Remapped Sectors:        N/A
Number of Reads:        3922772
Number of Writes:        6092245
Number of Luns:          2
Raid Group ID:          9
Clariion Part Number:    DG118032458 
Request Service Time:    N/A
Read Requests:          3922772
Write Requests:          6092245
Kbytes Read:            472965617
Kbytes Written:          403726059
Stripe Boundary Crossing: 392467

马上Call EMC,喊人连夜换掉了两块硬盘。

坏掉的硬盘和并不属于前几日故障LUN,但是同在一个Storage Group之中,与先前的故障应该没有直接的关联。
目前发现一台主机的PowerPath存在问题,这个问题导致一路光纤通道出现问题,这个故障导致部分LUN的Trespass。

-The End-

By eygle on 2007-04-01 16:32 | Comments (2) | Posted to Hardware | Edit |Pageviews:

相关文章 随机文章
  • EMC-我的硬盘可以继续坏
  • 光纤存储、SUN遭遇莫名故障
  • 稳定的风险
  • 如何分配磁盘组(EMC阵列)
  • EMC Navisphere AGENT(NAVIAGENT) 安装日志
  • [赏画]范曾-牛郎织女会七夕
    经典图书推荐系列-之一
    EMC CX500 阵列升级扩容
    Merry Christmas 2005,Happy New year
    tkprof的含义
    网上相关主题:
    Google

    留言 (2)

    万幸,没有丢数据!

    Posted by: power5 at April 2, 2007 11:27 AM

    碰到过EMC CX600频繁坏盘,半年中一个月1个,尽是Softmedia error .现在似乎好了,有可能升级firmware解决一些问题。

    Posted by: rollingpig at April 11, 2007 3:59 PM

    发表留言:



    Remember Me?
    (输入验证码后方可评论,谢谢支持)



    CopyRight © 2004 eygle.com, All rights reserved.