« 超级女声与罗大佑 | Blog首页 | 大佑依然年轻-记罗大佑2005北京演唱会 »
EMC的FC Disk坏了一块
作者:eygle | 【转载请注出处】|【云和恩墨 领先的zData数据库一体机 | zCloud PaaS云管平台 | SQM SQL审核平台 | ZDBM 数据库备份一体机】
链接:https://www.eygle.com/archives/2005/08/emcaefc_diskaee.html
此前这块磁盘已经报警,现在终于是坏了。链接:https://www.eygle.com/archives/2005/08/emcaefc_diskaee.html
这次的教训是,一旦磁盘报警就应该立即更换。服务商那边曾提出先清除警报状态,再作观察,结果没等到动作Bus 0 Enclosure 0 Disk 10就彻底损坏了。
Hot Spare盘顶上,没有影响系统正常运行。
从navicli我们可以看到故障磁盘已经被removed,Hotspare盘已经启用。
故障盘:
# navicli -h 172.16.9.5 getdisk 0_0_10 Bus 0 Enclosure 0 Disk 10 State: Removed |
热备盘:
# navicli -h 172.16.9.5 getdisk 0_0_14 Bus 0 Enclosure 0 Disk 14 Vendor Id: SEAGATE Product Id: ST314680 CLAR72 Product Revision: 7A0A Lun: 101 Type: 101: Hot Spare State: Enabled Hot Spare: 101: YES Hot Spare Replacing: 0_0_10 Prct Rebuilt: 101: 100 Prct Bound: 101: 100 Serial Number: 3HY6TMN6 Sectors: 139681792 (68204) Capacity: 68238 Private: 101: 69704 Bind Signature: 0x80bd, 0, 14 Hard Read Errors: 0 Hard Write Errors: 0 Soft Read Errors: 0 Soft Write Errors: 0 Read Retries: N/A Write Retries: N/A Remapped Sectors: N/A Number of Reads: 303280 Number of Writes: 104340 Number of Luns: 1 Raid Group ID: 101 Clariion Part Number: DG118032458 Request Service Time: N/A Read Requests: 303280 Write Requests: 104340 Kbytes Read: 9240617 Kbytes Written: 1250471 Stripe Boundary Crossing: 0 |
By eygle on 2005-08-26 09:24 | Comments (3) | System | 407 |
现在硬盘的质量好象
越来越差,损坏的几率
越来越大
坏盘后虽然hot spare能够顶上,但是rebuild还是会影响一些性能,尤其是前5块盘发生损坏的话会把write cache disable掉,如果是繁忙的系统就差不多挂了。我们曾经碰到一次坏头5块盘然后write cache disable,把系统负载顶得老高。另外一次sp坏了一个,也是write cache disable,情况更严重,因为i/o处理太慢,结果app server全hang了,只能切换到standby。
EMC还算不错,以前用T3的时候,Raid5坏一块盘,马上io wait就上来,应用一会就挂了。