eygle.com   eygle.com
eygle.com eygle
eygle.com  
 

« ITPUB 2007年会 相聚北京香山饭店 | Blog首页 | 世界是平的 网络是脆弱的 »

坏多少算多 硬盘有多安全?

前几天在"五邑大学选用IBM存储搭建SAN存储架构"一文之后,有朋友留言说:

FAStT700东西不错,可惜配的EXP500盘柜坏盘故障较多,一年坏一块算轻的。

可是,一个盘阵,一年坏一块硬盘算多么?

昨天,我们的EMC CX500又坏了一块硬盘,在圣诞节,不错的日子。同样记得,在上个圣诞节,这个EMC也是坏过硬盘的,看来存储也会选日子的。

首先收到报警邮件:

Time Stamp 12/25/06 17:17:37 Event Number 2580
Severity Error Host cx500spb
Storage Array CK200041200044 SP N/A Device N/A
Description Storage Array Faulted Bus 0 Enclosure 1 : Faulted Bus 0 Enclosure 1 Disk 12 : Removed

毫无疑问0_1_12号硬盘损坏了:

bash-2.03# navicli -h 172.16.9.5 getdisk 0_1_12
Bus 0 Enclosure 1 Disk 12
State: Removed

顶上的热备盘:

bash-2.03# navicli -h 172.16.9.5 getdisk 0_0_14
Bus 0 Enclosure 0 Disk 14
Vendor Id: SEAGATE
Product Id: ST373307 CLAR72
Product Revision: 7A10
Lun: 101
Type: 101: Hot Spare
State: Enabled
Hot Spare: 101: YES
Hot Spare Replacing: 0_1_12
Prct Rebuilt: 101: 100
Prct Bound: 101: 100
Serial Number: 3HZ9E674
Sectors: 139681792 (68204)
Capacity: 68238
Private: 101: 69704
Bind Signature: 0x80bd, 0, 14
Hard Read Errors: 0
Hard Write Errors: 0
Soft Read Errors: 0
Soft Write Errors: 0
Read Retries: N/A
Write Retries: N/A
Remapped Sectors: N/A
Number of Reads: 1008801249
Number of Writes: 227491148
Number of Luns: 1
Raid Group ID: 101
Clariion Part Number: DG118032459
Request Service Time: N/A
Read Requests: 1008801249
Write Requests: 227491148
Kbytes Read: 72577961
Kbytes Written: 1953226182
Stripe Boundary Crossing: 0

通常来说,存储的档次越高、硬盘的转速越快,出现硬盘故障的概率就越高,记得以前用SUN的T3时,硬盘也是很少出故障的。现在改用EMC,几乎每个月都有硬盘损坏。
当然硬盘故障可能和环境、存储的其他部件、甚至应用的使用方式都有关系。虽然我们机房的条件已经很好了,盘还是在不停的坏着...

不知道大家的存储用的怎么样?硬盘在以怎样的频率损坏着?

-The End-


历史上的今天...
    >> 2012-12-26文章:
    >> 2008-12-26文章:
    >> 2005-12-26文章:
           A Gift:Oracle DW/BI 2006 Calendar
    >> 2004-12-26文章:
           使用Solaris上的filestat工具

无觅

By eygle on 2006-12-26 10:02 | Comments (8) | System | 1284 |

8 Comments

感觉SCSI的盘故障率还是很低的,IBM的可能算个特例,3年里坏了两块(一共10块的盘柜两个)72G的。尺寸在哪摆着,3.5英寸的一个小盒子。SATA 300G的故障率高更可以理解。或许是因为你们的库太繁忙了,该考虑分担一下应用了。

感觉SCSI的盘故障率还是很低的,IBM的可能算个特例,3年里坏了两块(一共10块的盘柜两个)72G的。尺寸在哪摆着,3.5英寸的一个小盒子。SATA 300G的故障率高更可以理解。或许是因为你们的库太繁忙了,该考虑分担一下应用了。

俺来说说吧,这个俺用的比较多.
1:ibm x系列的pcserver上的scsi盘,这个俺最头痛的,我一个主机上,6个盘,1年时间,坏了5个,数据库重装了好多次呀(老板不答应买大的盘作raid,没办法)
2:ibm ds4300(fast 600)我在广东四个地市用过,除了江门电力的在验收前就挂了一个以外,其他的都没有挂,那个盘在运行的时候,客户想看看raid0+1效果是不是真的好,上去就给我抽掉了,估计和这个有关,其他的都运行了接近2年了,无任何磁盘故障报过来,不过我都是0+1,频繁程度也算很高的.
3:还是ibm ds4300,在天津,一共有13个地方用,其中有两个柜子是300g的盘满配,到目前为止,无任何问题出现,系统io同样比较大.其中最长的运行了8个月了,最短的3个月,到目前为止,没有报任何磁盘故障到我这里.
个人感觉,ibm的scsi盘是真烂,不过光纤盘还是不错的,用来比较顺手,俺个人比较喜欢ibm的主机加fast系列的柜子,配起来简单呀,主要是俺是个新手,呵呵.

to David.Guo;
你们用的DS4300的盘是容量是多大的?转速多少?

CX600,05年30个盘一年大概坏了3-4个,老板写信把EMC骂了通,今年一块都没坏....:DD

晕,骂人盘就不坏了啊:|

俺们在广东用的是72g,10k的,广东用了6+4*3=18块
在天津,是300g,10k的,天津用了14*2+4*11=72块.

要是骂人就不坏盘的话,俺马上申请老板招个人天天痛骂厂商,我估计厂商也愿意的,部件和人力都省了.


CopyRight © 2004~2020 云和恩墨,成就未来!, All rights reserved.
数据恢复·紧急救援·性能优化 云和恩墨 24x7 热线电话:400-600-8755 业务咨询:010-59007017-7040 or 7037 业务合作: marketing@enmotech.com