eygle.com   eygle.com
eygle.com eygle
eygle.com  
 

« ZDNET《循序渐进Oracle》技术交流会 | Blog首页 | 婆婆妈妈与恩墨的时代 »

Resize datafile导致ASM Crash一例
modb.pro

昨天,同时维护一个Oracle 10.1.0.3.0的数据库时,导致ASM实例Crash,数据库切换。

这是一个启用很早的Oracle10g数据库,一直运行得很稳定,故障率很低。
查看日志,发现如下错误信息:

Wed Aug 29 12:05:24 2007
alter database datafile '+DATADG/mmsdb/datafile/gateway.295.1' resize 12000M
Wed Aug 29 12:05:25 2007
Completed: alter database datafile '+DATADG/mmsdb/datafile/ga
Wed Aug 29 12:10:14 2007
create tablespace dodd datafile size 100M
Wed Aug 29 12:10:15 2007
Starting control autobackup
Created Oracle managed file /msflsh/MMSDB/autobackup/2007_08_29/o1_mf_n_631887015_3f9wf82j_.bkp
Control autobackup written to DISK device
handle '/msflsh/MMSDB/autobackup/2007_08_29/o1_mf_n_631887015_3f9wf82j_.bkp'
Completed: create tablespace dodd datafile size 100M
Wed Aug 29 12:11:24 2007
drop tablespace dodd
Wed Aug 29 12:11:25 2007
Deleted Oracle managed file +DATADG/mmsdb/datafile/dodd.313.5
Starting control autobackup
Created Oracle managed file /msflsh/MMSDB/autobackup/2007_08_29/o1_mf_n_631887085_3f9whfv1_.bkp
Control autobackup written to DISK device
handle '/msflsh/MMSDB/autobackup/2007_08_29/o1_mf_n_631887085_3f9whfv1_.bkp'
Completed: drop tablespace dodd
Wed Aug 29 12:21:48 2007
alter database datafile '+DATADG/mmsdb/datafile/gateway.295.1' resize 15000M
Wed Aug 29 12:21:48 2007
Errors in file /opt/oracle/admin/mmsdb/bdump/mmsdb_asmb_8036.trc:
ORA-00600: internal error code, arguments: [kffmXpResize], [26], [32], [], [], [], [], []
Wed Aug 29 12:21:51 2007
Errors in file /opt/oracle/admin/mmsdb/bdump/mmsdb_asmb_8036.trc:
ORA-00600: internal error code, arguments: [kffmXpResize], [26], [32], [], [], [], [], []
Wed Aug 29 12:21:51 2007
ASMB: terminating instance due to error 486
Wed Aug 29 12:21:51 2007
Errors in file /opt/oracle/admin/mmsdb/bdump/mmsdb_pmon_7990.trc:
ORA-00486: ASMB process terminated with error
Instance terminated by ASMB, pid = 8036

注意日志,首先是Resize缩小了数据文件,然后再Resize放大了文件。
这正好完全吻合了Oracle的一个Bug:3952778

这个Bug的描述为:
Shrinking and then growing an ASM file can result in an internal error ORA-600 [kffmxpresize].
已经确定影响版本:10.1.0.3

看到没有,我们的数据库环境和同事的操作和这个Bug完全吻合,于是ASM实例Crash,数据库崩溃了。
真让人晕倒!

至于这个Bug是否百发百中,有兴趣的朋友可以试试看:D

这次事故给我们的教训是:DBA也需要看手气!
这次事故给DBA的教训是:如果经常手气不好,一定要找找原因。

-The End-


历史上的今天...
    >> 2018-08-30文章:
    >> 2010-08-30文章:
    >> 2008-08-30文章:
    >> 2005-08-30文章:

By eygle on 2007-08-30 11:32 | Comments (8) | Case | 1586 |

8 Comments

看来这次操作手气不是很好

哈哈,莫非你的同事是先看到了bug,然后想验证一下?结果真的中招了!

有没有办法把某个版本的已知所有bug都列出来?
不如象是走地雷阵,说不定什么时候就中招

一般每个版本都会有一个Bug List不过太长了,根本看不过来的。

heh,偶的一个库用了10.2.0.3,上线的时候还是碰到很了很多bug,有些你根本就想象不到的平常操作就可能触发bug。而且有些还没有出相应的patch。只能10g算是一个比较失败的版本了:)

我想知道的是shrinking一个文件后,隔多久才可以再加大这个ASM文件?还是说只要shrink后,无论隔多久再加大size,这个BUG照出不误?

这次事故给我们的教训是:DBA也需要看手气!
这次事故给DBA的教训是:如果经常手气不好,一定要找找原因。

老大这句话太有意思了

这事也太有趣了


CopyRight © 2004~2020 云和恩墨,成就未来!, All rights reserved.
数据恢复·紧急救援·性能优化 云和恩墨 24x7 热线电话:400-600-8755 业务咨询:010-59007017-7040 or 7037 业务合作: marketing@enmotech.com