« Oracle 11gR2 安装初体验 - OEL + Oracle | Blog首页 | 使用ora_rowscn识别误操作数据时间点 »
恩墨科技为某企业SAP数据库提供紧急援助服务
作者:eygle | 【转载请注出处】|【云和恩墨 领先的zData数据库一体机 | zCloud PaaS云管平台 | SQM SQL审核平台 | ZDBM 数据库备份一体机】
链接:https://www.eygle.com/archives/2009/09/sap_db_recovery.html
近日凌晨,被朋友的一个电话吵醒,是一个紧急的故障处理,客户的业务遍及全国,是24x7的业务系统。链接:https://www.eygle.com/archives/2009/09/sap_db_recovery.html
由于硬件的故障导致了数据库无法启动,全国的几个重要城市已经排起了长龙。
揉揉惺忪的睡眼,赶往了客户现场,由于业务极其重要,客户已经准备容灾系统及全备份恢复。
这是一个SAP的ERP系统,经过检查是由于SAP的备份工具在执行热备份时出现了硬件故障,导致数据库不一致需要恢复,又由于其他厂商进行了不适当的恢复尝试,使得数据库必须进行不完全恢复。
在告警日志文件中,注意到这样的提示:
Sat Sep 3 01:19:58 2009
ARC0: Cannot archive online log based on backup controlfile
Sat Sep 3 01:19:58 2009
ARC1: Cannot archive online log based on backup controlfile
Sat Sep 3 01:20:58 2009
ARC0: Cannot archive online log based on backup controlfile
这是在启动尝试中,使用了备份的控制文件进行恢复,当前的日志无法归档.
最后极其幸运的是,客户的redo日志做了镜像,保存有完好的日志,通过这些日志得以将不完全恢复推进到日志的终点,没有数据损失:
Sat Sep 3 01:22:30 2009
Media Recovery Log /oracle/ora92/log011.dbf
Incomplete recovery applied all redo ever generated.
Recovery completed through change 789009345
Media Recovery Complete
最近已经遇到了多次SAP备份失败导致的故障,有的甚至要求从数月之前的归档开始恢复,导致客户的业务遭受影响和损失。
这和SAP打包的备份工具有关,这个工具采用热备方式进行,而且没有失败检测和报警机制,很多客户在失败后也无法得知,当发现时也已经为时过晚。
所以,通过适当的服务和第三方支持,了解自己的数据库,使数据库不再是一个黑匣子,是非常非常重要的。
-The End-
历史上的今天...
>> 2012-09-07文章:
>> 2010-09-07文章:
>> 2007-09-07文章:
>> 2006-09-07文章:
>> 2005-09-07文章:
By eygle on 2009-09-07 08:19 | Comments (3) | Backup&Recovery | Case | 2390 |
谢谢大师的提醒,我记得thomas kyte也是这么说的!
“热备份时出现了硬件故障,导致数据库不一致需要恢复”
为什么?
我们有次热备的时候,因为打雷,导致整个机房的电跳掉了.
第二天来,就实施了恢复.