eygle.com   eygle.com
eygle.com eygle
eygle.com  
 

« Oracle 11gR2 安装初体验 - OEL + Oracle | Blog首页 | 使用ora_rowscn识别误操作数据时间点 »

恩墨科技为某企业SAP数据库提供紧急援助服务
modb.pro

近日凌晨,被朋友的一个电话吵醒,是一个紧急的故障处理,客户的业务遍及全国,是24x7的业务系统。
由于硬件的故障导致了数据库无法启动,全国的几个重要城市已经排起了长龙。

揉揉惺忪的睡眼,赶往了客户现场,由于业务极其重要,客户已经准备容灾系统及全备份恢复。

这是一个SAP的ERP系统,经过检查是由于SAP的备份工具在执行热备份时出现了硬件故障,导致数据库不一致需要恢复,又由于其他厂商进行了不适当的恢复尝试,使得数据库必须进行不完全恢复。

在告警日志文件中,注意到这样的提示:
Sat Sep  3 01:19:58 2009
ARC0: Cannot archive online log based on backup controlfile
Sat Sep  3 01:19:58 2009
ARC1: Cannot archive online log based on backup controlfile
Sat Sep  3 01:20:58 2009
ARC0: Cannot archive online log based on backup controlfile

这是在启动尝试中,使用了备份的控制文件进行恢复,当前的日志无法归档.

最后极其幸运的是,客户的redo日志做了镜像,保存有完好的日志,通过这些日志得以将不完全恢复推进到日志的终点,没有数据损失:
Sat Sep  3 01:22:30 2009
Media Recovery Log /oracle/ora92/log011.dbf
Incomplete recovery applied all redo ever generated.
Recovery completed through change 789009345
Media Recovery Complete

最近已经遇到了多次SAP备份失败导致的故障,有的甚至要求从数月之前的归档开始恢复,导致客户的业务遭受影响和损失。
这和SAP打包的备份工具有关,这个工具采用热备方式进行,而且没有失败检测和报警机制,很多客户在失败后也无法得知,当发现时也已经为时过晚。

所以,通过适当的服务和第三方支持,了解自己的数据库,使数据库不再是一个黑匣子,是非常非常重要的

-The End-


历史上的今天...
    >> 2012-09-07文章:
    >> 2010-09-07文章:
    >> 2007-09-07文章:
    >> 2006-09-07文章:
           DBA语录之:规范的重要
    >> 2005-09-07文章:
           How to Install .src.rpm package ?

By eygle on 2009-09-07 08:19 | Comments (3) | Backup&Recovery | Case | 2390 |

3 Comments

谢谢大师的提醒,我记得thomas kyte也是这么说的!

“热备份时出现了硬件故障,导致数据库不一致需要恢复”

为什么?

我们有次热备的时候,因为打雷,导致整个机房的电跳掉了.

第二天来,就实施了恢复.


CopyRight © 2004~2020 云和恩墨,成就未来!, All rights reserved.
数据恢复·紧急救援·性能优化 云和恩墨 24x7 热线电话:400-600-8755 业务咨询:010-59007017-7040 or 7037 业务合作: marketing@enmotech.com