eygle.com   eygle.com
eygle.com eygle
eygle.com  
 

« opatch的补丁号、下载及备忘 | Blog首页 | IPC Send Timeout和ORA-29740 Instance Evicted »

IBM 的 clverify 与 Oracle 的 cluvfy

昨晚在客户Oracle数据库系统上应用一个Patch时,遇到了一幢惊心动魄的事情。

当我们刚刚应用完Patch之后,系统上就出现了一条广播消息,提示:

Broadcast message from root@p570 (tty) at 00:00:19 ...

clverify has detected cluster configuration errors on node p570. Detailed clverify output is available in standard clverify log on node p570.
提示说clverify检查到Cluster错误,因为应用的一个Patch和CRS有点关系,但是第一感觉是:难道CRS除了问题?
而且直接把clverify误判成了Oracle的Cluvfy,汗!
Oracle的cluvfy是用来验证Oracle集群的一致性的,我用cluvfy检查一下也没有发现问题

[oracle@dbrac1 oracle]$ cluvfy


USAGE:
cluvfy [ -help ]
cluvfy stage { -list | -help }
cluvfy stage {-pre|-post} <stage-name> <stage-specific options>  [-verbose]
cluvfy comp  { -list | -help }
cluvfy comp  <component-name> <component-specific options>  [-verbose]
再仔细看提示才发现此clverify不是cluvfy:

HACMP 5.1中,包括集群校验程序(clverify)和新的集群通信后台(clcomdES)都需要/var文件系统下附加的空间。

要得到详细的消息和附加的调试信息,在每个节点的/var下需要满足:

Ø        20M仅一次,包括:

-          /var/HACMP/clcomd/clcomd.log  2M

-          /var/HACMP/clcomd/clcomddiag.log  18M

Ø        /var/HACMP/odmcache目录下附加的(1M*集群中的节点数)空间。

Ø        4M每个节点集群的效验数据。

Ø        2M的集群效验logclverify.log[0-9])。

在集群的每个节点中,效验工具在需要/var4M的空间,clverify可以在同一时间最多保持四份节点效验数据的拷贝(节点初始化和同步时)

/var/HACMP/clverify/current//*包含当前执行的效验的日志。

/var/HACMP/clverify/pass//*包含最后通过的效验的日志。

/var/HACMP/clverify/passprev/ /*包含倒数第二次通过效验的日志。

/var/HACMP/clverify/fail//*包含最后一次失败的效验日志。

同时,/var/HACMP/clverify/clverify.log和它的拷贝消耗1-2M的磁盘空间。
再来检查HACMP的日志,发现的确是系统Cluster因为两台主机的时间不一致发出了一个警告,和数据库无关。
ERROR: The HACMP timestamp file for shared volume group: oraclevg is inconsistent
with the time stamp in the VGDA for the following nodes: p1 p2
重启数据库,一切是正常的。

这个故事说明,DBA不仅要心理素质好,眼神也要好!

-The End-





历史上的今天...
      >> 2008-06-26文章:
      >> 2007-06-26文章:
             摄影习作-小小的太阳
      >> 2006-06-26文章:
             Oracle9iR2 NF:压缩表技术
             试用IBM DB2 Enterprise Server V9.0
             DB2新手上路:DB2命令行连接
      >> 2005-06-26文章:
      >> 2004-06-26文章:
             Oracle诊断案例-Sql_trace之一
             Oracle诊断案例-Sql_trace之二
             Oracle诊断案例-Spfile案例一则

By eygle on 2009-06-26 10:18 | Comments (4) | Del.icio.us | Google | Case | FAQ | Edit |Pageviews:

无觅

搜索本站:

4 Comments

HACMP5.1还没用过,以后遇到有参考了.呵呵!

很奇怪,为什么客户用了CRS还要考虑用HACMP?

5.1,也算老系统了,那时应该还没有CRS吧?

这是个9i的RAC?

不仅在HACMP 5.1中有,新版也同样有的。

奇怪,客户做ha没做时间同步么

发表留言



CopyRight © 2004~2012 eygle.com, All rights reserved.
数据恢复·紧急救援·联系我们:电话:010-59459859 手机:13911812803 邮件:eygle@eygle.com|MSN联系:eygle@hotmail.com