ORACLE RAC环境下节点自动重启问题总结
作者:网络转载 发布时间:[ 2014/9/9 11:04:09 ] 推荐标签:数据库 Oracle
4.在任意一个节点使用ROOT用户来设置DIAGWAIT的值(按照ORACLE的推荐,一般设置为13)
![]()
查看设置结果,如下:
![]()
5.启动所有节点的CRS资源

6.验证CRS是否正常运行
![]()
7.查看oprocd进程的状态

批注:11gR2之前版本的集群,ORACLE建议将Diagwait设置为13。从本质上讲,diagwait值在RAC环境中控制着两件关键的事情:
默认情况下,集群守护进程OPROCD的超时值为1秒和0.5秒的时间差,这意味着,如果OPROCD不能在 1.5秒内返回,系统会被重启。设置diagwait为推荐值13会将OPROCD的默认超时时差增加到10秒(diagwait - CSS重启时间[默认为3秒]),从而防止大量由于OPROCD没有在定义的时间内返回而导致的'假'的节点重启。对于繁忙的系统,1.5秒的默认值太小了。长期推荐的办法是将OPROCD超时提高到一个更为合理的值11秒(1秒休眠时间+10秒时间差)。
当节点驱逐/重启事件发生时,增加diagwait,我们更可能在重新启动之前将日志信息刷新到磁盘,因此,缩短寻找问题根本原因时间。
从11g第2版(11.2.0.1和更高版本)开始,这一变化不再是必要的。然而,对于之前的版本,这个改变必须在一个完整的停机时间进行,而且这个值不能通过补丁修正。因此,必须安排停机时间手动修改。鉴于已知通过设置diagwait解决的问题的数量,申请停机时间来修改它是值得的投入。请注意,因为这个值存储在Oracle集群注册表(OCR),如果您的确需要重建OCR或从一个之前的备份恢复,您可能需要重新设置diagwai。

sales@spasvo.com