- A+
一、环境
AIX6.1+11.2.0.2GI,双节点
二、问题描述
这是一套新安装的rac,集群的节点1在运行root.sh脚本时报错,并且数据库无法启动。
三、分析过程
由于是root.sh脚本报错,所以需要看下root.sh脚本的运行日志。默认情况下root.sh脚本的运行日志在$GI_HOME的cfgtoollogs目录下,文件名称格式是rootcrs_<HOSTNAME>.log
报错信息如下:
CRS_5017: The resource action "ora.cluster_interconnect.haip start" encountered the following error:
start action for HAIP abort. for details refer to "(:CLSN00107:)" in "/u01/11.2.0/grid/log/infirac1/agent/ohasd/orarootagent_root/orarootagent_root.log"
根据上面的输出可以确定是启动haip时出现了错误,所以需要进一步分析启动haip的代理进程orarootagent_root的日志orarootagent_root.log
在orarootagent_root.log日志中出现了使用网卡的关键信息:
infList 'inf ib0,ip *.*.*.1,sub *.*.*.*'
Error in getting Key SYSTEM.network.haip.group.cluster_interconnect.interface.valid in OCR
Fail to open OLR HAIP subtype SYSTEM.network.haip.group.cluster_interconnect.interface.valid key,rc=4
看来是在启动haip时出现了一些和操作系统相关的错误,因此需要在看一下操作系统层面私网网卡的状态,不过根据网卡的名称来判断infiniband似乎被使用了,在和dba确认之后得到了肯定的答案。
最终确定网卡状态一切正常,问题还是出现在GI层面,经过确认后发现,GI在11.2.0.2版本中,针对AIX平台还不支持infiniband技术。因此暂时只能不使用HAIP,而需要使用初始化参数cluster_interconnects来指定ASM和数据库实例的私网通信IP地址。
注:默认该参数的值为空,使用HAIP来实现ASM和数据库实例间的私网通信。
四、解决方案
使用以下命令修改参数cluster_interconnects之后,数据库可以正常启动了。
alter system set cluster_interconnects='*.*.*.*' scope=spfile sid='****';
本文由 路远 首发于【路远网(http://www.luyuan.io)】未经允许不得以任何方式转载,违者必将追究法律责任。
- 我的微信
- 这是我的微信扫一扫
- 我的电报
- 这是我的电报扫一扫