由于HAIP导致的数据库无法启动

  • A+
所属分类:技术

chatGPT账号

一、环境

AIX6.1+11.2.0.2GI,双节点

 

二、问题描述

这是一套新安装的rac,集群的节点1在运行root.sh脚本时报错,并且数据库无法启动。

 

三、分析过程

由于是root.sh脚本报错,所以需要看下root.sh脚本的运行日志。默认情况下root.sh脚本的运行日志在$GI_HOME的cfgtoollogs目录下,文件名称格式是rootcrs_<HOSTNAME>.log

报错信息如下:

CRS_5017: The resource action "ora.cluster_interconnect.haip start" encountered the following error:

start action for HAIP abort. for details refer to "(:CLSN00107:)" in "/u01/11.2.0/grid/log/infirac1/agent/ohasd/orarootagent_root/orarootagent_root.log"

由于HAIP导致的数据库无法启动

 

 

根据上面的输出可以确定是启动haip时出现了错误,所以需要进一步分析启动haip的代理进程orarootagent_root的日志orarootagent_root.log

在orarootagent_root.log日志中出现了使用网卡的关键信息:
infList 'inf ib0,ip *.*.*.1,sub *.*.*.*'

Error in getting Key SYSTEM.network.haip.group.cluster_interconnect.interface.valid in OCR

Fail to open OLR HAIP subtype SYSTEM.network.haip.group.cluster_interconnect.interface.valid key,rc=4

看来是在启动haip时出现了一些和操作系统相关的错误,因此需要在看一下操作系统层面私网网卡的状态,不过根据网卡的名称来判断infiniband似乎被使用了,在和dba确认之后得到了肯定的答案。

最终确定网卡状态一切正常,问题还是出现在GI层面,经过确认后发现,GI在11.2.0.2版本中,针对AIX平台还不支持infiniband技术。因此暂时只能不使用HAIP,而需要使用初始化参数cluster_interconnects来指定ASM和数据库实例的私网通信IP地址。

由于HAIP导致的数据库无法启动

注:默认该参数的值为空,使用HAIP来实现ASM和数据库实例间的私网通信。

 

四、解决方案

使用以下命令修改参数cluster_interconnects之后,数据库可以正常启动了。

alter system set cluster_interconnects='*.*.*.*' scope=spfile sid='****';

本文由 路远 首发于【路远网http://www.luyuan.io)】未经允许不得以任何方式转载,违者必将追究法律责任。

  • 我的微信
  • 这是我的微信扫一扫
  • weinxin
  • 我的电报
  • 这是我的电报扫一扫
  • weinxin
chatGPT账号
路远

发表评论

您必须登录才能发表评论!