oracle 11g rac 又一节点无法启动的生产case怎么办

网友投稿 529 2024-01-02 11:45:38

oracle 11g rac 又一节点无法启动的生产case怎么办

这篇文章主要介绍了oracle 11g rac 又一节点无法启动的生产case怎么办,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。

一、环境描述

11g rac 双节点,AIX小型机

二、现象

节点2无法启动

crsctl start crs 执行报错。

三、问题分析处理

1.查看数据库日志Archived Log entry 399348 added for thread 2 sequence 205493 ID 0xffffffff8452e669 dest 1: Sat Dec 09 11:13:47 2017 Thread 2 advanced to log sequence 205495 (LGWR switch)   Current log# 3 seq# 205495 mem# 0: +DATA/orcl2/onlinelog/group_3.257.890091875 Sat Dec 09 11:13:51 2017 Archived Log entry 399349 added for thread 2 sequence 205494 ID 0xffffffff8452e669 dest 1: Sat Dec 09 11:24:07 2017 NOTE: ASMB terminating Errors in file /u01/app/oracle/diag/rdbms/orcl2/PTS22/trace/PTS22_asmb_8847608.trc: ORA-15064: ? ASM ?????? ORA-03113: ????????? Errors in file /u01/app/oracle/diag/rdbms/orcl2/PTS22/trace/PTS22_asmb_8847608.trc: ORA-15064: ? ASM ?????? ORA-03113: ????????? ASMB (ospid: 8847608): terminating the instance due to error 15064 Sat Dec 09 11:24:07 2017--判断可能是通信问题 orcldb2:/u01/app/oracle/diag/rdbms/orcl2/orcl22/trace$oerr ora 15064 1506400000"communication failure with ASM instance" // *Cause:  There was a failure to communicate with the ASM instance, most //          likely because the connection went down. // *Action: Check the accompanying error messages for more information on the //          reason for the failure.  Note that database instances will always //          return this error when the ASM instance is terminated abnormally.

2.查看集群日志

2017-12-09 11:23:51.026 [cssd(7667900)]CRS-1612:Network communication with node orcldb1 (1missing for 50% of timeout interval.  Removal of this node from cluster in 14.523 seconds 2017-12-09 11:23:59.039 [cssd(7667900)]CRS-1611:Network communication with node orcldb1 (1missing for 75% of timeout interval.  Removal of this node from cluster in 6.509 seconds 2017-12-09 11:24:03.052 [cssd(7667900)]CRS-1610:Network communication with node orcldb1 (1missing for 90% of timeout interval.  Removal of this node from cluster in 2.497 seconds 2017-12-09 11:24:05.552 [cssd(7667900)]CRS-1609:This node is unable to communicate with other nodes in the cluster and is going down to preserve cluster integritydetails at(:CSSNM00008:) in /u01/app/11.2.0/grid/log/orcldb2/cssd/ocssd.log. 2017-12-09 11:24:05.552 [cssd(7667900)]CRS-1656:The CSS daemon is terminating due to a fatal errorDetails at (:CSSSC00012:) in /u01/app/11.2.0/grid/log/orcldb2/cssd/ocssd.log 2017-12-09 11:24:05.614 [cssd(7667900)]CRS-1652:Starting clean up of CRSD resources.

3.查看系统日志

IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION FE2DEE00   1209123617 P S SYSXAIXIF      DUPLICATE IP ADDRESS DETECTED IN THE NET FE2DEE00   1209122517 P S SYSXAIXIF      DUPLICATE IP ADDRESS DETECTED IN THE NET FE2DEE00   1209114417 P S SYSXAIXIF      DUPLICATE IP ADDRESS DETECTED IN THE NET FE2DEE00   1209114317 P S SYSXAIXIF      DUPLICATE IP ADDRESS DETECTED IN THE NET A924A5FC   1209112417 P S SYSPROC        SOFTWARE PROGRAM ABNORMALLY TERMINATED

综上所以的日志都指向数据库通信可能有问题。

检查心跳网络,在节点一上ping 节点二是通的,ping自己当然也是通的。

这里感觉好奇怪,貌似心跳也没问题啊。各种问好??????整理下思路,在节点二上ping 节点一,好嘛,真心ping不通。找到这个问题之后和客户沟通,发现网络刚刚做了调整导致的。经过网络工程师的处理。心跳网络恢复。轮到我上了,把集群给拉起来。--root用户执行 crsctl stop crs --报错 crsctl stopcrs -f 强制关闭 crsctlstart crs crsctl stat res -t

感谢你能够认真阅读完这篇文章,希望小编分享的“oracle 11g rac 又一节点无法启动的生产case怎么办”这篇文章对大家有帮助,同时也希望大家多多支持,关注行业资讯频道,更多相关知识等着你来学习!

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:vue适合做移动端吗(vue适合移动端开发吗)
下一篇:怎么解决数据库中ORA-04030错误
相关文章