안녕하세요, surmin입니다! 😊
오늘은 RAC 환경에서 Clusterware가 비정상적으로 기동되어 강제 종료해야 하는 상황이 발생했을 경우, 종료 순서와 주의 사항에 대해 공유하고자 합니다.
그럼 시작하겠습니다!
-환경: RAC / oracle 19c / Oracle Linux 9.4
#프로세스 종료는 아래와 같은 순서로 진행한다.
0. 스크립트 수정
1. 오라클 클러스터 데몬확인
2. ohasd.bin 프로세스 kill
3. cssagent와 ocssd.bin을 제외한 다른 모든 프로세스를 동시에 kill
4. cssagent ,cssmonitor ,ocssd.bin 프로세스 동시 kill
#스크립트를 먼저 수정을해줘야 한다 그래야 자동으로 ohasd 프로세스가 리스폰 안됨
#TMI) 스크립트 수정 후 적용을 위해 재시작 하는데 재시작 후 프로세스 안올라옴
crsctl start crs 를 통하여
프로세스 올려주어야함 (물론 종료가 목적이라면 목적을 달성한거임)
cd /etc/init.d
cp -av init.ohasd init.ohasd_backup
====
RESTART_LIMIT=10 # 최대 재시작 횟수
RESTART_TIME_WINDOW=60 # 재시작 시간 윈도우(초)
CURR_TIME=0 # 현재 시간
TIME_ELAPSE=0 # 경과 시간
PREV_RESTART_TIME=0 # 이전 재시작 시간
RESTART_COUNTER=0 # 재시작 카운터
====
스크립트 내용중에 윗 부분중 RESTART_LIMIT=10 만 RESTART_LIMIT=0 으로 변경 후
sudo systemctl restart oracle-ohasd (그후 아래내용 진행)
#뒤에 reboot은 시스템 재시작 후 자동으로 시작됨
#Oracle Clusterware 프로세스 확인
[root@oracle19cadg02 ~]# ps -ef | grep d.bin | grep -v css | grep -v grep
root 2033 1 0 10:42 ? 00:00:11 /grid/app/grid/19c/bin/ohasd.bin reboot
grid 2586 1 0 10:42 ? 00:00:07 /grid/app/grid/19c/bin/evmd.bin
grid 2593 1 0 10:42 ? 00:00:03 /grid/app/grid/19c/bin/mdnsd.bin
grid 2836 1 0 10:42 ? 00:00:03 /grid/app/grid/19c/bin/gpnpd.bin
grid 2866 1 0 10:42 ? 00:00:07 /grid/app/grid/19c/bin/gipcd.bin
root 4108 1 0 10:42 ? 00:00:17 /grid/app/grid/19c/bin/osysmond.bin
root 4693 1 0 10:43 ? 00:00:07 /grid/app/grid/19c/bin/octssd.bin reboot
root 5440 1 0 10:43 ? 00:00:13 /grid/app/grid/19c/bin/crsd.bin reboot
# ohasd.bin 프로세스 kill
kill -9 2033
#나머지 프로세스 한꺼번에 kill
kill -9 2586 2593 2836 2866 4108 4693 5440
#cssagent 프로세스 /ocssd.bin 프로세스 /cssmonitor 프로세스 kill
[root@oracle19cadg02 ~]# ps -ef | grep css
grid 4171 1 0 10:42 ? 00:00:22 /grid/app/grid/19c/bin/ocssd.bin -S 2
root 43986 1 0 11:34 ? 00:00:00 /grid/app/grid/19c/bin/cssdagent
root 43991 1 0 11:34 ? 00:00:00 /grid/app/grid/19c/bin/cssdmonitor
root 44716 40580 0 11:34 pts/0 00:00:00 grep --color=auto css
kill -9 4171 43986 43991