카테고리 없음2020. 2. 15. 22:32

안녕하세요. 블로그를 이사하게 되었습니다.

http://myinfrabox.tistory.com 

 

MyInfraBox

 

myinfrabox.tistory.com

자주 방문 부탁드립니다.

여기에 있는 게시글들은 모두 위의 주소 블로그로 옮겨질 예정입니다.

감사합니다.

Posted by 인프라쟁이 DBA

Deadman Switch : windows, Linux

TSA에는 ConfigRM, HATS, HAGS라는 Reosource Monitoring 데몬이 실행되게 되어 있습니다. 이 알고리즘들은 시스템에서 자원이 충분한지를, 혹은 제대로 운영되고 있는지를 판가름하게 되어 있습니다. 그런데 만약 이 자원들이 충분하지 않다면 위의 프로세스들은 RSCT라는 인프라 스트럭쳐에게 알려 더 이상 이 시스템이 운영이 불가능하다고 판단, Deadman Switch가 운영되어 System 상태를 죽이게 됩니다. 이 Deadman Switch는 일반적으로 AIX, Linux, Unix는 Halt 상태가 되어 시스템을 불능 상태로 빠뜨리고 Windows는 Blue Screen을 띄어 시스템 상태를 불능으로 빠뜨립니다. 이 Blue Screen을 띄우는 장치 드라이버는 ibmhadms.sys 입니다.


이거 하나 알라고 얼마나 뒤져댔는지 모른다.

역시 정답은 매뉴얼에.


IBM System Automation for Multiplatforms Version 3.2 Administrator's and User's Guide
278 page : Dead-Man-Switch (DMS) to protect critical resources

Posted by 인프라쟁이 DBA

Windows에서 암호를 바꾼후 TSA가 동작이 않될때가 있다.

특히 Tivoli Console 화면에서 lssrc -a를 입력하면 다음과 같은 메세지를 뿌리면서

아무 반응도 없게 된다.

0513-156 Timeout waiting for command response. If you specified a foreign host, check if the System Resource Controller service on the foreign host is up and running.


TSA - Windows는 Administrator의 암호에 의해서 Service가 움직이게 되어 있다.

그래서 Windows Administrator암호를 바꾸게 되면 TSA 암호도 바꾸어 주어야 한다.


Administrator 암호를 바꾸어 주는 화면은 다음과 같다.

아래 화면과 같이 관리도구의 서비스 화면으로 들어가면 다음과 같은 항목이 있다.

System Resource Controller



이 항목의 속성을 보게되면 다음과 같이 로그온 탭이 있다.


여기에서 암호를 바꾸어 주어야만 System Resource Controller가 정상 작동하게 된다.


Windows의 Administrator암호를 바꾸면 반드시 위의 SRC의 암호도 바꾸어주어야 한다.


Posted by 인프라쟁이 DBA

윈도우에서 업데이트를 모두 하고 TSA를 설치 후 preprpnode hostname1 hostname2

를 입력하면 다음과 같은 에러가 떨어질 수가 있다.

$preprpnode hostname1 hostname2

/usr/sbin/rsct/bin/lsrsrc-api: 2612-022 A session could not be established with the RMC daemon on <hostname>


그래서 netstat -an | grep -i 657를 하면

udp는 떠 있지만 tcp 포트가 뜨지 않을 경우가 있다.


TSA의 RMC기능은 반드시 657 포트를 통해서 작업이 이루어진다.

이 657 포트가 장애가 생기면 다른 작업을 진행할 수가 없다.


원인을 찾다가 결국 알아낸 단순한 것.


C:\Windows\System32\drivers\etc\에 보면 services라는 파일이 있다.

보통 Port의 이름을 정의할때 쓰는 파일인데 이곳의 맨아래에 보면 특수 문자가 붙어 있다.

이 특수문자때문에 Port할당시 방해가 된것 같다.

rmc  657/tcp <-이 뒤에 특수문자가 있는데 이걸 삭제

그리고 리부팅 후 확인해보면 Port가 떠있는것을 확인해 볼 수 있다.


이걸 알아내느라 1달을 허비했다.... 젠장....


역시 삽질의 길은 멀고도 험하다....

Posted by 인프라쟁이 DBA