HP서버 정보 보기 - hpasmcli

2018. 8. 5. 16:49IT/Server

HP서버 정보 보기 - hpasmcli


HP서버 정보 보기 - hpasmcli



이전 hpssacli 포스팅에 이어 hpasmcli에 대한 포스팅을 해보려 한다.


서버에 실제 인식되어있는 hp product에 대한 정보 및 서버 온도, 로그 등을 보는 명령어로

운영 중에 hpssacli, hpacucli와 함께 아주 많이 사용되는 tool이다.


hpssacli와 hpacucli에 대한 포스팅은 이전에 포스팅하였다.

2018/08/05 - [IT/Server] - HP서버 정보 보기 - hpssacli, hpacucli


hpsacmli의 의미는 다음과 같다.

asmcli : Server Management Application Command Line Interface

이번에는 hpasmcli 명령어 중 자주 사용되는 명령어와 운영 중에 이슈가 있었던 사례를 포스팅 해보도록 하겠다.




ASMCLI (Server Management Application Command Line interface)



hpssacli와 마찬가지로 hpasmcli rpm 설치 후 hpasmcli를 입력하면 asmcli command mode로 진입할 수 있다.


command mode로 진입하지 않고 사용하는 방법은

hpasmcli -s "명령어"

와 같이 입력하여 사용할 수 있고, 리다이렉션 > 을 사용해 file로 남길 수 도 있다.

(처음에 hpssacli와 사용법이 달라 구글링 했던 기억이 난다.)


자주 사용하는 명령어로는

show temp -> 서버 부품별 온도

show iml -> 서버 로그 (hplog -v 로 대체 사용 가능)

show powersupply -> 파워서플라이 정보

show fan -> FAN 정보

show dimm -> 메모리정보 (dmidecode -t 17을 더 많이 사용하게 됨)


위 5가지를 자주 사용하게 된다.



hpsamcli command mode로 접속 후 show iml

또는

hpasmcli -s "show iml"

또는

hplog -v


보통 서버를 육안으로 점검 후 이상 발생 시 위 3가지 명령어로 확인한 후

이상이 있는 부품 정보를 보는 다른 명령어를 이용해 서버 상태를 점검하게 된다.


서버의 health LED에 주황색 하나만 점등 되었다면

95%이상 cache battey, powersupply, fan, disk fail 문제였다.




HPASMCLI 주의점



주의 할 점은 OS에 나오는 log time은 영국시간으로 한국시간과 8시간 차이가 있다는 점,

또한 OS에는 로그가 올라오지 않는 경우도 있기 때문에 LED가 점등되었는데 OS상에 로그가 보이지 않는다면

ILO(HP Integrated Lights-Out) 원격접속을 이용해 HW log를 점검해 보아야 한다.



또한 ps -ef |grep hp를 통해 보면 hp-health process가 떠있는 것을 볼 수 있는데,

hpasmcli는 hp-health 데몬이 gethering한 정보를 보여주는 것이기 때문이다.


이상하게도, 이 hp-health 데몬이 가끔 먹통이 되는 경우가 있어 관련된 패치를 몇 번 진행하였음에도 불구하고

지속되는 버그가 존재한다.

HP ProLiant Gen8 과 Gen9에서만 존재하는 버그인지는 잘 모르겠다.


그렇다고 해서 이 hp-health 데몬을 강제로 kill 시키는 것은 상당히 위험할 수 있다.

os에서 watchdog이 시스템을 강제로 리붓시키는 경우가 있을 수 도 있기 때문이다 (엔지니어에게 들은 내용)


방법은 서버를 shutdown시킨 후 power recycle을 시도하는 것이다.

서버운영을 하면서 생각보다 잔류전력이 많은 것을 관장하고 있다는 것을 느낄 때가 많았는데

hp-health가 먹통이 되었을 때는 power recycle을 하여 다시 재실행 시켜주고 있다.

(빨리 제대로 된 사유와 버그픽스가 이루어졌으면 좋겠다.)



hpasmcli와 cron을 사용하여 서버 상태를 자동으로 loging하여 점검을 진행 할 수 있는데,

이는 상당히 주의가 필요하다.

왜냐하면, 위의 hp-health 먹통 버그때문에 hpasmcli 명령어가 좀비 process로 빠진 상태로 종료되지 않기 때문이다.

정확히는 os가 hpasmcli 명령어가 정상적으로 동작하지 않는다고 판단하여 kill하기 전에

cron에 의해 asmcli 명령이 반복 실행되면 process가 full나는 경우가 발생할 수 도 있다.




'IT > Server' 카테고리의 다른 글

HP - array controller failure  (2) 2019.02.22
HP서버 정보 보기 - hpssacli, hpacucli  (1) 2018.08.05