ZMC (ZMON Management Console) 사용 가이드

Print

목 차

1. ZMC(ZMON Management Console) 소개 

  • ZMON의 수집 데이터를 기준으로 좀더 쉽게 Alert Rule을 설정/관리 할 수 있다.

  • Channel 등록을 통해 ZCARE와 연계하거나, Slack을 통해 직접 통지할 수 있다. 

2. ZMC접속방법

접속 URL : http://mon.cloudz.co.kr/alert-manager

  • http://Mon.cloudz.co.kr/ (ZMON Grafana) 에 접속 한 뒤 ZMC에 접속하면 Login 과정없이 접속가능하다
    (ORG별로 기본적으로 제공되는 Default 폴더의 ZMC Guide 대시보드에 Link를 클릭해 이동할 수 있다.)

  • 2 Grafana Login이 되지 않은 상태에서는 ZMC에 접속하면 Grafana Login 화면으로 이동하고, 로긴 후 다시 ZMC 화면으로 자동적으로 이동한다. 

3. 메뉴 및 기본 UI 설명

3.1 UI 설명

①        HOME LOGO : 클릭시 ZMC의 home(Dashboards)로 이동한다

②        메뉴토글 : 클릭시 메뉴를 숨기거나 다시 보이게 한다. 

③        메뉴 : 클릭시 각 페이지로 이동한다. 

④        이동경로 : 현재 페이지를 확인하거나 상위페이지로 이동할 수 있다. 

⑤        ORG 선택목록 : ORG를 변경할 수 있다. 선택하려는 ORG가 ORG 선택 목록에 없다면 ZMON 담당자에게 ORG의  ZMC사용 요청해야 한다.

⑥        Grafana Link : 선택한 ORG의 Grafana를 새창으로 연다. 

3.2 Menu 설명

①        Dashboards : 실시간 알람 발생 목록을 볼 수 있다

②        Monitoring List : ORG에 속한 모니터링 대상정보 목록. 서비스 유형별, 대상명으로 조회 할 수 있다. 

③        Alert Rule Set : 여러 개의 Alert Rule을 그룹으로 묶어 Alert Rule Set으로 관리할 수 있고, Alert Rule Set내의 각각의  Alert Rule을 개별적으로 수정/관리 할 수 있다.  대상별로 설정된 Alert Rule Set을 확인 할 수 있다. 

④        Alert Event List : Alert Rule Set에 등록된 Alert Rule 을 기준으로 발생된 알람정보를 조회한다. 

⑤        Alert Channels : Alert 발생 통지를 전달할 Channel을 관리한다. 

⑥        Usage : ZMC에서 모니터링하는 대상에 대한 사용 통계를 월별로 제공한다.

4. 메뉴 상세 설명 및 기능 안내

4.1 Dashboards

①  필터스위치 :  체크해제 하면 체크해제한 Severity를 리스트에서 제외한다. 체크하면 해당 Serverity를     리스트에 표기한다.

②  실시간 Alert 목록 :  현재 OPEN상태의 Alert 만 표기한다. (전체 알람에 대해 조회시 Alert Event List 메뉴 이용)

③ Refresh : ON 상태일경우, 1분마다 자동으로 Dashboard List를 refresh 한다. OFF일경우, refresh 하지 않으며, Refresh 글자를 클릭시 Dashboard List가 수동으로 새로고침된다.

  • Serverity : Alert 심각도 : Caution(주의), Warning(경고), No Data(데이터없음)로 표현

  • Event Date : Alert 발생 시간

  • Alert Rule : Alert을 발생시킨 Alert Rule명

  • Message : Alert 발생 내역

  • Alert Rule Set : Alert을 발생시킨 Alert Rule 이 포함된 Alert Rule Set. Alert Rule Set을 클릭하면 상세 내역으로 이동한다.

  • Alert Close : 실시간 Alert 목록에서 Alert 상황이 해제되어야 하나 해제되지 않은경우 사용자가 수동으로 해제할 수 있는 기능(단, 실제 Alert 상황이 유지되고 있는 상황에는 해제후 다시 Alert 이 발생할 수 있다.)

  • Name : Alert 발생 대상 명. 대상을 클릭하면 해당 대상에 대한 상세 정보 창으로 이동한다.
    상세창에서는 실시간 Alert 목록에서 선택한 Alert이 default로 표기된다. (Aelrt Rule Set, Alert Rule 자동선택)

1)대상명 : 대상명과 Service 및 대상의 상태를 표기한다.

2)Alert Rule Set : 해당 대상이 매핑 되어있는 Alert Rule Set목록을 표기한다. 

3)Alert Rule : 2)의 목록을 선택하면 선택한 Alert Rule Set의 Alert Rule 목록을 표기한다. Alert Rule 의 on/off로  Alert을 활성화/비활성화 시킬 수 있다.

4)3)의 Alert Rule을 선택후 Detail 버튼을 클릭하면 Alert Rule 상세페이지가 표기된다.

   이 화면에서 열린 Alert Rule 상세페이지에선 수정 할 수 없다. 

 

4.2 Monitoring List

①        Service 종류 : 선택시 해당 Service종류에 해당하는 대상에 대한 정보가 조회된다.

②        대상명(Name)을 입력하고 Search버튼을 클릭하여 조회한다. 

③        대상정보목록

  • Service : LINUX, WINDOWS, HTTP, PING 

  • UPTIME : 대상의 UPTIME을 표기한다. 

  • Status : 대상의 상태(RUNNING, STOP) 를 표기한다. STOP인경우 No Data Alert등이 지속적으로 발생할 수 있음으로 STOP버튼()을 클릭해 상태를  DISABLE로 변경할 수 있다.  DISABLE로 변경된 대상 목록에 표기되지 않고, Alert 감시도 하지 않는다. DISABLE된 대상이 다시 RUNNING상태가 되면 자동으로 다시 목록에 표기되고 Alert 감시를 할 수 있다.

  • Last Monitored Time : Data가 수집된 마지막 시간 표시

  • Name : 대상명과 Alert 발생수를 확인 할 수 있다. 대상명을 클릭하면 대상 상세정보화면으로 이동한다.

    1)        대상명 : 대상명과 Service 및 대상의 상태를 표기한다.
    2)        Alert Rule Set : 해당 대상이 매핑 되어있는 Alert Rule Set목록을 표기한다.
    3)        Alert Rule : 2)의 목록을 선택하면 선택한 Alert Rule Set의 Alert Rule 목록을 표기한다. Alert Rule 의 on/off로 Alert을 활성화/비활성화 시킬 수 있다.
    4)        3)의 Alert Rule을 선택후 Detail 버튼을 클릭하면 Alert Rule 상세페이지가 표기된다.

 

4.3 Alert Rule Set

4.3.1 Alert Rule Set

  • Delete : Alert Rule Set 리스트의 check항목에 check하면 delete 버튼이 표시되고, 버튼을 클릭하면 check된 Alert rule set이 삭제 된다.

  • History : Alert Rule Set 리스트의 check항목에 check하면 history 버튼이 표시되고 버튼을 클릭하면 Alert rule set의 변경 이력을 확인할 수 있다.

  • Add : 신규 Alert Rule Set을 추가하는 화면으로 이동한다.

  • Alert Rule Set Name : Alert Rule Set 명

  • Notify Channel : Alert 이 발생할 경우 알람을 발생시킬 채널 선택(다중선택 가능)

  • Audit Channel : Alert Rule Set에 변경사항이 있을경우 Audit Channel 로 선택한 채널에 변경사항에대해 noti 알람을 발생시킨다. noti 알람을 발생하는 경우는 다음과 같다
    - Alert Rule Set 추가 / 삭제 / 변경 및 on/off 조작시
    - Alert Rule 추가 / 삭제 / 변경 및 on/off 조작시
    - Alert Rule 의 monitoring 대상 추가 / 삭제 및 on/off, nodata 조작시

Alert Rule

  • Check : Alert Rule Set을 선택하면 Delete 버튼이 표기된다. Delete 버튼 클릭시 삭제된다. 

  • Last Modified Time : Alert Rule Set 최종수정시간.

  • On/Off : Alert Rule Set을 통한 감시를 활성화/ 비활성화 할 수 있다. 

  • Alert Rule Set : Alert Rule Set명과 발생 Alert Count를 표기한다. Alert Rule Set명을 클릭시 Alert Rule Set 상세 화면으로 이동한다.

1)Name : Alert Rule Set 명

2)Channel : 해당 Alert Rule Set의 Alert Rule에 의에 Alert 발생시 Alert 발송할 Channel정보 .
 Channel 아래 마우스를 클릭하면 Select box가 표시된다. 해당 리스트에서 Channel을 선택하면 추가된다. (Channel 목록에 Channel을 추가 할 때는 Alert Channels 메뉴에서 한다.)

3)Monitoring List : Alert Rule 선택시 해당 Alert Rule이 적용된 대상에 대한 목록을 표시한다.
No data에대한 감시 및 임계치에 대한 감시에 대해 On/Off로 관리할 수 있다.
history항목의 버튼을 클릭시 해당 대상에 대한 No Data및On/Off 변경사항에 대해 이력을 확인할 수 있다.

4)Alert Rule : Alert Rule 목록을 선택 후 View 버튼 클릭시 상세내역 수정을, Delete버튼 클릭시 삭제를 진행할 수 있다. On/Off의 스위치를 이용하여 Alert을 활성화/비활성화 할 수 있다.History 버튼 클릭시 각 Alert Rule에 대한 변경 이력을 확인할 수 있다.Add버튼 클릭시 신규 Alert Rule을 추가할 수 있다.

Alert Rule을 추가 화면에서 Template선택하면 해당 Tamplate에 맞는 상세내용으로 Alert Rule을 추가할 수 있다. 

  • Alert Rule Template : Alert Rule의 Measurment별로 구성된 Template를 선택할 수 있다. (단, 선택시 설정중이던 Alert Rule정보는 잃을 수 있음으로 수정중엔 변경하지 않도록 한다.)

  • Monitoring List: 해당 Alert Rule이 적용될 대상목록이 표기된다. Add버튼을 클릭하면 전체 대상목록 팝업이 뜨고 해당 팝업에서 선택하여 추가할 수 있다. 

  • Metric : Alert Rule명을 입력한다. Alert Message 발송시 Title로 표기된다. 

  • Rules : 임계치를 설정한다. Template별로 임계치 설정 항목이 변경된다.

 ※ 템플릿별 알람설정 방법 상세 안내 : https://support.cloudz.co.kr/ko/support/solutions/articles/42000071438 

4.4 Alert Event List

①        조회조건    

  • 일자/시간 조회 : Created Time을 기준으로 조회한다. 입력 박스를 클릭하면 달력 및 시간 선택 박스가 표기된다. 

  • ORG 조회 : 접속한 사용자가 관리/접속할 수 있는 ORG에 대해 모든 Alert Event List를 조회할 수 있다. 

  • Alert 상태 조회 : Alert 의 OPEN / CLOSED 상태를 조회한다. 

  • 대상(Name)조회 :  Search 버튼 옆 입력박스에 대상을 입력하여 조회힌다. 

  • 필터스위치  :  체크해제() 하면 체크해제한 Severity를 리스트에서 제외한다.() 체크하면 해당 Serverity를 리스트에 표기한다.

②        실시간 Alert 목록 

  • Level : Alert 심각도 : Caution(주의), Warning(경고), No Data(데이터없음)로 표현

  • Created Time : Alert 발생 시간

  • Released Time : Alert Closed 시간 

  • Name : Alert 발생 대상 명. 대상을 클릭하면 해당 대상에 대한 상세 정보 창으로 이동한다.

  • Alert Rule : Alert을 발생시킨 Alert Rule명

  • Message : Alert 발생 내역

  • Notification : 버튼 클릭시 발생한 Alert의 메세지 전송이력 확인할 수 있다.Alert Channel명 / Alert 상태 / 메세지 전송이력(Time-메세지 전송시각/Success-메세지전송 성공여부/Message - 메세지 실패시 실패내역)

  • Alert Rule Set : Alert을 발생시킨 Alert Rule 이 포함된 Alert Rule Set. Alert Rule Set을 클릭하면 상세 내역으로 이동한다.

4.5 Alert Channels