ZMC (ZMON Management Console) 사용 가이드

Print

목차

1. ZMC(ZMON Management Console) 소개 

  • ZMON의 수집 데이터를 기준으로 좀더 쉽게 Alert Rule을 설정/관리 할 수 있다.
  • Channel 등록을 통해 ZCARE와 연계하거나, Slack을 통해 직접 통지할 수 있다. 

2. 접속방법
    접속 URL : http://mon.cloudz.co.kr/alert-manager

  • http://Mon.cloudz.co.kr/ (ZMON Grafana) 에 접속 한 뒤 ZMC에 접속하면 Login 과정없이 접속가능하다
    (ORG별로 기본적으로 제공되는 Default 폴더의 ZMC Guide 대시보드에 Link를 클릭해 이동할 수 있다.)
  • 2 Grafana Login이 되지 않은 상태에서는 ZMC에 접속하면 Grafana Login 화면으로 이동하고, 로긴 후 다시 ZMC 화면으로 자동적으로 이동한다. 

3. 메뉴 및 기본 UI 설명

3.1 UI 설명

①        HOME LOGO : 클릭시 ZMC의 home(Dashboards)로 이동한다

②        메뉴토글 : 클릭시 메뉴를 숨기거나 다시 보이게 한다. 

③        메뉴 : 클릭시 각 페이지로 이동한다. 

④        이동경로 : 현재 페이지를 확인하거나 상위페이지로 이동할 수 있다. 

⑤        ORG 선택목록 : ORG를 변경할 수 있다. 선택하려는 ORG가 ORG 선택 목록에 없다면 ZMON 담당자에게 ORG의
           ZMC사용 요청해야 한다.

⑥        Grafana Link : 선택한 ORG의 Grafana를 새창으로 연다. 


3.2 Menu 설명

①        Dashboards : 실시간 알람 발생 목록을 볼 수 있다

②        Monitoring List : ORG에 속한 모니터링 대상정보 목록. 서비스 유형별, 대상명으로 조회 할 수 있다. 

③        Alert Rule Set : 여러 개의 Alert Rule을 그룹으로 묶어 Alert Rule Set으로 관리할 수 있고, Alert Rule Set내의 각각의 

           Alert Rule을 개별적으로 수정/관리 할 수 있다.  대상별로 설정된 Alert Rule Set을 확인 할 수 있다. 

④        Alert Event List : Alert Rule Set에 등록된 Alert Rule 을 기준으로 발생된 알람정보를 조회한다. 

⑤        Alert Channels : Alert 발생 통지를 전달할 Channel을 관리한다. 

⑥        Usage : ZMC에서 모니터링하는 대상에 대한 사용 통계를 월별로 제공한다.

4. 메뉴 상세 설명 및 기능 안내

4.1 Dashboards

①  필터스위치 :  체크해제() 하면 체크해제한 Severity를 리스트에서 제외한다.() 체크하면 해당 Serverity를
     리스트에 표기한다.

②  실시간 Alert 목록 :  현재 OPEN상태의 Alert 만 표기한다. (전체 알람에 대해 조회시 Alert Event List 메뉴 이용)

  • Serverity : Alert 심각도 : Caution(주의), Warning(경고), No Data(데이터없음)로 표현
  • Event Date : Alert 발생 시간
  • Alert Rule : Alert을 발생시킨 Alert Rule명
  • Message : Alert 발생 내역
  • Alert Rule Set : Alert을 발생시킨 Alert Rule 이 포함된 Alert Rule Set. Alert Rule Set을 클릭하면 상세 내역으로 이동한다.
  • Name : Alert 발생 대상 명. 대상을 클릭하면 해당 대상에 대한 상세 정보 창으로 이동한다.

           상세창에서는 실시간 Alert 목록에서 선택한 Alert이 default로 표기된다. (Aelrt Rule Set, Alert Rule 자동선택)

1) 대상명 : 대상명과 Service 및 대상의 상태를 표기한다.

2)  Alert Rule Set : 해당 대상이 매핑 되어있는 Alert Rule Set목록을 표기한다. 

3)  Alert Rule : 2)의 목록을 선택하면 선택한 Alert Rule Set의 Alert Rule 목록을 표기한다. Alert Rule 의 on/off로
     Alert을 활성화/비활성화 시킬 수 있다.

4)  3)의 Alert Rule을 선택후 Detail 버튼을 클릭하면 Alert Rule 상세페이지가 표기된다.

   이 화면에서 열린 Alert Rule 상세페이지에선 수정 할 수 없다. 

 

4.2 Monitoring List

①        Service 종류 : 선택시 해당 Service종류에 해당하는 대상에 대한 정보가 조회된다.

②        대상명(Name)을 입력하고 Search버튼을 클릭하여 조회한다. 

③        대상정보목록

  • Service : LINUX, WINDOWS, HTTP, PING 
  • UPTIME : 대상의 UPTIME을 표기한다. 
  • Status : 대상의 상태(RUNNING, STOP) 를 표기한다. STOP인경우 No Data Alert등이 지속적으로 발생할 수 있음으로 STOP버튼()을 클릭해 상태를  DISABLE로 변경할 수 있다.  DISABLE로 변경된 대상 목록에 표기되지 않고, Alert 감시도 하지 않는다. DISABLE된 대상이 다시 RUNNING상태가 되면 자동으로 다시 목록에 표기되고 Alert 감시를 할 수 있다.  
  • Last Monitored Time : Data가 수집된 마지막 시간 표시
  • Name : 대상명과 Alert 발생수를 확인 할 수 있다. 대상명을 클릭하면 대상 상세정보화면으로 이동한다.
    • 1)        대상명 : 대상명과 Service 및 대상의 상태를 표기한다.
    • 2)        Alert Rule Set : 해당 대상이 매핑 되어있는 Alert Rule Set목록을 표기한다.
    • 3)        Alert Rule : 2)의 목록을 선택하면 선택한 Alert Rule Set의 Alert Rule 목록을 표기한다. Alert Rule 의 on/off로 Alert을 활성화/비활성화 시킬 수 있다.
    • 4)        3)의 Alert Rule을 선택후 Detail 버튼을 클릭하면 Alert Rule 상세페이지가 표기된다.

 

4.3 Alert Rule Set

4.3.1 Alert Rule Set

  • Add : 신규 Alert Rule Set을 추가하는 화면으로 이동한다.

    Alert Rule Set Name 과 Notify Channel을 입력하고 저장하면 생성된 Alert Rule Set에 상세 관리 페이지로 이동한다.
  • Check : Alert Rule Set을 선택하면 Delete 버튼이 표기된다. Delete 버튼 클릭시 삭제된다. 
  • Last Modified Time : Alert Rule Set 최종수정시간.
  • On/Off : Alert Rule Set을 통한 감시를 활성화/ 비활성화 할 수 있다. 
  • Alert Rule Set : Alert Rule Set명과 발생 Alert Count를 표기한다. Alert Rule Set명을 클릭시 Alert Rule Set 상세 화면으로 이동한다.

  1. Name : Alert Rule Set 명
  2. Channel : 해당 Alert Rule Set의 Alert Rule에 의에 Alert 발생시 Alert 발송할 Channel정보 .
     Channel 아래 마우스를 클릭하면 Select box가 표시된다. 해당 리스트에서 Channel을 선택하면 추가된다. (Channel 목록에 Channel을 추가 할 때는 Alert Channels 메뉴에서 한다.)
  3. Monitoring List : Alert Rule 선택시 해당 Alert Rule이 적용된 대상에 대한 목록을 표시한다.
    No data에대한 감시 및 임계치에 대한 감시에 대해 On/Off로 관리할 수 있다.
  4. Alert Rule : Alert Rule 목록을 선택 후 View 버튼 클릭시 상세내역 수정을, Delete버튼 클릭시 삭제를 진행할 수 있다. On/Off의 스위치를 이용하여 Alert을 활성화/비활성화 할 수 있다.
    Add버튼 클릭시 신규 Alert Rule을 추가할 수 있다.

Alert Rule을 추가 화면에서 Template선택하면 해당 Tamplate에 맞는 상세내용으로 Alert Rule을 추가할 수 있다. 

  • Alert Rule Template : Alert Rule의 Measurment별로 구성된 Template를 선택할 수 있다. (단, 선택시 설정중이던 Alert Rule정보는 잃을 수 있음으로 수정중엔 변경하지 않도록 한다.)
  • Monitoring List: 해당 Alert Rule이 적용될 대상목록이 표기된다. Add버튼을 클릭하면 전체 대상목록 팝업이 뜨고 해당 팝업에서 선택하여 추가할 수 있다. 
  • Metric : Alert Rule명을 입력한다. Alert Message 발송시 Title로 표기된다. 
  • Rules : 임계치를 설정한다. Template별로 임계치 설정 항목이 변경된다.

    슬라이더방식의 임계치 수정 및 Duration 설정

슬라이더 방식으로 특정 값을 선택하고, 선택한 값에 대해 상태조건 및 심각도등을 설정할 수 있다.

 

Disk 사용율 Template에서는 감시할 대상(Name) 또는 감시할 제외대상(Exception List)을 설정 할 수 있다. 감시할 대상은 단일Path만 입력할 수 있다. 제외대상은 입력하고 Add버튼을 클릭하면 제외대상이 추가된다.  


4.3.2 Monitoring List

  • Name : 대상명 및 알람발생 count가 표시된다. 클릭시 대상상세정보로 이동한다.
  • Alert Rule Set : 대상을 감시하는 Alert Rule이 포함된 Alert Rule Set 명을 표기한다. 클릭시 Alert Rule Set 상세 정보로 이동한다. 
  • Status : 대상의 상태(RUNNING, STOP) 를 표기한다. STOP인경우 No Data Alert등이 지속적으로 발생할 수 있음으로 STOP버튼()을 클릭해 상태를  DISABLE로 변경할 수 있다.  DISABLE로 변경된 대상 목록에 표기되지 않고, Alert 감시도 하지 않는다. DISABLE된 대상이 다시 RUNNING상태가 되면 자동으로 다시 목록에 표기되고 Alert 감시를 할 수 있다.  
  • Type : 대상의 Type을 표기한다. LINUX, WINDOWS, HTTP


4.4 Alert Event List

①        조회조건    

  • 일자/시간 조회 : Created Time을 기준으로 조회한다. 입력 박스를 클릭하면 달력 및 시간 선택 박스가 표기된다. 
  • Alert 상태 조회 : Alert 의 OPEN / CLOSED 상태를 조회한다. 
  • 대상(Name)조회 :  Search 버튼 옆 입력박스에 대상을 입력하여 조회힌다. 
  • 필터스위치  :  체크해제() 하면 체크해제한 Severity를 리스트에서 제외한다.() 체크하면 해당 Serverity를 리스트에 표기한다.

②        실시간 Alert 목록 

  • Level : Alert 심각도 : Caution(주의), Warning(경고), No Data(데이터없음)로 표현
  • Created Time : Alert 발생 시간
  • Released Time : Alert Closed 시간 
  • Name : Alert 발생 대상 명. 대상을 클릭하면 해당 대상에 대한 상세 정보 창으로 이동한다.
  • Alert Rule : Alert을 발생시킨 Alert Rule명
  • Message : Alert 발생 내역
  • Alert Rule Set : Alert을 발생시킨 Alert Rule 이 포함된 Alert Rule Set. Alert Rule Set을 클릭하면 상세 내역으로 이동한다.

4.5 Alert Channels

①        Alert Channels 목록 : Alert Name 과 해당 채널이 사용되는 Alert Rule Set 수를 표기한다. 클릭시 채널에 대한 상세 페이지가 표기된다.

  • Cancel 버튼 : Detail 창을 닫는다. 
  • Delete 버튼 : 클릭시 해당 Alert channel을 삭제한다.
  • Test 버튼 : Slack 은 Channel Name , Slack URL , Opsgenie는 OpsGenie API Key가 입력된 상태에서 Test 버튼을 클릭하염
     입력된 정보의 채널에 테스트 메시지를 전송한다.
  • Modify 버튼 : 클릭시 Alet channel의 상세 내역을 변경할 수 있는 창이 표시된다.

②        Add 버튼 클릭시 신규 채널 등록 창이 표기된다.

  • Channel : 채널 종류를 선택한다. ( Slack , Opsgenie ) 
  • Alert Name :  Alert Name 을  입력한다. 
  • Chanel Name : Slack의 경우에만 입력한다. Slack의 채널명을 입력한다. 
  • Slack URL : Slack의 경우에만 입력한다. Slack의 Hook URL을 입력한다.
  • OpsGenie API Key : Opsgenie의 경우에만 입력한다. Opsgenie의 API KEY  를 입력한다.
  • Description :  Alert channel에 대한 설명 입력한다.
  • Save 버튼 : 필수적인 정보를 입력후 save버튼을 클릭하면 저장된다. 

 

4.6 Usage

  • ①        년월선택 :  버튼을 이용하여 년/월을 선택할 수 있다.
  • ②        Type별 집계 : ③의 Type을 기준으로 Count한 집계를 표기한다.
  • ③        월별 사용정보 목록 
  • Type : 감시 Type을 표기한다.(Host, Ping Check, Http Check, SNMP, AWS Service, Azure Service )
  • Name :  감시대상명을 표기한다.
  • Duration : 월별 감시 누적시간을 표기한다.
  • Ragne : Duration에서 표기하는 시간에 대한 From~To를 표기한다. 

이 답변이 유용합니까? 아니오

Send feedback
도움을 드리지 못해 죄송합니다. 피드백을 주시면 이 문서의 품질을 높이겠습니다.