ZMC 알람 설정 방법 안내(템플릿별 설정 안내)

Print

 

1. ZMC 접속 

1) 그라파나에서 ZMC 가이드 대시보드에서 접속 

https://mon.cloudz.co.kr  접속

 

- Dashboards > Manage < Default 폴더내의 ZMC Guide 대시보드를 선택한다.

대시보드내 ZMC Site Link 클릭하면 ZMC 사이트가 열린다. 

 * 목차 리스트의 링크를 클릭시 해당하는 가이드 페이지가 열린다. 

2) ZMC URL 접속

https://mon.cloudz.co.kr/alert-manager/ 로 접속한다. 

그라파나가 로그인 되어있는 경우 바로 ZMC가 열리고, 그라파나가 로그인되어있지 않은 경우
  그라파나 로그인창이 열린다. ZMC URL으로 접속시 그라파나 로그인하면 바로 ZMC가 열린다.  



2. ZMC Alert Rule Set 추가 방법



1)       Alert Rule Set 메뉴를 클릭한다

2)       Add버튼을 클릭한다

3)       Alert Rule Set Name 을 입력한다 

4)       Notify Channel 선택하여 입력한다.(Channel을 생성하지 않았다면건너뛸 수 있다)

5)       Save 버튼을 클릭하여 저장한다

6)       Alert rule 을 설정할 수 있는 화면으로 전환 된다.
 (Name
 Channel 변경시 Save 버튼이 표시되고버튼클릭시 저장된다)


3. ZMC Alert Rule 설정방법



1)  이미 생성된 Alert Rule Set Alert Rule Set 명을 클릭시 Alert Rule 을 설정할 수 있는 화면으로 전환된다.



2)  Add 버튼을 클릭하면 신규 Alert rule을 추가 할 수 있는 설정창이 나타난다.


3)  신규 Alert Rule 설정시 Template을 선택한다



4)  템플릿 선택시 각 템플릿별 설정 항목들이 셋팅된다

5)  템플릿 타입 별 설정
- CPU Usage, Memory Usage, SWAP Usage , IOWAIT Usage

- Disk Usage

- Disk Volume Usage 

- LOAD 1Min, LOAD 5Min LOAD 15Min 

- Sysem Restarted, HTTP Fail Count, Ping Fail Count 

- PROCESS COUNT 

- LOG EXE Collector


◎  CPU Usage, Memory Usage, SWAP Usage , IOWAIT Usage(Two Step Slide Alert Rule)

(Preview 버튼 마우스 오버시 확인가능)

  • Metric : 알람 메시지 전송시 org/Metric 명을 표기하므로 정확한 명칭을 입력한다
  • Rules(슬라이드방식 ): Caution(Yellow)/Warning(Red) 박스를 클릭한체 좌우로 움직여 임계치를     설정한다임계치는 Usage %로 표현하여 0~100 이내로 설정한다각 메트릭에 대한 수집값이 임계치에 도달하면 알람이 발생한다
    • Duration : 설정한 임계치에 도달하더라도 Duration에 설정한 시간동안 임계치가 유지되어야 알람을 발생한다예로 Duration  1분을 설정 했을 경우 1분동안 임계치가 유지되어야 알람이 발생한다. 1분이 되기전에 수치가 떨어지면 알람이 발생하지 않는다
  • Message : 기본 메시지에 추가로 알람 메세지를 설정 할 수 있다.  Preview버튼을 마우스오버 하면 설정된 Alert rule에 대해 알람이 발생했을 때 예시 알람을 확인할 수 있다.

Monitoring List : 설정한 Alert Rule을 적용할 대상을 추가한다. Add 버튼을 클릭하면 추가할 대상을 선택할 수 있는 Monitoring List팝업이 뜬다.
 

해당 목록에서 추가할 대상을 선택하고 Select 버튼을 클릭하면 Alert Rule 설정창에 선택한 대상이 표기된다, Alert Rule 설정창의 리스트는 팝업에서 최종적으로 선택한 리스트만 표기된다. Alert rule설정을 저장하고 난뒤에는 해당 설정창에서 이미 추가된 리스트는 확인 할 수 없다. (이미 추가된 리스트는 Alert Rule Set 상세화면에서 Alert rule선택시 하위 monitoring list에서 확인 가능하다.)



◎  Disk Usage(Two Step Alert Rule + Exception List)

(Preview 버튼 마우스 오버시 확인가능)

  • Metric : 알람 메시지 전송시 org/Metric명을 표기하므로 정확한 명칭을 입력한다
  • Rules(슬라이드방식) : Caution(Yellow)/Warning(Red) 박스를 클릭한체 좌우로 움직여 임계치를 설정한다임계치는 Usage %로 표현하여 0~100 이내로 설정한다 .각 메트릭에 대한 수집값이 임계치에 도달하면 알람이 발생한다
    • Duration : 설정한 임계치에 도달하더라도 Duration에 설정한 시간동안 임계치가 유지되어야 알람을 발생한다예로 Duration  1분을 설정 했을 경우 1분동안 임계치가 유지되어야 알람이 발생한다. 1분이 되기전에 수치가 떨어지면 알람이 발생하지 않는다
    • Exception List : 제외 처리할 경로를 입력 후 add 버튼을 클릭한다. Exception List에 추가된 경로를 제외한 모든 경로에 대한 DISK 감시를 한다(예시 : C: , /boot , / 등등 )
  • Message : 기본 메시지에 추가로 알람 메세지를 설정 할 수 있다.   Preview버튼을 마우스오버 하면 설정된 Alert rule에 대해 알람이 발생했을 때 예시 알람을 확인할 수 있다.
  • Monitoring List : 설정한 Alert Rule을 적용할 대상을 추가한다. Add 버튼을 클릭하면 추가할 대상을 선택할 수 있는 Monitoring List팝업이 뜬다.
     

    해당 목록에서 추가할 대상을 선택하고 Select 버튼을 클릭하면 Alert Rule 설정창에 선택한 대상이 표기된다, Alert Rule 설정창의 리스트는 팝업에서 최종적으로 선택한 리스트만 표기된다. Alert rule설정을 저장하고 난뒤에는 해당 설정창에서 이미 추가된 리스트는 확인 할 수 없다. (이미 추가된 리스트는 Alert Rule Set 상세화면에서 Alert rule선택시 하위 monitoring list에서 확인 가능하다.)

◎ Disk Volume Usage(Two Step Alert )
(Preview 버튼 마우스 오버시 확인가능)

  • Metric : 알람 메시지 전송시 org/Metric명을 표기하므로 정확한 명칭을 입력한다
  • Rules(슬라이드방식) : Caution(Yellow)/Warning(Red) 박스를 클릭한체 좌우로 움직여 임계치를 설정한다임계치는 Usage %로 표현하여 0~100 이내로 설정한다 .각 메트릭에 대한 수집값이 임계치에 도달하면 알람이 발생한다
    • Target(disk.path) : 감시할 타겟 경로를 입력하면 해당 경로에 대한 DISK 감시를 한다(예시 : C: , /boot , / 등등 ). 타겟은 한 개만 지정 가능하다. 여러 개의 타겟을 감시하고 자 할 경우 Alert Rule을 추가 해서 사용한다. 
    • Duration : 설정한 임계치에 도달하더라도 Duration에 설정한 시간동안 임계치가 유지되어야 알람을 발생한다예로 Duration  1분을 설정 했을 경우 1분동안 임계치가 유지되어야 알람이 발생한다. 1분이 되기전에 수치가 떨어지면 알람이 발생하지 않는다
  • Message : 기본 메시지에 추가로 알람 메세지를 설정 할 수 있다.   Preview버튼을 마우스오버 하면 설정된 Alert rule에 대해 알람이 발생했을 때 예시 알람을 확인할 수 있다.
  • Monitoring List : 설정한 Alert Rule을 적용할 대상을 추가한다. Add 버튼을 클릭하면 추가할 대상을 선택할 수 있는 Monitoring List팝업이 뜬다.
     

    해당 목록에서 추가할 대상을 선택하고 Select 버튼을 클릭하면 Alert Rule 설정창에 선택한 대상이 표기된다, Alert Rule 설정창의 리스트는 팝업에서 최종적으로 선택한 리스트만 표기된다. Alert rule설정을 저장하고 난뒤에는 해당 설정창에서 이미 추가된 리스트는 확인 할 수 없다. (이미 추가된 리스트는 Alert Rule Set 상세화면에서 Alert rule선택시 하위 monitoring list에서 확인 가능하다.)

 

◎ LOAD 1Min, LOAD 5Min LOAD 15Min(Two Step Input Alert Rule)


(Preview 버튼 마우스 오버시 확인가능)

  • Metric : 알람 메시지 전송시 org/Metric명을 표기하므로 정확한 명칭을 입력한다
  • Rules(입력방식) : Caution/Warning 에 임계치를 입력하여 설정한다각 메트릭에 대한 수집값이 임계치에 도달하면 알람이 발생한다.
     * LOAD
    감시시 임계치 설정시 참고 https://lunatine.net/2016/02/19/about-load-average/#load-average-%ED%8C%90%EB%8B%A8
    • Duration : 설정한 임계치에 도달하더라도 Duration에 설정한 시간동안 임계치가 유지되어야 알람을 발생한다예로 Duration  1분을 설정 했을 경우 1분동안 임계치가 유지되어야 알람이 발생한다. 1분이 되기 전에 수치가 떨어지면 알람이 발생하지 않는다
  • Message : 기본 메시지에 추가로 알람 메세지를 설정 할 수 있다.   Preview버튼을 마우스오버 하면 설정된 Alert rule에 대해 알람이 발생했을 때 예시 알람을 확인할 수 있다.
  • Monitoring List : 설정한 Alert Rule을 적용할 대상을 추가한다. Add 버튼을 클릭하면 추가할 대상을 선택할 수 있는 Monitoring List팝업이 뜬다.
     

    해당 목록에서 추가할 대상을 선택하고 Select 버튼을 클릭하면 Alert Rule 설정창에 선택한 대상이 표기된다, Alert Rule 설정창의 리스트는 팝업에서 최종적으로 선택한 리스트만 표기된다. Alert rule설정을 저장하고 난뒤에는 해당 설정창에서 이미 추가된 리스트는 확인 할 수 없다. (이미 추가된 리스트는 Alert Rule Set 상세화면에서 Alert rule선택시 하위 monitoring list에서 확인 가능하다.)


◎ Sysem Restarted, HTTP Fail Count, Ping Fail Count(Status Condition)(Preview 버튼 마우스 오버시 확인가능)

  • Metric : 알람 메시지 전송시 org/Metric명을 표기하므로 정확한 명칭을 입력한다
  • Rules(수식입력방식) : 
    • Status Coundition : 좌변은 수집 field가 표시되고해당 수집값에 대한 임계치를 수식으로 입력한다예로 좌변이 uptime 표기되었고, >= 를 선택하고우변에 1을 입력한경우 uptime 값이 1이거나, 1보다 클 경우 알람이 발생한다
           > System Restart : uptime에 대한 임계치를 초단위로 입력한다
           > HTTP Fail Count : HTTP 결과에 대한 임계치를 입력한다. (0은 성공 1이상 error)
                HTTP 결과값에 대한 참조
                : https://github.com/influxdata/telegraf/tree/master/plugins/inputs/http_response#result--result_code
           > PING Fail Count ; PING 결과에 대한 임계치를 입력한다. (0은 성공 1이상 error)
  • Duration : 설정한 임계치에 도달하더라도 Duration에 설정한 시간동안 임계치가 유지되어야 알람을 발생한다예로 Duration  1분을 설정 했을 경우 1분동안 임계치가 유지되어야 알람이 발생한다. 1분이 되기 전에 수치가 떨어지면 알람이 발생하지 않는다
  • Level : 임계치에 도달할경우 알람을 주의로 보낼지 경고로 보낼지 선택한다
  • Message : 기본 메시지에 추가로 알람 메세지를 설정 할 수 있다.   Preview버튼을 마우스오버 하면 설정된 Alert rule에 대해 알람이 발생했을 때 예시 알람을 확인할 수 있다.
  • Monitoring List : 설정한 Alert Rule을 적용할 대상을 추가한다. Add 버튼을 클릭하면 추가할 대상을 선택할 수 있는 Monitoring List팝업이 뜬다.
     

    해당 목록에서 추가할 대상을 선택하고 Select 버튼을 클릭하면 Alert Rule 설정창에 선택한 대상이 표기된다, Alert Rule 설정창의 리스트는 팝업에서 최종적으로 선택한 리스트만 표기된다. Alert rule설정을 저장하고 난뒤에는 해당 설정창에서 이미 추가된 리스트는 확인 할 수 없다. (이미 추가된 리스트는 Alert Rule Set 상세화면에서 Alert rule선택시 하위 monitoring list에서 확인 가능하다.)


    ◎ PROCESS COUNT(target + Status Condition)
    (Preview 버튼 마우스 오버시 확인가능)
  • Metric : 알람 메시지 전송시 org/Metric명을 표기하므로 정확한 명칭을 입력한다
  • Rules(수식입력방식) : 
    • Target(procstat_lookup.pattern) : telegraf 설정시 input.procstat 에서 설정한 pattern을 입력한다한 개의 pattern 만 입력할 수 있다여러 개의 pattern을 감시하고 자 할 경우, Alert rule을 추가하여 감시해야 한다
    • Status Coundition : 좌변은 수집 field가 표시되고해당 수집값에 대한 임계치를 수식으로 입력한다예로 좌변이 pid_count 표기되었고, < 를 선택하고우변에 1을 입력한경우 입력한 target에 대한 pid_count 값이 1보다 작을 경우 알람이 발생한다
    • Duration : 설정한 임계치에 도달하더라도 Duration에 설정한 시간동안 임계치가 유지되어야 알람을 발생한다예로 Duration  1분을 설정 했을 경우 1분동안 임계치가 유지되어야 알람이 발생한다. 1분이 되기 전에 수치가 떨어지면 알람이 발생하지 않는다
    • Level : 임계치에 도달할경우 알람을 주의로 보낼지 경고로 보낼지 선택한다
  • Message : 기본 메시지에 추가로 알람 메세지를 설정 할 수 있다.   Preview버튼을 마우스오버 하면 설정된 Alert rule에 대해 알람이 발생했을 때 예시 알람을 확인할 수 있다.
  • Monitoring List : 설정한 Alert Rule을 적용할 대상을 추가한다. Add 버튼을 클릭하면 추가할 대상을 선택할 수 있는 Monitoring List팝업이 뜬다.
     

    해당 목록에서 추가할 대상을 선택하고 Select 버튼을 클릭하면 Alert Rule 설정창에 선택한 대상이 표기된다, Alert Rule 설정창의 리스트는 팝업에서 최종적으로 선택한 리스트만 표기된다. Alert rule설정을 저장하고 난뒤에는 해당 설정창에서 이미 추가된 리스트는 확인 할 수 없다. (이미 추가된 리스트는 Alert Rule Set 상세화면에서 Alert rule선택시 하위 monitoring list에서 확인 가능하다.)

◎ LOG EXE Collector (target + Status Condition)

  • LOG 알람 telegraf 설정 방법 안내 :https://support.cloudz.co.kr/ko/support/solutions/articles/42000066959-log-keyword-line-append-%EA%B0%90%EC%8B%9C-%EB%93%B1%EB%A1%9D-%EB%B0%A9%EB%B2%95 
    (Preview 버튼 마우스 오버시 확인가능)
  • Metric : 알람 메시지 전송시 org/Metric명을 표기하므로 정확한 명칭을 입력한다
  • Rules(수식입력방식) : 
    • Target(procstat_lookup.pattern) : logMonitoring.sh에 설정한 MONITORING_TARGET 을 ""를  포함하여 입력한다한 개의 target만 입력할 수 있다여러 개의 target을 감시하고 자 할 경우, Alert rule을 추가하여 감시해야 한다
    • Status Coundition : 좌변은 수집 field가 표시되고해당 수집값에 대한 임계치를 수식으로 입력한다예로 좌변이 seq가 표기되었고, >= 를 선택하고우변에 1을 입력한경우 입력한 target에 대한 seq값이 1이상일경우 알람이 발생한다. (설정한 로그가 발생하면 1이상이 수집되므로 seq >=1로 설정한다.)
    • Duration : 설정한 임계치에 도달하더라도 Duration에 설정한 시간동안 임계치가 유지되어야 알람을 발생한다예로 Duration  1분을 설정 했을 경우 1분동안 임계치가 유지되어야 알람이 발생한다. 1분이 되기 전에 수치가 떨어지면 알람이 발생하지 않는다
    • Level : 임계치에 도달할경우 알람을 주의로 보낼지 경고로 보낼지 선택한다
  • Message : 기본 메시지에 추가로 알람 메세지를 설정 할 수 있다.   Preview버튼을 마우스오버 하면 설정된 Alert rule에 대해 알람이 발생했을 때 예시 알람을 확인할 수 있다.
  • Monitoring List : 설정한 Alert Rule을 적용할 대상을 추가한다. Add 버튼을 클릭하면 추가할 대상을 선택할 수 있는 Monitoring List팝업이 뜬다.
     
    해당 목록에서 추가할 대상을 선택하고 Select 버튼을 클릭하면 Alert Rule 설정창에 선택한 대상이 표기된다, Alert Rule 설정창의 리스트는 팝업에서 최종적으로 선택한 리스트만 표기된다. Alert rule설정을 저장하고 난뒤에는 해당 설정창에서 이미 추가된 리스트는 확인 할 수 없다. (이미 추가된 리스트는 Alert Rule Set 상세화면에서 Alert rule선택시 하위 monitoring list에서 확인 가능하다.)

6)       Alert Rule 및 Monitoring별 알람 on/off 기능 및 history 기능 

  • Alert Rule Set 메뉴 클릭후 Alert Rule Set Liston/off를 클릭하면 해당 Alert Rule Set 의 알람을 on/off 시킬수 있다, off시 전체 알람이 off가 되지만 on적용시 Alert Rule Set 내의 Alert Ruleon/off monitoring Liston/off 에 셋팅한 설정이 적용된다
  • Alert Rule Set내의 Alert Rule monitoring List별 알람 on/off 셋팅을 하려면
    Alert Rule Set List
    의 목록을 선택한다.

  • Alert Rule Set 상세 화면에서 Alert Rule별로 on/off를 적용시킬 수 있고해당 Alert Rule에 대해 각 monitoring 대상별로 on/off를 적용할수 있다
  • OFF의 경우 상위depth에 따라 적용받는다. ON의 경우 하위 depth까지 모두 on 되어 있어야 한다 아래의 표를 참조한다.

Alert Rule Set
 (sample)

Alert Rule
 (cpu)

Monitoring
List
 (A)

Monitoring
List
 (B)

설정 결과

on

on

off

on

sample 내에 cpu에 대한 감시진행,
 대상 A는 감시 off, B는 감시 on

on

off

on

off

sample 내에 cpu에 대한 감시 off 

off

on

on

off

sample 내 모든 감시 off


  • Alert Rule Set 상세 화면에서 Alert Rule List에서 선택후 history 버튼을 클릭하면 해당 Alert Rule에 대한 상세내용 및 on/off 변경사항에 대해 이력을 확인할 수 있다

  • Alert Rule Set 상세 화면에서 Alert rule List에서 Alert Rule 선택 후 아래 Monitoring List에서 각 목록의 history 버튼을 클릭하면 Nodata on/off 변경사항에 대한 이력을 확인할 수 있다.

이 답변이 유용합니까? 아니오

Send feedback
도움을 드리지 못해 죄송합니다. 피드백을 주시면 이 문서의 품질을 높이겠습니다.