목 차
1. ZMC(ZMON Management Console) 소개
ZMON의 수집 데이터를 기준으로 좀더 쉽게 Alert Rule을 설정/관리 할 수 있다.
Channel 등록을 통해 ZCARE와 연계하거나, Slack을 통해 직접 통지할 수 있다.
2. ZMC접속방법
접속 URL : http://mon.cloudz.co.kr/alert-manager
http://Mon.cloudz.co.kr/ (ZMON Grafana) 에 접속 한 뒤 ZMC에 접속하면 Login 과정없이 접속가능하다
(ORG별로 기본적으로 제공되는 Default 폴더의 ZMC Guide 대시보드에 Link를 클릭해 이동할 수 있다.)2 Grafana Login이 되지 않은 상태에서는 ZMC에 접속하면 Grafana Login 화면으로 이동하고, 로긴 후 다시 ZMC 화면으로 자동적으로 이동한다.
3. 메뉴 및 기본 UI 설명
3.1 UI 설명
① HOME LOGO : 클릭시 ZMC의 home(Dashboards)로 이동한다
② 메뉴토글 : 클릭시 메뉴를 숨기거나 다시 보이게 한다.
③ 메뉴 : 클릭시 각 페이지로 이동한다.
④ 이동경로 : 현재 페이지를 확인하거나 상위페이지로 이동할 수 있다.
⑤ ORG 선택목록 : ORG를 변경할 수 있다. 선택하려는 ORG가 ORG 선택 목록에 없다면 ZMON 담당자에게 ORG의 ZMC사용 요청해야 한다.
⑥ Grafana Link : 선택한 ORG의 Grafana를 새창으로 연다.
3.2 Menu 설명
① Dashboards : 실시간 알람 발생 목록을 볼 수 있다
② Alert Event List : Alert Rule Set에 등록된 Alert Rule 을 기준으로 발생된 알람정보를 조회한다
③ Alert Config : + 버튼 클릭시 Alert Rule 설정 관련 메뉴를 확인할 수 있다.
- Monitoring List : ORG에 속한 모니터링 대상정보 목록. 서비스 유형별, 대상명으로 조회 할 수 있다.
- Alert Rule Set : 여러 개의 Alert Rule을 그룹으로 묶어 Alert Rule Set으로 관리할 수 있고,
Alert Rule Set내의 각각의 Alert Rule을 개별적으로 수정/관리 할 수 있다.
대상별로 설정된 Alert Rule Set을 확인 할 수 있다.
- Alert Channels : Alert 발생 통지를 전달할 Channel을 관리한다.
③ Agent Config : Agent 의 설정을 관리한다.
- Telegraf : Telegraf Agent 의 상태확인 및 설정을 관리한다.
https://support.cloudz.co.kr/support/solutions/articles/42000076875
- Datadog : DataDog Agent의 상태확인 및 설정을 관리한다.
https://support.cloudz.co.kr/ko/support/solutions/articles/42000079324
④ Health Check : HTTP, PING, TCP 설정을 관리한다.
https://support.cloudz.co.kr/support/solutions/articles/42000075160
⑤ Cloud Integrations : + 버튼클릭시 Cloud Monitoring을 위한 integration 관리메뉴를 확인 할 수 있다.
https://support.cloudz.co.kr/support/solutions/articles/42000075364
- Account : Cloud의 Account를 관리한다.
- AWS Integration : ZMON으로 모니터링할 AWS의 서비스 및 메트릭 등을 관리한다.
- Azure Integration : ZMON으로 모니터링할 Azure의 Resource 및 메트릭 등을 관리한다.
⑥ ORG Management : + ORG 를 관리하는 메뉴를 확인 할 수 있다.
- Users : 사용자 관리 및 초대를 할 수 있다.
- Maintenance Plan : 작업 공지를 관리 한다.
- Usage : ZMC에서 모니터링하는 대상에 대한 사용 통계를 월별로 제공한다.
4. 메뉴 상세 설명 및 기능 안내
4.1 Dashboards
① 필터스위치 : 체크해제 하면 체크해제한 Severity를 리스트에서 제외한다. 체크하면 해당 Serverity를 리스트에 표기한다.
② 실시간 Alert 목록 : 현재 OPEN상태의 Alert 만 표기한다. (전체 알람에 대해 조회시 Alert Event List 메뉴 이용)
③ Refresh : ON 상태일경우, 1분마다 자동으로 Dashboard List를 refresh 한다. OFF일경우, refresh 하지 않으며, Refresh 글자를 클릭시 Dashboard List가 수동으로 새로고침된다.
Serverity : Alert 심각도 : Caution(주의), Warning(경고), No Data(데이터없음)로 표현
Event Date : Alert 발생 시간
Alert Rule : Alert을 발생시킨 Alert Rule명
Message : Alert 발생 내역
Alert Rule Set : Alert을 발생시킨 Alert Rule 이 포함된 Alert Rule Set. Alert Rule Set을 클릭하면 상세 내역으로 이동한다.
Alert Close : 실시간 Alert 목록에서 Alert 상황이 해제되어야 하나 해제되지 않은경우 사용자가 수동으로 해제할 수 있는 기능(단, 실제 Alert 상황이 유지되고 있는 상황에는 해제후 다시 Alert 이 발생할 수 있다.)
Name : Alert 발생 대상 명. 대상을 클릭하면 해당 대상에 대한 상세 정보 창으로 이동한다.
상세창에서는 실시간 Alert 목록에서 선택한 Alert이 default로 표기된다. (Aelrt Rule Set, Alert Rule 자동선택)
1)대상명 : 대상명과 Service 및 대상의 상태를 표기한다.
2)Alert Rule Set : 해당 대상이 매핑 되어있는 Alert Rule Set목록을 표기한다.
3)Alert Rule : 2)의 목록을 선택하면 선택한 Alert Rule Set의 Alert Rule 목록을 표기한다. Alert Rule 의 on/off로 Alert을 활성화/비활성화 시킬 수 있다.
4)3)의 Alert Rule을 선택후 Detail 버튼을 클릭하면 Alert Rule 상세페이지가 표기된다.
이 화면에서 열린 Alert Rule 상세페이지에선 수정 할 수 없다.
4.2 Alert Event List
① 조회조건
일자/시간 조회 : Created Time을 기준으로 조회한다. 입력 박스를 클릭하면 달력 및 시간 선택 박스가 표기된다.
ORG 조회 : 접속한 사용자가 관리/접속할 수 있는 ORG에 대해 모든 Alert Event List를 조회할 수 있다.
Alert 상태 조회 : Alert 의 OPEN / CLOSED 상태를 조회한다.
대상(Name)조회 : Search 버튼 옆 입력박스에 대상을 입력하여 조회힌다.
필터스위치 : 체크해제() 하면 체크해제한 Severity를 리스트에서 제외한다.() 체크하면 해당 Serverity를 리스트에 표기한다.
② 실시간 Alert 목록
Level : Alert 심각도 : Caution(주의), Warning(경고), No Data(데이터없음)로 표현
Created Time : Alert 발생 시간
Released Time : Alert Closed 시간
Name : Alert 발생 대상 명. 대상을 클릭하면 해당 대상에 대한 상세 정보 창으로 이동한다.
Alert Rule : Alert을 발생시킨 Alert Rule명
Message : Alert 발생 내역
Notification : 버튼 클릭시 발생한 Alert의 메세지 전송이력 확인할 수 있다.Alert Channel명 / Alert 상태 / 메세지 전송이력(Time-메세지 전송시각/Success-메세지전송 성공여부/Message - 메세지 실패시 실패내역)
Alert Rule Set : Alert을 발생시킨 Alert Rule 이 포함된 Alert Rule Set. Alert Rule Set을 클릭하면 상세 내역으로 이동한다.
4.3 Alert Config > Monitoring List
① Service 종류 : 선택시 해당 Service종류에 해당하는 대상에 대한 정보가 조회된다.
② 대상명(Name)을 입력하고 Search버튼을 클릭하여 조회한다.
③ 대상정보목록
Service : LINUX, WINDOWS, HTTP, PING
UPTIME : 대상의 UPTIME을 표기한다.
Status : 대상의 상태(RUNNING, STOP) 를 표기한다. STOP인경우 No Data Alert등이 지속적으로 발생할 수 있음으로 STOP버튼()을 클릭해 상태를 DISABLE로 변경할 수 있다. DISABLE로 변경된 대상 목록에 표기되지 않고, Alert 감시도 하지 않는다. DISABLE된 대상이 다시 RUNNING상태가 되면 자동으로 다시 목록에 표기되고 Alert 감시를 할 수 있다.
Last Monitored Time : Data가 수집된 마지막 시간 표시
Name : 대상명과 Alert 발생수를 확인 할 수 있다. 대상명을 클릭하면 대상 상세정보화면으로 이동한다.
1) 대상명 : 대상명과 Service 및 대상의 상태를 표기한다.
2) Alert Rule Set : 해당 대상이 매핑 되어있는 Alert Rule Set목록을 표기한다.
3) Alert Rule : 2)의 목록을 선택하면 선택한 Alert Rule Set의 Alert Rule 목록을 표기한다. Alert Rule 의 on/off로 Alert을 활성화/비활성화 시킬 수 있다.
4) 선택한 Alert Rule에 알림표시가 있는경우 Current Alert List 에 현재 발생중인 알람이 표기된다.
5) 3)의 Alert Rule을 선택후 Detail 버튼을 클릭하면 Alert Rule 상세페이지가 표기된다.
4.4 Alert Config > Alert Rule Set
Delete : Alert Rule Set 리스트의 check항목에 check하면 delete 버튼이 표시되고, 버튼을 클릭하면 check된 Alert rule set이 삭제 된다.
History : Alert Rule Set 리스트의 check항목에 check하면 history 버튼이 표시되고 버튼을 클릭하면 Alert rule set의 변경 이력을 확인할 수 있다.
Add : 신규 Alert Rule Set을 추가하는 화면으로 이동한다.
Alert Rule Set Name : Alert Rule Set 명
Notify Channel : Alert 이 발생할 경우 알람을 발생시킬 채널 선택(다중선택 가능)
Audit Channel : Alert Rule Set에 변경사항이 있을경우 Audit Channel 로 선택한 채널에 변경사항에대해 noti 알람을 발생시킨다. noti 알람을 발생하는 경우는 다음과 같다
- Alert Rule Set 추가 / 삭제 / 변경 및 on/off 조작시
- Alert Rule 추가 / 삭제 / 변경 및 on/off 조작시
- Alert Rule 의 monitoring 대상 추가 / 삭제 및 on/off, nodata 조작시
Alert Rule
Check : Alert Rule Set을 선택하면 Delete 버튼이 표기된다. Delete 버튼 클릭시 삭제된다.
Last Modified Time : Alert Rule Set 최종수정시간.
On/Off : Alert Rule Set을 통한 감시를 활성화/ 비활성화 할 수 있다.
Alert Rule Set : Alert Rule Set명과 발생 Alert Count를 표기한다. Alert Rule Set명을 클릭시 Alert Rule Set 상세 화면으로 이동한다.
1)Name : Alert Rule Set 명
2)Channel : 해당 Alert Rule Set의 Alert Rule에 의에 Alert 발생시 Alert 발송할 Channel정보 .
Channel 아래 마우스를 클릭하면 Select box가 표시된다. 해당 리스트에서 Channel을 선택하면 추가된다. (Channel 목록에 Channel을 추가 할 때는 Alert Channels 메뉴에서 한다.)
3)Monitoring List : Alert Rule 선택시 해당 Alert Rule이 적용된 대상에 대한 목록을 표시한다.
No data에대한 감시 및 임계치에 대한 감시에 대해 On/Off로 관리할 수 있다.
history항목의 버튼을 클릭시 해당 대상에 대한 No Data및On/Off 변경사항에 대해 이력을 확인할 수 있다.
4)Alert Rule : Alert Rule 목록을 선택 후 View 버튼 클릭시 상세내역 수정을, Delete버튼 클릭시 삭제를 진행할 수 있다. On/Off의 스위치를 이용하여 Alert을 활성화/비활성화 할 수 있다.History 버튼 클릭시 각 Alert Rule에 대한 변경 이력을 확인할 수 있다.Add버튼 클릭시 신규 Alert Rule을 추가할 수 있다.
Alert Rule을 추가 화면에서 Template선택하면 해당 Tamplate에 맞는 상세내용으로 Alert Rule을 추가할 수 있다.
Alert Rule Template : Alert Rule의 Measurment별로 구성된 Template를 선택할 수 있다. (단, 선택시 설정중이던 Alert Rule정보는 잃을 수 있음으로 수정중엔 변경하지 않도록 한다.)
Monitoring List: 해당 Alert Rule이 적용될 대상목록이 표기된다. Add버튼을 클릭하면 전체 대상목록 팝업이 뜨고 해당 팝업에서 선택하여 추가할 수 있다.
Metric : Alert Rule명을 입력한다. Alert Message 발송시 Title로 표기된다.
Rules : 임계치를 설정한다. Template별로 임계치 설정 항목이 변경된다.
※ 템플릿별 알람설정 방법 상세 안내 : https://support.cloudz.co.kr/ko/support/solutions/articles/42000071438