fbpx

GCP 使用 Log Viewer 監控GCE發生HostError時主動發出通知

為了避免機房搬遷的時候企業服務中斷造成營業損失,架構師手把手教學如何使用 Log Viewer 監控 GCE。

預計流程

1. 建立 Create Log-based Metrics

2. 建立 Monitoring 告警聯繫人

3. 測試使用指令是否會觸發告警

實作步驟

1. 建立 Create Log-based Metrics

  Step.1 點擊 Logging → Logs-based Metrics 

  

  Step.2 點擊 Create Metric

  

 

  Step.3 設定監控條件

   resource.type=”gce_instance”

(jsonPayload.event_subtype=”compute.instances.migrateOnHostMaintenance” OR  jsonPayload.event_subtype=”compute.instances.hostError”)  

 Step.4 確認Metrics 是否建立成功,並且使用此 Metric 建立 Monitoring


 

2. 建立 Monitoring 告警聯繫人

   Step.1 建立Monitoring → Alerting 告警,完成後點擊 Save

   

   Step.2 選擇現有的Notified告警聯繫人,如要建立新的Notified告警聯繫人,可參考這篇的步驟3 Step.5 

   

  Step.3 接著輸入Alert的名稱,完成設定後點擊 Save

  

3. 測試使用指令是否會觸發告警

  Step.1 使用指令方式測試 Alarm 結果

    • 指令 – gcloud compute instances simulate-maintenance-event fortest1 –zone us-central1-a
    • 對象 – 我的環境 VM Name : fortest1 Zone: us-central1-a
    • 教學文件 – https://cloud.google.com/compute/docs/instances/setting-instance-scheduling-options#testingpolicies