- 讓維運不再盲目。Prometheus 專為現代分散式架構設計,透過多維度的數據模型與強大的查詢語言,能精準捕捉伺服器、容器及應用程式的各類指標。無論是容量預警還是故障排查,Prometheus 都能提供最直觀的即時數據支持。
- 多維度數據模型: 使用指標名稱(Metric Name)與鍵值對(Labels)定義數據,提供極其靈活的數據分類與切片能力。
- 強大的 PromQL 查詢語言: 專為時序數據設計的查詢語法,能輕鬆完成聚合、數學運算以及趨勢預測,產生有價值的分析結果。
- 獨特的拉取式(Pull)架構: 透過 HTTP 協議主動從被監控目標拉取數據,簡化了客戶端的配置,並能更容易地偵測目標是否存活。
- 服務發現自動化: 深度整合 Kubernetes、Consul、AWS EC2 等環境,當新服務啟動時,Prometheus 能自動將其納入監控範圍。
- 高效能時序儲存: 針對大規模監控指標進行優化,單台伺服器即可處理每秒數十萬筆樣本數據,且儲存格式極度緊湊。
主要功能、特點
介紹: Prometheus 是一款畢業於 CNCF 的開源監控系統。它不依賴分散式儲存,每個伺服器節點都是自治的,這使其在系統發生局部故障時依然能可靠運作。
服務: 提供指標採集、時序資料儲存、強大的報警規則(Alertmanager)整合、以及豐富的 Exporters 生態系(如 Node Exporter, SQL Exporter),是現代化運維觀測(Observability)的核心。
指令
# A metric with label filtering
go_gc_duration_seconds{instance="localhost:9090", job="alertmanager"}
# Aggregation operators
sum by (app, proc) (
instance_memory_limit_bytes - instance_memory_usage_bytes
) / 1024 / 1024


