监控指标

4个黄金指标:

  • 延迟:服务请求所需时间。 记录用户所有请求所需的时间,重点是要区分成功请求的延迟时间和失败请求的延迟时间
  • 通讯量:监控当前系统的流量,用于衡量服务的容量需求。
  • 错误:监控当前系统所有发生的错误请求,衡量当前系统错误发生的速率
  • 饱和度:衡量当前服务的饱和度。主要强调最能影响服务状态的受限制的资源

RED方法

RED方法是Weave Cloud在基于Google的“4个黄金指标”的原则下结合Prometheus以及Kubernetes容器实践,细化和总结的方法论,特别适合于云原生应用以及微服务架构应用的监控和度量。主要关注以下三种关键指标:

  • (请求)速率:服务每秒接收的请求数。
  • (请求)错误:每秒失败的请求数。
  • (请求)耗时:每个请求的耗时。