一、监控基础知识
监控系统俗称「第三只眼」,几乎是我们每天都会打交道的系统,下面 4 项基础知识是必须要了解的。
1、监控系统的7大作用正所谓「无监控,不运维」,监控系统的地位不言而喻。不管你是监控系统的开发者还是使用者,首先肯定要清楚:监控系统的目标是什么,它能发挥什么作用?
- 实时采集监控数据:包括硬件、操作系统、中间件、应用程序等各个维度的数据。
- 实时反馈监控状态:通过对采集的数据进行多维度统计和可视化展示,能实时体现监控对象的状态是正常还是异常。
- **预知故障和告警:**能够提前预知故障风险,并及时发出告警信息。
- **辅助定位故障:**提供故障发生时的各项指标数据,辅助故障分析和定位。
- **辅助性能调优:**为性能调优提供数据支持,比如慢SQL,接口响应时间等。
- **辅助容量量规划:**为服务器、中间件以及应用集群的容量规划提供数据支撑。
- **辅助自动化运维:**为自动扩容或者根据配置的SLA进行服务降级等智能运维提供数据支撑。
出任何线上事故,先不说其他方有问题,监控部分一定是有问题的。
听着很甩锅的一句话,仔细思考好像有一定道理。我们在事故复盘时,通常会思考这3个和监控有关的问题:有没有做监控?监控是否及时?监控信息是否有助于快速定位问题?
可见光有