分类 监控方案 中的文章

从kubectl top看K8S监控原理

一. 前言 kubectl top 可以很方便地查看node、pod的实时资源使用情况:如CPU、内存。这篇文章会介绍其数据链路和实现原理,同时借kubectl top 阐述 k8s 中的监控体系,窥一斑而知全豹。最后会解释常见的一些问题: kubectl top 为什么会报错? kubectl top node 怎么计算,和节点上直接 top 有什么区别? kubectl top pod 怎么计算,包含……

阅读全文

高可用prometheus:thanos 实践

背景 在prometheus 使用心得文章中有简单提到prometheus 的高可用方案,尝试了联邦、remote write 之后,我们最终选择了 thanos 作为监控配套组件,利用其全局视图来管理我们的多地域、200+集群的监控数据。本文主要介绍 thanos 的一些组件使用和心得体会。 prometheus官方的高可用……

阅读全文

高可用prometheus:常见问题

监控系统的历史悠久,是一个很成熟的方向,而Prometheus作为新生代的开源监控系统,慢慢成为了云原生体系的事实标准,也证明了其设计很受欢迎。本文主要分享在prometheus实践中遇到的一些问题和思考 几点原则 监控是基础设施,目的是为了解决问题,不要只朝着大而全去做,尤其是不必……

阅读全文

监控方案汇总

概述 随着越来越多的线上服务docker化,对容器的监控、报警变得越来越重要,容器监控有多种形态,有些是开源的(如promethues),而另一些则是商业性质的(如Weave),有些是集成在云厂商一键部署的(Rancher、谷歌云),有些是手动配置的,可谓百花齐放。 本文将对现有的容……

阅读全文