随笔分类 -  监控

基于VictoriaMetrics的prometheus 集群监控报警方案
摘要:VictoriaMetrics 是一个不错的prometheus 集群方案,同时也提供了比较全的周边工具,同时社区也很活跃,以下 是一个简单的集成,后续落地实施踩坑 参考方案图 主要是基于VictoriaMetrics提供的周边工具做的集成 参考说明 主要是各点的一些说明,详细的可以看相关资料 说明 阅读全文

posted @ 2020-05-13 16:01 荣锋亮 阅读(1862) 评论(0) 推荐(0) 编辑

VictoriaMetrics vmalert 重启状态的处理
摘要:默认vmalert 是不存储状态的,但是为了方便vmalert支持了一些配置 状态持久化 我们可以通过配置-remotewite 写报警状态到支持remote write 协议的存储(很多,VictoriaMetrics,一些adadter。。。) 状态恢复 我们可以通过-remoteread 配置 阅读全文

posted @ 2020-05-13 11:40 荣锋亮 阅读(477) 评论(0) 推荐(0) 编辑

karma prometheus alertmanager dashboard简单试用
摘要:官方提供了一个简单的all-in-one 的dockerfile 我们可以学习下karma,了解下karma的处理机制,同时在这个all-in-one 中 也还包含了kthxbye一个方便的报警确认进程,整个项目基于supervisord运行(当然这个也是大家基于all-in-one容器的一个套路) 阅读全文

posted @ 2020-05-13 11:37 荣锋亮 阅读(1192) 评论(0) 推荐(0) 编辑

kthxbye一种解决prometheus alertmanager 报警确认的守护进程
摘要:一些问题 当前,在Alertmanager中触发新警报时,有两种选择: 解决警报时,使其处于活动状态 使此警报静音一段时间 这在小型环境中效果很好,但可能会导致大型团队出现问题: 如果您将警报保持处于活动状态,则需要以某种方式传达您正在处理它的信息,否则团队中的其他人也可能会开始处理它,或者(更糟糕 阅读全文

posted @ 2020-05-13 10:50 荣锋亮 阅读(651) 评论(0) 推荐(0) 编辑

karma 一个不错的prometheus alertmanager dashboard
摘要:默认的alertmanager已经包含了ui,但是比较简单,karma是一个不错的alert dashboard,核心基于golang开发,ui 使用react编写 运行 参考命令 ALERTMANAGER_URI=https://alertmanager.example.com karma or 阅读全文

posted @ 2020-05-13 09:43 荣锋亮 阅读(937) 评论(0) 推荐(0) 编辑

VictoriaMetrics vmagent的一些介绍
摘要:以前有简单说明过vmagent,实际上vmagent可以替代我们做好多事情.以下是一个说明 vmagent的作用 主要目的是实现metrics 的收集然后存储到VictoriaMetrics以及prometheus兼容的存储系统(主要支持remote_write 协议即可,有好多实现) 同时一个好处 阅读全文

posted @ 2020-05-12 21:05 荣锋亮 阅读(2924) 评论(2) 推荐(0) 编辑

VictoriaMetrics vmalert 说明
摘要:vmalert 可以执行一系列给定的rule(基于metricsql),然后发送报警到Alertmanager 特性 集成VictoriaMetrics TSDB MetricsQL 表达式校验 prometheus 报警规则格式支持 集成Alertmanager 轻量级没有额外的依赖 使用 构建 阅读全文

posted @ 2020-05-12 20:20 荣锋亮 阅读(2091) 评论(0) 推荐(0) 编辑

VictoriaMetrics vmauth 说明
摘要:VictoriaMetrics 的auth 组件是为了增强安全的,基于golang 的httputil.ReverseProxy ,当前支持的模式比较简单(基于配置文件) 包含的命令 vmauth-20200511-085829-heads-cluster-0-g6c88e352 Usage of 阅读全文

posted @ 2020-05-12 20:00 荣锋亮 阅读(731) 评论(0) 推荐(0) 编辑

lightproxy 阿里巴巴开源的基于proxy 的web debug 工具
摘要:lightproxy 阿里巴巴开源的基于proxy 的web debug 工具 包含的特性 捕捉请求&&响应数据 实时主机绑定 远端url转发处理 接口以及页面mock 请求&&响应修改 说明 这个也是一个不错的类似charles以及Fiddler替换方案(跨平台) 参考资料 https://git 阅读全文

posted @ 2020-05-01 23:11 荣锋亮 阅读(1011) 评论(0) 推荐(0) 编辑

netdata 实时性能监控系统
摘要:netdata 是一个分布式,高性能的实时系统&&应用监控系统,同时生态也很不错 工作原理 参考生态 说明 从图上我们可以看出netdata基本可以大统一了,包含可监控的整个链路,是一个值得研究的工具 参考资料 https://github.com/netdata/netdata 阅读全文

posted @ 2020-04-28 19:50 荣锋亮 阅读(1289) 评论(0) 推荐(0) 编辑

victoriametrics 集群模式试用
摘要:已经设计过一个使用简单单机模式的,以下是一个关于集群模式的试用 环境准备 docker-compose 文件 version: "3" services: prometheus: image: prom/prometheus ports: - 9090:9090 volumes: - ./promd 阅读全文

posted @ 2020-04-28 14:46 荣锋亮 阅读(1323) 评论(4) 推荐(0) 编辑

victoriametrics 单机试用
摘要:以下是关于victoriametrics 单机的一个简单试用 环境准备 docker-compose 文件 version: "3" services: prometheus: image: prom/prometheus ports: - 9090:9090 volumes: - ./promda 阅读全文

posted @ 2020-04-28 14:21 荣锋亮 阅读(2108) 评论(0) 推荐(0) 编辑

Better Prometheus rate() Function with VictoriaMetrics
摘要:转自:https://www.percona.com/blog/2020/02/28/better-prometheus-rate-function-with-victoriametrics/ There are a lot of things I love about Prometheus; it 阅读全文

posted @ 2020-04-28 13:14 荣锋亮 阅读(285) 评论(0) 推荐(0) 编辑

几个不错的网站状态报告开源系统
摘要:Cachet https://github.com/CachetHQ/Cachet statusfy https://github.com/aceforth/statusfy checkup https://github.com/sourcegraph/checkup statping https: 阅读全文

posted @ 2020-04-28 11:52 荣锋亮 阅读(535) 评论(0) 推荐(0) 编辑

victoriametrics 集群架构
摘要:victoriametrics 支持基于模式,同时拆分出了三大组件,vminsert,vmselect,vmstorage 参考图 从这张图我们可以看到insert 以及select 都是无状态的,只有vmstorage,对于insert 以及select 的扩展很简单,主要是vmstorage 配 阅读全文

posted @ 2020-04-28 11:49 荣锋亮 阅读(3657) 评论(0) 推荐(0) 编辑

vmagent 方便的prometheus存储兼容的agent
摘要:vmagent 只是一个agent ,实现了prometheus 的remote_write 协议,同时强大的地方是支持influx ,opentsdb,graphite 。。。协议 基于此以及VictoriaMetrics可以灵活的扩展监控的处理 参考架构 说明 vmagent 的功能是很强大的, 阅读全文

posted @ 2020-04-28 11:48 荣锋亮 阅读(1528) 评论(0) 推荐(0) 编辑

使用promxy实现prometheus 的ha 以及api 聚合
摘要:promxy 是一个聚合proxy 可以用来实现prometheus 的ha 详细的相关介绍可以参考github 文档,是一个值得尝试的工具,同时VictoriaMetrics对于自己的一些短板 也推荐了此工具,以前也介绍过一个时序数据库cache proxy trickster也是值得试用的 参考 阅读全文

posted @ 2020-04-27 23:23 荣锋亮 阅读(2258) 评论(0) 推荐(0) 编辑

victoriametrics 快速高效&&可扩展的时序数据库
摘要:victoriametrics 是一个时序数据库,可以用来作为prometheus 的long-term 远端存储 特性 支持promtheus 查询api,同时实现了一个metricsql 查询语言 支持全局查询视图,好处多prometheus 实例写数据到victoriametrics,然后提供 阅读全文

posted @ 2020-04-27 23:15 荣锋亮 阅读(4830) 评论(0) 推荐(0) 编辑

statping web 状态监控服务
摘要:statping 是基于golang开发的一款很不错,而且支持快速配置以及不同报警模型的web监控工具,使用简单 而且还暴露的灵活的prometheus metrics很强大,以前介绍过一个vigil 的工具,与statping相比vigil就有点 差了,statping提供了灵活的监控配置界面,我 阅读全文

posted @ 2020-04-27 12:13 荣锋亮 阅读(875) 评论(0) 推荐(0) 编辑

prometheus 一些不错的exporter
摘要:statping 监控网站应用的(状态查看的),同时暴露了prometheus metrics 参考网站:https://github.com/statping/statping sql_exporter 灵活的sql exporter 参考网站:https://github.com/justwat 阅读全文

posted @ 2020-04-27 11:27 荣锋亮 阅读(2401) 评论(0) 推荐(1) 编辑

导航