摘要: 前言 容器集群管理系统 Kubernetes(简称K8s),为容器化的应用提供部署运行、容器编排、负载均衡、服务发现和动态伸缩等一系列完整功能,Prometheus 对 K8s 支持非常棒,能够自动发现 K8s 的监控目标!Prometheus 产生的告警,可以通过 Alertmanager 转发到 阅读全文
posted @ 2020-07-05 21:20 lambda2019 阅读(164) 评论(0) 推荐(0)
摘要: 大促常态化的当下,平台总是会提前做各种排查测试,严阵以待,生怕出现高并发带来的,但往往还是防不胜防。事实上,在移动互联网盛行的当下,超高并发压力并不只存在于电商领域,在线教育、在线办公、社交娱乐等领域同样深受其扰。 在超高并发量下,IT系统如何才能挺住不崩?有没有办法可以提前预测到,并加筑好“防御堡 阅读全文
posted @ 2020-07-05 21:07 lambda2019 阅读(241) 评论(0) 推荐(0)
摘要: 众所周知Zabbix 是一款用来监控IT基础设施的监控套件,同时也具有很多方便运维人员使用的优秀功能,如:支持多条件告警,支持多种告警方式,支持多组模板、支持模板继承,因此在众多的开源运维监控软件中独占鳌头,受到了众多企业青睐。 暇瑜不掩,Zabbix在告警方式还是有一定局限性,如Email发送告警 阅读全文
posted @ 2020-06-21 16:20 lambda2019 阅读(584) 评论(0) 推荐(0)
摘要: Open-Falcon 是小米运维部开源的一款互联网企业级监控系统解决方案。其中有着如下的特点: ①强大灵活的数据采集:自动发现,支持falcon-agent、snmp、支持用户主动push、用户自定义插件支持、opentsdb data model like(timestamp、endpoint、 阅读全文
posted @ 2020-06-21 16:15 lambda2019 阅读(453) 评论(0) 推荐(0)
摘要: Cacti是一套基于PHP,MySQL,SNMP及RRD Tool开发的网络流量监测图形分析工具。Cacti提供了一个快速轮询器,高级图表模板,多种数据采集方法和用户管理功能。所有这一切都被包装在一个直观的,易于使用的界面中,这对于局域网以及成千上万个设备的复杂网络来说是有意义的。 但是为了不错过重 阅读全文
posted @ 2020-06-06 15:01 lambda2019 阅读(236) 评论(0) 推荐(0)
摘要: 睿象云智能告警平台CA中通知策略实现了被分派人接收告警的通知方式,确保告警发生/认领/关闭时,能以用户习惯的接收告警的方式,实时收到告警通知,同时,尽可能减少告警遗漏。 如果你想实现电话、短信、微信、邮件、APP,5种通知方式,您需要: • 个人信息中,填写正确的电话号码;点击右上角 个人中心可修改 阅读全文
posted @ 2020-06-06 14:54 lambda2019 阅读(223) 评论(0) 推荐(0)
摘要: 智能告警平台(Cloud Alert) CA,能快速接入各类告警信息,通过自动去重、规则压缩、算法降噪,实现告警降噪,帮助运维团队减少告警,避免告警风暴;同时通过分派、排班、通知等功能,快速实现告警流程化管理,帮助IT运维团队更快响应告警,恢复告警,提升告警管理能力。 CA提供多维度报表帮助您快速分 阅读全文
posted @ 2020-05-24 21:28 lambda2019 阅读(635) 评论(0) 推荐(0)
摘要: 当下运维人员的一大头疼事,便是复杂而凌乱的告警,无法将告警信息进行灵活分类,通知给不同的人,这样就加大了IT运维人员对告警信息的判断难度,进而无法快速的的定位到根因,也就无法快速的解决问题。 睿象云智能告警平台Cloud Alert(简称CA)快速接入各类事件,通过人工智能算法自动发现、诊断、修复I 阅读全文
posted @ 2020-05-20 22:44 lambda2019 阅读(302) 评论(0) 推荐(0)
摘要: 为何要压缩告警? 运维监控工具/平台,一般是通过配置固定阈值,达到阈值后自动触发/生成告警。如网络中断、闪断;系统升级更新;设备多监控内容多等情况下,更会产生海量告警。以下为告警管理常见问题: l 故障期间,告警风暴,手机/邮箱会被海量告警淹没; l 运维人员很难从海量告警从筛选出重要告警,容易忽略 阅读全文
posted @ 2020-05-10 19:21 lambda2019 阅读(395) 评论(0) 推荐(0)
摘要: 当下IT运维人员的一大问题,就是对于大量的告警难以进行精准的通知,以及无法在大批量的告警中快速的定位到问题的所在,再加上时不时出现的告警风暴,加大了告警处理的难度,这就需要一款完善的告警管理平台来针对告警的统一化管理。 睿象云智能告警平台Cloud Alert(简称CA)快速接入各类事件,通过人工智 阅读全文
posted @ 2020-05-02 22:13 lambda2019 阅读(252) 评论(0) 推荐(0)
Aiops Aiops博客