nCompass-解决方案介绍
单击返回:自学N-Compass之路
nCompass-解决方案介绍
1. IT运维的现状及痛点
业务部门投诉系统不可用,各个部门盘查: 网络是通的;系统资源正常;应用进程状态都是正常的;数据库日志中也没有报错
- 运维被动: 80%的故障都是用户先发现反馈给服务台后,运维人员才知道
- 架构复杂:系统架构变得越来越复杂,问题多,责任界定及排障困难。
- 说不清:系统不可用,各部门,服务商都说不是自己的问题。
- 价值难以体现:不出故障觉得运维没用,出了故障觉得运维更没用
2. 运维的发展历程
3. 智能架构(Dev Ops 及 AI Ops对平台要求较高)
- 数据接入(流量、日志、三方数据)-----多源数据统一接入、关联分析、统一呈现
- 多源数据整合(1000W/S处理能力)-----1000万/秒的高速处理效率
- 规则库-----可编辑的分析规则,可针对不同类型的数据进行统计分析
- 机器学习/算法(智能基线/警报 、隐患排查/预警、智能分析/定位、 评估报告/建议)----- AI算法的支持,异常检测,多维主因素分析,预测分析,根因定位
- 动态大屏/场景模块------可灵活编辑的前端动态Dashboard,基于用户架构快速实现数据可视化
- 平台协调------可给予脚本实现多平台的行为联动,AIOps落地
4. 业务可视化平台搭建的5个步骤
- 业务梳理:真正了解你的业务系统状态(业务之间调用关系,网络节点/应用节点,端到端监控展示形式)
- 业务可视:全方位、多维度的进行业务可视化(针对网络的,针对系统的,互联网出口,专线链路,端口流量,可用性等),nCompass通过内置可视化70多种显示控件。
a. 可视化,看得见,才能管理
b. 运维价值体现
c. 重大事件保障(促销监控保障) - 智能监控:建立基于机器学习算法的主动式监控体系(解决经常误报,经常少报,不够灵活,不够全面,不够预测)
a. 基于机器学习技术,可实现指标的告警基线自动生成,当指标明显偏离正常运行区间时,可主动发出告警;
b. 基于异常检测技术,对告警事件进行精细化处理,规避误报、漏报的现象。 - 知识图谱:基于AI算法驱动的数据智能分析, 内置智能根因定位的主要算法:
a. 基线偏离算法:基于指标的历史数据,预测未来数据的区间(上基线,下基线)用于智能告警场景。
b. 异常检测:检测数据序列中的离群点,用于异常检测/告警场景。使用非监督学习/监督学习结合的算法综合判断异常情况,内置行业海量数据的预测训练模式;
c. 根因定位算法:使用NEO4J构建分析对象关系图,提取待分析节点的相关节点机路径,结合知识库进行相关性分析,综合推导异常根因。用于告警或事件分析场景。
d. 多维主因素算法:深度分析数据变化的维度组成情况,并给出变化贡献度评分,用于变化或问题的主要因素定位。
e. 预测算法:基于历史数据预测未来的数据走势,反映出数据的周期性、趋势、波动等特性。用于容量规划、异常预测等场景。根据具体场景的的准确性及性能要求,选择使用LSYM或ARIMA实现算法。
异常时会收到告警邮件,会通知您“告警对象”“告警内同”“智能分析”“分析建议”“分析报告等”。
nCompass内置的知识图谱或称故障场景有, 业务突发/ 性能下降/ 可用性异常/变更比对分析/业务路径自动梳理/隐患排查。 也可自定义场景。
实时监控 → 基线告警 → 智能分析 → 根因定位 → 报告推送 - 平台联动:多平台的联动从而实现故障自愈
5. nCompass与传统网络监控分析方法对比
作者:CARLOS_CHIANG
出处:http://www.cnblogs.com/yaoyaojcy/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文链接。
posted on 2020-02-25 17:04 CARLOS_KONG 阅读(2878) 评论(0) 编辑 收藏 举报