亿级用户百TB级数据的AIOps 技术实践之路
关于面临的挑战
"因为专业性强,我认为反而让交互方式变简单了,打个点餐的比方,软件1.0阶段是,我要吃鱼香肉丝,我要吃辣的或是素一点的,根据清晰的接口上菜。而软件2.0阶段就是,我今天想吃开心一点的,然后菜就上来了。学件的提出,说明 AIOps 给大家带来的已经不再是枯燥的接口,而是变成很友好的用户交互来解决业务场景。"
现在的输入和之前不一样,之前是输入的是明确的内容,你来替我做行为;现在是输入的是目的,系统来做策略以及执行;后者更加宏观。
关于数据价值
"业务系统情况做到一目了然。"
除了有分析数据,还要有分析结果。怎么做到一目了然,首先要明确都有哪些业务,然后明白业务支撑的系统都有哪些,这些系统底层的操作系统级别的情况怎样,你说我们现在连每天多少数据量,每天多少访问量,ES的QoS是多少,这些运营数据都没有怎么来玩,怎么来搞?所以需要梳理出来一套。
关于数据平台
直接上图,说明了大数据的处理的基本模式,这套模式其实不只是AIOps,大数据相关的一套流程都是如此,此时,关于数据仓库,数据集市的概念也很明白说出来了。
作者对于Durid数据库花了很多笔墨,这项技术还是有价值去研究一下的。
关于数据智能
异常检测
1.Z-score算法
2.Boxplot算法
指标异常检测算法
1.时间序列分解算法
2.多工况检测算法
参考:
https://blog.csdn.net/Mes8Y62b6ogV207/article/details/80193083#t5