大数网 吴玉征
先说个真实的故事。
前一段时间,有一家知名的国际连锁咖啡公司的自助交易系统(支付宝、微信、ApplePAY)特别慢,工作人员也不知道为什么。由于他们刚上了业务运维,支持这套系统的云智慧后台管理人员通过数据一层层梳理,最后确定到某个区域的某个数据中心的某一块硬盘缓存溢满,导致交易变慢。找到并解决问题之后,该咖啡连锁店一下午挽回好几万笔的交易数。
为什么这么大量?因为一旦手机支付存在问题,大量用户排队使用POS机支付,耽误了时间也耽误了效率。这家公司在全国有近2000家门店,都在使用同一平台。尽管这家公司也在使用其他公司的运维管理平台,可对方并没有把这当做一回事;最要命的是,这家IT外包公司是国外的,正值夜晚,就算有了报警数据估计也没人注意到。
小小硬盘的缓存能引起大的事故,简直就是蝴蝶效应的现实版本。由此可见,一旦IT从传统的技术运维上升到业务运维,发挥的作用出乎意料,而这正是APM的未来所在。
要肯定传统APM的作用。无论是端到端的性能检测还是基于数据流程、系统流程的,都是属于IT自己的事情,和业务关系不大。APM的好处是,基于代码级别的,支持多平台和多语言,支持快速定位,具有全局的监控性能管理。如果这种技术以及思维方式扩大到更广泛的领域呢?
这就是如今的趋势,APM正在进入业务运维领域。这不是由厂商驱动的,而是业内趋势有关。这个趋势将改变APM产业格局,更会大大改变传统的业务运维。
前两天和云智慧的CEO殷晋先生、总裁刘洪涛先生交流之后,梳理出以下干货。
1. 企业的IT应用在发生变化,移动化、社交化对公司的商业模式、组织变革带来冲击,尤其是移动化。现在不少公司业务如销售线索发现、找到客户,完成支付和交易、甚至是数据的加工和汇总都在移动端完成。移动端的性能好坏直接影响到公司的核心业务,这是传统BPM无法解决的难题,上述是一个典型性的案例。
2. 需要转变APM的方向。APM的本意是应用性能监控,无论是提供代码级别的、跨平台的监控还是能迅速找到性能问题所在,都是IT的事情,和业务没有直接关系。这种IT和业务“两张皮”、自说自话的格局该转变了。比如说,代码写的不好,网络堵塞,APM能告诉我哪里出了问题,该如何解决。但它能告诉我,这种会影响到哪些业务,是供应链环节还是核心的交易系统,影响的程度如何?
3. 视角在发生转变。业务运维关注的是业务,是从用户的视角出发,关注点不同。这种业务的视角注定是解决业务问题,从数据的角度分析和关心业务的性能、关联度,促进交易,优化性能,提高用户留存率和活跃度,更好服务公司的主营业务。这种视角体现了IT的价值,更是IT与业务融合的具体表现形式,同时这种视角还具有全局性和逻辑性。
4. 业务运维有三个方面。分别是,IT支撑,这是APM的最擅长的领域,关注IT运维和IT基础设施监控,还要包括针对网络、应用端主动监控和应用性能管理;其次是业务系统,包括传统的ERP、交易系统、订单、支付系统、物流系统、供应链系统等,关注的是系统的稳定性,从数据的角度看业务的运营。最后是业务管理,关注的是企业内部人员、绩效问题的组织系统,包括业务流程、业务结果、业务效率和业务评价等;现在来说前两者都可以立刻实现,而业务管理部分还需要有相应的标准化体系建立。
5. 基于以上三个维度,可以构建三维立体模型,并根据业务指标与用户体验指标建立起基于业务质量的动态监控指标体系,形成相应的S-KPI、KQI,为业务运维提供科学的考评标准,这也是业务管理标准建立的基础。
6. 数据驱动的业务运维。这与市场主流的大数据分析公司的关注点不同。业务运维管理的核心是业务支撑系统的运行数据,自下而上把各个业务系统中的核心数据关联起来,再以自上而下的视角通过发现前端业务波动,找到造成问题的应用性能瓶颈,通过提高性能,为业务的高效运转做贡献。大数据厂商更注重用户数据的业务价值,关心各种数据的来源、转化率、流失率,强调的是运营层面的分析和优化结果,两者的应用范围不同、实现路径不同,方法论相似。
7. 业务运维已经进入应用阶段。这是企业发展的趋势,也是日后所有相关厂商的必争之地。云智慧最早开发出相关产品,并在多个领域有了成功案例,获得了先发优势。同时,在与传统企业客户的交流中,这种理念被客户广泛接受,云智慧再一次提早踏准了点。
8. 充分市场竞争环境下,体验是关键。云智慧通过在金融、商业、制造等竞争激烈行业近一年的客户交流和方案实施经验积累看到,从技术来说,业务运维管理和应用性能管理的原理相似,也没有太多难点和壁垒,几乎所有的APM厂商都能做。而客户更关心的是前端业务的“体验”,这是对业务产品关键影响的因素,也是业务运维的核心价值所在。
9. 需要行业共同努力。云智慧现在做的是在行业充当“布道师“,和用户探讨业务运维的转变方向、数据驱动的价值、业务的关注重点,以及和业务系统的融合。这个市场刚刚兴起,需要与企业CIO、经营层、管理层通过一系列普及概念和充分沟通,才能让业务运维切实发挥行业价值。
10. 单一功能的SaaS类产品价值在减少。APM的这种转变也是当前SaaS领域的发展趋势,只做单点应用、单一功能的工具类产品很难提升,企业客户需要切实解决某类业务问题的解决方案,而不仅仅是一个个IT工具。这是所有IT的核心价值所在,能为业务带来何种价值。只要有价值,就不会在经济形势不好的情况下被替换。
云智慧是业务运维解决方案服务商,旗下产品监控宝(www.jiankongbao.com)、透视宝(www.toushibao.com)、压测宝(www.yacebao.com),已累计为电商、移动互联网、广告传媒、在线游戏、教育医疗、金融证券、政企等行业的几十万用户提供了一站式的应用性能监控、管理及测试服务。