摘要:
根据专业评测机构 downdetector.com 统计,2018年,Facebook 系统全年宕机 200 次,Youtube 宕机 140 次,Google 宕机 100 次。每次宕机损失至少 100 万美元。 应用频繁宕机,客户数字体验糟透,还要赚钱?恐怕先得赔上一大笔! 数字时代,一切依赖应 阅读全文
摘要:
企业应用由单体应用系统向分布式系统的发展趋势已经不可逆转。十年前 “SOA” 大频率的出现在软件系统招标技术架构要求书中,相信用不了多久“微服务架构”也会被频繁提及——分布式系统将成为主流。 01 为什么分布式系统会“火”? 因为业务应用随着自身功能的复杂化、应用间更频繁的相互调用以及用户数的不断增 阅读全文
摘要:
日志是整个银行 IT 信息系统中非常重要的信息和数据,它对信息安全整个过程中关键记录信息的监控统计,特别针对安全事故分析、追踪起到了关键性作用。 随着网络规模的迅速扩大,加上各类应用系统逐步增多,运维人员工作量往往会成倍增加,使得关键信息得不到重点关注。 大量事实表明,对于安全事件发生或关键数据遭到 阅读全文
摘要:
3月3日凌晨,阿里云出现宕机故障,受宕机故障影响,华北不少互联网公司 APP、网站纷纷瘫痪,一大波程序员、运营和运维不得不从被窝里爬起来干活。网友“上海蓝盟网络夏立成”调侃,“阿里云一年一宕机,今年特别早”。 然而日常生产、生活对应用依赖程度逐渐增加导致宕机频率和成本都在升高,人工运维投入产出却在下 阅读全文
摘要:
连续举办了11届的中国软件生态大会和中国软件渠道大会,2019年全面升级为中国数字智能生态大会(CDEC)。 3月21日,主题为“共筑数字生态共同体”的 CDEC 2019 暨第十二届中国软件渠道大会首站在北京中关村软件园国际会议中心成功举办。 本次大会由中国软件行业协会、中关村发展集团、中国软件网 阅读全文
摘要:
近年来,各商业银行业务规模迅速增长,作为底层的技术支撑,生产系统的集群规模也越来越大,运维难度也逐步增加。 1 银行应用运维现状 经过大量调研发现大部分商业银行尽管已实现了各业务系统软硬件方面的全网监控,也实现了统一运维管理,但还是处于被动运维管理模式,对信息系统的健康程度了解不够深入,也不能快速排 阅读全文
摘要:
数字时代监控运维系统数据量暴增,指标、日志、代码堆栈、网络数据包等等时间序列数据从每天几百兆采集量膨胀到每天上百GB,上TB。由于故障总是偶发,而监控数据在故障发生回朔时才更有价值。 如何利用这些低价值密度的海量数据呢? 传统监控系统要么只是针对指标、日志等单一类型数据提供分析能力,要么只针对网络、 阅读全文
摘要:
应用性能是企业制胜关键,任何一秒的业务中断或应用性能下降都将减少业务收入、给客户留下糟糕的用户体验。对于今天更加依赖互联网来实现、提升自身价值的企业来说,应用可用性、用户体验和响应时间等性能指标从未如此重要。 2009 年,微软在必应搜索引擎上开展实验,发现当服务响应时间增加到 2 秒时,每个用户带 阅读全文