阅读笔记(十三)
2015年年底,美团与大众点评宣布合并,合并后新美大的年活跃用户量达到1.7亿,高速增长的业务压力和巨额交易量的背后,是美团云提供的技术支持,让其保持着平稳运营。
云的核心技术一定是由规模驱动的,大规模的电商在这方面有更深的积累。因为电商的特点除了流量大,其流量峰值波动也非常大,比如一些特殊的节日,用户访问量的峰值就会很高,所以电商在资源的弹性调度方面有更多的经验。2012年,美团始逐步创建自己的私有云平台,2013年5月正式对外推出公有云服务。2015年更是扩建了新的数据中心,并推出了更多的组件服务。
美团拥有的大数据相关实施经验,使得美团云能够对外提供更有针对性的大数据融合解决方案。
美团云在虚拟化、运维等方面积累了相当多的技术经验。同时,美团云对外输出的不仅是底层IaaS的云服务,更有大数据解决方案。因此,美团做云是一件水到渠成的事,美团云希望成为美团网技术积累对外输出的窗口,为更多的创业者、中小企业包括正在进行”互联网+”的传统企业提供基础设施云服务,解决大家在技术方面的后顾之忧,而能够专心业务发展。
美团网早期架构是从私有云做起的。目标是,资源云化和快速交付。值得一提的是,美团云从一开始就没有完全选用OpenStack,而是决定自研云平台。原因在于当时OpenStack并不成熟,只有个别组件比如glance、keystone是合适的,所以在虚拟化、网络层,美团云进行了自主研发。
现在看来,这样做是对的。因为OpenStack偏向私有云,如果当初完全基于OpenStack,现在做公有云将比较困难。但美团云选择自研云平台,结合自身业务,所以现如今能够平稳地支撑着所有业务。
四个纬度上的性能释放
首先,从物理链路来看,性能方面,美团云实现了万兆互联;其次,在核心上实现了双机冗余,不会因为某个物理环节问题,导致网络不能启动;第三,采用了TOR交换机堆叠,双40G上联,随着日后网络流量的增加,可以再扩展。此外,在网线的选择上,美团云还采用了10G Base-T的电口万兆网络,这个技术比较新,很多交换机厂商都还没有这样的设备。但是它的成本较低,运维起来也会更方便。另外,在机房建设的过程中,美团云还使用了一些目前业界领先的技术,比如核心机柜封闭冷通道、预端接,对成本的节省都是百万级的。
“以最小代价解决最大问题”
当网关不是瓶颈的时候,流量就能够自由通到主机上,所以接下来就是通过主机网络释放性能。美团云最早使用的OVS V1.1版本,在千兆网络下可行,但万兆网络下性能远远不够。升级到V2.3后平台后,Megaflow对高并发情况下性能有数量级的提升,创建能够满足要求。
未来,运维自动化的程度会进一步提高。通过openflow或者netconf等通信手段提取到控制器上,进一步整理和分析后,能够形成可视化的网络路径图,实现更高效的网络运维管理。
文章部分转载:
美团云的网络架构演进之路