重新认识运维

重新认识运维

背景

随着业务的发展,新技术的迭代,公司研发采用了微服务架构或是上云等等,这没有考虑运维成本和效率,带来运维极大的复杂性,让运维纯手工,苦不堪言,痛苦。从现象来看,运维和研发之间的矛盾更加严重。

这是现状,这也是趋势,作为运维自己应该主动改变,做新型架构下的运维(sre,devops)。

改变

  1. 第一是思维的改变,理解当前的困境,不是某一个人导致的。把目标放到业务效率,稳定,成本上。而不是以前单纯的上线工具人。这就是要有端到端思维,理解他人,利用自己能力,经验,工具,开发能力,团队协作,组织能力,文化氛围来解决矛盾。时刻都要想着:效率,稳定,成本。
  2. 第二是sre,现状的运维都叫sre,他源自Google,Netflix是最佳实践。叫站点稳定性工程师。利用软件工程的方法来解决稳定性(运维)问题。就是用开发软件,开源工具来提高稳定性和效率。这也需要技术架构和企业文化的支持,抛开这一切,光喊口号都是刷流氓。
  3. 第三是devops,其实devops和sre在运维看来,我认为是差不多,从表面上看,是解决运维和研发之间的矛盾。深层次讲:都是业务迅速发展下的技术变革,上云,微服务等等让运维复杂性大大增加,运维不得不解决问题,这才是运维转变的核心原因。
  4. 第四是理解研发,作为运维,你的改变更加迫在眉睫。但是实践运用会有非常大的阻碍,比如研发不理解,还是老套路等等,所以不要责怪研发只知道开发需求代码。你应该尝试主动沟通,分享你的看法,理性友好交流,互相促进,成就彼此。所以不要责怪研发只知道开发需求代码
  5. 第五要学习开发语言和了解更好的开源工具,比如jekins,cmdb,Python,各类中间件等。

持续学习,保持谦虚,敬畏技术,在技术的快速潮流之下,不进则退。前进,铭记初心,真理。才是唯一答案。

说说我自己

我从传统研发到现在,也在不停的转型中,说说我的改变。

  1. 在之前:负责应用上线,研发需要啥我就跟他搭建啥,数据库,中间件完全安装我的理解和认知来。没有稳定性和效率的概念,上线后,代码能跑起来就不在关心。其他时间写写脚本巡检服务器,做监控等等。这最大的问题就是重复,机械的工作,找不到工作的意义。

  2. 在之后:学习开发语言python,了解新的技术架构(docker,k8s,云,分布式架构)等待。加强owner意识,积极沟通。统一中间件数据库版本和部署架构,写脚本一键部署。规范应用上线流程,编写应用规范,部署标准,监控标准等待。编写部门wiki,部署cmdb,利用gitlab和jekins,ansible,监控等等工具。很多工作虽然还没有能力形成平台或服务。但是在效率上有非常大的提升。这其中没有组织能力来支撑推行起来非常难,坚持就是突破。

    核心还是放在:效率,稳定,成本上来。

posted @ 2022-01-10 10:07  penngke  阅读(70)  评论(0编辑  收藏  举报