运维工作感悟 - 迁
个人感悟
排错:
运维工作与开发、测试最大的不同就是每天有各种排错需要应对。以前单纯的认为排错能力会随着经验、技术增长,现在发现貌似这个增长曲线并不是线性的。排错能力跟个人的习惯、思考方式息息相关,良好的习惯和思考方式会成长进步的很快(最近被几个年轻的小伙秒的不轻:(),在他们身上我发现了自己不足:
- 仔细仔细再仔细。比如dhcp没去掉引起两个网卡;是不是哪里拼错了?;线上操作的时候没想周全;一直在自己电脑上做网络测试,就不能换个其他虚拟机试试?
- 持续顺藤摸瓜找原因。 比如光看到文档上描述的,--root-dir参数貌似和我的一样啊,可是就是没去服务器上看,也没去试
- 多看官方文档。 查问题不能百度或者google一下就完事了,要多在官方文档上找,而不是简单找一片处理
体系:
-
值班运维
运维服务台:7*24 小时运维值班,告警处理 -
应用运维
服务部署、项目上线、线上业务部署更新,版本管理、灰度发布 -
DBA
负责管理所有数据系统:数据库、分布式缓存等存储系统 -
安全运维
负责整体的安全规范、漏洞检测、安全防护 -
系统运维
运维平台建设:环境规划、运维研发、构架设计、配置管理 -
基础运维
基础设施建设:网络、IDC 托管、私有云、基础服务