对运维工作的思考
运维可以分为下几点,包括:
1. 实施部署
a. 建设背景
b. 建设目标
c. 解决方案
i. 逻辑架构
ii. 服务器配置
iii. 所需组件
iv. 网络策略
d. 实施计划表
i. 规划网络区域,申请硬件资源。
ii. 确定每台机器所需安装的组件,规划相关端口。
iii. 确定是否需要调用外部系统。
iv. 申请网络策略。
v. 根据实施进度内容指定开始和完成时间,确定相关责任人。
vi. 上线检查表【操作系统、应用】。
2. 日常巡检
a. 硬件【磁盘、内存、cpu、网络(tcp连接状态、最大打开的文件数等)】
b. 应用【健康值】
c. 业务【每个业务流程的健康值】
3. 版本发布
a. 升级前准备工作
i. 业务需求【系统干啥的】
ii. 业务逻辑图
iii. 网络拓扑图【写明IP、数据流】
iv. 环境清单
1) 服务器信息【所在安全域、配置、安装的组件、用户信息】
2) 中间件【所属应用、IP、版本、端口、安装路径、启动用户、启动命令、巡检点包括控制台、命令】
3) 数据库信息【IP、实例、字符集、版本、数据库用户】
4) 域名【域名、映射关系:IP,端口】
5) 监控工具中包含的监控项和需要手工巡检项
b. 升级前注意事项
c. 升级步骤
d. 如何确认是否升级成功
e. 验证
4. 解决系统在运行过程中产生的技术和业务问题
a. 熟练使用中间件
b. 熟悉数据流