摘要:
这里结合自己负责的过保迁移项目、之前的生产经验,和处理过的一些case记录一下自己的一些思考。 首先3个前提 原则1: 牢记安全生产红线。安全生产红线的意义在于 提变更的时候更慎重的审视自己的变更方案,也可以让更多的人交叉review; 信息广播,有助于变更执行人评估是否有交叉影响的变更; 一旦出问 阅读全文
摘要:
系统模块 cpu 字段含义 user: 表示CPU执行用户进程的时间,通常期望用户空间CPU越高越好. sys: 表示CPU在内核运行时间,系统CPU占用率高,表明系统某部分存在瓶颈.通常值越低越好. wait: CPU在等待I/O操作完成所花费的时间.系统部应该花费大量时间来等待I/O操作,否则就 阅读全文
摘要:
tsar介绍 本文主要介绍如何利用tsar对线上linux服务器进行诊断,及其原理。 tsar是由淘宝核心系统部门研发并开源到github上,源码路径见 "alibaba/tsar" 。 为了支持rds运维,加入一些定制的功能,由于内核组以功能不普遍适用拒绝合并到主干,拉了一个分支到内网gitlb上 阅读全文
摘要:
Nginx如何处理一个连接 Nginx作为服务器 1 启动 首先,nginx在启动时,会解析配置文件,得到需要监听的端口与ip地址 然后,nginx的master进程里面,先初始化好这个监控的socket(创建socket 设置addrreuse等选项 绑定到指定的ip地址端口 在listen),然 阅读全文
摘要:
nginx常见的2个time 我们在通过 采集对nginx的数据进行采集时,发现tsar采集到的rt时间和nginx自身日志中打印的时间 对不上,这让我们在收到报警后很难快速的和nginx的日志对应起来,从而找到我们响应慢的api。于是对nginx的几个处理时间进行了分析,原来 包含了用户数据接收时 阅读全文
摘要:
nginx将一个HTTP请求分为11个处理阶段,这样做让每个HTTP模块可以仅仅专注于完成一个独立,简单的功能。而一个请求的完整处理过程可以由多个HTTP模块共同合作完成。可以极大的提高多个模块合作的协同性,可测试性,可扩展性。换言之,nginx在处理每一个http请求,和配置文件上的顺序没有关系。 阅读全文