工作随笔
1. lvs 相关
遇见一个集群,80 口 断断续续的, 时好时坏的,
经查询:发现,某一台lvs 设备上未转发,cache 访问都正常,但就是不做转发,在登陆界面上,总是报 当前目录下只读,分析原因是跟盘只读,导致转发测试失败,重启机器恢复。
2. dns 相关:
业务保障,某一台单机在某一段时间内,部分域名报解析失败,去机器上查询,首先,nginx 日志报 can not resolv host ,得出 dns 当时确实出问题了,查dns 进程监控日志,发现当时的dns 服务 没问题, 那就是当时的解析内容有问题,/var/named/anyhost 文件可能出错了,查detede 的linkdate 分析日志,发现 当时的探测文件大小为0 ,探测失败,未成功写入,导致 anyhost 文件内容不对,继续查询原因,定位到 原因是 detect 程序的bug: 具体为 cms3 下发会向 detect 配置文件写数据,同时 detect 进程从配置文件读数据,同时操作是,detect 程序崩溃,导致 探测内容为空。
question : 探测失败时,anyhost 里的内容是什么样的,明天测试下,通过把 磁盘空间写满,是 linkdata 写不进数据,然后查 anyhost 文件,以及此时的 dns 是怎么解析的 。
3. ghr 相关:
ghr 端口 9120 ,cache 会连 刷新内网的9120 ,如果刷新配错了,会导致访问ghr 失败,调度失败。
4 . docker 的 系统盘和数据盘的挂载的相关问题
18 日 查一下
5. /proc/net/dev 网卡流量数据文件,和ip a 看的一样
/proc/net/snmp 包含tcp 连接情况的文件
ulimit是linux shell的内键命令,它具有一套参数集,用于对 shell进程 及其 子进程 进行 资源限制。 文件方面的限制
sysctl 修改内核参数
临时修改
sysctl -w net.ipv4.ip_forward=1 # 开启IP转发
-w 或修改 /proc/sys/ 下的文件
永久修改
sysctl.conf配置文件