随笔分类 -  线上故障运维分析

摘要:就在2020年的末尾,公司将一部分项目准备迁至腾讯云,30号部署了一批nginx服务器并已经运行。 今日项目开始放量,出于谨慎登录服务器看了下状态,惊讶发现nginx路径下涉及到nginx的文件全部丢失,只剩下空文件夹。 幸亏服务没有重启,原先的配置仍在内存中。 检查了很多的可能点,排除了人为的删除 阅读全文
posted @ 2021-01-05 23:10 Normanlin 阅读(708) 评论(0) 推荐(0)
摘要:近期有需求,从自建ECS数据库迁移至RDS,因担心有迁移失败的风险,选择了DTS双向同步做迁移。 正向同步:源同步数据至目标。 反向同步:目标同步至源。需在正向同步完成后配置,确保目标已经有源的所有数据,切换至目标后反向同步就可以把新数据迁移回源。 刚开始很正常,所有数据均同步至RDS直到将入口切换 阅读全文
posted @ 2020-11-30 17:33 Normanlin 阅读(856) 评论(0) 推荐(0)
摘要:上周在调整K8S中某域名其中一段PATH的ingress白名单问题时,由于对ingress的白名单策略理解不充分导致错误配置,使白名单应用到全域名中造成整个域名403。 特此花时间研究一下整个ingress相关的配置。 参考文档:https://github.com/kubernetes/ingre 阅读全文
posted @ 2020-11-15 17:07 Normanlin 阅读(2547) 评论(0) 推荐(0)
摘要:今日,有用户反映账号无法登录,研发发现现象为 经过排查,发现域名证书已过期,该域名绑定在SLB的扩展域名之中,非默认域名。 而一个月前阿里有该证书的预警,但预警的是另一条SLB(证书在默认域名中),于是当时我更换了这条SLB的证书。 经过分析,发现阿里云监控目前对于SLB扩展域名的证书并不会预警,导 阅读全文
posted @ 2020-09-30 14:46 Normanlin 阅读(247) 评论(0) 推荐(0)