摘要:
参考文档 Named processes stacked | Grafana Labs Named processes | Grafana Labs ncabatoff/process-exporter:Prometheus 导出器,用于挖掘 /proc 以报告所选进程 (github.com) 操 阅读全文
摘要:
背景 中午吃完饭回来,刚要准备午休,同事告诉我说现在某个区域的服务出现了故障,Redis无法连接。 Redis我们是部署的哨兵模式,一主两从,哨兵分别部署在另外三台节点,也就是说我们的Redis哨兵一共用了6台机器。 登录服务器查看为什么Redis无法连接,发现Redis只是没有启动而已。怪了,谁会 阅读全文
摘要:
背景 为避免再次出现因Prometheus宕机导致业务无法查看历史数据受到影响,准备将Prometheus架构从单节点方式升级为高可用集群方式并将后端存储由本地存储改为远端分布式时序数据库存储。分布式时序数据库采用国产数据库TDengine。 架构 解释:虚线代表Prometheus master节 阅读全文
摘要:
背景 Prometheus是业内有名的开源监控工具,我所在的公司也是采用Prometheus+Grafana方式构建监控系统,并且不只是监控运维层面的数据,业务层面的服务状态也通过Java代码的客户端micrometer向Prometheus提交数据并在Grafana上配置出图,方便运营和技术同学进 阅读全文
摘要:
目录简介DOCTYPE声明基础骨架html标签head标签body标签title标签meta标签标题标签段落、换行、水平线段落换行水平线图片图片路径超文本链接超链接属性超链接表现文本有序列表type属性有序列表嵌套无序列表type属性无序列表嵌套常见应用场景导航效果表格表格属性单元格合并Form表单 阅读全文
摘要:
背景介绍 根据运营反馈线上环境监控图表Response Time出现了波动,由于我之前处理过类似的情况,上次是由于Redis占用大量内存没有释放的问题导致的,所以这次我也从内存着手进行分析问题的原因。 (虽然最后确定导致此问题的原因是Java代码中的问题,但对于cache内容被那些进程所占用的,仍然 阅读全文
摘要:
背景介绍 公司同事反馈测试环境某台机器ssh登录特别慢,我接到此需求后对该机器上的ssh问题进行处理并对测试环境所有机器进行依次验证ssh速度。 参考文档 SSH调试模式 SSH登录很慢正常情况 欢迎信息 解决思路 按照ssh调优的步骤检查UseDNS和GSSAPIAuthentication 如果 阅读全文
摘要:
背景介绍 在ubuntu20.04中使用apt安装软件时会出现报错dpkg/ error processing package install-info (--configure)/ installed install-info package post-installation script su 阅读全文
摘要:
背景介绍 近期看到的一道面试题,要求使用Suse系统。由于我之前没有接触过Suse系统,记录下如何配置IP地址。(环境是VMware Fusion虚拟机) 参考文档 SuSE 12 SP5配置静态IP地址 - 魔幻小生 - 博客园 (cnblogs.com) 具体步骤 查看系统版本 linux-nv 阅读全文
摘要:
背景介绍 近期研发同学反馈业务响应波动厉害,怀疑是Redis操作key比较慢的缘故。由于该环境是我一手安装部署的,我将进行问题排查。 Redis环境以及业务环境都已经使用Prometheus进行了监控。 环境说明 我们有两套一样的环境来服务不同的客户,另外一套环境中业务一直平稳运行,Redis并没有 阅读全文