随笔分类 -  服务调优

压测,流量回放,服务瓶颈...
prometheus报错too many open files解决
摘要:背景: 公司用的prometheus突然有一天报too many open files错误,通过网上搜索及查看prometheus日志发现,prometheus的open files限制只有1024,太小了 但是系统的ulimit上限很大,因此需要解决prometheus上限只有1024的问题 解决 阅读全文

posted @ 2023-06-14 20:38 生活费 阅读(205) 评论(0) 推荐(0) 编辑

cpu占用超过一定值时及时dump jvm堆栈信息
摘要:背景:线上某个服务cpu偶发性报警,当上机器去查看时,可能已经恢复,抓不到现场,因此期望能够自动监控cpu,发现异常及时dump堆栈信息 方案:通过如下脚本临时搞一下 #!/bin/bash program="xxxxxx.jar" while((1)) do java_pid=$(ps aux|g 阅读全文

posted @ 2022-10-20 11:42 生活费 阅读(377) 评论(0) 推荐(0) 编辑

linux tcp相关参数
摘要:/etc/sysctl.conf文件 /etc/sysctl.conf是一个允许你改变正在运行中的Linux系统的接口。它包含一些TCP/IP堆栈和虚拟内存系统的高级选项,可用来控制Linux网络配置,由于/proc/sys/net目录内容的临时性,建议把TCPIP参数的修改添加到/etc/sysc 阅读全文

posted @ 2019-02-18 14:33 生活费 阅读(292) 评论(0) 推荐(0) 编辑

记一次性能优化,限制tcp_timewait数量,快速回收和重用
摘要:前言 这篇文章的主题是记录一次Python程序的性能优化,在优化的过程中遇到的问题,以及如何去解决的。为大家提供一个优化的思路,首先要声明的一点是,我的方式不是唯一的,大家在性能优化之路上遇到的问题都绝对不止一个解决方案。 如何优化 首先大家要明确的一点是,脱离需求谈优化都是耍流氓,所以有谁跟你说在 阅读全文

posted @ 2019-02-18 11:29 生活费 阅读(1891) 评论(1) 推荐(0) 编辑

记一次docker问题定位(perf,iostat等性能分析)
摘要:背景 最近参与的项目是基于 OpenStack 提供容器管理能力,丰富公司 IaaS 平台的能力。日常主要工作就是在开源的 novadocker 项目(开源社区已停止开发)基础上进行增强,与公司的其他业务组件进行对接等。 周末给下游部门的 IaaS 平台进行了一次升级,主要升级了底层操作系统,基本用 阅读全文

posted @ 2018-04-27 10:29 生活费 阅读(7907) 评论(5) 推荐(3) 编辑

使用tcpcopy导入线上流量进行功能和压力测试
摘要:假设我们要上线一个两年内不会宕机的先进架构。在上线前,免不了单元测试,功能测试,还有使用ab,webbench等等进行压力测试。 但这些步骤非生产环境下正式用户的行为。或许你会想到灰度上线,但毕竟可能会影响到部分用户,这怎么对得起我们两年内不宕机的承诺呢? 好在网易的 王斌 开发了tcpcopy, 阅读全文

posted @ 2018-03-13 12:14 生活费 阅读(606) 评论(0) 推荐(0) 编辑

导航