随笔分类 -  监控

1 2 下一页

prometheus报错too many open files解决
摘要:背景: 公司用的prometheus突然有一天报too many open files错误,通过网上搜索及查看prometheus日志发现,prometheus的open files限制只有1024,太小了 但是系统的ulimit上限很大,因此需要解决prometheus上限只有1024的问题 解决 阅读全文

posted @ 2023-06-14 20:38 生活费 阅读(206) 评论(0) 推荐(0) 编辑

CentOS6 基于 Python 安装 Sentry
摘要:概述Sentry 是一款可用于 Production 环境的错误跟踪工具,可实时通知 Production 环境中用户由于一些不可预料行为 (或者程序写的有问题) 导致程序 Crash 或 Exception,Sentry 可以通过 Integration 如 HipChat 来发送通知,并且可以通 阅读全文

posted @ 2023-05-17 14:16 生活费 阅读(108) 评论(0) 推荐(0) 编辑

python方式安装sentry
摘要:Sentry 简介 Sentry 是一个开源的实时错误报告工具,支持 web 前后端、移动应用以及游戏,支持 Python、OC、Java、Go、Node、Django、RoR 等主流编程语言和框架 ,还提供了 GitHub、Slack、Trello 等常见开发工具的集成。Sentry 服务支持多用 阅读全文

posted @ 2022-08-11 21:11 生活费 阅读(618) 评论(0) 推荐(0) 编辑

sentry配置openldap登录授权
摘要:废话不多说,直接上配置,将以下配置加到sentry.conf.py文件里,然后重启sentry web就行了 ######################################FOR LDAP AUTH############################################ 阅读全文

posted @ 2022-06-24 20:50 生活费 阅读(277) 评论(0) 推荐(0) 编辑

prometheus node-exporter 全部指标说明
摘要:Basic CPU / Mem / Disk Info Basic CPU / Mem / Disk Gauge Basic CPU / Mem Graph Basic Net / Disk Info CPU Memory Net Disk Memory Detail Meminfo /proc/m 阅读全文

posted @ 2022-06-16 21:25 生活费 阅读(4844) 评论(0) 推荐(2) 编辑

记一次性能优化,限制tcp_timewait数量,快速回收和重用
摘要:前言 这篇文章的主题是记录一次Python程序的性能优化,在优化的过程中遇到的问题,以及如何去解决的。为大家提供一个优化的思路,首先要声明的一点是,我的方式不是唯一的,大家在性能优化之路上遇到的问题都绝对不止一个解决方案。 如何优化 首先大家要明确的一点是,脱离需求谈优化都是耍流氓,所以有谁跟你说在 阅读全文

posted @ 2019-02-18 11:29 生活费 阅读(1891) 评论(1) 推荐(0) 编辑

ElasticSearch + xpack 使用
摘要:ElasticSearch 是一个高可用开源全文检索和分析组件。提供存储服务,搜索服务,大数据准实时分析等。一般用于提供一些提供复杂搜索的应。我们为什么要选择 ElasticSearch ?因为它是一个准实时的搜索工具,在一般情况下延时少于一秒,它还支持物理上的水平扩展,并拥有一套分布式协调的管理功 阅读全文

posted @ 2017-12-15 10:15 生活费 阅读(16363) 评论(0) 推荐(0) 编辑

88个 Linux 系统管理员必备的监控工具
摘要:随着互联网行业的不断发展,各种监控工具多得不可胜数。这里列出网上最全的监控工具。让你可以拥有超过80种方式来管理你的机器。在本文中,我们主要包括以下方面: 命令行工具 网络相关内容 系统相关的监控工具 日志监控工具 基础设施监控工具 命令行工具 网络相关内容 系统相关的监控工具 日志监控工具 基础设 阅读全文

posted @ 2017-09-19 20:34 生活费 阅读(758) 评论(0) 推荐(0) 编辑

Linux系统CPU的性能监控及调优
摘要:前言: 性能优化是一个老生常谈的话题,典型的性能问题如页面响应慢、接口超时,服务器负载高、并发数低,数据库频繁死锁等。尤其是在“糙快猛”的互联网开发模式大行其道的今天,随着系统访问量的日益增加和代码的臃肿,各种性能问题开始纷至沓来。 在系统层面能够影响应用性能的一般包括三个因素:CPU、内存和IO, 阅读全文

posted @ 2017-06-20 12:00 生活费 阅读(825) 评论(0) 推荐(0) 编辑

20大免费的网络监控和分析工具推荐
摘要:Google Analytics 网站分析工具十分重要,Google Analytics(分析)适用于复杂的分析。 Kissmetrics Kissmetrics提供两种产品:分析和互动,尽管你可能对分析最感兴趣,但其中的一些数据可以使用互动来解决。 Mixpanel 与Segment和Google 阅读全文

posted @ 2017-03-21 10:43 生活费 阅读(3414) 评论(0) 推荐(0) 编辑

linux工具大全
摘要:Linux Performance hi-res: observability + static + perf-tools/bcc (svg)slides: observabilityslides: static, benchmarking, tuning sar, perf-tools, bcc/ 阅读全文

posted @ 2017-02-10 15:50 生活费 阅读(569) 评论(0) 推荐(1) 编辑

Linux下高cpu占有率的调试方案
摘要:1.用top命令查看哪个进程占用CPU高 gateway网关进程14094占用CPU高达891%,这个数值是进程内各个线程占用CPU的累加值。 2.用top -H -p pid命令查看进程内各个线程占用的CPU百分比 #top -H -p 14094 top中可以看到有107个线程,但是下面9个线程 阅读全文

posted @ 2017-01-06 19:02 生活费 阅读(950) 评论(0) 推荐(0) 编辑

DISK 100% BUSY,谁造成的?
摘要:iostat等命令看到的是系统级的统计,如果要追查是哪个进程导致的I/O繁忙,应该怎么办? iostat等命令看到的是系统级的统计,比如下例中我们看到/dev/sdb很忙,如果要追查是哪个进程导致的I/O繁忙,应该怎么办? # iostat -xd...Device: rrqm/s wrqm/s r 阅读全文

posted @ 2016-11-17 16:18 生活费 阅读(620) 评论(0) 推荐(0) 编辑

如何用十条命令在一分钟内检查Linux服务器性能
摘要:如果你的Linux服务器突然负载暴增,报警短信快发爆你的手机,如何在最短时间内找出Linux性能问题所在?来看Netflix性能工程团队的这篇博文,看它们通过十条命令在一分钟内对机器性能问题进行诊断。 概述 通过执行以下命令,可以在1分钟内对系统资源使用情况有个大致的了解。 uptime dmesg 阅读全文

posted @ 2016-09-18 11:07 生活费 阅读(314) 评论(0) 推荐(0) 编辑

Hp && Dell服务器硬件监控
摘要:HP 安装HP工具: 1 查看控制器状态 raid卡型号等hpssacli ctrl all show status 2 查看硬盘类型、大小 raid级别、状态等等hpssacli ctrl all show config 3 查看所有控制器的详细信息hpssacli ctrl all show d 阅读全文

posted @ 2016-09-06 12:11 生活费 阅读(957) 评论(0) 推荐(0) 编辑

Linux 进程资源用量监控和按用户设置进程限制
摘要:每个 Linux 系统管理员都应该知道如何验证硬件、资源和主要进程的完整性和可用性。另外,基于每个用户设置资源限制也是其中一项必备技能。 在这篇文章中,我们会介绍一些能够确保系统硬件和软件正常工作的方法,这些方法能够避免潜在的会导致生产环境下线或钱财损失的问题发生。 报告 Linux 进程统计信息 阅读全文

posted @ 2016-09-06 12:05 生活费 阅读(3135) 评论(0) 推荐(0) 编辑

linux性能不好怎么办?对着清单撸一遍
摘要:性能不好怎么办?对着清单撸一遍 Brendan Gregg是Netflix的资深性能架构师,著名性能调优专家。著有《性能之巅:洞悉系统、企业与云计算》)一书,可以说是性能调优领域的集大成之作。 前不久,Brendan Gregg在SREcon16上分享了《Performance Checklists 阅读全文

posted @ 2016-07-25 12:51 生活费 阅读(882) 评论(0) 推荐(0) 编辑

linux下实现CPU使用率和内存使用率获取方法
摘要:想获取一下目标机运行时linux系统的硬件占用情况,写了这几个小程序,以后直接用了。 方法就是读取proc下的文件来获取了。 cpu使用率: /proc/stat ,内存使用情况: /proc/meminfo 看程序 : typedef struct PACKED //定义一个cpu occupy的 阅读全文

posted @ 2016-07-08 16:19 生活费 阅读(3067) 评论(0) 推荐(0) 编辑

Docker 监控的一点想法
摘要:目前项目内部署了docker,于是涉及到关于监控的事情,参考一些经典实例以及一些自己的想法,总结一下思路。 1、关于监控的内容 监控宿主机本身 监控宿主机本身还是比较简单的,同其他服务器监控类似,对cpu、network、io、disk等做通用的检查,这里不再细说。 额外的,因为是docker的宿主 阅读全文

posted @ 2016-06-15 11:45 生活费 阅读(344) 评论(0) 推荐(0) 编辑

Linux网络流量监控与分析工具Ntopng
摘要:Ntopng工具 Ntopng是一个功能强大的流量监控、端口监控、服务监控管理系统 能够实现高效地监控多台服务器网络 Ntopng是一个功能强大的流量监控、端口监控、服务监控管理系统 能够实现高效地监控多台服务器网络 Ntopng功能介绍 Ntop提供了命令行界面和web界面两种工作方式,通过web 阅读全文

posted @ 2016-06-08 11:38 生活费 阅读(2871) 评论(0) 推荐(0) 编辑

1 2 下一页

导航