上一页 1 2 3 4 5 6 7 ··· 18 下一页
摘要: 简介 Linux Cgroup 可​​​让​​​您​​​为​​​系​​​统​​​中​​​所​​​运​​​行​​​任​​​务​​​(进​​​程​​​)的​​​用​​​户​​​定​​​义​​​组​​​群​​​分​​​配​​​资​​​源​​​ — 比​​​如​​​ CPU 时​​​间​​​、​​​系​​​ 阅读全文
posted @ 2021-12-29 19:49 闫世成 阅读(74) 评论(1) 推荐(0) 编辑
摘要: NameSpace 命名空间/名称空间 Linux Namespace:是Linux提供的一种内核级别环境隔离的方法。 Linux Namespaces 机制提供了一种资源隔离方案。PID,IPC,Network等系统资源不再是全局性的,而是属于特定的Namespace。 每个Namespace里面 阅读全文
posted @ 2021-12-29 19:38 闫世成 阅读(326) 评论(0) 推荐(0) 编辑
摘要: 云原生 云原生技术是一套体系或者说是一套方法论。 云原生(Cloud Native)的概念,由来自Pivotal的MattStine于2013年首次提出,被一直延续使用至今。 这个概念是Matt Stine根据其多年的架构和咨询经验总结出来的一个思想集合,并得到了社区的不断完善,内容非常多,包括De 阅读全文
posted @ 2021-12-29 19:28 闫世成 阅读(457) 评论(0) 推荐(0) 编辑
摘要: 基于仓库安装 官网地址: http://nginx.org/en/linux_packages.html sudo apt install curl gnupg2 ca-certificates lsb-release ubuntu-keyring curl https://nginx.org/ke 阅读全文
posted @ 2021-11-30 21:27 闫世成 阅读(264) 评论(2) 推荐(1) 编辑
摘要: 准备工作 注册企业微信很简单也没有审核, 百度一下即可。 创建部门 创建部门需要记录部门ID 1. 选择通讯录,添加部门。 2. 查看部门ID 创建应用 1. 选择应用管理, 自建 -> 创建应用。 3. 查看 AgentID & Secret 4. 企业微信查看 Secret 查看企业ID 选择我 阅读全文
posted @ 2021-11-13 23:33 闫世成 阅读(551) 评论(0) 推荐(0) 编辑
摘要: 准备工作 通过 钉钉 进行告警,首先需要有一个钉钉群。和钉钉机器人。 进入钉钉群设置中的智能群助手 添加自定义机器人 安全设置选择加签 此处需要保存加签秘钥。 完成添加器人 此处需要保存 webhook 地址。 部署 prometheus-webhook-dingtalk Github上已经有人写好 阅读全文
posted @ 2021-11-13 19:00 闫世成 阅读(2583) 评论(0) 推荐(1) 编辑
摘要: 概述 Alertmanager 支持配置以创建集群以实现高可用性。这可以使用--cluster-*标志进行配置。 重要的是不要在 Prometheus 及其警报管理器之间负载平衡流量,而是将 Prometheus 指向所有警报管理器的列表。 Gossip算法简介 主要用在分布式数据库系统中各个副本节 阅读全文
posted @ 2021-11-13 18:24 闫世成 阅读(135) 评论(0) 推荐(0) 编辑
摘要: 概述 Alertmanager 的 route 配置支持定义 树 状路由表,入口位置称为根节点, 每个字节点可以基于匹配条件定义出一个独立的路由分支。 所有的告警都将从路由根节点,而后进行子节点遍历。 若路由上的 continue 字段为 false, 则遇到第一个匹配的路由分支后即停止匹配, 否则 阅读全文
posted @ 2021-11-13 18:12 闫世成 阅读(214) 评论(0) 推荐(0) 编辑
摘要: 准备工作 1. 准备163邮箱 2. 登录163邮箱 设置中开启 SMTP功能 3. 新增授权码,需要保存后面配置文件需要用到 alertmanage 配置 配置文件 global: #resolve_timeout: 5m smtp_smarthost: 'smtp.163.com:25' # 1 阅读全文
posted @ 2021-11-13 15:16 闫世成 阅读(2065) 评论(0) 推荐(2) 编辑
摘要: 分组 概述 分组将类似性质的警报分类为单个通知。当许多系统同时发生故障并且可能同时触发数百到数千个警报时,这在较大的中断期间尤其有用。 示例:当发生网络分区时,集群中正在运行数十个或数百个服务实例。您的一半服务实例无法再访问数据库。Prometheus 中的警报规则被配置为在每个服务实例无法与数据库 阅读全文
posted @ 2021-11-09 03:28 闫世成 阅读(1188) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 18 下一页