上一页 1 ··· 13 14 15 16 17 18 19 20 21 ··· 23 下一页
摘要: 概述 继上一篇 Thanos 部署与实践 发布半年多之后,随着技术的发展,本系列又迎来了一次更新。本文将介绍如何结合 Kvass 与 Thanos,来更好的实现大规模容器集群场景下的监控。 有 Thanos 不够吗 ? 有同学可能会问,Thanos 不就是为了解决 Prometheus 的分布式问题 阅读全文
posted @ 2020-12-08 09:35 腾讯云原生 阅读(1190) 评论(0) 推荐(0) 编辑
摘要: 概述 下面几个问题,相信广大 K8s 用户在日常集群运维中都曾经遇到过: 集群中的某个应用被删除了,谁干的? Apiserver 的负载突然变高,大量访问失败,集群中到底发生了什么? 集群节点 NotReady,是什么原因导致的? 集群的节点发生了自动扩容,是什么触发的?什么时间触发的? 以前,排查 阅读全文
posted @ 2020-12-07 15:56 腾讯云原生 阅读(1608) 评论(0) 推荐(0) 编辑
摘要: 在 TKE 上利用 HPA 实现业务的弹性伸缩 概述 Kubernetes Pod 水平自动扩缩(Horizontal Pod Autoscaler,以下简称 HPA)可以基于 CPU 利用率、内存利用率和其他自定义的度量指标自动扩缩 Pod 的副本数量,以使得工作负载服务的整体度量水平与用户所设定 阅读全文
posted @ 2020-12-03 10:50 腾讯云原生 阅读(646) 评论(0) 推荐(0) 编辑
摘要: 1 方案介绍 大数据处理技术现今已广泛应用于各个行业,为业务解决海量存储和海量分析的需求。但数据量的爆发式增长,对数据处理能力提出了更大的挑战,同时对时效性也提出了更高的要求。实时分析已成为企业大数据分析中最关键的术语,这意味企业可将所有数据用于大数据实时分析,实现在数据接受同时即刻为企业生成分析报 阅读全文
posted @ 2020-12-01 17:45 腾讯云原生 阅读(1566) 评论(0) 推荐(0) 编辑
摘要: 概述 不久前,我们在文章《如何扩展单个Prometheus实现近万Kubernetes集群监控?》中详细介绍了TKE团队大规模Kubernetes联邦监控系统Kvass的演进过程,其中介绍了针对规模较大的集群,我们是如何通过修改Prometheus代码来实现横向扩缩容的。经过方案上的改进,Kvass 阅读全文
posted @ 2020-11-25 11:36 腾讯云原生 阅读(1057) 评论(0) 推荐(0) 编辑
摘要: 概述 不久前,我们在文章《如何扩展单个Prometheus实现近万Kubernetes集群监控?》中详细介绍了TKE团队大规模Kubernetes联邦监控系统Kvass的演进过程,其中介绍了针对规模较大的集群,我们是如何通过修改Prometheus代码来实现横向扩缩容的。经过方案上的改进,Kvass 阅读全文
posted @ 2020-11-25 11:36 腾讯云原生 阅读(649) 评论(0) 推荐(0) 编辑
摘要: 随着容器技术的发展成熟,越来越多的组件迁移到容器,在技术迁移过程中,数据库,游戏,AI 这些组件对容器网络性能(时延,吞吐,稳定性)提出了更高的要求。为了得到更优的时延和吞吐表现,各大云厂商都在致力于缩短节点内容器的网络访问链路,让数据包能尽可能快地转发到容器网卡。 腾讯云容器服务 TKE 借助智能 阅读全文
posted @ 2020-11-19 10:36 腾讯云原生 阅读(1141) 评论(0) 推荐(0) 编辑
摘要: 你对Docker, K8s,微服务,边缘容器等等各种云原生技术感兴趣吗? 你想和更多同行分享你对云原生技术的独特见解吗? 快来参与腾讯云原生有奖征文活动吧!Cherry机械键盘,Airpodspro等你拿! 腾讯云原生面向广大云原生技术爱好者推出征文计划,凡符合活动规则并通过征选的文稿,将会被发布在 阅读全文
posted @ 2020-11-12 21:14 腾讯云原生 阅读(422) 评论(0) 推荐(0) 编辑
摘要: 容器的底层实现深度依赖于内核的众多特性,如 overlay 文件系统,namespace, cgroup 等,因此内核的功能和稳定性,在很大程度上,决定了整个容器PaaS平台的功能和稳定性。从 TKE 上线三年多以来,上万集群,数十万个节点的运营经验来看,内核问题约占所有节点问题的三分之一。 那么容 阅读全文
posted @ 2020-11-12 10:54 腾讯云原生 阅读(1234) 评论(0) 推荐(0) 编辑
摘要: 概述 有时候,集群资源莫名被删除或修改,有可能是人为误操作,也有可能是某个应用的 bug 或恶意程序调用 apiserver 接口导致,需要找出 "真凶"。这时候,我们需要为集群开启审计,记录 apiserver 的接口调用,然后根据条件检索和分析审计日志来找到原因。 关于 TKE 的集群审计简介与 阅读全文
posted @ 2020-11-09 18:03 腾讯云原生 阅读(451) 评论(0) 推荐(0) 编辑
上一页 1 ··· 13 14 15 16 17 18 19 20 21 ··· 23 下一页