03 2021 档案
摘要:作者:詹雪娇,腾讯云容器产品经理,目前主要负责腾讯云集群运维中心的产品工作。 张鹏,腾讯云容器产品工程师,拥有多年云原生项目开发落地经验。目前主要负责腾讯云TKE集群和运维中心开发工作。 引言 降本增效从云计算发展至今一直都是企业上云最核心的关注点,无论是在线业务还是大数据、AI业务,都非常依赖算力
阅读全文
摘要:概述 Velero 是一个非常强大的开源工具,可以安全地备份和还原,执行灾难恢复以及迁移Kubernetes群集资源和持久卷,可以在 TKE 平台上使用 Velero 备份、还原和迁移集群资源,关于如何使用请参阅 使用对象存储 COS 作为 Velero 存储实现集群资源备份和还原 和 在 TKE
阅读全文
摘要:前言 架构转型,拥抱云原生服务生态 当前微信内部的大数据计算平台是基于自研的 Yard 资源调度系统来建设,Yard 的设计初衷除了提供在线服务资源隔离外,另一方面是为了提高在线服务机器的整体资源利用率,其核心策略是在机器空闲时能在上面跑一些大数据离线任务。但是对接业界各种大数据计算框架(例如 Ha
阅读全文
摘要:杜杨浩,腾讯云高级工程师,热衷于开源、容器和Kubernetes。目前主要从事镜像仓库、Kubernetes集群高可用&备份还原,以及边缘计算相关研发工作。 前言 SuperEdge分布式健康检查功能由边端的edge-health-daemon以及云端的edge-health-admission组成
阅读全文
摘要:前言 SuperEdge service group 利用 application-grid-wrapper 实现拓扑感知,完成了同一个 nodeunit 内服务的闭环访问 在深入分析 application-grid-wrapper 之前,这里先简单介绍一下社区 Kubernetes 原生支持的拓
阅读全文
摘要:引言 随着模型规模和数据量的不断增大,分布式训练已经成为了工业界主流的 AI 模型训练方式。基于 Kubernetes 的 Kubeflow 项目,能够很好地承载分布式训练的工作负载,业已成为了云原生 AI 领域的事实标准,在诸多企业内广泛落地。 尽管 Kubeflow 让基于 Kubernetes
阅读全文
摘要:
阅读全文
摘要:周成,腾讯云工程师,主要负责腾讯etcd监控平台设计、开发、运维工作,具备大规模Kubernetes和etcd集群运维开发经验。 唐聪,腾讯云资深工程师,极客时间专栏《etcd实战课》作者,etcd活跃贡献者, 主要负责腾讯云万级K8s集群和内部业务的公共etcd平台以及serverless产品研发
阅读全文
摘要:赵化冰,腾讯云高级工程师,Istio Member,ServiceMesher管理委员,Istio 项目贡献者, Aerika 项目创建者 ,热衷于开源、网络和云计算。目前主要从事服务网格的开源和研发工作。 唐阳,知乎基础架构工程师。Istio 项目贡献者,Argo 项目贡献者,专注于开源,云原生与
阅读全文
摘要:作者朱瑜坚,腾讯云后台开发工程师,熟悉 CNI 容器网络相关技术,负责腾讯云 TKE 的容器网络的构建和相关网络组件的开发维护工作,作为主力开发实现了 TKE 下一代容器网络方案。 1. 问题背景 1.1 问题描述 最近,某内部客户的 TKE VPC-CNI 模式的独立网卡集群上出现了 pod 间访
阅读全文
摘要:近日,腾讯云容器服务 TKE 荣获新加坡 MTCS 最高级安全认证,标志着腾讯云 TKE 在为用户提供可靠、易部署、灵活扩展等基础服务上,已经全面满足了新加坡监管机构以及多个行业客户对服务安全的要求。 科普一下: 可能很多人对新加坡 MTCS 认证还不熟悉,这里小编来给大家科普一下吧。😊 新加坡的
阅读全文
浙公网安备 33010602011771号