k8s云集群混搭模式,可能帮你节省50%以上的服务成本

现在大部分中小企业或团队都是使用云平台来部署自己的服务,如阿里云,亚马逊云等。一般来说,业务的负载都具备一定的规律,比如每天集中在某几个小时,或呈现时间段周期性波峰、波谷交替的现象,如下图

如果使用ECS来部署服务,则可能大部分时间ECS的资源没有得到充分利用,造成成本浪费,尤其对于像GPU之类成本较高的资源就更加了。这个时候,我们可以考虑使用云集群的混搭模式来节约成本。

 

业务场景

假设有一个这样的业务场景,包括如下特点及要求:

  1. 整个系统包括业务服务与两层视觉服务

  2. 各层服务之间调用需做负载均衡

  3. 每天的业务量主要集中在上午几个小时

  4. 平时业务量较低时仍要保证服务可用

  5. 尽可能降低成本,尤其是GPU服务器成本(GPU贵啊)

 

 

k8s云集群混搭模式

现在各大云平台都已经提供容器云服务,如阿里云有基于ECI(弹性容器实例)的Serverless Kubernetes集群服务,基于ECS节点不需要提供master的Kubernetes托管版集群服务,及自己提供master的Kubernetes专有版集群服务等。为了迎合类似上述业务场景的需求,也提供了Kubernetes + virtual node(虚拟节点)的混合集群服务,如下图所示

其中的虚拟节点基于ECI支持多种功能,如GPU容器实例、大规格容器实例等,增强了Kubernetes集群的弹性,使集群不局限于ECS节点的资源,做到弹性无限扩容。

 

部署方案

结合前面的业务场景,我们可以采用k8s的混合集群服务来部署我们的项目,如下图

 

实现步骤:

  1. 创建Kubernetes托管版集群

  2. 加入已有ECS节点

  3. 添加一个虚拟节点,通过添加应用 ack-virtual-node 来实现

  4. 分别创建无状态的业务Deployment、AI-1 Deployment、AI-2 Deployment(对应三层服务)

  5. 分别在业务Deployment上创建公网SLB,AI-1 Deployment、AI-2 Deployment上创建内网SLB

  6. 分别在各Deployment上根据CPU或内存使用阈值配置弹性水平伸缩HPA

  7. 根据需要可以在某个或某些Deployment上配置定时伸缩,通过添加应用 ack-kubernetes-cronhpa-controller 来实现
     

因为水平伸缩一般需要一定时间,延迟可能会对业务造成影响,所以在业务负载比较规律的时候,可以通过定时伸缩(就是定时扩展到多少个容器,再定时收缩到多少个容器)来改善;目前定时伸缩配置的查看与更新只能通过kubectl命令行进行。

总结

  按照官方文档的计费方式,一个普通的2核8G的ECS一年大概费用是2600左右,如果通过容器服务的方式(按秒计费),假设每天起8小时,则一年大概费用1550左右,如果业务负载再集中到几个小时,费用会更低,对于比较稀缺又昂贵的GPU服务就更加了。但是如果服务全部按容器24小时租赁,其成本就又比ECS贵了(一年约4600),所以在平时业务负载较低的时候,可以将容器调度到ECS上保障服务的提供,业务负载高时,通过HPA或cronHPA的方式动态伸缩到虚拟节点上。对于业务负载具有一定规律的服务来说,采用这种混搭的部署方式将极大地降低你的云服务成本。不过目前k8s云集群服务应该推出时间不久,产品的易用性还比较低,对不具备一定容器与编排基础的人使用门槛相对较高。

 

欢迎关注我的微信公众号:jboost-ksxy (一个不只有实战干货的技术公众号,及时获取更新内容)
———————————————————————————————————————————————————————————————
微信公众号

posted @   【雨歌】  阅读(1443)  评论(0编辑  收藏  举报
编辑推荐:
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
阅读排行:
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器
· DeepSeek如何颠覆传统软件测试?测试工程师会被淘汰吗?
点击右上角即可分享
微信分享提示