摘要: MLOps是一种机器学习工程文化,基于MLOps的机器学习系统需要具备持续集成 (CI)、持续交付 (CD) 、持续训练 (CT)等能力。 MLOps和DevOps区别?持续集成 (CI)在传统单元测试、集成测试上,还需要基于验证数据进行模型质量评估。持续交付 (CD)交付的不是一个软件或服务,而是 阅读全文
posted @ 2023-08-01 16:29 muzinan110 阅读(66) 评论(0) 推荐(0) 编辑
摘要: 传统容器网络性能损耗 加速一:智能网卡网络加速 SR-IOV 是一种 PCI-SIG 标准化方法,支持管理性PCI Express (PCIe) 原生硬件资源。单个 PCIe 物理设备 - 物理功能 (PF) - 多个单独 PCIe 虚拟设备 - 虚拟功能 (VF) ,所需的资源仲裁在设备中进行,不 阅读全文
posted @ 2023-08-01 15:09 muzinan110 阅读(111) 评论(0) 推荐(0) 编辑
摘要: Calico 搭配 Macvlan CNI 规划说明: 在此规划中默认 CNI 为 Calico/Cilium,需要配合安装 Multus-underlay、Spiderpool 等组件。 建议所有节点都具备多张物理网卡且网卡名称一致。 eth0 为主机默认路由所在网卡,网关指向 Gateway 主 阅读全文
posted @ 2023-08-01 14:55 muzinan110 阅读(142) 评论(0) 推荐(0) 编辑
摘要: 网络连通 以 Multus 为多网络平面,搭配 Overaly CNI ( 低内 Calico、高内核 Cilium)+ Underlay CNI( Spidernet、Macvlan、SRIOV),打造一套网络联通的网络生态。 网络服务暴露 公有云- 内外部 DNS- L4/L7 负载均衡及 TL 阅读全文
posted @ 2023-08-01 14:47 muzinan110 阅读(70) 评论(0) 推荐(0) 编辑
摘要: 同城灾备分为「冷备」和「热备」 冷备: 定期备份数据,不提供服务 热备: 实时同步数据,并做好随时切换的准备,不提供服务 同城双活:同城双活比同城灾备的优势在于,两个机房都可以接入「读写」流量,提高可用性的同时,还提升了系统性能。 异地双活:异地双活才是抵御「城市」级别灾害的更好方案,两个机房同时提 阅读全文
posted @ 2023-08-01 14:37 muzinan110 阅读(58) 评论(0) 推荐(0) 编辑
摘要: 多集群服务发现 : 使用ServiceExport和ServiceImport,实现跨集群的服务发现。 多集群网络支持 : 使用Submariner打通集群间容器网络。 使用 ErieCanal 实现跨集群的服务治理 与 ErieCanal 集成支持跨集群的服务治理。 阅读全文
posted @ 2023-08-01 14:33 muzinan110 阅读(41) 评论(0) 推荐(0) 编辑
摘要: 不同 调度策略 下的集群分发能力: ClusterAffinity:基于ClusterName、Label、Field的定向调度。 Toleration:基于Taint和Toleration的调度。 SpreadConstraint:基于集群拓扑的调度。 ReplicasScheduling:针对有 阅读全文
posted @ 2023-08-01 14:31 muzinan110 阅读(101) 评论(0) 推荐(0) 编辑
摘要: 用于设定策略的资源:PropagationPolicy,OverridePolicy。 执行策略相关的资源:ResourceBinding,ClusterResourceBinding, Work。 karmada 分发资源到成员集群流程如上图所示, 在 karmada 控制平面创建Resource 阅读全文
posted @ 2023-08-01 14:28 muzinan110 阅读(33) 评论(0) 推荐(0) 编辑
摘要: 此外,当前云原生体系下的多云多集群,和云计算体系下的概念认知存在相当大的理念沟壑,这也导致了在云原生领域多云相关技术演进的方向,实际上是一个复杂的系统工程。在云原生体系下,既有的多云多集群,都是围绕应用为中心的管理视角,这超越了云计算下的仅仅以资源分配为中心的管理视角。不能让应用无感知的进行多云多集 阅读全文
posted @ 2023-08-01 14:22 muzinan110 阅读(35) 评论(0) 推荐(0) 编辑