随笔分类 - 分布式
摘要:相关软件 1、kubeadm 安装步骤 1、禁用所有交换分区 /etc/fstab 可以用free命令查看禁用情况 2、关闭防火墙 3、禁用SELinux 安装网络插件flannel 报错 把自定义pki密钥拷到对应目录下。 在/etc/hosts文件中加上主机名映射。 添加node节点 新加的节点
阅读全文
摘要:Horovod是一个支持TensorFlow、Keras、PyTorch和Apache MXNet的分布式训练框架。Horovod的目标是让分布式深度学习更快更易用。 为啥不用原生的TensorFlow分布式训练? 1、代码改动多少? 2、比原生的分布式训练快多少? Horovod用的MPI比分布式
阅读全文
摘要:自定义资源(Custom Resource)是k8s API的扩展。资源是k8s API中的一个端点,存储某种类型的API对象的集合。例如,内置的pods资源包含pod对象的集合。(注:API这个词用的不是很易读)
阅读全文
摘要:Service是一个Pod集合的抽象,提供网络服务。 ClusterIP:默认的服务类型,基于集群内部IP提供服务,服务只能在集群内部访问。 NodePort:基于机器的网卡IP提供服务,可以从集群外部访问服务。从NodePort到ClusterIP的路由会自动创建。 用户空间代理模式(user s
阅读全文
摘要:部署(Deployment)控制器为Pod和ReplicaSet提供声明性更新。
阅读全文
摘要:副本集合(ReplicaSet)的作用是,在任何时刻,都维护一个Pod对象数目固定的副本集合,这些Pod对象都相同,通常用于保证可用性。 不过,k8s官方推荐使用更高层级的概念Deployment,而不是直接用ReplicaSet。 在旧版本中,叫ReplicationController Repl
阅读全文
摘要:kubernetes,简称k8s,是一个开源系统,用于管理跨多台机器的容器化应用,并且提供基础机制,用于部署、维护和扩展应用。 基本对象 Pod service volume namespace k8s的golang客户端:https://github.com/kubernetes/client-g
阅读全文
摘要:参考链接: http://docs.ceph.com/docs/mimic/cephfs/
阅读全文