摘要:
进程间通信MPI MPI(Message Passing Interface), 消息传递接口,通常用于并行计算场景中多进程间通信。以一个计算节点为例,节点中有8张GPU卡,通常一张卡上有一个训练任务进程,8张卡就会涉及到8个进程,此时训练时,进程间的通信就会变的极其重要。这种多进程通信,也被称为集 阅读全文
摘要:
k8s基础机制 无状态pod的特性 顾名思义,pod无状态即pod不保留任何状态,没有持久化存储,可以进行快速扩展,通过增加更多的pod副本来处理负载。任何一个pod失败,都不会导致数据的丢失。 有状态pod的特性 数据库都是有状态,因为其需要持久化数据。有状态pod,保留了状态,所以pod丢失并不 阅读全文