liu_shaobo

导航

 

2023年8月9日

摘要: 1、观点差异 K8s专为管理长时间运行的流程而构建的 协调多个微服务,扩展、管理可用性,通常支持一个或多个web服务 云原生系统假设有"infinite"可用资源 优先级不是云编排的核心,体现在调度语义上,"Affinity"与"Anti-Affinity"设置不能转换为批处理工作流程 HPC系统假 阅读全文
posted @ 2023-08-09 09:45 liu_shaobo 阅读(2777) 评论(0) 推荐(0) 编辑
 

2023年4月16日

摘要: Slurm使用四个基本步骤来管理一个job/step的CPU资源: 步骤1:节点选择Slurm选择向作业或作业步骤分配CPU资源的节点集。节点选择受到许多控制CPU分配的配置和命令行选项的影响(下面的步骤2)。如果配置了SelectType=select/linear,则所选节点上的所有资源都将分配 阅读全文
posted @ 2023-04-16 21:54 liu_shaobo 阅读(496) 评论(0) 推荐(0) 编辑
 

2023年4月9日

摘要: Slurm在世界上许多最强大的计算机上提供工作负载管理。在2013年11月的Top500榜单上,排名前十的系统中有五个使用Slurm,包括排名第一的系统。仅这五个系统就包含超过570万个核心。下面列出了一些使用Slurm的系统: 天河二号由中国国防科技大学(NUDT)设计,拥有16000个节点,每个 阅读全文
posted @ 2023-04-09 17:04 liu_shaobo 阅读(100) 评论(0) 推荐(0) 编辑
 

2023年3月5日

摘要: sacct用于报告有关活动或已完成作业的作业或作业步的记账信息。 salloc用于实时为作业分配资源。通常用于分配资源和生成shell。然后使用shell执行srun命令来启动并行任务。 sattach用于将标准输入,输出和错误以及信号功能附加到当前正在运行的作业或作业步。可以多次附加到作业和从作业 阅读全文
posted @ 2023-03-05 18:35 liu_shaobo 阅读(344) 评论(0) 推荐(0) 编辑
 

2022年6月19日

摘要: 1. 确保时钟、用户和组(UID 和 GID)在集群中同步。 2. 安装MUNGE进行身份验证。确保集群中的所有节点都有相同的munge.key。在启动Slurm守护进程之前,请确保MUNGE守护进程munged已经启动。 3. 解压文件: tar --bzip -x -f slurm*tar.bz 阅读全文
posted @ 2022-06-19 10:21 liu_shaobo 阅读(588) 评论(0) 推荐(0) 编辑
 

2022年5月22日

摘要: PartitionName 分区名 Nodes 节点名 Default=YES 如果没有给作业指明分区,则会分配到默认分区,值时YES或NO。 MaxTime=60 作业运行的最大时间(分钟)限制,INFINITE为没有限制。 DefMemPerNode 每个节点默认分配的内存大小,单位MB,默认值 阅读全文
posted @ 2022-05-22 17:29 liu_shaobo 阅读(1661) 评论(0) 推荐(0) 编辑
 

2022年5月14日

摘要: 阅读全文
posted @ 2022-05-14 10:50 liu_shaobo 阅读(352) 评论(0) 推荐(0) 编辑
 

2022年5月2日

摘要: Slurm节点管理的配置在/etc/slurm.conf文件中指定,更改节点配置(例如添加节点、更改处理器数量等)需要重新启动slurmctld守护进程和slurmd守护进程。所有slurmd守护进程必须知道系统中的每个节点,才能转发消息以支持分层通信。注册到系统的节点的资源少于配置的资源(例如内存 阅读全文
posted @ 2022-05-02 09:51 liu_shaobo 阅读(2283) 评论(0) 推荐(0) 编辑
 

2022年4月30日

摘要: VMD是一种功能强大的分子动力学可视化软件,可使用3D显示图形,设置动画和分析大型生物分子系统。 备注:Linux下需要安装桌面<CentOS7.x安装桌面>; 1、下载VMD软件 # wget https://www.ks.uiuc.edu/Research/vmd/vmd-1.9.4/files 阅读全文
posted @ 2022-04-30 10:05 liu_shaobo 阅读(521) 评论(0) 推荐(0) 编辑
 

2022年3月19日

摘要: 1、OpenBLAS介绍OpenBLAS是一个基于GotoBLAS2 1.13 BSD版本的优化BLAS(基本线性代数子程序)库。由于GotoBLAS维护者Mr. Kazushige离开TACC,GotoBLAS不再维护,因此,张先轶博士创建了OpenBLAS项目。OpenBLAS和MKL性能不相上 阅读全文
posted @ 2022-03-19 14:45 liu_shaobo 阅读(1006) 评论(0) 推荐(0) 编辑