liu_shaobo

导航

 
  • sacct用于报告有关活动或已完成作业的作业或作业步的记账信息。

  • salloc用于实时为作业分配资源。通常用于分配资源和生成shell。然后使用shell执行srun命令来启动并行任务。

  • sattach用于将标准输入,输出和错误以及信号功能附加到当前正在运行的作业或作业步。可以多次附加到作业和从作业中分离。

  • sbatch用于提交作业脚本,以便以后执行。该脚本通常包含一个或多个用于启动并行任务的srun命令。

  • sbcast用于将文件从本地磁盘传输到分配给作业运行节点的本地磁盘。可以用来有效地使用无磁盘的计算节点,或者相对于共享文件系统提供更好的性能。

  • scancel用于取消待处理或正在运行的作业或作业步。还可用于向与正在运行的作业或作业步相关联的所有进程发送任意信号。

  • scontrol用于查看和/或修改Slurm状态的管理工具。注意:许多 scontrol 命令只能以root用户身份执行。

  • sinfo报告由Slurm管理的分区和节点的状态。有各种过滤,排序和格式选项。

  • sprio用于显示影响作业优先级的组件的详细视图。

  • squeue报告作业或作业步的状态,具有多种过滤、排序和格式化选项。默认情况下,按优先顺序报告正在运行的作业,然后按优先顺序报告待处理的作业。

  • srun用于实时提交作业或启动作业步。srun有多种选项来指定资源要求,包括:最小和最大节点数,处理器数,要使用或不使用的特定节点,以及特定节点特征(内存、磁盘空间、某些必需的特性等)。一个作业可以包含多个作业步,这些作业步在作业节点分配中的独立或共享资源上顺序或并行执行。

  • sshare显示集群上公平份额使用的详细信息。注意,这仅在使用priority/multifactor插件时才可行。

  • sstat用于获取有关正在运行的作业或作业步所使用的资源的信息。

  • strigger用于设置,获取或查看事件触发器。事件触发器包括节点关闭或作业接近其时间限制等事件。

  • sview是一个图形用户界面,用于获取和更新Slurm管理的作业,分区和节点的状态信息。

  • smap报告由Slurm管理的作业,分区和节点的状态信息,但以图形方式显示反映网络拓扑的信息。

posted on 2023-03-05 18:35  liu_shaobo  阅读(338)  评论(0编辑  收藏  举报