超级计算LSF作业调度系统(web界面集群管理)
简介:LSF机群作业管理系统是曙光公司自己的一套作业管理系统,采用B/S架构,直接在网页管理界面就可以管理整个作业和作业节点;
1 LSF常用作业管理命令:
作业提交bsub
查看自己运行的所有作业的情况bjobs
跟踪某任务屏幕输出bpeek
bkill 杀死某个作业
bqueues作业队列情况
bstop停止挂起作业
bresume 恢复挂起作业
lshost查看节点信息
bhosts查看所有节点作业信息
lshosts查看所有节点负载信息
busers 查看用户最大可用核心以及用户作业情况,比如busers hubo.huang(hubo.huang是用户名)
作业脚本范例:
计算任务是通过脚本文件提交到作业管理系统的(也即是在pac管理平台提交,pac管理平台有作业脚本范例),脚本文件是一个可执行文件;
脚本参数说明:
1作业要使用的队列 2作业需要的核心数 3每节点分配给作业运行的核心数
lsf一般有主节点,和从节点,防止作业管理单点故障;
路漫漫其修远兮
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步