超级计算LSF作业调度系统(web界面集群管理)

简介:LSF机群作业管理系统是曙光公司自己的一套作业管理系统,采用B/S架构,直接在网页管理界面就可以管理整个作业和作业节点;

1 LSF常用作业管理命令:

作业提交bsub

查看自己运行的所有作业的情况bjobs

跟踪某任务屏幕输出bpeek

bkill 杀死某个作业

bqueues作业队列情况

bstop停止挂起作业

bresume 恢复挂起作业

lshost查看节点信息

bhosts查看所有节点作业信息

lshosts查看所有节点负载信息

busers 查看用户最大可用核心以及用户作业情况,比如busers  hubo.huang(hubo.huang是用户名)

 

作业脚本范例:

计算任务是通过脚本文件提交到作业管理系统的(也即是在pac管理平台提交,pac管理平台有作业脚本范例),脚本文件是一个可执行文件;

脚本参数说明:

1作业要使用的队列 2作业需要的核心数 3每节点分配给作业运行的核心数 

lsf一般有主节点,和从节点,防止作业管理单点故障;

 

posted @ 2016-07-19 15:50  王能武  阅读(3062)  评论(0编辑  收藏  举报