摘要: 超算上一些重要角色节点: node100 node101 (lsf作业调度系统节点,和PAC网站页面管理) node108 node105 (NIS服务主从节点) node166 (parastor并行存储 MGR节点) 备份策略:备份可以通过定时计划任务 /etc/crontab 来进行备份,备份 阅读全文
posted @ 2016-07-19 18:51 王能武 阅读(475) 评论(0) 推荐(0) 编辑
摘要: 基础点: CST DC MC主控节点配置文件:/etc/xdg/CST AG/CST DC Main Control2013.conf CST DC SS求解器节点配置文件:/etc/xdg/CST AG/CST DC Solver Control2013.conf MC进程:lsb-cst-mai 阅读全文
posted @ 2016-07-19 16:52 王能武 阅读(1133) 评论(0) 推荐(0) 编辑
摘要: 简介:LSF机群作业管理系统是曙光公司自己的一套作业管理系统,采用B/S架构,直接在网页管理界面就可以管理整个作业和作业节点; 1 LSF常用作业管理命令: 作业提交bsub 查看自己运行的所有作业的情况bjobs 跟踪某任务屏幕输出bpeek bkill 杀死某个作业 bqueues作业队列情况 阅读全文
posted @ 2016-07-19 15:50 王能武 阅读(3023) 评论(0) 推荐(0) 编辑
摘要: 1 内存泄漏的原因:应用程序在占用内存后,退出时没有及时的放出内存,导致没有放出的这块内存不能被其他程序使用,从而出现内存变小,泄漏问题;终究原因其实就是程序没有写好。 2 内存泄漏的判断:可以通过shell脚本检测出节点的内存大小,并比对节点已安装的内存大小,如果小于节点原始内存大小,则表示内存出 阅读全文
posted @ 2016-07-19 13:33 王能武 阅读(669) 评论(0) 推荐(0) 编辑