下载后可任意编辑LSF 作业管理系统使用方法这份文档将指导您通过 LSF 提交和管理作业。文档包含了使用 LSF 提交、查看、删除作业的相关内容。遵循文档的操作法律规范和反馈方法,将帮助您顺利完成工作。也欢迎大家对文档内容提出建议,谢谢!Contents [hide] 1 通过 LSF 查看集群运行状态 o1.1 查看 LSF 计算节点列表 bhosts o1.2 查看 LSF 队列 bqueues o1.3 查看计算节点负载 lsload 2 使用 LSF 提交作业 bsub o2.1 手动提交作业 o2.2 交互式批量提交 o2.3 编写 LSF 作业控制脚本 o2.4 一个功能更完整的 LSF 作业控制脚本 3 其他作业管理操作 o3.1 查看作业状态 bjobs o3.2 终止作业 bkill o3.3 监视作业输出 bpeek o3.4 作业历史信息 bhist 4 参考资料 通过 LSF 查看集群运行状态查看 LSF 计算节点列表 bhosts# bhostsHOST_NAME STATUS JL/U MAX NJOBS RUN SSUSP USUSP RSVfat01 ok - 16 0 0 0 0 0fat02 ok - 16 0 0 0 0 0fat03 ok - 16 0 0 0 0 0下载后可任意编辑fat04 ok - 16 0 0 0 0 0fat05 ok - 16 0 0 0 0 0fat06 ok - 16 0 0 0 0 0fat07 ok - 16 0 0 0 0 0fat08 ok - 16 0 0 0 0 0fat09 ok - 16 0 0 0 0 0fat10 ok - 16 0 0 0 0 0......查看 LSF 队列 bqueues查看所有队列的整体信息:# bqueuesQUEUE_NAME PRIO STATUS MAX JL/U JL/P JL/H NJOBS PEND RUN SUSPcpu 40 Open:Active - - - - 2072 0 2072 0fat 40 Open:Active - - - - 0 0 0 0gpu 40 Open:Active - - - - 288 0 288 0mic 40 Open:Active - - - - 0 0 0 0cpu-fat 40 Open:Active - - - - 16 0 16 0查看某个队列的信息:# bqueues fatQUEUE_NAME PRIO STATUS MAX JL/U JL/P JL/H NJOBS PEND RUN SUSPfat 40 Open:Active - - - - 0 0 0 0下载后可任意编辑查看计算节点负载 lsload查看整体负载:# lsloadHOST_NAME status r15s r1m r15m ut pg ls it tmp swp memnode011 ok 0.0 0.3 0.4 0% 0.0 0 49024 193G 62G 61Gnode039 ok 0.0 0.6 0.5 0% 0.0 0 49024 194G 62G 61Gnode041 ok 0.0 0.0 0.0 0% 0.0 0 49024 194G 62G 61Gnode050 ok 0.0 0.0 0.0 0% 0.0 0...