PBS 作业调度使用方法: 1. IBM HPC Platform 作业提交流程 用户需要使用集群资源进行作业计算时,需要使用作业调度系统。 IBM HPC Platform 集群采用的是开源的Torque+Maui 作业调度系统。 任何用户都需要产生Job_que.sh 任务作业脚本: >> genQue 当前文件夹下会产生一个Job_que.sh 的shell 作业脚本文件 编辑Job_que.sh 任务作业脚本: >> vi Job_que.sh 提交Job_que.sh 任务作业脚本: >> qsub Job_que.sh 注意:在Job_qu e.sh 中,所有任务的运行时间超过120 小时的情况下,job 作业将会被自动停止!如果有疑问和延长作业运行时间的需要请直接联系管理员。 具体的更多关于任务作业脚本的说明、使用和提交请参考 vi 和本章第 2 小节:Torqu e PBS 作业调度系统使用说明。 2. Torqu e PBS 作业调度系统使用说明 Torque PBS 提供对批处理作业和分散的计算节点(Compute nodes)的控制。 PBS 是Protable Batch System 的缩写,是一个任务管理系统。当多个用户使用同一个计算资源时,每个用户用PBS 脚本提交自己的任务,由 PBS 对这些任务进行管理和资源的分配。 matlab 作业的PBS 脚本说明: 将这个脚本保存成为Job_que.sh 后,使用然后qsub Job_que.sh 就将这个任务提交给了系统。最后可以通过查看我那件下面 log 文件查看程序运行结果。 #!/bin/sh #PBS -N JOB #PBS -l nodes=1:ppn=8 #PBS -l feature=xe #PBS -l naccesspolicy=singlejob #PBS -o RunJob.out #PBS -e RunJob.err #PBS -l walltime=120:00:00 #PBS -q batch echo --------- `date` ---------- echo HomeDirectory is $PWD echo echo Current Dir is $PBS_O_WORKDIR echo cd $PBS_O_WORKDIR echo "------------This is the node file -------------" cat $PBS_NODEFILE echo "-----------------------------------------------" cat $PBS_NODEFILE > host.mpd np=$(cat $PBS_NODEFILE | wc -l) echo The number of core is $np echo echo #-----------------------------------------------------# # OpenMPI Job Submitting Example # # # mpirun -np $np -machinefile host.mpd $BINPATH ... # # #-__--------------------------------------------------# # -__- have fun! # matlab –no...