| |||
uSLURM (Simple Linux Utility for Resource Management)
sacct: 查看历史作业信息
scancel : 取消作业
sinfo: 查看节点与分区状态
squeue: 查看队列状态
srun: 执行作业
uSLURM环境变量
变量 | 说明 |
---|---|
SLURM_NPROCS | 要加载的进程数 |
SLURM_TASKS_PER_NODE | 每节点要加载的任务数 |
SLURM_JOB_ID | 作业的 JobID |
SLURM_SUBMIT_DIR | 提交作业时的工作目录 |
SLURM_JOB_NODELIST | 作业分配的节点列表 |
SLURM_JOB_cpuS_PER_NODE | 每个节点上分配给作业的 CPU 数 |
SLURM_JOB_NUM_NODES | 作业分配的节点数 |
HOSTNAME | 对于批处理作业,此变量被设置为批处理脚本所执行节点的节点名 |
uSLURM常用命令
squeue -u chris_chen,查看账号chris_chen的作业信息。