User Tools

Site Tools


using-slurm

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
Next revisionBoth sides next revision
using-slurm [2019/02/01 12:17] jean-bakausing-slurm [2019/02/01 12:26] jean-baka
Line 71: Line 71:
  
 ==== Check queue status ==== ==== Check queue status ====
-<code>squeue</code>+''squeue'' is the command to use to get more information about the different jobs that are running on the cluster, waiting in a queue for resources to become available, or halted for some reason: 
 +<code>[jbaka@compute03 ~]$ squeue 
 +             JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON) 
 +             16330     batch interact  pyumbya  R    6:33:26      1 taurus 
 +             16339     batch interact ckeambou  R    5:19:07      1 compute04 
 +             16340     batch interact ckeambou  R    5:12:52      1 compute04 
 +             16346     batch velvet_o  dkiambi  R    1:39:09      1 compute04 
 +             16348     batch interact fkibegwa  R      22:38      1 taurus 
 +             16349     batch interact    jbaka  R       3:27      1 compute03 
 +</code> 
 + 
 +In addition to the information above, it is sometimes useful to know what is the number of CPUs (computing cores) allocated to each job: the scheduler will queue jobs asking for resources that aren't available, most often because the other jobs are eating up all the CPUs available on the host. To get the number of CPUs for each job and display the whole thing nicely, the command is slightly more involved: 
 + 
 +<code>[jbaka@compute03 ~]$ squeue -o"%.7i %.9P %.16j %.8u %.2t %.10M %.6D %10N %C" 
 +  JOBID PARTITION             NAME     USER ST       TIME  NODES NODELIST   CPUS 
 +  16330     batch      interactive  pyumbya  R    6:40:52      1 taurus     1 
 +  16339     batch      interactive ckeambou  R    5:26:33      1 compute04 
 +  16340     batch      interactive ckeambou  R    5:20:18      1 compute04 
 +  16346     batch velvet_out_ra_10  dkiambi  R    1:46:35      1 compute04 
 +  16348     batch      interactive fkibegwa  R      30:04      1 taurus     1 
 +  16349     batch      interactive    jbaka  R      10:53      1 compute03 
 +</code> 
 + 
 +or, alternatively: 
 + 
 +<code>[jbaka@compute03 ~]$ squeue -O username,jobid,name,nodelist,numcpus 
 +USER                JOBID               NAME                NODELIST            CPUS                 
 +pyumbya             16330               interactive         taurus              1                    
 +ckeambou            16339               interactive         compute04                              
 +ckeambou            16340               interactive         compute04                              
 +dkiambi             16346               velvet_out_ra_109_vecompute04                              
 +fkibegwa            16348               interactive         taurus              1                    
 +jbaka               16349               interactive         compute03                    
 +</code> 
using-slurm.txt · Last modified: 2022/11/03 11:38 by jean-baka