PBS Kurzanleitung

Inhalt:

1. Wozu PBS?
2. Wie submitte ich Jobs?
3. Kontrolle
4. WICHTIGER HINWEIS
5. Weitere Dokumentationen

1. Wozu PBS?


PBS steht fuer Portable Batch System und sorgt, ganz einfach gesagt, dafuer, dass grosse und lange Rechenjobs auf denen dafuer am besten geigneten Ressourcen ausgefuehrt werden.
Durch dieses System werden lange Rechenzeiten verkuerzt, indem ein Job immer auf dem Rechner ausgefuerht wird, der  gerade am wenigsten zu tun hat.

Ein Beispiel:

Angenommen, Rechner A hat zur Zeit die schnellste CPU. Dies hat  sich herumgesprochen und alle wollen ihre Jobs auf Rechner A ausfuehren.
Dies wiederum fuehrt zur Ueberlasstung der Maschine. Man kann also sagen, ja mehr Leute auf einer Maschine rechnen, desto laenger dauert auch der Rechenjob.

Mit PBS wird alles viel einfacher. Sie uebergeben Ihren Job einfach an das PBS System und dieses sucht sich dann die besten Ressourcen fuer diesen Job heraus und starten die Berechnungen auf dem entsprechenden Rechner.
Sie bekommen lediglich eine Mail, wenn Ihr Job fertig ist.
 
 

2. Wie submitte ich Jobs?


Falls nicht sofort eine passender Rechner gefunden wird, oder keine ausreichenden Ressourcen fuer einen Job zur verfuegung stehen, wird der Job automatisch in einer sog. Queue gespeichert.

Welche Queue fuer einen Job verantwortlich ist, ergibt sich aus den Ressourcen, die der Job benoetigt.
Es sollte also bei dem Submitten eines Jobs auch immer die Ressourcen angeben werden, die dieser Job benoetigt.
Wichtig hierbei sind:

Der Speicher, den der Job braucht: z.B. vmem=1GB
Auf wievielen Prozessoren gerechnet werden soll (fuer parallele Jobs): z.B. nodes=4
Wie lange der Job rechnen wird: z.B. walltime=10:00:00 (fuer 10 Stunden)

Das Kommando zum submitten eines Job koennte also folgerndermassen aussehen:

qsub -l vmem=1GB,nodes=4,walltime=10:00:00 <jobname>

Qsub ist das Kommando zum submitten eines Jobs.
Die Option -l gibt an, dass nun eine Liste mit reservierten Ressourcen folgt
der Jobname ist der Name des Skripts oder des Programms, das gerechnet werden soll.
 

3. Kontrolle


Wie schon o.g. bekommen Sie nach Beendigung eine Mail.  Auch wenn ein Fehler auftreten sollte, oder bei anderen Ereignissen, die den Job beeinflussen, werden Sie per Mail informiert.
Sie haben auch die Moeglichkeit, sich den Status Ihres Jobs mit dem Kommando qstat (und wir empehlen die Option -n) jederzeit anzuschauen.
 
 

4. WICHTIGER HINWEIS


Da das PBS Sysytem nur auf Maschinen mit der Betriebssystemversion 5.1 laeuft, konnten wir es bisher nur auf folgenden Rechnern einsetzen:

alpha41
alpha40
alpha32
alpha24

und auf allen Rechnern des Parallelsystems.

Daher ist es erforderlich, dass Sie sich zum submitten von Jobs und zur Statusabfrage auf die o.g. Maschinen einloggen.
 
 

5. Weitere Dokumentationen


Eine ausfuerliche Anleitung finden Sie auf den Webseiten des PHYSnet-Rechenzentrums unter www.physnet.uni-hamburg.de/physnet im Bereich Dokumentationen.