PBS steht fuer Portable Batch System und sorgt, ganz einfach gesagt,
dafuer, dass grosse und lange Rechenjobs auf denen dafuer am besten geigneten
Ressourcen ausgefuehrt werden.
Durch dieses System werden lange Rechenzeiten verkuerzt, indem ein
Job immer auf dem Rechner ausgefuerht wird, der gerade am wenigsten
zu tun hat.
Ein Beispiel:
Angenommen, Rechner A hat zur Zeit die schnellste CPU. Dies hat
sich herumgesprochen und alle wollen ihre Jobs auf Rechner A ausfuehren.
Dies wiederum fuehrt zur Ueberlasstung der Maschine. Man kann also
sagen, ja mehr Leute auf einer Maschine rechnen, desto laenger dauert auch
der Rechenjob.
Mit PBS wird alles viel einfacher. Sie uebergeben Ihren Job einfach
an das PBS System und dieses sucht sich dann die besten Ressourcen fuer
diesen Job heraus und starten die Berechnungen auf dem entsprechenden Rechner.
Sie bekommen lediglich eine Mail, wenn Ihr Job fertig ist.
2. Wie submitte ich Jobs?
Falls nicht sofort eine passender Rechner gefunden wird, oder keine
ausreichenden Ressourcen fuer einen Job zur verfuegung stehen, wird der
Job automatisch in einer sog. Queue gespeichert.
Welche Queue fuer einen Job verantwortlich ist, ergibt sich aus den
Ressourcen, die der Job benoetigt.
Es sollte also bei dem Submitten eines Jobs auch immer die Ressourcen
angeben werden, die dieser Job benoetigt.
Wichtig hierbei sind:
Der Speicher, den der Job braucht: z.B. vmem=1GB
Auf wievielen Prozessoren gerechnet werden soll (fuer parallele Jobs):
z.B. nodes=4
Wie lange der Job rechnen wird: z.B. walltime=10:00:00 (fuer 10 Stunden)
Das Kommando zum submitten eines Job koennte also folgerndermassen aussehen:
qsub -l vmem=1GB,nodes=4,walltime=10:00:00 <jobname>
Qsub ist das Kommando zum submitten eines Jobs.
Die Option -l gibt an, dass nun eine Liste mit reservierten Ressourcen
folgt
der Jobname ist der Name des Skripts oder des Programms, das gerechnet
werden soll.
3. Kontrolle
Wie schon o.g. bekommen Sie nach Beendigung eine Mail. Auch
wenn ein Fehler auftreten sollte, oder bei anderen Ereignissen, die den
Job beeinflussen, werden Sie per Mail informiert.
Sie haben auch die Moeglichkeit, sich den Status Ihres Jobs mit dem
Kommando qstat (und wir empehlen die Option -n) jederzeit anzuschauen.
4. WICHTIGER HINWEIS
Da das PBS Sysytem nur auf Maschinen mit der Betriebssystemversion
5.1 laeuft, konnten wir es bisher nur auf folgenden Rechnern einsetzen:
alpha41
alpha40
alpha32
alpha24
und auf allen Rechnern des Parallelsystems.
Daher ist es erforderlich, dass Sie sich zum submitten von Jobs und
zur Statusabfrage auf die o.g. Maschinen einloggen.
5. Weitere Dokumentationen
Eine ausfuerliche Anleitung finden Sie auf den Webseiten des PHYSnet-Rechenzentrums
unter www.physnet.uni-hamburg.de/physnet
im Bereich Dokumentationen.