Inbetriebnahme des Superskalarrechners

Überblick

Seit Oktober ist die langerwartete Endausbaustufe des HP-Superskalarclusters (SSC) im URZ verfügbar. Mit der feierlichen Einweihung am 15. Oktober wurde die Anlage formal übergeben. Damit steht Wissenschaftlern verschiedenster Disziplinen der TU Chemnitz-Zwickau ein Hochleistungsrechensystem auf Basis des derzeit weltweit leistungsfähigsten RISC-Prozessors PA-8000 zur Verfügung. Nicht zuletzt aus Berichten in Presse, Funk und Fernsehen hat sicher der eine oder andere von diesem Ereignis erfahren. Auch aus diesem Grund soll hier vorrangig auf aus unserer Sicht relevante technologische Fragen zum vorgesehenen Nutzerbetrieb und weniger auf technische Details eingegangen werden.

Zum Auftakt dennoch erst mal ein "Steckbrief" des SSC:
Es besteht aus zwei HP 9000/889 K460, die jeweils folgende Konfiguration aufweisen:

Für Nutzerdaten steht ein Disk Array zur Verfügung, welches an beiden Rechnern zu jeweils ca. 8 GB über das Verzeichnis /scratch zugreifbar ist. Achtung: Es handelt sich dabei um jeweils verschiedene Plattenbereiche des Disk Arrays, d.h. es erfolgt kein (!) geteilter Zugriff auf gemeinsame Daten zwischen beiden Maschinen.

Die Installation von AFS steht unmittelbar bevor und dürfte zum Zeitpunkt der Drucklegung bereits erfolgt sein.

Projekte und Beantragung

Voraussetzung für die Nutzung ist ein Nutzerkennzeichen im URZ mit einer speziellen Erweiterung für den SSC. Das Nutzerkennzeichen selbst erhält man nach Einreichen des ausgefüllten Antragsfmrmulars (Formular 1) im Nutzerservice.

Die zusätzliche Beantragung der Nutzung von Supercomputing-Ressourcen (SSC, Parallelrechner) erfolgt projektorientiert. Ein solches Projekt ist die thematische und administrative Zusammenfassung mehrerer Nutzer mit Benennung eines verantwortlichen Projektleiters. Ein Projekt kann mit Hilfe des Online-Formulares unter dem URL "http://wwwsys.hrz.tu-chemnitz.de:2409/home/kba/super/forms/extraforms.html#superform" beantragt werden. Der Antrag ist entweder vom jeweiligen Projektleiter (kann Lehrstuhlleiter, Abteilungsleiter etc. sein) selbst oder in seinem Auftrag zu stellen. Im Antrag werden die Thematik des Projektes und die benötigten Ressourcen sowie die URZ-Nutzerkennzeichen der zukünftigen Projektmitarbeiter angegeben. Die Einrichtung des beantragten Projektes im URZ führt dann zur Erweiterung der Rechte jedes angegebenen Projektmitarbeiters um die Nutzung der beantragten Ressource.

Mit Genehmigung eines Projektes wird dem Projektleiter ein Projektkürzel mitgeteilt, welches zur eindeutigen Kennzeichnung des Projektes dient und in folgenden Zusammenhängen zum Einsatz kommt:

Derzeit (09.12.96) existieren am SSC 17 Projekte mit insgesamt 90 Nutzerkennzeichen:

Fakultät Projekte NKZ
Elektrotechnik 1 1
Informatik 2 3
Maschinenbau 8 14
Physik 4 21
Mathematik 2 51
Summe 17 90

Zum Vergleich: Auf unserem Parallelrechner sind derzeit 19 Projekte mit insgesamt 94 Nutzerkennzeichen registriert.

Interaktiv oder Batch ?

Bisherige sporadische Beobachtungen der Systemaktivität auf den beiden Maschinen haben ergeben, daß es in den typischen "Spitzenzeiten" mitunter zu beachtlichen, z.T. sogar im Grenzbereich liegenden Auslastungsfaktoren kommt. Andere Zeitfenster weisen hingegen nur eine geringe Auslastung auf. Um diese Diskrepanz zu beseitigen, liegt die Idee nahe, den reinen interaktiven Zugang zu einem Mischbetrieb - interaktiv/batchorientiert - zu erweitern. Da im URZ bereits Erfahrungen mit dem Batchsystem DQS existieren, wird dieses nun auch auf den SSC-Maschinen wie folgt zum Einsatz kommen:

Auf dem pilatus werden DQS-Jobs i.a. immer dann laufen, sobald welche vorhanden sind; beim pontius muß erst eine bestimmter Last-Schwellenwert unterschritten werden, ehe ein DQS-Job gestartet wird.

Die Arbeitsweise von DQS sei kurz erklärt: Im DQS beschreibt der Nutzer, welche Ressourcen ein durch ihn zu startender Prozeß benötigt, z.B. hinsichtlich Hauptspeicheranforderungen und/oder Zielarchitektur. Oder genauer gesagt: Der Nutzer beschreibt die Maschine (Anforderungen), welche sein Programm abarbeiten soll. Zum Spezifizieren und Übermitteln der Anforderungen (und für die Angabe des auszuführenden Programms) dient das Kommando qsub. Der so spezifizierte Job wird nun in die "passende" Batch-Queue (auf der "passenden" Maschine!) eingeordnet und zum geeigneten Zeitpunkt ausgeführt. Weitere Kommandos ermöglichen die Abfrage des aktuellen Status, das Löschen von Jobs etc.

Wie wird man nun mit DQS vertraut ? Keine Angst, DQS ist einfach und schnell erlernbar. Dazu sei insbesondere auf das Tutorium zur DQS-Nutzung (http://www.tu-chemnitz.de/home/kba/super/dqs-tutorium.html) verwiesen.


Weitere Informationen rund ums Supercomputing finden sich 'in' der Supercomputing-Corner (http://www.tu-chemnitz.de/home/kba/super/super-corner.html)
und direkt zum SSC unter "http://www.tu-chemnitz.de/home/stb/ssc/index.html ".
Spezielle Problematiken, z.B. im Zusammenhang mit der Nutzung hauptspeicherintensiver Programme, können unter "http://www.tu-chemnitz.de/home/stb/ssc/news.html " nachgelesen werden.
Es gibt auch eine Mailingliste, "ssc_user@hrz.tu-chemnitz.de", die von den Administratoren im URZ zur Bekanntgabe von Informationen an die am SSC registrierten Nutzer, aber auch von diesen selbst zum Erfahrungstausch genutzt werden kann.


Steffen Brose, Gruppe System ; Karsten Baensch, Gruppe Anwendungen