TU Chemmnitz

UNIVERSITÄTSRECHENZENTRUM

TU Chemnitz > URZ > Zeitung > Ausgabe 4/2003

HPC: Multiprozessorrechner

Zwei Nachfolgesysteme für den "Superscalarcluster" stellen unseren HPC-Nutzern sehr schnelle CPUs und viel RAM zur Berechnung nicht-paralleler Probleme zur Verfügung.

Zur Beschleunigung aufwändiger Berechnungen gibt es eine Reihe typischer Ansätze:

Das Entwickeln besserer Algorithmen ist dabei Sache der Wissenschaftler, das parallele Berechnen von Teilaufgaben ermöglichen wir mit dem Chemnitzer Linux-Cluster CLiC. Für manche Aufgaben eignen sich jedoch beide Vorgehensweisen nicht, oft bedingt durch den Einsatz kommerzieller Software oder aufgrund der prinzipiellen Charakteristika der Aufgabe.

Um auch in diesen Fällen Unterstützung bieten zu können, wurde 1996 unser Superscalarcluster aus zwei HP 9000 Systemen mit je vier CPUs und 3,75 GB RAM in Betrieb genommen. Wie nicht anders zu erwarten, sind auch diese Rechner in die Jahre gekommen und entsprechen nicht mehr aktuellen Anforderungen. Daher begannen wir bereits im vergangenen Jahr mit der Planung für Nachfolgesysteme. Nach Installation und ausführlicher Testphase stehen nun zwei neue Computeserver zur Verfügung.

Hard- und Software

Beide Rechner verfügen über jeweils zwei sehr schnelle CPUs und einen großen Hauptspeicher, sind im Detail aber sehr unterschiedlich:

Selbstverständlich sind beide Rechner mittels Gigabit-Ethernet ans Campusnetz angeschlossen und auch das AFS kann auf beiden wie gewohnt genutzt werden.

Medusa und Herkules
Die beiden Systeme: herkules (oben) und medusa

Von besonderem Interesse für "leistungshungrige" Benutzer sollten die speziellen Fähigkeiten der beiden CPU-Typen sein.
Die im herkules verwendeten Xeon Prozessoren unterstützen mit SSE-2 (Streaming SIMD Extensions) die parallele Anwendung einer Operation auf mehrere Fließkomma-Operanden, so können z.B. gleichzeitig vier Zahlen einfacher Genauigkeit mit vier anderen multipliziert werden. Ebenso unterstützen diese CPUs eine virtuelle "Verdopplung" namens Hyperthreading; dazu stellt sich eine physikalische CPU dem Betriebssystem gegenüber als zwei CPUs dar und stellt ihre Leistung beiden virtuellen CPUs zur Verfügung. Somit scheint der herkules nicht nur zwei sondern vier CPUs zu besitzten. Zwar erhöht dies nicht die reine Rechenleistung der CPUs, doch falls ein Prozess eine "CPU-Hälfte" durch einen langsamen Speicherzugriff blockiert, kann so lange die andere Hälfte arbeiten und damit diese eigentlich verlorene CPU-Zeit nutzen.

Die Itanium 2 CPUs der medusa basieren auf einem völlig anderen Ansatz als die sonst üblichen CPUs (es werden z.B. sogenannte VLIW-Befehle verwendet, Very Long Instruction Word), dies verleiht ihr eine enorme Leistungsfähigkeit bei niedriger Taktrate, erhöht jedoch die Komplexität der maschinennahen Programmierung ganz erheblich. Zur besseren Ausnutzung der Hardware-Spezialitäten von medusa und herkules wurden Lizenzen für die aktuelle Version der Intel-Compiler für C/C++ und Fortran beschafft. Diese Compiler sind bekannt dafür, perfekt an diese CPUs angepasst zu sein und hervorragend optimierten Code zu produzieren. Dabei versuchen sie so kompatibel wie möglich zum Gnu C-Compiler (gcc) zu sein.

Weitere Software ist in Vorbereitung, bitte beachten Sie dazu die Informationen auf den entsprechenden Webseiten des URZ. Bei Wünschen oder Fragen zu Compilern, Bibliotheken oder systemnahen Problemen können Sie sich an den Autor dieses Artikels wenden, für Simulations- und allgemeine Mathematik-Software ist Jürgen Winkler zuständig. Wir beide sind telefonisch unter Hausanschluss 1725 zu erreichen.

Nutzung

Die beiden Computeserver herkules und medusa werden genauso wie das Linux-Cluster CLiC über unser Batchsystem PBS bereitgestellt und verwaltet. Zur Anwendung kommt dabei erstmalig eine Weiterentwicklung des bisher im Einsatz befindlichen OpenPBS: Scalable OpenPBS. Diese Variante enthält einige Modifikationen zur Verbesserung der Stabilität und Zuverlässigkeit, ist dabei aber voll kompatibel zu OpenPBS und sieht für den Nutzer nicht anders aus. Falls nicht noch unerwartete Probleme auftreten, ist auch mit einem zukünftigen Einsatz auf dem CLiC zu rechnen.

Zur Nutzung der beiden beschriebenen Systeme sind alle Nutzer berechtigt, die bereits Zugang zum CLiC haben, also Mitglied eines angemeldeten Projekts sind. Zusätzliche Interessenten können natürlich ein neues Projekt anmelden.
Alle Informationen zum High-Performance Computing an der TU Chemnitz, den hier erwähnten Rechnern und Softwarepaketen sowie zum Zugang können Sie über das HPC-Portal des URZ finden: www.tu-chemnitz.de/urz/hpc


Karsten Petersen, Oktober 2003