Am 25. Oktober 1994 wurde der Parallelrechner GC/PowerPlus der Firma Parsytec an der TU Chemnitz-Zwickau der Nutzung übergeben:
Minister Meyer vom SMWK zerschnitt symbolisch
ein altes Magnetband.
Diese Anschaffung bietet den Forschern und Studenten die Möglichkeit, ihr Wissen und ihre Erfahrung auf einem Gebiet zu verbessern, das die Zukunft der Computerwissenschaften wesentlich mit beeinflussen wird.
Es besteht die Notwendigkeit, alternative Konzepte zur sequentiellen Architektur bei Computersystemen zu entwickeln und zu vervollkommnen.
Diese Notwendigkeit ergibt sich aus dem Widerspruch zwischen der Rechenkapazität, wie sie von den großen neuen Anwendungsgebieten angefordert wird, und den physikalischen Performance-Grenzen, die bei der Entwicklung neuer sequentieller Systeme bestehen.
Diese neuen Anwendungsgebiete, die sogenannten Grand Challenges, sind zum Beispiel die Strömungsdynamik, die Genforschung und die Klimamodellierung.
Sie benötigen Rechenleistungen, die sich im TeraFlop-Bereich bewegen.
Eine Möglichkeit, diesen Anforderungen gerecht zu werden, ist, die Leistung vieler Prozessoren parallel zu nutzen.
Durch diesen Ansatz können sowohl die Fortschritte in der Entwicklung der Prozessoren genutzt, als auch die physikalischen Grenzen sequentieller Systeme umgangen werden.
Die Entwicklung immer größerer paralleler Systeme ließ die Leistungsfähigkeit in den letzten Jahren erheblich ansteigen.
Der Rechner, der jetzt an der TU Chemnitz-Zwickau genutzt werden kann, besitzt dabei folgende Kennwerte:
Er hat 128 Prozessoren in 64 Knoten.
Jeder Knoten ist mit 32 MByte Hauptspeicher ausgestattet.
Die Maschine hat also insgesamt 2 GigaByte Hauptspeicher.
Als Prozessoren werden dabei die PowerPC 601 von Motorola eingesetzt, mit einer Taktrate von 80 MHz und einer peak performance von 80 MFlops double precision.
Damit sind theoretisch 10 GFlop Gesamtleistung möglich;
bei ersten Testprogrammen wurden bereits mehr als 6 GFlop praktisch
gemessen. Damit ist der GC/PowerPlus der modernste und
leistungsfähigste Supercomputer Deutschlands; weltweit gehört er
zu den 100 schnellsten.
Vier Kommunikationsprozessoren T805-30 pro Knoten sorgen für eine Übertragungsbandbreite von 35,2 MB/s pro Knoten und 8,8 MB/s zwischen benachbarten Knoten.
Der Rechner ist ein MIMD-System mit Message Passing.
MIMD-Systeme zeichnen sich dadurch aus, daß sie über mehrere unabhängige Verarbeitungseinheiten verfügen.
Beim Message Passing Modell kommunizieren die einzelnen Knoten des Systems, indem Nachrichten ausgetauscht werden.
Diese Nachrichten dienen sowohl zum Datenaustausch, als auch zur Synchronisation.
Ein alternatives Konzept dazu ist zum Beispiel ein shared memory System, bei dem die Prozessoren über einen gemeinsamen Adreßraum verfügen, über den dann der Datenaustausch erfolgen kann.
Zur Leistungssteigerung bei Aufgaben mit hoher I/O-Leistung gibt es das parallele Filesystem PARIX PFS. Die Performanceerhöhung erfolgt dabei durch Aufteilung der Files auf mehrere Platten (im hier installierten System auf 4 mal 2 GByte-Platten) und der Ausnutzung mehrerer physischer Links von den Frontend-Rechnern zum Parallelrechner. Beim Schreiben wird dabei ein File über alle angeschlossenen Platten verteilt. Dem Anwender wird die Nutzung dieses Systems dadurch erleichtert, daß für den Zugriff normale Standardfunktionen aus C oder FORTRAN, also open, close, read, write, ... genutzt werden können. Außerdem ist das parallele Filesystem über NFS unter UNIX eingebunden und es kann somit leicht vor oder nach der eigentliche Verarbeitung auf die Daten zugegriffen werden.
Neben der hardwaretechnischen Grundlage ist für die Nutzung eines neuen Systems entscheidend, welche Softwarewerkzeuge zur Verfügung stehen. Allgemein muß dabei gesagt werden, daß das Softwareangebot für Parallelrechner sehr beschränkt ist. Das liegt schon darin begründet, daß kein standardisiertes Betriebssystem, vergleichbar zu UNIX oder MS-DOS, für Parallelrechner existiert. Somit sind Programmentwicklungen meist an einen konkreten Parallelrechner gebunden.
Die Softwareausstattung am Chemnitzer System stellt sich folgendermaßen dar: Als Betriebssystem auf dem Parallelrechner wird PARIX (PARallel extension to unIX) eingesetzt, welches ebenfalls eine Entwicklung der Firma Parsytec ist. Mit PARIX wurde versucht, ein UNIX-artiges Betriebssystem für Rechner mit hoher Prozessoranzahl zu entwickeln. Dabei erfolgt jeglicher Datenaustausch, auch die Synchronisation, durch explizite Kommunikation über Kanäle (virtuelle Links). Da es unmöglich ist, jeden Prozessor einzeln zu programmieren, wird in PARIX das SPMD-Modell eingesetzt (single program multiple data). Um jedoch die Möglichkeiten der MIMD-Architektur vollständig ausnutzen zu können, ist es möglich, zur Laufzeit weitere unterschiedliche Programme auf verschiedene Prozessoren nachzuladen.
Zur Entwicklung von Anwenderprogrammen stehen ein C- und ein FORTRAN-Cross-Compiler zur Verfügung, die für den Motorola-Prozessor optimiert sind. Ein Fortran90-Compiler kann als Präprozessor genutzt werden.
PVM, als System zur Entwicklung paralleler Programme auf unterschiedlichsten Hardwareplattformen, ist sehr weit verbreitet. Programme, die auf dieser Programmierumgebung basieren, können also sowohl auf Workstationclustern als auch auf Parallelrechnern ausgeführt werden. PVM stellt dabei eine Reihe von Systemrufen bereit, die es den einzelnen Knoten erlauben, miteinander zu kommunizieren. Ein solches System, das auf PVM 3.2.3 basiert, ist als PVM/PARIX ebenfalls verfügbar. Dieses System wurde dabei speziell für den Parsytec-Parallelrechner optimiert. PVM/PARIX unterstützt alle Parsytec-Computer, aber auch die Einbindung in ein heterogenes Netzwerk von Systemen, auf denen die public domain Version von PVM läuft. Zukünftig ist der Einsatz von MPI als Kommunikationsschnittstelle geplant. Gegenwärtig existiert für diesen neuen Standard aber noch keine nutzbare Implementation.
Für die Analyse paralleler Programme kann außerdem DETOP, ein paralleler source level debugger, genutzt werden. Durch diesen Debugger ist es möglich, eine globale Sicht auf das Programm zu gewinnen. Er unterstützt voll das PARIX Programmiermodell, das heißt, der Debugger kann auch Semaphoren und Links des Systems überwachen. Er läuft als ein Prozeß auf einer Workstation und kommuniziert mit einem Monitoring System auf den Knoten, welches nur einen geringen Bedarf an CPU-Zeit und Speicher beansprucht.
Zur Performance-Analyse kann PATOP eingesetzt werden. Dieses Tool erlaubt es, eine top down Untersuchung eines Programms durchzuführen, um Leistungsengpässe aufzufinden. Die Analyse kann dabei auf System-, Knoten- und Threadlevel erfolgen.
Gegenwärtig wird eine von der Universität Paderborn entwickelte Software erprobt, die einen einfacheren, nutzerfreundlicheren Zugang zum Parallelrechner ermöglicht und die insbesondere auch einen Stapelbetrieb zuläßt. Nähere Informationen dazu können dem WWW entnommen werden. Informationen über aktuelle Neuigkeiten und eine kurze Einführung in die Nutzung des Parallelrechners findet man unter: Homepage der TU / URZ / Supercomputing-Corner bzw. Neuigkeiten zum Parallelrechner . An dieser Stelle kann man sich auch informieren, wie Sie ein Login für den Parallelrechner erhalten. Ansprechpartner im URZ sind Jens Wagner, Dr. Wolfgang Riedel und Christoph Ziegler.
Erfreulich ist, daß nach einer kurzen Anlaufphase der Parallelrechner schon intensiv genutzt wird. Hauptnutzer des Systems sind zur Zeit die Mitarbeiter der Mathematik und der Informatik. Hauptanwendungsgebiete sind dabei die numerische Simulation von Strömungen und Druckverteilungen sowie neuronaler Netze. So werden zum Beispiel von Mitarbeitern des Fachgebietes Numerische Mathematik Berechnungen in der Kontinuumsmechanik durchgeführt. Diese beinhalten Berechnungen von Potentialfeldern (Temperaturverteilungen, Magnetfelder oder auch Schadstoffverteilungen in der Umwelt), Deformationsberechnungen (Berechnungen von Staudämmen) und Strömungssimulationen (u.a. Brandsimulationen für die Feuerwehr).
Neben der Nutzung des Rechners durch die Chemnitzer Mitarbeiter und Studenten zeigt sich auch ein reges Interesse von Mitarbeitern anderer Forschungseinrichtungen, zum Beispiel aus Dresden, Leipzig, Braunschweig, Heidelberg, Paderborn, Aachen u.a.
Durch die Anschaffung des Parallelrechners an der TU Chemnitz-Zwickau konnten die Lehr- und Forschungsbedingungen in relevanten Bereichen erheblich verbessert und auf ein sehr hohes Niveau gehoben werden. Das trägt dazu bei, die Attraktivität der TU Chemnitz-Zwickau sowohl bei der Industrie als auch bei den Studenten zu erhöhen.