TU Chemmnitz

Universitätsrechenzentrum

TU Chemnitz > URZ > Zeitung > Ausgabe 3/2005

Was gibt es Neues am CLiC?

Der Chemnitzer Linux Cluster ist in die Jahre gekommen. Dennoch entwickelt das URZ diesen Hochleistungsrechner weiter, um die Stabilität und den Service zu erhöhen.

Aktueller Stand

Seit nunmehr fünf Jahren betreibt das URZ den Chemnitzer Linux Cluster (CLiC). Auf diesem Hochleistungsrechner können Nutzer Berechnungen für verschiedenste Projekte durchführen.

Der Dauerbetrieb über diesen langen Zeitraum führt vermehrt zum Ausfall einzelner Hardwarekomponenten. Am häufigsten betroffen sind hierbei Festplatten und Netzteile. Falls Ersatzteile vorhanden sind oder sich Komponenten zwischen Rechnern tauschen lassen, sorgen die Techniker des URZ dafür, dass einzelne Knoten wieder nutzbar werden. Aus wirtschaftlichen Gründen können jedoch keine Ersatzteile neu beschafft werden.

Von den insgesamt 528 Rechnern des CLiC sind derzeit etwa 40 defekt und daher dauerhaft nicht nutzbar.

Trotz der mittlerweile in die Jahre gekommenen Technik und des moralischen Verschleißes trat der für uns unerwartete Effekt ein, dass die Auslastung des CLiC seit Anfang des Jahres deutlich zunahm und jetzt größtenteils über 100% liegt. Dieser Effekt wird am besten in der graphischen Nutzungsstatistik sichtbar:

nodex.png

Jobverteilung

In Folge der hohen Auslastung stehen für Berechnungen oft nicht sofort die benötigten Ressourcen zur Verfügung, so dass davon betroffene Rechenaufträge (Jobs) in einer Warteschlange auf ihre Zuteilung warten müssen. Für die Verwaltung der im Cluster vorhandenen Ressourcen und deren exklusive Freischaltung für zugeordnete Jobs sorgt das Batch-Systems "OpenPBS". Der darin eingebundene Scheduler trifft die Entscheidung, wie angeforderte Ressourcen auf reelle Ressourcen zugeordnet werden.

In der Vergangenheit wurde diese Komponente des OpenPBS von einem einfachen FIFO-Scheduler realisiert, der den Jobs in der Reihenfolge Ihres Eintreffens freie Ressourcen zuteilte. Eine Ausnahme in dieser Zuteilungsregel bildeten Ressourcenbeschränkungen pro Nutzer, um eine übermäßige Nutzung durch einzelne Personen zu verhindern. Da Jobs mit geringem Ressourcenbedarf kontinuierlich die freien Resourcen verbrauchen können, blieben große Jobs oft übermäßig lange in der Warteschlange.

Scheduler "Maui"

Seit einigen Wochen ist auf dem CLiC der leistungsfähigere Scheduler Maui im Einsatz. Jobs werden nun nicht mehr nur strikt nach ihrem Eintreffen sortiert. Ein als "backfilling" bezeichneter Mechanismus nutzt kleine Jobs mit kurzen Laufzeiten als "Lückenfüller" für Ressourcen, die bis zur Zuteilungsreife eines großen Jobs bisher ungenutzt blieben. Die Zuteilung von Jobs kann nun nicht mehr durch andere Jobs verzögert werden.

Backfilling funktioniert desto besser, je kleiner und präziser die Laufzeiten (walltime) der Jobs spezifiziert wurden. Nur dann können "freigezogene" Ressourcen, welche für den Start großer Jobs benötigt werden, optimal mit kleinen Jobs aufgefüllt werden.

Ein weiterer Vorteil von Maui ist, dass ein Jobstart durch das interne Reservierungssystem von Maui im Vorfeld festgelegt bzw. zugesichert wird. Die Startzeit kann unter der Status-Seite eingesehen werden. Zusätzlich zu diesen Informationen können nun detaillierte Informationen zu jedem Job über diese Seite abgefragt werden.

Des Weiteren besteht nun auch die Möglichkeit Ressourcen, beispielsweise für eine Lehrveranstaltung, reservieren zu lassen.

AFS-Probleme

Eine deutliche Verbesserung für die Nutzung des CLiC konnte auch in Bezug auf die Integration des AFS erzielt werden. Um sich für Zugriffe im AFS authentifizieren zu können, muss der Nutzer über ein gültiges AFS-Token verfügen. Die Gültigkeit dieser Tokens ist auf 30 Tage begrenzt. Damit die Jobs während ihres Aufenthaltes in der Warteschlange, beziehungsweise während der Berechnung auf den Knoten, ein gültiges AFS-Token besitzen, werden diese von speziellen Prozessen periodisch verlängert.

Bisher sorgte eine künstliche Bremse dafür, dass diese periodische Verlängerung keine Überlast auf den AFS-Servern erzeugte. Diese Verzögerung ist auf Grund von Systemänderungen im AFS-Umfeld nicht mehr nötig. Somit ist der Job-Start bzw. -Abbruch nicht mehr so fehleranfällig. Für den Nutzer bedeutet dies im Endeffekt kürzere Job-Startzeiten und weniger Störungen zur Laufzeit eines Jobs.

Nachfolgeprojekt CHIC

Wie bereits informiert, ist die Beschaffung eines neuen Hochleistungsrechners (CHIC) beantragt (HBFG-Verfahren). Nach gegenwärtigem Kenntnisstand wird dieser Cluster nicht vor Mitte 2006 einsatzbereit sein. Der "alte" CLiC wird erst in den wohlverdienten Ruhestand gehen können, wenn das neue System im Routinebetrieb gefahren wird. Dies gilt allerdings nur unter der Voraussetzung, dass keine weiteren kritischen Hardwareausfälle am CLiC auftreten.


Thomas Pöhnitzsch, Ronald Schmidt, Juli 2005