Ein neuer Server für www.tu-chemnitz.de
Der vom URZ für die TU betriebene World Wide Web Service gehört
zweifellos zu den gefragtesten Diensten im Netz. Folgende Statistik
belegt die ungebremst wachsenden Zugriffszahlen auf den WWW-Server
www.tu-chemnitz.de:
Durchschnittliche Zahl der Zugriffe pro Tag:
Jan Mar Mai Jul Sep Nov
1994: 5676 5639 7450 13405
1995: 20660 28299 31968 33526 43030 50037
1996: 57075 61234 72559
Als Server-Software ist seit geraumer Zeit der CERN httpd 3.0
im
Einsatz. Er erfüllt seine Aufgabe zwar wacker, kommt aber nun an die
Grenze seiner Leistungsfähigkeit. Das bemerkt man als Nutzer an manchmal
etwas langen Antwortzeiten, mitunter kommt es auch zu Aussetzern.
Zudem sind moderne und wünschenswerte Fähigkeiten nicht verfügbar, da
keine Weiterentwicklung erfolgt.
Also gut, ein neue Server-Software muß her. Diese muß sich zuallererst
gut an unsere Gegebenheiten anpassen lassen, denn der WWW-Nutzer
darf keine Änderungen mitbekommen - außer "schneller und besser".
Der Server sollte sicher und stabil arbeiten, moderne Features
enthalten und weiterentwickelt werden.
Natürlich spielen auch Faktoren wie Kosten und Support eine Rolle.
Unsere Autoren sollen neue Möglichkeiten erhalten, ohne daß sich
Bewährtes ändert.
Nicht ganz unwesentliche Randbedingungen: Der Server soll weiter unter
Solaris betrieben werden und muß auch in unserer AFS/NFS Umgebung leben können.
Wir blickten unter diesen Voraussetzungen auf den
WWW-Server-Markt und
faßten Kandidaten ins Auge. Wir testeten
Spinner, einen modularen und
schnellen WWW-Server für Unix, der interessante Features bietet, wie
komfortable Konfiguration und Spezial-Tags im HTML.
So wird z.B. <accessed> durch die aktuelle Zugriffszahl ersetzt.
Allerdings entdeckten wir auch einige schwerwiegende Fehler, wie z.B.
falsche Zeitangaben.
Der nächste Kandidat war Apache.
Dies ist ein frei verfügbarer HTTP-Server für Unix, der von einer Gruppe von
Enthusiasten (und Könnern!) aus dem NCSA-Server weiterentwickelt wird.
Wesentliche Eigenschaften sind:
- Schnelligkeit: Apache nutzt Pre-forking, d.h. hält immer ein paar
Prozesse in Reserve, die neue Anfragen sofort beantworten.
- Modularität: Der Server muß nur die Module enthalten, die gebraucht
werden. Er besitzt eine C-API, so daß Erweiterungen leicht möglich
sind.
- Konfigurierbare Fehlermeldungen: Erklärungen von Fehlerursachen, auch
in Deutsch
- Server Side Includes: Vor dem Ausliefern von Dateien können z.B.
aktuelles Datum oder letzte Modifikationszeit eingefügt werden.
- Virtual Homes: In Abhängigkeit, wie der Server angesprochen wird,
können verschiedene Homepages ausgeliefert werden.
- Viele Konfigurationsmöglichkeiten - auch für Autoren selbst
- Nicht zuletzt: Verfügbarkeit als Sourcecode, große Community, Support
via Newsgruppe comp.infosystems.www.servers.unix,
ständige
Weiterentwicklung
Die ersten Tests verliefen erfolgversprechend: Einfache Installation und
Konfiguration, gute Dokumentation, gute Performance.
Dazu kam die Meldung: Apache is #1!
Seit April 1996 ist laut Netcraft's Web Server Survey
der Apache-Server der am meisten eingesetzte
WWW-Server im Internet. Ja, so viele Server-Admins können eigentlich
nicht irren (eine Aussage, die sonst im Computerbereich wohl nicht
zutrifft :-)! Jedenfalls ist es ein Argument mehr für unsere
Entscheidung zu Apache!
Was wird sich ändern mit Apache?
Für den WWW-Nutzer ändert sich nichts - keine Konfigurationsänderungen,
keine URL-Änderungen. Er dürfte aber, gerade in Spitzenzeiten, deutlich
kürzere Antwortzeiten bemerken.
Für die recht stattliche Anzahl unserer WWW-Autoren
gibt es eine Reihe neuer Möglichkeiten:
- Server Side Includes
-
In HTML-Kommentaren können einige Spezialanweisungen untergebracht
werden, die vom Server ausgeführt werden. Das sind z.B. das
automatische Einfügen von bestimmten Texten, z.B. letzte
Modifikationszeit, Größe von Files. Auch ganze Files können eingefügt
werden.
- Counter
-
Der Zugriffszähler auf Dokumente erweist sich als Dauerbrenner. Bisher
haben wir dafür nur eine "Bastellösung" via cgi-Skript anbieten können.
Ein Apache-Modul übernimmt nun das Zählen der Zugriffe auf alle
Dokumente. Über o.g. Mechanismus ist es möglich, den Zähler als Text
in ein Dokument einzufügen. Auch grafische Zähler werden demnächst
angeboten.
- Imagemaps
-
Apache kann Imagemaps - die "klickbaren Bilder" - nun auch ohne
cgi-Skript realisieren. Dazu muß allerdings ein Map-File angelegt
werden, was sich von den bisher verwendeten unterscheidet. Die
bisherige Variante funktioniert aber weiterhin.
- Darstellung von Verzeichnislisten
-
Als Autor kann man nun selbst steuern, wie ein URL zu behandeln ist,
der auf ein Verzeichnis zeigt. Es kann festgelegt werden, wie eine
Verzeichnisliste aussehen soll (Icons, Titel- und Fußtext, Größe,
Modifikationszeit und Kurzbeschreibung) oder ob nur ein bestimmtes File
angezeigt werden soll. Weiterhin
sind die Filetypen entsprechend der Endungen und ein Standardtyp vom
Autor konfigurierbar. Dies alles erfolgt in einem .htaccess-File in
dem betreffenden Verzeichnis.
- Zugriffsschutz
-
Der Zugriff auf WWW-Dokumente kann weiterhin eingeschränkt werden auf
bestimmte Rechner/Domains oder durch Abfrage einer Kennung geschützt
werden. Bisher erfolgte diese Konfiguration in einem .www_acl File, jetzt
muß das - anders - im File .htaccess formuliert werden.
Genauere Beschreibungen dazu werden erstellt und über die Mailing-Liste
www-autoren@tu-chemnitz.de und die Newsgruppe chemnitz.tu.urz
annonciert.
Neben einer neuen Server-Software sind Lösungen für eine Reihe weiterer
Probleme in Arbeit:
- Für wichtige Daten, etwa Fakultäts-Startseiten, müssen
nutzerunabhängige und damit langlebige URLs eingeführt werden.
D.h., diese Daten müssen aus einem nutzerspezifischen Verzeichnis
(
http://.../~user/fakultaet/...) in ein Serververzeichnis
(http://.../fakultaet/...) wandern. AFS bietet uns hier gute
Möglichkeiten, zumal damit auch Zugriffsrechte feiner vergeben werden
können (mehrere Autoren können schreiben, Unterverzeichnisse
"verschenken" etc.)
Für viele Fakultäten ist dieser Umzug bereits erfolgt, die
verbleibenden werden wir ansprechen. Auch andere Interessenten können
uns daraufhin ansprechen.
- Ein weiteres Ziel ist eine größere Verfügbarkeit der Daten. Hier
werden wir uns den AFS-Mechanismus der Read-Only-Kopien zu nutze
machen. Für den Autor mit einem speziellen WWW-Verzeichnis im AFS
hat das den Effekt, daß er seine Daten nach dem Editieren und
Kontrollieren durch ein Kommando freigeben muß.
- Die Suchmöglichkeiten auf unserem Server müssen verbessert werden.
Hier erhoffen wir uns durch den Harvest Broker/Gatherer gute Ergebnisse:
- schnellere und bessere Suche
- Präzisierung/Einschränkung der Suchanfragen (Suche nur in bestimmten Dokumenten)
- Austausch von Such-Indizes mit anderen Servern
Seit Mitte Mai ist ein Test-Server mit Apache in Betrieb, der unter
http://www.tu-chemnitz.de:8080/
ansprechbar ist. Ziel des Tests ist es,
Probleme zu erkennen und zu beheben, damit wir recht bald den
problemlosen Umstieg vom CERN httpd zu Apache schaffen. Hier sind wir für
Hinweise sehr dankbar.
Frank Richter