Software-News

Intel Compiler 9.0

Die durch das URZ zentral installierten und bereitgestellten Intel Compiler der neuen Version 9.0 für Linux unterstützen die Architekturen IA32 und IA64 (Itanium), bieten eine herausragende Optimierung und stellen sich dabei weitgehend kompatibel zu den Gnu-Compilern dar.
Das URZ stellt folgende Compiler bereit:

  • C/C++ und Fortran Compiler
  • nur auf IA64: Spezieller Assembler für Assembler-Programme der Itanium-Architektur

Weitere Informationen: Homepage des Herstellers

Verfügbarkeit

Die TU Chemnitz verfügt über mehrere Academic Licences. Jeweils zwei Nutzer können gleichzeitig ("Floating 2-pack", getrennt gezählt für C/C++ und Fortran) die Compiler für die folgenden Plattformen nutzen:

  • Linux x86 ("IA32"), mit glibc 2.2.4, 2.2.5, 2.2.93, 2.3.2, 2.3.3, oder 2.3.4 und Linux Kernel 2.4.X oder 2.6.X wie zum Beispiel durch folgende Distributionen repräsentiert:
    • RedHat Linux 7.3, 8.0, 9.
    • RedHat Enterprise Linux 2.1, 3.0, 4.0 (nicht für Fortran)
  • Linux IA64 (Itanium), mit glibc 2.2.4, 2.2.5, 2.3.2, 2.3.3 oder 2.3.4 und Linux Kernel 2.4.X oder 2.6.X wie zum Beispiel durch folgende Distributionen repräsentiert:
    • RedHat Linux 7.2
    • RedHat Enterprise Linux AS 2.1, 3, 4

Eine individuelle Lizenz muss nicht gekauft werden. Jeder beim URZ angemeldete Nutzer kann die Intel Compiler benutzen.
Bitte beachten Sie: Es handelt sich um eine Lizenz zur ausschließlichen Nutzung für Forschung und Lehre. Die mit diesen Compilern erzeugten Programme dürfen nicht verkauft oder kommerziell genutzt werden.

Nutzung

Zur Nutzung müssen eine Reihe von Umgebungsvariablen gesetzt werden. Bitte führen Sie entsprechend der verwendeten Shell eines der folgenden Kommandos in einer Shell aus:

  • Für C/C++ Compiler
BASH: source /uni/global/capp/intel-9.0/cc_setup.sh
TCSH: source /uni/global/capp/intel-9.0/cc_setup.csh

  • Für Fortran Compiler
BASH: source /uni/global/capp/intel-9.0/fc_setup.sh
TCSH: source /uni/global/capp/intel-9.0/fc_setup.csh
(Sie können die Aufrufe auch in ein Shell-Script übernehmen.)

Anschließend sind in der jeweiligen Shell folgende Kommandos nutzbar:

Kommando Funktion
icc, icpc C/C++ Compiler
ifort Fortran Compiler
idb Debugger
ias IA64 Assembler
iccec Entwicklungsumgebung Eclipse 3.0 (nur für IA32 C/C++ Compiler)

Kommando icpc verwendet immer C++ Ressourcen, auch wenn ein C Quellprogramm angegeben wird. Zum Unterschied von icc und icpc siehe Hinweise zum Aufruf bzw. Kommando man icc. Für den C/C++ Compiler hat Intel ein Eclipse-Paket (Version 3.0.1) mitgeliefert, das für die Architektur IA32 anwendbar ist. Der Aufruf erfolgt mit Kommando iccec.
Aus Kompatibilitätsgründen gibt es noch die alten Kommandos ecc (IA64 C/C++ Compiler), ifc und efc (IA32 und IA64 Fortran Compiler).

Dokumentationen

Ansprechpartner: Jürgen Winkler


Vertragsbedingungen NAG-Landeslizenz

Noch Ende vergangenen Jahres sah es so aus, dass die länderübergreifende Lizenz von NAG (Numerical Algorithms Group) auf Grund der angespannten Haushaltsituation an den Bildungseinrichtungen hätte beendet werden müssen (siehe Bericht in "Mitteilungen des URZ", Ausgabe 04/2005). Damit wäre die unbegrenzte Nutzung der NAG Programmbibliotheken für Fortran, C/C++ und Grafik für die Universitäten und Fachhochschulen aus Sachsen und Sachsen-Anhalt nicht mehr möglich gewesen und die Vorteile für die Softwareentwicklung durch Verwendung der vorgefertigten und optimierten Bibliotheksfunktionen nicht mehr vorhanden.

Ohne Landeslizenz hätte die Software nur noch individuell in wesentlich teureren Einzellizenzen dezentral gekauft werden können. Durch intensive Abstimmung zwischen den an der Landeslizenz teilnehmenden Hochschulen bezüglich des konkreten Bedarfs für Bibliotheken und Rechnerplattformen und aufwändige Verhandlungen mit NAG konnte ein kostenreduzierter Landeslizenz-Vertrag für ein weiteres Jahr ab 1.4.2006 abgeschlossen werden, allerdings in folgender dezimierter Form.

Der Vertrag beinhaltet nur noch die NAG-Produkte:

  • Fortran 77 Library (FL)
  • Fortran 90 Library (FN)
  • C Library (CL)

Außerdem gibt es Einschränkungen auf nachfolgende Rechner-Plattformen:

  • 32-Bit MS Windows
  • 32-Bit Linux

Da die TU Dresden noch die 64-Bit Linux Plattform benötigte, wurde eine separate Lösung/Bezahlung erreicht, die die anderen Einrichtungen nicht betrifft. Es wurden im NAG Download-Bereich des URZ gesonderte passwortgeschützte Verzeichnisse speziell für die 64-Bit Produkte und Zugriffsberechtigung der TU Dresden eingerichtet.

Mit dem neuen Vertrag ist zu beachten, dass bereits bezogene NAG-Bibliotheken, die nicht unter die obigen Produkte/Rechnerplattformen fallen, so zu entfernen sind, dass eine Nutzung ab 1.4.06 nicht mehr möglich ist. Das schließt auch die Löschung von NAG-Routinen ein, die in andere/selbstentwickelte Softwareprodukte eingebettet und eventuell an andere Einrichtungen verteilt wurden.

Die Produkte dürfen nur nichtkommerziell für akademische Zwecke innerhalb der zum Vertrag gehörenden Einrichtungen genutzt werden. Unbeschränkt sind die Anzahl der Installationen, CPUs und Nutzer.

Das Universitätsrechenzentrum der TU Chemnitz bleibt weiterhin der vertragliche Partner für NAG und übernimmt die Bestellung und Verteilung der Software für die anderen Einrichtungen über die im Vertrag registrierten Kontaktpersonen.

Seit geraumer Zeit hat NAG sein Produkt-Lizenzierungsmodell umgestellt. Die Installation von Software ist nur über einen rechnergebundenen Lizenzschlüssel möglich. Das bedeutet einen stark erhöhten Aufwand für die zentrale Bestellung/Verteilung der NAG Bibliotheken, da nur das URZ der TU Chemnitz der vertraglich fixierte Ansprechpartner ist und mit NAG kommunizieren darf.

Es muss bei jeder einzelnen Rechnerinstallation eine rechnerspezifische Kennzahl über ein von NAG geliefertes Programm ermittelt, diese an das URZ der TU Chemnitz gemeldet werden, womit dann der Lizenzschlüssel bei NAG bestellt werden kann. Der von NAG gelieferte Lizenzschlüssel musste schließlich wieder an den Nutzer der zur Landeslizenz gehörenden Einrichtung übermittelt werden. Falls durch irgendeinen Fehler der Lizenzschlüssel nicht funktionierte, ging oben beschriebener Bestell/Verteilungszyklus von vorn los ;-(. Die Beschwerden an NAG waren vorprogrammiert, insbesondere auch, weil die individuelle Generierung der Lizenzschlüssel bei NAG zusätzliche Wartezeit nach sich zog.

Neben einigen nicht sinnvollen Vorschlägen (z.B. Sub-Lizenzverantwortliche in jeder Einrichtung), konnte mit NAG für unsere Landeslizenz eine Sonderverfügung ausgehandelt werden. Es gibt nun für jedes Produkt einen rechnerunabhängigen Lizenzschlüssel, der zentral zusammen mit dem Produkt über WWW-Download an berechtigte Nutzer vergeben werden kann und der eine Gültigkeit entsprechend der Vertragsdauer hat.

Ansprechpartner: Jürgen Winkler


jEdit

logo64.png
Seit kurzem steht der leistungsfähige und intuitiv bedienbare Texteditor jEdit auch unter Windows zur Verfügung. Der Editor eignet sich sehr gut dazu, Programmtexte unterschiedlicher Art zu bearbeiten. Er bietet dazu (über Plugins) eine zum Teil weitgehende Syntaxunterstützung an. Insofern eignet sich jEdit gut für HTML- und XML-Dateien und für Quelltexte aller üblichen Programmiersprachen.

Der Editor ist auch flexibel an die Wünsche des Nutzers anpassbar. So können beispielsweise die Aufrufe externer Programme (zum Kompilieren usw.) an die grafische Oberfläche angebunden werden.
jEdit ist in Java implementiert und kann so (prinzipiell) auf allen Plattformen laufen. Unter Linux ist die Software auf den vom URZ betreuten Rechnern schon längere Zeit im Einsatz.

Der Aufruf erfolgt über das jeweilige Startmenü bzw. das Kommando jedit. Die Installation von zusätzlichen Plugins erledigt der "Plugin-Manager" im Menü Plugins der grafischen Oberfläche.

Weitere Informationen:

Ansprechpartner: Dr. Wolfgang Riedel


OCRshop

Das URZ hat eine Lizenz der kommerziellen Software OCRshop XTR 5.5 erworben, die zu den leistungsfähigsten Werkzeugen der optischen Zeichenerkennung (OXR) im Linux/Unix-Bereich gehört. Die Software ist im Campusnetz für die Plattform Linux (i386_linux26) über /uni/global verfügbar und kostenfrei nutzbar.

Die folgendn Informationen zu fachlichen Details der OCRshop-Nutzung stammen von Ralf König (ehemals Mitarbeiter an der Fakultät für Informatik, jetzt nicht mehr Angehöriger der TU).

Einleitung

OCR (optical character recognition), also optische Zeichenerkennung, bezeichnet die Wiederherstellung editierbarer und durchsuchbarer Texte aus digitalen Bilddaten, die meist per Scanner gewonnen werden.

Zielformat sind üblicherweise Textdateien ohne physisches (Font, fett, kursiv, unterstrichen ...) oder logisches (Überschrift, Fußnote...) Markup. OCR Shop bietet aber auch, wenn auch nicht immer perfekt, die Erhaltung ersterer Merkmale in Verbindung mit den entsprechenden Ausgabeformaten (Punkt: Retain Formatting im Fenster Automatic Recognition oder Interactive Recognition).

Voraussetzungen

  • die Seiten sind bereits gescannt und liegen als Grafikdateien vor, am besten 300 dpi, 256 Graustufen, bei kleinen Fonts (<10 Punkt) auch 400 dpi
  • Format: TIFF (.tif), optional komprimiert (LZW, Packbits)
  • Seite möglichst gerade scannen
  • auf guten Kontrast achten
  • Helligkeit so einstellen, dass die Buchstaben untereinander nicht "verkleben", aber jeder einzelne Buchstabe noch zusammenhängend ist
  • OCR Shop unterstützt in der von uns lizenzierten Version keine direkte Scannernutzung

Wenn die Dateien in anderen Grafikformaten vorliegen

Konvertieren in einer Shell unter UNIX mit z.B.:

convert bild.jpg bild.tif

Das Programm convert aus dem ImageMagick-Paket erkennt das Grafikformat der Ein-/Ausgabedatei an der Dateiendung und wandelt entsprechend um. Im obigen Beispiel wird die Datei bild.jpg im JPEG-Format in eine Datei bild.tif im TIFF-Format konvertiert, die Ausgangsdatei bleibt aber bestehen.

OCR Shop aufrufen

Wichtig
OCR Shop speichert alle Einstellungen, unabhängig davon, ob sie im GUI oder an der Kommandozeile gemacht wurden, in den Dateien .ocrshop.* im aktuellen Verzeichnis ab, ohne dass man dies explizit angeben muss.

Kommandozeile: ocrshop &

Dadurch wird OCR Shop mit seiner grafischen Benutzerschnittstelle (GUI) aufgerufen. Hier kann man alle nötigen Einstellungen vornehmen und den OCR-Prozess starten. Alternativ kann OCR Shop auch ohne GUI aufgerufen werden, wenn die Verarbeitungsparameter bereits bekannt sind:

ocrshop -nogui=yes

Vor allem für größere Dokumente wird empfohlen:

  1. OCR Shop erst mit GUI aufrufen und im GUI die nötigen Einstellungen tätigen.
  2. OCR Shop verlassen (OCR Shop speichert seine Einstellungen automatisch).
  3. OCR Shop ohne GUI aufrufen. Es beginnt dann den OCR-Prozess an Hand der vorher eingestellten Parameter. In einer Datei können die Dateinamen der zu erkennenden Bilddateien angegeben werden. Beispiel:
    ocrshop -nogui=yes -imgsrc=photos.list -docname=secret

Bei folgendem Inhalt von photos.list: /user/james/firstpage.tif, /user/james/lastpage.tif, /user/q/instructions.tif werden von OCR Shop die Dateien: secretd001p001.txt, secretd001p002.txt, secretd001p003.txt mit den erkannten Texten erzeugt.

Der OCR-Prozess

Es empfiehlt sich, zunächst im Hauptmenü (Options|Languages) die im Text verwendeten Sprachen auszuwählen. Sollte man die Vorlage als schwierig einschätzen (geringer Kontrast, verklebte oder zerbrochene Buchstaben), kann auch der Punkt 3D OCR in Options|Recognition Options gewählt werden. Dazu muss das Ausgangsbild aber in Graustufen vorliegen.

Dann wählt man entweder Automatic oder interactive recognition. Bei Letzterem muss man bei jedem Bild den Bereich auswählen, der den Text enthält, bei automatic wird der Bereich vom ersten Bild auf die anderen übertragen.

Der Rest ist eigentlich sehr intuitiv: Dateien auswählen, Dokumentennamen vergeben (OCR Shop verwendet nicht automatisch den Namen der Bilddatei) und den Erkennungsprozess starten.

Des weiteren kann man hier den erkannten Text über den Punkt Document Specification|Text Format in einem gewählten Format abspeichern lassen.

  • Meinen Vorstellungen kam dabei "ASCII Smart" am nächsten.
  • "ASCII Standard" hat die Zeilen aus unbekannten Gründen noch mal jeweils in der Mitte umgebrochen.
  • "ASCII Stripped" entfernt die Zeilenumbrüche innerhalb der Absätze.

Außerdem empfiehlt sich evt. der Punkt Retain Formatting, der versucht, die Formatierungen des Originals weitgehend zu erhalten.

Im Anschluss an den Erkennungsprozess wird der unter Options|Proofing Editor Setup ausgewählte Editor gestartet. Dies lässt sich mit der Kommandozeilenoption autosave=yes auch verhindern.

Verbessern der Erkennungsleistung

OCR Shop ist bei seiner Arbeit nicht perfekt. Inbesondere bei Wörtern, die nicht in den Wörterbüchern vorkommen (Eigennamen, Firmen- und Produktbezeichnungen, Neologismen) sind Fehler (oder falsche automatische Korrekturen) nicht auszuschließen.

Folgende Maßnahmen versprechen im Einzelfall Abhilfe:

  1. Wenn die Vorlage sehr gut ist, aber das Programm falsch korrigiert (also unbekannte Wörter, die eigentlich korrekt erkannt werden müssten, auf Wörter, die im Wörterbuch vorkommen korrigiert, kann man im Punkt Options|Recognition Options|Lexical Assist dieses Verhalten ändern. Ist Lexical Assist deaktiviert, so orientiert sich OCR Shop nur noch an den gewählten Sprachen und nicht an den ausgewählten Wörterbüchern.
  2. Alternativ kann man die unbekannten Wörter in ein Benutzerwörterbuch übernehmen (Options|User Dictionary).

Manuelle Korrektur

Trotz aller Finessen ist ein kritisches Probelesen und die manuelle Korrektur des Ergebnistextes oft unabdingbar. Zeichen, bei denen sich das Programm unsicher war, kennzeichnet es mit einer Tilde (~). Nach solchen Zeichen sollte bei der Nachbearbeitung als erstes gesucht und die betroffenen Stellen entsprechend manuell korrigiert werden.

(Unter Options|Proofing Editor Set-up kann man auch ein anderes Zeichen als "~" als reject character einstellen, falls die Tilde oft im Text vorkommt.)

Es empfiehlt sich ein leistungsstarker Editor mit umfangreichen Möglichkeiten zum Suchen und Ersetzen von Text, da sich Fehler des Programmes oft wiederholen. Auch eine integrierte Rechtschreibprüfung kann nicht schaden. Jedoch sollte ihr Nutzen nicht überschätzt werden, da ja auch OCR Shop schon mit Wörterbüchern arbeitet.

Vertiefung

Bei noch offen stehenden Fragen hilft hoffentlich das (englische) Benutzerhandbuch /uni/global/doc/ocrshop/ocrxtr_manual.pdf.

Ansprechpartner: Dr. Wolfgang Riedel


Sammelbeschaffung Simulationssoftware

In verschiedenen Lehrstühlen der Fakultät für Maschinenbau bestand Bedarf nach Einsatz der Simulationssoftware der Firma ITI. Konkret betrifft das die Produkte ITI-SIM und SimulationX, die jeweils für unterschiedliche Teildisziplinen des Maschinenbaus relevant sind (s.u.). Das URZ hat die Interessen der Professuren gebündelt, um durch eine Sammelbeschaffung finanziell akzeptable Bedingungen zu erzielen. Außerdem übernehmen wir damit das Management der Verwaltung der Lizenzen und der zukünftigen Softwarewartung innerhalb der TU.

Das erworbene Softwarepaket besteht aus folgenden Komponenten:

  1. Simulationssoftware ITI-SIM 3.7
    • Basismodul
    • Bibliotheken: Mechanik, Motoren und Kupplungen, Elektrische Motoren, Übertragungselemente, Signalquellen, Lineare Signalglieder, Nichtlineare Signalglieder, Spezielle Signalglieder, Schalter, Hydraulik, Pneumatik, Thermik, Linearelastische Strukturen, Kurvengetriebe
    • Optionen: Variantenrechnung, Eigenfrequenz/Schwingformen, Stationäre Analyse ITI-STAT, Ordnungsanalyse ITI-ORD,
    • Makros: Gelenkwelle, Elastischer Anschlag, Starrer Anschlag
  2. Simulationssoftware SimulationX 1.2
    • Professional Edition
    • Bibliotheken: Mechanik 1D, Mechanik 3D, CAD-Import, Allgemeine Signalglieder, Signalquellen, Lineare Signalglieder, Zeitdiskrete Signalglieder, Nichtlineare Signalglieder, Spezielle Signalglieder, Schalter, Motoren, Kupplungen, Übertragungselemente, Planetengetriebe (ab Version 2.1), Elektrische Motoren, Elektronik (analog), Magnetik, Hydraulik III, Pneumatik II, Thermik
    • Optionen: Gleichgewichtsberechnung, Varianten-Assistent, Lineare Systemanalyse

Es sind derzeit jeweils eine Anzahl von ITI-SIM- und von SimulationX-Lizenzen zur lokalen Installation in den betreffenden Lehrstühlen erworben worden. Zusätzlich dazu haben wir je 10 Netzwerklizenzen gekauft, die in einem Pool im Universitätsteil Reichenhainer Straße installiert werden. Für alle Lizenzen ist ein Wartungsvertrag abgeschlossen worden, der die Lieferung von Updates und entsprechenden Support enthält.

Für die Lehrstuhllizenzen ist ein ausgehandelter Festbetrag von 240 € als Einmalkosten plus ein jährlicher Wartungsbetrag von 50 € (jeweils plus Mehrwertsteuer) zu bezahlen. Diese Beträge verstehen sich als Anteile am Gesamtpaket und sind als Entgelt an das URZ zu überweisen.

Das erworbene Lizenzpaket kann zukünftig noch erweitert werden. Sowohl von ITI-SIM als auch von SimulationX können zusätzliche Lizenzen nachgekauft werden - zu den gleichen finanziellen Rahmenbedingungen. Interessenten wenden sich diesbezüglich an den Autor des Artikels.

Ansprechpartner: Dr. Wolfgang Riedel


Gruppe Anwendungen, April 2006