Dokumentenmanagement 09.12.2005, 18:41 Uhr

Faust muss in den Scanner  

VDI nachrichten, Weimar, 9. 12. 05 – Mit Hightech sowie finanziellem Sponsoring durch den Speicherspezialisten EMC Deutschland beginnt jetzt die Digitalisierung literarischer Schätze aus der Herzogin Anna Amalia Bibliothek in Weimar. Zunächst werden 20 000 Bände aus der brandgeschädigten Weltkulturerbe-Sammlung elektronisch erfasst, archiviert und ins Internet gestellt. Des Pudels Kern ist ein eigens entwickelter Online-Langzeitspeicher namens Centera.

Behutsam, fast zärtlich fährt Helmut Schade über den leinenen Einband des wuchtigen Folianten. Der ist erkennbar angejahrt, so wie der ganze Band. „Ein feines Stück“, entfährt es ihm leise. Dann öffnet er den Buchdeckel, wieder bedächtig. Nur keine Hast, keine Routine, durchfährt es Schade. Große, rote Frakturbuchstaben, vor gut zwei Jahrhunderten auf das mittlerweile vergilbte Papier gebracht, geben den Titel preis: „Faust“.

Schade schaltet die Lampen ein, die an miniaturisierte Stadionflutlichter erinnern. Er kontrolliert die Koordinaten auf dem schwarzen Tisch, den der opulente Faust nun zu einem gut Teil füllt. Dann startet er den Scanner. Auf dem Monitor daneben kontrolliert er, wie in Sekundenbruchteilen ein Stück Weltliteratur in digitale Einzelteile zerlegt und sofort wieder neu zusammengesetzt wird. Zunächst fotografiert er die Buchdeckel vorn und hinten, dann Rücken-, Bauch-, Kopf- und Fußschnitt. Es folgen der Spiegel vorn und schließlich Seite um Seite, stets erst die rechte, danach die linke.

„Ein fester Algorithmus, den wir so festgelegt haben“, erläutert Michael Knoche. Er scheint ebenso fasziniert von dem klassischen Band. „Einer der schönsten in unserer Faust-Sammlung“, schwärmt er. Dabei zähle diese immerhin 14 000 Bände des wichtigsten Goethe-Stückes – verlegt, gedruckt, übersetzt und gesammelt in aller Welt. Knoche leitet das weltberühmte Haus, in dem solcherlei Raritäten zuhauf zum Fundus gehören, die Herzogin Anna Amalia Bibliothek in Weimar.

Und zuhauf werden diese nun auch von Hochleistungsscannern abgetastet. Hierbei ließen sich, so Schade, Formate bis A 0 sowie unterschiedlichste Vorlagen – darunter Gemälde mit Rahmen, Reliefs und Miniaturen – ebenso schonend wie authentisch erfassen. Da freilich bei den Faust-Originalen eins schöner als das andere sei, wie Direktor Knoche mit hintersinnigem Lächeln hinzufügt, habe man sich entschieden, diese in Deutschland beispiellose Digitalisierungsaktion mit jener Spezialsammlung zu beginnen. Band für Band, Seite um Seite wird sie nun erfasst, elektronisch archiviert und anschließend ins Netz gestellt.

Selbst früheste literarische Zeugnisse vom Leben des Magiers Faust, in denen sich der junge Goethe zunächst selbst belas – etwa die „Epistolae familiares“ (1536) und die „Historia von Doctor Johann Fausten“ (1599) – werden so erstmals einer weltweiten Fangemeinde optisch zugänglich. Und damit diese auch in der letzten Studierstube authentisch anmuten, machen die Weimarer durch verschiedene Belichtungen selbst noch Reliefs und Strukturen sichtbar.

Schon 2001 habe seine Bibliothek mit der Digitalisierung wertvoller Bücher, Handschriften, Karten und Atlanten begonnen, erzählt Knoche. 200 bis 300 wären es sicher schon, überschlägt er. Doch für ein Haus mit fast 1 Mio. Exemplaren war dies zu wenig in vier Jahren. Zugleich drückten finanzielle und technologische Nöte: „Wie sollten wir die riesigen Speichermengen in den Griff bekommen!“ Immerhin entstünden beim Scannen pro Buchseite Tiff-Dateien mit bis zu 145 MByte Größe.

Dann aber kam die fürchterliche Brandnacht des 3. September 2004, als ein defektes Kabel den größten Bibliotheksbrand in der deutschen Nachkriegsgeschichte auslöste. Drei Tage lang kämpften 900 Helfer gegen die Flammen, die am Ende dennoch 50 000 Bände verschlangen. Weitere 62 000 Bücher aus der zum Weltkulturerbe zählenden Sammlung laborieren seither an Ruß- und Löschwasserschäden.

EMC Corporation

Die EMC Corporation mit Hauptsitz in Hopkinton, Massachusetts (USA), wurde 1979 gegründet. Sie entwickelt und vertreibt Produkte, Services und Komplettlösungen für Management und Speicherung von Informationen. 25 240 Mitarbeiter an weltweit über 100 Standorten erwirtschafteten 2004 einen Umsatz von 8,23 Mrd. $. Der Gewinn stieg nach Konzernangaben 2004 um 76 %. Laut einer Erhebung des US-Wirtschaftsmagazins Fortune sind 77 % der 500 weltgrößten Unternehmen EMC-Kunden, unter den 100 größten sind es sogar 90 %.

Seit 1986 ist EMC auch in Deutschland aktiv. Zu den Kunden zählen Unternehmen aller Branchen, so VW, BMW, ING-DiBa, Bayer, BASF, Aventis und Lufthansa. hl

Paradoxerweise war es dieses Unheil, das eine Lösung der Speicherprobleme anbahnen half. Denn dass die Bücherei monatelang im öffentlichen Interesse stand, rief einen gleich doppelt potenten Partner auf den Plan: die Firma EMC Deutschland. Die Tochter eines amerikanischen Spezialisten für digitale Langzeitspeicherlösungen zweigte nicht nur eine halbe Mio. € aus dem eigenen Etat ab, es liefert hierfür auch die nötige Hard- wie Software, um Zehntausende Weimarer Klassikbände digital erfassen und online präsentieren zu können.

„Kommen Sie, ich zeige Ihnen das Equipment“, bittet der Direktor eine Etage höher. Stolz öffnet er die Tür zu einer größeren Besenkammer. An deren Wänden steigen zahlreiche Kabelschnüre aufwärts, und gleich vorn links steht das einzige Mobiliar: ein schlanker, grauer Kasten. Der hat den Charme eines Kasernenspinds, doch Knoche strahlt zufrieden.

Was also ist des Pudels Kern, möchte man frei nach Goethe mit Dr. Faustus fragen. Als kompetentester Mephisto bietet sich hierfür Malte Rademacher an, Marketingchef von EMC für Europa und den Nahen Osten. Er kam Ende Oktober nach Weimar gereist, um Centera persönlich zu überbringen. So nenne sich, wie er erläutert, das Innenleben der Schränke: das von EMC entwickelte Online-Langzeitspeichersystem.

„Das plattenbasierte Archiv wurde eigens für die langfristige Aufbewahrung unveränderlicher digitaler Inhalte, so genanntem Fixed Content, entwickelt“, erläutert Rademacher. „Es archiviert die Daten als Objekte, deren Integrität dann konstant über einen elektronischen Fingerabdruck sowie eine interne Sicherheitskopie geschützt wird.“ Die momentane Kapazität pro System beziffert er mit 28 Terabyte, ausreichend für etwa 20 000 Bände.

Den Faustbänden folgen dann, wie von Knoche zu erfahren ist, eine Sammlung historischer Landkarten und Atlanten aus dem 15. Jahrhundert sowie literarische Werke des 18. und 19. Jahrhunderts. Hierzu zähle etwa ein Teil der Handschrift zur Oper „Orpheus und Eurydike“ von Christoph Willibald Gluck, verrät er. Ab 2007, dem 200. Todesjahr von Bibliotheksgründerin Herzogin Anna Amalia, sollen sie dann auch in Sekundenschnelle im Internet abrufbar sein.

Doch zwischen Scannen und Archivieren haben die Literaturgötter noch ein andere Hürde gesetzt: Wie erfasst und verlinkt man solch einen Mammutfundus derart präzise und unmissverständlich, dass sich die Digitalisate später eindeutig zuordnen lassen?

Dass dies gelingt, obliegt etwa Karin Schmidt. Sie sitzt in einem hellen schmucklosen Büro an einem ebenso unspektakulären PC-Bildschirm. Nicht ohne Grund hat man eine diplomierte Mathematikerin für jene filigrane Arbeit ausgeguckt. Denn geradezu pedantisch muss sie nun die digitalisierten Werke prüfen, gegebenenfalls nachbearbeiten und dann deren gesamte bibliographische Struktur – bis zu den Kapiteln, Kupferstichen oder sonstigen Abbildungen – in ein Dokumentenmanagementsystem eingeben. „Hieraus entstehen dann die Metadaten für die Online-Datenbank“, erzählt sie. Als Grundlage für das Einstellen ins Netz fertige sie je Seite jpeg-Dateien in drei verschiedenen Auflösungen an: je eine für Detailansichten, für die Vorschau sowie ein Thumbnail.

Auch dieses Dokumentenmanagementsystem lieferte EMC. Doch ganz so selbstlos ist deren Sponsoring natürlich nicht. Der Konzern wittert einen riesigen Markt und sieht sein Engagement in der berühmten Bibliothek, in deren Rokoko-Sälen einst auch der Geheimrat Goethe das Sagen hatte, als wirksamen Werbeträger.

Immerhin würden heute in der modernen Welt rund 80 % aller Informationen digital erstellt, mithin niemals zu Papier gebracht, erzählt Rademacher. Und gerade besagter Fixed Content mache heute die Hälfte des weltweit anfallenden Datenvolumens aus – in Gestalt von E-Mails, Verträgen, Röntgenbildern, TV-Filmen oder Satellitenbildern. „Auch die neuen Archivierungsfristen erfordern sehr lange Authentizität und Sicherheit der Daten“, gibt er zu bedenken.

Dennoch ziehen Mitarbeiter des Projektes „Anna Amalia“ parallel zur Digitalisierung von allen Originalen auch noch Mikrofilme – vorsichtshalber. Da gebe es halt noch so etwas wie „digitalen Alzheimer“, spöttelt Knoche. Er jedenfalls will er sichergehen, dass es seinen 400 Jahren alten Büchern eines Tages im elektronischen Bücherregal nicht so ergeht wie den gerade 40 Jahre alten Videobildern von der Mondlandung der Amerikaner: Sie sind heute bereits unlesbar. HARALD LACHMANN

 

Ein Beitrag von:

  • Harald Lachmann

Themen im Artikel

Stellenangebote im Bereich Softwareentwicklung

EschmannStahl GmbH-Firmenlogo
EschmannStahl GmbH Ingenieur für Automatisierungstechnik (M/W/D) Reichshof-Wehnrath
AGCO GmbH-Firmenlogo
AGCO GmbH Softwareentwickler (m/w/d) elektronische Steuergeräte Marktoberdorf
Lauer & Weiss GmbH-Firmenlogo
Lauer & Weiss GmbH Entwicklungsingenieur (m/w/d) modellbasierte Softwareentwicklung Fellbach bei Stuttgart
Lauer & Weiss GmbH-Firmenlogo
Lauer & Weiss GmbH Entwicklungsingenieur (m/w/d) Embedded Softwareim Bereich Automotive Fellbach bei Stuttgart
Lauer & Weiss GmbH-Firmenlogo
Lauer & Weiss GmbH Software-Entwickler (m/w/d)im BereichAutomotive Fellbach bei Stuttgart
Northrop Grumman LITEF GmbH-Firmenlogo
Northrop Grumman LITEF GmbH Softwareingenieur (m/w/d) Produktentwicklung Freiburg
TECCON Consulting&Engineering GmbH-Firmenlogo
TECCON Consulting&Engineering GmbH Softwareentwickler (m/w/d) Java / Spring / Hibernate / Maven keine Angabe
h.a.l.m. elektronik GmbH-Firmenlogo
h.a.l.m. elektronik GmbH Application Engineer (m/w/d) Solarzellen EL-Qualitätskontrolle mittels Machine-Learning Frankfurt am Main
MED-EL Medical Electronics-Firmenlogo
MED-EL Medical Electronics Development Engineer, Digital Signal Processing (m/f) Innsbruck (Österreich)
Bertrandt Services GmbH-Firmenlogo
Bertrandt Services GmbH Software Entwickler (m/w/d) keine Angabe

Alle Softwareentwicklung Jobs

Top 5 IT & T…

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.