Kollege Computer löst das Milliarden-Teile-Puzzle
Ende 1989 befahl Stasi-Chef Erich Mielke, so viele Stasi-Unterlagen wie möglich durch die Aktenschredder zu jagen oder von Hand zu zerreißen. Das Ergebnis: mehr als 1 Mrd. Puzzleteilchen. Von Hand würde die Rekonstruktion mehrere hundert Jahre dauern, doch mithilfe des Computers gelingt es in zehn bis 15 Jahren. VDI nachrichten, Düsseldorf, 6. 11. 09, rb
Am 6. November 1989 befahl Erich Mielke, der Minister für Staatssicherheit, so viele Stasi-Unterlagen wie möglich durch die Aktenschredder zu jagen. Doch die wenig leistungsfähigen Geräte gingen schnell kaputt – fast alle Akten wurden deshalb von Hand zerrissen. Das Resultat: 15 000 Säcke mit geschätzt 600 Mio. Fetzen. Weil sie aber zweiseitig bedruckt sein können, hat das Stasi-Puzzle mehr als 1 Mrd. Teile. Wollte die Stasi-Unterlagen-Behörde (BStU) die Akten von Hand rekonstruieren, bräuchte sie, je nach Personal, 400 bis 600 Jahre.
Umso mehr verwundert es, dass die Behörde so zögerlich reagierte, als Bertram Nickolay, ein Experte für maschinelles Sehen und Automatisierung, im Jahr 1995 vorschlug, dieses Puzzle von Computern zusammensetzen zu lassen. „Ich hatte Fernsehberichte gesehen über die Aktenschnipsel – und mich hat die Sache interessiert, weil ich mit einigen namhaften DDR-Dissidenten befreundet bin“, erzählt der Abteilungsleiter am Fraunhofer-Institut für Produktionsanlagen und Konstruktionstechnik in Berlin.
Doch die Behörde bezweifelte, dass Scanner und Computer in der Lage sein könnten, die zerrissenen Seiten zu rekonstruieren. Und so begann Nickolay auf eigene Faust, den Gegenbeweis anzutreten. Schritt für Schritt entwickelte er, unterstützt von Diplomanden, eine Puzzle-Software. Und als die BStU schließlich 2003 europaweit eine Machbarkeitsstudie zur maschinellen Rekonstruktion der Stasi-Akten ausschrieb, war sein Programm das einzige, das die Seiten korrekt und vollständig zusammensetzen konnte.
2007 begann endlich die Pilotphase, in der die Laboranlage zu einem leistungsfähigen System weiterentwickelt wurde. Das soll seine Fähigkeiten jetzt an 400 Säcken mit Schnipseln beweisen. „Das werden wir wohl bis zum Sommer 2011 schaffen, und wenn das System mal im Routinebetrieb läuft – die Computer können ja Tag und Nacht arbeiten -, könnten wir das gesamte Puzzle in zehn bis 15 Jahren schaffen“, meint Nickolay.
Um der Software ihre Arbeit zu erleichtern, werden die Säcke schichtweise ausgepackt, denn es hat sich gezeigt, dass zusammengehörige Teile oft nah beieinander liegen. Jede Schnipsel-Schicht landet zunächst in einem nummerierten Karton, um sie später wiederfinden zu können. Zum Scannen werden die Schnipsel von Hand auf ein Fließband gelegt. Die Puzzle-Software erfasst von jedem digitalisierten Schnipsel zahlreiche Merkmale, z. B. Papierfarbe, liniert oder kariert, Maschinen- oder Handschrift oder beides, und natürlich die Form. „Beim Zusammensetzen geht der Computer dann eigentlich genauso vor wie ein Kind, das legt bei einem Puzzle auch erstmal alle blauen Stückchen für den Himmel, dann alle grünen für die Wiese auf einen Haufen und so weiter.“
Die fertigen Seiten landen in Form von PDF-Dokumenten im sogenannten Lektoratsrechner, an dem Mitarbeiter der BStU und des Fraunhofer-Instituts überprüfen, ob die Seiten korrekt und vollständig zusammengesetzt wurden. Ein Mensch erfasst innerhalb weniger Sekunden, ob eine Seite „stimmt“ und der Text vollständig ist – während der Computer noch lange weiterpuzzelt, wenn nur eine unbedruckte Ecke fehlt.
Nachdem dieses Puzzle geschafft ist, könnte sich dann ein zweites anschließen, sozusagen eine Ebene höher. „Wir haben erstmal einzelne Seiten, aber ein Dokument besteht aus mehreren Seiten, eine Akte aus mehreren Dokumenten“, erklärt Nickolay. „Und da der Computer ja sowieso schon die Eigenschaften der Seiten erfasst hat, kann er sie auch für diese sogenannte Formierung vorsortieren.“ Die Behörde überlegt noch, ob der Computer auch diese Vorarbeiten übernehmen soll. „Die eigentliche Formierung anhand der Inhalte können dann natürlich nur die Archivare machen.“
14 Jahre nachdem Bertram Nickolay die Idee hatte, ist das Projekt heute weltbekannt. Aus Osteuropa und Südamerika melden sich Staaten, die ebenso wie Deutschland das Erbe eines Gewaltregimes zu bewältigen haben. In Argentinien sind es die Akten der Verschleppten und Verschwundenen sowie ein von Terroristen zerstörtes jüdisches Archiv. In Warschau, Prag und Sofia gibt es ebenfalls Säcke mit zerrissenen Unterlagen, wenn auch nur jeweils ein paar hundert.
Aber nicht nur politische Akten landen in Nickolays Labor. „Auch nationale und internationale Strafverfolgungs- und Finanzbehörden nutzen unsere Technik bereits, bei Razzien werden ja oft schnell noch ein paar brisante Dokumente zerstört.“ Für solche Fälle will er den Behörden demnächst eine Software zur Verfügung stellen, mit der sie selbst Dokumente rekonstruieren können.
Der neueste „Kunde“ allerdings hat eine Aufgabe mit ganz anderen Dimensionen zu bewältigen: das im März eingestürzte Kölner Stadtarchiv, dessen Dokumente vor dem Scannen zum Teil erst mal vorsichtig gereinigt werden müssen. „Die ersten Versuche waren vielversprechend.“ Auch diese gewaltige Aufgabe wird sein Puzzle-Computer bewältigen, da ist Bertram Nickolay zuversichtlich. RENATE ELL
Ein Beitrag von: