Daten für die Ewigkeit

Wissenschaftliche Rechenzentren

Archivbeispiel Leibniz-Rechenzentrum

image.jpg

© PC Magazin

Vorsintflutliche Datenträger? Daten auf Disketten sind heute schon kaum mehr lesbar.

Auch in den wissenschaftlichen Rechenzentren ist Langzeit-Archivierung ein großes Thema. Primärdaten aus Studien und Experimenten müssen laut den Richtlinien der Deutschen Forschungsgemeinschaft (DFG) mindestens zehn Jahre aufbewahrt werden, einzelne Einrichtungen wie Unikliniken wollen ihre Daten 30 Jahre und länger halten.

Diese Institutionen kämpfen, neben dem Medienproblem, vor allem mit riesigen Datenmengen. Beim Leibniz-Rechenzentrum (LRZ) in München z.B., dem IT-Dienstleister für alle Münchner Hochschulen, wurde bereits 2007 die 3000-Terabyte-Grenze überschritten, die Hälfte davon sind Archivdaten.

DVDs kommen bei diesen Datenmengen als Speichermedium nicht in Frage, stattdessen archiviert das LRZ auf Magnetbändern. Die Bandtechnologie, die dabei zum Einsatz kommt, ermöglicht die Speicherung von bis zu 1000 GByte auf einem Magnetband.

Theoretisch sind dafür zwar auch Festplatten als Datenträger geeignet. Doch die gelten bei den großen Datenmengen wegen der hohen Energiekosten als nicht effizient genug.

Im Gegensatz zu Bändern muss man nämlich in Platten auch die Wärme wieder abführen, die beim Betrieb entsteht. Für tausende von Festplatten ist eine große, teure Klimaanlage nötig. Magnetbänder hingegen brauchen im Gegensatz zu Festplatten kaum Energie und produzieren auch keine Wärme.

Die Verwaltung der Archivdaten erfolgt mit einer speziellen Archivierungs-Software, mit der sich verschiedene Policies definieren lassen. Über diese lässt sich festlegen, wie lange welche Daten aufbewahrt werden, wie viele Versionen es geben soll und wann welche Daten gelöscht werden sollen.

Mehrfach gesichert

image.jpg

© PC Magazin

Das Leibniz-Rechenzentrum in Garching bei München beteiligt sich an einer kontinuierlich wachsenden Zahl von Archivierungs-Projekten.

Um digitale Daten über Jahrzehnte hinweg zu erhalten, sieht das LRZ nur eine praktikable Lösung: Die Informationen müssen nach einigen Jahren auf neue Datenträger kopiert - im Fachjargon: "migriert" - werden. Mehr als fünf Jahre werden die Daten in der Regel am LRZ nicht auf dem gleichen Medium gehalten.

Mit dieser Strategie schlägt das LRZ zwei Fliegen mit einer Klappe: Man senkt die Wahrscheinlichkeit, dass Daten infolge mangelnder Haltbarkeit des Datenträgers verloren gehen. Und: Man bleibt auf dem aktuellen Stand der Technik der Lesegeräte.

Aufbewahrt werden die Bänder in vollklimatisierten Räumen mit konstanter Temperatur und Feuchtigkeit, die mehrfach gegen alle möglichen Katastrophen abgesichert sind. Sollte es trotz aller Vorsichtsmaßnahmen doch einmal zu einer völligen Zerstörung des Rechenzentrums kommen, bleiben immer noch die Nachbarn: Die wichtigsten Daten werden an das einige hundert Meter entfernte Rechenzentrum der Max-Planck-Gesellschaft in Garching kopiert.

image.jpg

© PC Magazin

Scan-Robotor wie von der österreichischen Firma Treventus digitalisieren Bücher und andere gebundenen Druckerzeugnisse automatisch und schonend.

Know-how und technische Infrastruktur machen das LRZ zu einem begehrten Partner bei Archivierungs-Projekten. So führt das LRZ mit der Bayerischen Staatsbibliothek mehrere Projekte durch. Zusammen mit Google erfolgt etwa die Massendigitalisierung des urheberrechtsfreien historischen Bestandes an Druckwerken - über eine Million Titel mit über 250 Millionen Seiten.

Bereits abgeschlossen ist das von der DFG geförderte Projekt vd16digital, bei dem zwischen 2007 und 2009 das deutsche Schriftgut des 16. Jahrhunderts eingescannt und archiviert wurde.

Die Buchseiten wurden über Scan-Roboter eingelesen, die automatisch umblättern können, und anschließend als Bilddaten im TIFF-Format gespeichert - TIFF ist weit verbreitet, gilt als zukunftssicher und besitzt eine sehr hohe Farbtreue. Später sollen die TIFFs per OCR-Software eingelesen werden, um Texte per Volltextsuche zu erreichen.

Mehr zum Thema

SSD: Optimale Windows 7-Einstellungen
SSD Einstellungen

Wir geben wertvolle Tipps, wie Sie Ihrer SSD unter Windows 7 zu noch mehr Leistung verhelfen und außerdem deren Lebensdauer verlängern.
SSD
Sicherheit

In den letzten Wochen erreichten uns Meldungen von Forscherteams, die nicht nur an entgegengesetzten Enden der Welt forschen, sondern auch, je nach…
Die NSA könnte Zugriff auf Intel- und AMD-Prozessoren haben.
Hardware-Hintertür für NSA?

Steve Blank glaubt, dass NSA, Prism & Co. via Sicherheitsupdates Zugriff auf Intel- und AMD-CPUs haben. So ließe sich der Großteil des Internet…
Ein Anbieter von Online-Backups verrät, welche HDDs zuverlässig sind.
Hitachi Spitze bei HDD-Zuverlässigkeit

Der Online-Backup-Anbieter Backblaze hat eine Statistik darüber veröffentlicht, welche Festplatten besonders zuverlässig sind. HDD-Hersteller…
USB-SSD Verbatim Vx450 External SSD
SSD-Tuning

Wir geben fünf Tipps für Abelssoft SSD Fresh 2015. Damit unternehmen Sie perfektes SSD-Tuning für mehr Lebenszeit und bessere Performance.