Daten für die Ewigkeit

Wissenschaftliche Rechenzentren

20.6.2011 von Klaus Manhart

ca. 2:10 Min
Ratgeber
VG Wort Pixel
  1. Langzeit-Archivierung in der Wissenschaft
  2. Wissenschaftliche Rechenzentren
  3. Langzeit-Archivierung

Archivbeispiel Leibniz-Rechenzentrum

image.jpg
Vorsintflutliche Datenträger? Daten auf Disketten sind heute schon kaum mehr lesbar.
© PC Magazin

Auch in den wissenschaftlichen Rechenzentren ist Langzeit-Archivierung ein großes Thema. Primärdaten aus Studien und Experimenten müssen laut den Richtlinien der Deutschen Forschungsgemeinschaft (DFG) mindestens zehn Jahre aufbewahrt werden, einzelne Einrichtungen wie Unikliniken wollen ihre Daten 30 Jahre und länger halten.

Diese Institutionen kämpfen, neben dem Medienproblem, vor allem mit riesigen Datenmengen. Beim Leibniz-Rechenzentrum (LRZ) in München z.B., dem IT-Dienstleister für alle Münchner Hochschulen, wurde bereits 2007 die 3000-Terabyte-Grenze überschritten, die Hälfte davon sind Archivdaten.

DVDs kommen bei diesen Datenmengen als Speichermedium nicht in Frage, stattdessen archiviert das LRZ auf Magnetbändern. Die Bandtechnologie, die dabei zum Einsatz kommt, ermöglicht die Speicherung von bis zu 1000 GByte auf einem Magnetband.

Theoretisch sind dafür zwar auch Festplatten als Datenträger geeignet. Doch die gelten bei den großen Datenmengen wegen der hohen Energiekosten als nicht effizient genug.

Im Gegensatz zu Bändern muss man nämlich in Platten auch die Wärme wieder abführen, die beim Betrieb entsteht. Für tausende von Festplatten ist eine große, teure Klimaanlage nötig. Magnetbänder hingegen brauchen im Gegensatz zu Festplatten kaum Energie und produzieren auch keine Wärme.

Die Verwaltung der Archivdaten erfolgt mit einer speziellen Archivierungs-Software, mit der sich verschiedene Policies definieren lassen. Über diese lässt sich festlegen, wie lange welche Daten aufbewahrt werden, wie viele Versionen es geben soll und wann welche Daten gelöscht werden sollen.

Mehrfach gesichert

image.jpg
Das Leibniz-Rechenzentrum in Garching bei München beteiligt sich an einer kontinuierlich wachsenden Zahl von Archivierungs-Projekten.
© PC Magazin

Um digitale Daten über Jahrzehnte hinweg zu erhalten, sieht das LRZ nur eine praktikable Lösung: Die Informationen müssen nach einigen Jahren auf neue Datenträger kopiert - im Fachjargon: "migriert" - werden. Mehr als fünf Jahre werden die Daten in der Regel am LRZ nicht auf dem gleichen Medium gehalten.

Mit dieser Strategie schlägt das LRZ zwei Fliegen mit einer Klappe: Man senkt die Wahrscheinlichkeit, dass Daten infolge mangelnder Haltbarkeit des Datenträgers verloren gehen. Und: Man bleibt auf dem aktuellen Stand der Technik der Lesegeräte.

Aufbewahrt werden die Bänder in vollklimatisierten Räumen mit konstanter Temperatur und Feuchtigkeit, die mehrfach gegen alle möglichen Katastrophen abgesichert sind. Sollte es trotz aller Vorsichtsmaßnahmen doch einmal zu einer völligen Zerstörung des Rechenzentrums kommen, bleiben immer noch die Nachbarn: Die wichtigsten Daten werden an das einige hundert Meter entfernte Rechenzentrum der Max-Planck-Gesellschaft in Garching kopiert.

image.jpg
Scan-Robotor wie von der österreichischen Firma Treventus digitalisieren Bücher und andere gebundenen Druckerzeugnisse automatisch und schonend.
© PC Magazin

Know-how und technische Infrastruktur machen das LRZ zu einem begehrten Partner bei Archivierungs-Projekten. So führt das LRZ mit der Bayerischen Staatsbibliothek mehrere Projekte durch. Zusammen mit Google erfolgt etwa die Massendigitalisierung des urheberrechtsfreien historischen Bestandes an Druckwerken - über eine Million Titel mit über 250 Millionen Seiten.

Bereits abgeschlossen ist das von der DFG geförderte Projekt vd16digital, bei dem zwischen 2007 und 2009 das deutsche Schriftgut des 16. Jahrhunderts eingescannt und archiviert wurde.

Die Buchseiten wurden über Scan-Roboter eingelesen, die automatisch umblättern können, und anschließend als Bilddaten im TIFF-Format gespeichert - TIFF ist weit verbreitet, gilt als zukunftssicher und besitzt eine sehr hohe Farbtreue. Später sollen die TIFFs per OCR-Software eingelesen werden, um Texte per Volltextsuche zu erreichen.

Mehr lesen

Chronologische Liste und Netflix-Links

Marvel-Filme- und -Serien: Das ist die richtige Reihenfolge

Neuerscheinungen in der Übersicht

Netflix: Neue Filme und Serien

Vorschau auf Film- und Serien-Highlights

Amazon Prime Video: Neuheiten

Weiter zur Startseite  

Mehr zum Thema

SSD

Sicherheit

Datensicherheit bei SSDs: Löschen und Wiederherstellen

In den letzten Wochen erreichten uns Meldungen von Forscherteams, die nicht nur an entgegengesetzten Enden der Welt forschen, sondern auch, je nach…

software,freeware,tools,dattenrettung,workshop

Datenrettung

Dateien wiederherstellen - so geht's

Schnell hat man aus Versehen eine Datei gelöscht oder eine DVD ist nicht mehr lesbar. Wir zeigen Ihnen, wie Sie Daten retten können und was Sie dazu…

Die NSA könnte Zugriff auf Intel- und AMD-Prozessoren haben.

Hardware-Hintertür für NSA?

Prism-Spione könnten mit Intel- und AMD-CPUs das Internet…

Steve Blank glaubt, dass NSA, Prism & Co. via Sicherheitsupdates Zugriff auf Intel- und AMD-CPUs haben. So ließe sich der Großteil des Internet…

Ein Anbieter von Online-Backups verrät, welche HDDs zuverlässig sind.

Hitachi Spitze bei HDD-Zuverlässigkeit

Anbieter von Online-Backups nennt zuverlässige Festplatten

Der Online-Backup-Anbieter Backblaze hat eine Statistik darüber veröffentlicht, welche Festplatten besonders zuverlässig sind. HDD-Hersteller Hitachi…

Software Installation

Computer ohne Werbung

Adware vermeiden: Mit diesen 5 Tipps bleibt Ihr PC sauber

Wer unachtsam Programme installiert, kann sich schnell unerwünschte Software-Parasiten einfangen. Wir geben 5 Tipps, wie Sie Adware vermeiden.