Nach den erfolgreichen Testläufen mit dem neuen Speichersystem begannen die ersten Ansätze zum Auslesen der Daten aus den defekten RAID-Konfigurationen sehr vielversprechend.
Die Konfiguration der defekten Festplattenverbünde wurde von der eingesetzten Software gefunden und nach einigen Tagen Analysezeit wurden von selbiger Software auch kopier- und damit rettbare Nutzdaten angezeigt. Einige weitere Tage später war auch der erste Kopiervorgang von „defekt“ auf „neu“ abgeschlossen. Eine erste grobe manuelle Durchsicht zeigte bei Stichproben keine Auffälligkeiten in Bezug auf Vollständigkeit der Daten und deren Qualität.
Zur Sicherheit wiederholten wir den gesamten Vorgang des Auslesen der RAID-Konfiguration sowie des Kopierens der anschließend gefundenen Daten noch einmal mit Hilfe einer zweiten Software. Im Anschluss daran verglichen wir die von Software 1 rekonstruierten mit den von Software 2 geretteten Daten auf Bit-genaue Übereinstimmung. Weniger zu unserer Überraschung als vielmehr zu unserer Enttäuschung unterschieden sich die Datensätze doch sehr erheblich. Sowohl in Bezug auf die Anzahl der gefundenen und kopierten Dateien als auch in Bezug auf deren jeweilige Größe. Stichproben zeigten aber auch bei diesem zweiten Datensatz auf den ersten Blick keine Auffälligkeiten in Bezug auf Vollständigkeit und Qualität der Daten.
Aus diesem Grunde entschlossen wir uns zum Einsatz einer dritten Software zum Retten unserer Daten von den defekten RAID-Konfigurationen. Das Ergebnis: Ein dritter, von Datensatz 1 und 2 verschiedener Satz an Dateien. Viel Freude hat dieser Fakt bei uns nicht verbreitet.
Beim direkten Vergleich der nunmehr drei Datensätze fiel uns dann ein Umstand auf, der uns an der Qualität der Datenrettungsprogramme zweifeln läßt: Bei einer Vielzahl der geretteten Bilddateien stimmen sowohl die EXIF-Daten als auch die Dateinamen nicht mehr. So hat zum Beispiel ein Bild vom 01.01.2014 statt eines entsprechenden Dateinamens und entsprechender Aufnahmedaten in den EXIF-Feldern der Datei nunmehr einen Dateinamen der eine Entstehung des Bildes zum Beispiel am 01.07.2014 nahelegt, sowie EXIF-Angaben, nach denen das Bild zum Beispiel am 30.10.2013 statt mit Kamera X mit Kamera Y erstellt worden sein soll. Nach umfangreichem Vergleich lassen sich diese Fehler in allen drei Datensätzen feststellen. Es sind jedoch unterschiedliche Dateien von diesen Fehlern betroffen. Das Bild dieser Art der Datenkorruption sieht abstrahiert wie folgt aus:
Schema der Datenkorruption bei unterschiedlichen DatenrettungsprogrammenSoftware 1 | Software 2 | Software 3 | ||
---|---|---|---|---|
Bild 1 | gefunden & kopiert | ja | ja | nein |
Dateiname | korrekt | falsch | — | |
EXIF-Daten | falsch | falsch | — | |
Bild 2 | gefunden & kopiert | ja | nein | ja |
Dateiname | falsch | — | korrekt | |
EXIF-Daten | korrekt | — | falsch | |
Bild 3 | gefunden & kopiert | nein | ja | ja |
Dateiname | — | korrekt | falsch | |
EXIF-Daten | — | korrekt | falsch | |
Bild 4 | gefunden & kopiert | ja | ja | ja |
Dateiname | falsch | korrekt | falsch | |
EXIF-Daten | korrekt | korrekt | falsch |
Die Konsequenz aus diesen drei Rettungsversuchen mit ihren jeweils unterschiedlichen Ergebnissen: Nach einem automatischen Zusammenführen der drei Datensätze müssen alle in diesem neuen Datensatz enthaltenen Daten weitestgehend manuell auf Vollständigkeit und Korrektheit geprüft werden. Und das nimmt leider sehr viel Zeit in Anspruch…
Dies bedeutet wiederum, dass wir uns zur Nachbearbeitung des Grenzland-Projektes nach dem gegenwärtigen Stand der Dinge eine neue Arbeitsplattform besorgen müssen, da die bestehende durch den notwendigen Sichtungs- und Validierungsprozess der Altdaten auf unabsehbar lange Zeit blockiert sein wird.
Sobald ein diesbezüglicher Zeithorizont sichtbar wird, geben wir an dieser Stelle darüber Auskunft.