Schlagwort-Archive: Datenmüll

Datenkorruption und keine Ende in Sicht

Nach den erfolg­rei­chen Test­läu­fen mit dem neuen Spei­cher­sys­tem began­nen die ers­ten Ansätze zum Aus­le­sen der Daten aus den defek­ten RAID-Kon­fi­gu­ra­tio­nen sehr viel­ver­spre­chend.

Die Kon­fi­gu­ra­tion der defek­ten Fest­plat­ten­ver­bünde wurde von der ein­ge­setz­ten Soft­ware gefun­den und nach eini­gen Tagen Ana­ly­se­zeit wur­den von sel­bi­ger Soft­ware auch kopier- und damit rett­bare Nutz­da­ten ange­zeigt. Einige wei­tere Tage spä­ter war auch der erste Kopier­vor­gang von „defekt“ auf „neu“ abge­schlos­sen. Eine erste grobe manu­elle Durch­sicht zeigte bei Stich­pro­ben keine Auf­fäl­lig­kei­ten in Bezug auf Voll­stän­dig­keit der Daten und deren Qua­li­tät.

Zur Sicher­heit wie­der­hol­ten wir den gesam­ten Vor­gang des Aus­le­sen der RAID-Kon­fi­gu­ra­tion sowie des Kopie­rens der anschlie­ßend gefun­de­nen Daten noch ein­mal mit Hilfe einer zwei­ten Soft­ware. Im Anschluss daran ver­gli­chen wir die von Soft­ware 1 rekon­stru­ier­ten mit den von Soft­ware 2 geret­te­ten Daten auf Bit-genaue Über­ein­stim­mung. Weni­ger zu unse­rer Über­ra­schung als viel­mehr zu unse­rer Ent­täu­schung unter­schie­den sich die Daten­sätze doch sehr erheb­lich. Sowohl in Bezug auf die Anzahl der gefun­de­nen und kopier­ten Dateien als auch in Bezug auf deren jewei­lige Größe. Stich­pro­ben zeig­ten aber auch bei die­sem zwei­ten Daten­satz auf den ers­ten Blick keine Auf­fäl­lig­kei­ten in Bezug auf Voll­stän­dig­keit und Qua­li­tät der Daten.

Aus die­sem Grunde ent­schlos­sen wir uns zum Ein­satz einer drit­ten Soft­ware zum Ret­ten unse­rer Daten von den defek­ten RAID-Kon­fi­gu­ra­tio­nen. Das Ergeb­nis: Ein drit­ter, von Daten­satz 1 und 2 ver­schie­de­ner Satz an Dateien. Viel Freude hat die­ser Fakt bei uns nicht ver­brei­tet.

Beim direk­ten Ver­gleich der nun­mehr drei Daten­sätze fiel uns dann ein Umstand auf, der uns an der Qua­li­tät der Daten­ret­tungs­pro­gramme zwei­feln läßt: Bei einer Viel­zahl der geret­te­ten Bild­da­teien stim­men sowohl die EXIF-Daten als auch die Datei­na­men nicht mehr. So hat zum Bei­spiel ein Bild vom 01.01.2014 statt eines ent­spre­chen­den Datei­na­mens und ent­spre­chen­der Auf­nah­me­da­ten in den EXIF-Fel­dern der Datei nun­mehr einen Datei­na­men der eine Ent­ste­hung des Bil­des zum Bei­spiel am 01.07.2014 nahe­legt, sowie EXIF-Anga­ben, nach denen das Bild zum Bei­spiel am 30.10.2013 statt mit Kamera X mit Kamera Y erstellt wor­den sein soll. Nach umfang­rei­chem Ver­gleich las­sen sich diese Feh­ler in allen drei Daten­sät­zen fest­stel­len. Es sind jedoch unter­schied­li­che Dateien von die­sen Feh­lern betrof­fen. Das Bild die­ser Art der Daten­kor­rup­tion sieht abs­tra­hiert wie folgt aus:

Schema der Daten­kor­rup­tion bei unter­schied­li­chen Daten­ret­tungs­pro­gram­men
  Soft­ware 1Soft­ware 2Soft­ware 3
Bild 1gefun­den & kopiertjajanein
Datei­namekor­rektfalsch
EXIF-Datenfalschfalsch
Bild 2gefun­den & kopiertjaneinja
Datei­namefalschkor­rekt
EXIF-Datenkor­rektfalsch
Bild 3gefun­den & kopiertneinjaja
Datei­namekor­rektfalsch
EXIF-Datenkor­rektfalsch
Bild 4gefun­den & kopiertjajaja
Datei­namefalschkor­rektfalsch
EXIF-Datenkor­rektkor­rektfalsch

Die Kon­se­quenz aus die­sen drei Ret­tungs­ver­su­chen mit ihren jeweils unter­schied­li­chen Ergeb­nis­sen: Nach einem auto­ma­ti­schen Zusam­men­füh­ren der drei Daten­sätze müs­sen alle in die­sem neuen Daten­satz ent­hal­te­nen Daten wei­test­ge­hend manu­ell auf Voll­stän­dig­keit und Kor­rekt­heit geprüft wer­den. Und das nimmt lei­der sehr viel Zeit in Anspruch…

Dies bedeu­tet wie­derum, dass wir uns zur Nach­be­ar­bei­tung des Grenz­land-Pro­jek­tes nach dem gegen­wär­ti­gen Stand der Dinge eine neue Arbeits­platt­form besor­gen müs­sen, da die bestehende durch den not­wen­di­gen Sich­tungs- und  Vali­die­rungs­pro­zess der Alt­da­ten auf unab­seh­bar lange Zeit blo­ckiert sein wird.

Sobald ein dies­be­züg­li­cher Zeit­ho­ri­zont sicht­bar wird, geben wir an die­ser Stelle dar­über Aus­kunft.