Seitenanfang

RAID Rettung

Dieser Post wurde aus meiner alten WordPress-Installation importiert. Sollte es Darstellungsprobleme, falsche Links oder fehlende Bilder geben, bitte einfach hier einen Kommentar hinterlassen. Danke.


Wie schon geschrieben bin ich dabei meinen Home-Fileserver/Telefonanlage/etc. umzurüsten. Gestern Abend kamen die neuen Festplatten (UPS liefert hier meist zwischen 17:00 und 18:00 Uhr aus) und  waren dank Wechselrahmen auch schnell "eingebaut".

Dann begann die Einrichtung. Entgegen der ursprünglichen Planung werde ich letztendlich mit 5 Festplatten arbeiten, also immer noch zu sehr viele, aber zwei weniger als vorgesehen und zwar einfach weil ich diese Lösung für sinnvoller halte:

sda3 TBsdb3 TBsdc3 TBsdd160 GBsde160 GB
2 GB

Swap

2 GB

Swap

2 GB

/boot

RAID1

2 GB

/boot

RAID1

2 GB

/boot

RAID1

150 GB

/

RAID6

150 GB

/

RAID6

150 GB

/

RAID6

150 GB

/

RAID6

150 GB

/

RAID6

2 TB

storage

RAID5

2 TB

storage

RAID5

2 TB

storage

RAID5

Wer sich jetzt wundert, warum ich so viel Platz verschenke: Ich tue es nicht, alle Platten sind zu 100% partitioniert, der Rest ist Festplattenmathematik:

3 TB = 3000 GB (eigentlich wären es 3 * 1024 GB = 3072)

3000 GB - Partitionierung - 2 GB - 150 GB = 2038.98 GB

Aus Platzgründen wäre es vermutlich sinnvoller gewesen mit 7 Festplatten zu arbeiten um wenigstens die vollen 3000 GB unpartitioniert als RAID-Devices nutzen zu können, aber so sind es halt "nur" 3,8 TB netto inkl. Abzug für das XFS Dateisystem.

Die obige Grafik ist noch nicht ganz erreicht: Derzeit ist die "sde" noch nicht in Betrieb sondern dient als Datenzwischenspeicher, aber alle drei RAIDs sind aufgebaut und (nach rund 20 Stunden) syncronisiert.

Sicher booten kann man nur von RAID1 weil jede Festplatte ohne weiteres direkt lesbar ist (auch wenn moderne Bootloader z.T. auch von RAID5 booten können), die dreifache Absicherung sollte hoffentlich einen Verlust der Bootpartition verhindern auch wenn RAID1 immer das Problem der "schlechten" ersten Festplatte hat: Wenn sdc irgendwann mal unerkannte defekte Sektoren in diesen 2 GB hat, werden die kaputten Daten knallhart auf die anderen beiden intakten RAID1-Partitionen gespiegelt.

Das Betriebssystem und wichtige Daten ließen sich (genau wie /boot) glücklicherweise noch vollständig vom alten defekten RAID sichern und auch meine (mittlerweile 3) temporären Backups hätten eine Wiederherstellung erlaubt. Dieses RAID6 sollte hoffentlich einen Datenverlust beim nächsten Hardwarecrash vermeiden zumal die beiden 160 GB HDDs bereits jeweils einige Jahre Betriebszeit hinter sich haben, aber unabhängig voneinander und in unterschiedlichen Nutzungsszenarien - das hier 3 Festplatten gleichzeitig ausfallen ist fast auszuschließen zumal eine ohnehin nur als "Hot Spare" mitlaufen wird und bei Problemen einer anderen sofort automatisch übernehmen kann.

Der übrige Speicherplatz geht - wie früher - in ein RAID5. Ich habe lange überlegt ob ich anstatt eines großen RAIDs lieber 1-TB-Partitionen verwenden soll um nicht alles auf einem Dateisystem zu haben und bei einem irgendwann fälligen Upgrade könnte ich eine 3 TB Festplatte nachstecken und die 1 TB RAID-Devices neu "puzzeln", habe ich aber letztendlich dagegen entschieden. Alle dort gespeicherten Daten sind mehr oder weniger problemlos wiederbeschaffbar und selbst ein Verlust wäre schade, hätte aber keine (finanziellen) Folgen und (momentan) nehme ich eher eine naträgliche RAID- und XFS-Vergrößerung in Kauf. Vielleicht hätte ich das RAID noch partitionieren sollen, dann hätte ich nach einer Vergrößerung noch die Möglichkeit gehabt, den zusätzlichen Speicherplatz in einer eigenen Partition zu manifestieren.

Seit einigen Stunden kopiere ich jetzt Daten und habe bereits zwei Verzeichnisse gefunden, die von den Hardwarefehlern der alten Festplatten in Mitleidenschaft gezogen wurden. Das eine sollte sowieso auf das neue Storage RAID5 wandern und ich habe durch Zufall sogar noch eine 99%-Kopie an anderer Stelle, aber das zweite enthält unsere gesammelten Fotos seit unseren Anfängen der Digitalfotografie.

Ich habe beide Verzeichnisse beim Kopieren zurückgestellt, weil bei jeder einzelnen defekten Datei erst die Festplatte aussteigt, md dadurch das RAID - das dann nur noch aus einer intakten Festplatte besteht - stoppt und XFS einen Zwangs-Umount durchführt. Seitdem das Betriebssystem nicht mehr von dort läuft kann ich zwar das Filesystem regulär unmounten, das RAID stoppen und beides andersrum manuell restarten, aber das bei jeder defekten Datei zu machen wird noch nett werden und einige Zeit in Anspruch nehmen.

Vielleicht kopiere ich die defekte Festplatte auch "einfach" in eine 1-TB-Datei und lasse ihn die fehlerhaften Bereiche überspringen allerdings ohne Gewähr dass md sich danach anders verhält, mal schauen.

Verloren sind auf jeden Fall die Fotos von einem Kiga-Sommerfest mit Bea, ich glaube von 2005. Schöne Erinnerungen, auch wenn ich zugeben muss, dass wir sie bestimmt seit einigen Jahren nicht mehr angesehen haben.

Derzeit - beim Kopieren - sind inklusive einer USB-Festplatte insgesamt 9 Stück in Betrieb. Es ist ganz nett "/dev/sdi1" zu mounten, macht man auch nicht alle Tage.

Hier noch der Schnellkurs zum RAID-Bau:

RAID 6 mit 4 Devices erstellen: mdadm --create -l 6 -n 4 /dev/md0 /dev/sd[abcde]2

RAID-Metadaten auslesen: mdadm --misc -E /dev/sda2

RAID später zusammenbauen: mdadm --assemble /dev/md0 /dev/sd[abcde]2

Defektes "degraded" RAID zusammenbauen: mdadm --assemble /dev/md0 /dev/sd[ab]2 --force (Baut ein RAID5 nur aus /dev/sda2 und /dev/sdb2 zusammen. Achtung: Die gecrashte Festplatte (diejenige die bei mdadm --misc -E nicht als "faulty" geführt wird) muss immer als erstes angegeben werden, sonst weigert sich md das RAID zusammenzusetzen!)

mdadm.conf - Zeilen generieren: mdadm --detail --scan >>/etc/mdadm.conf

PS: Ich finde es erstaunlich, wie langsam ein moderner Computer Dateien kopieren kann. Wenn man allerdings bedenkt, dass er diese mit Hilfe der Parity aus dem defekten RAID5 ausrechnen und dann eine neue Parity für das neue RAID5 oder RAID6 berechnen muss, erklärt sich die Geschwindigkeit. Absolute Zahlen habe ich nicht, aber ohne diese Ausreden wäre ich wirklich enttäuscht.

 

Noch keine Kommentare. Schreib was dazu

Schreib was dazu

Die folgenden HTML-Tags sind erlaubt:<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>