Ihre Erfahrung mit RAID

esudnik

New Member
Hallo. Ich betreibe einen FreeBSD 6.0 Server mir Software Raid 1 über gmirror. Dabei habe ich Erfahrung gemacht, dass wenn eine Festplatte kaputt geht, das System in den meisten Fällen trotzdem mit einer Kernel-Panic abstürzt.

Nun habe ich vor das Ganze auf einen Hardware RAID mit 3ware Raid Controller 9550SX-4LP umzustellen. Leider habe ich damit keine Erfahrung. Kann mir jemand von euch sagen ob es bei einem Hardware RAID auch vorkommen kann, dass das gesamte System mit einer Panic abstürzt wenn eine Festplatte ausfällt? Und wenn ja, wie wahrscheinlich ist das?
 
gmirror gilt eigentlich als sehr zuverlässig. Derartige Probleme überraschen mich. Mit einem Hardware-Controller sollte das nicht auftauchen, da der Controller ja quasi eine Platte vorgaukelt, hinter der er die echten versteckt.
 
Öh, dumm gefragt Raid0?

Ich hab einige Escalades im Einsatz. Die Dinger machen NULL Ärger.

CU

Martin
 
Einmal ist dort das Problem von ata(4). Wie bekannt sein dürfte, ist P-ATA gar nicht hotplugfähig, für S-ATA muss man einen AHCI-fähigen Controller haben. Wenn eine Platte plötzlich verschwindet, gefällt FreeBSD dies gar nicht und er schmiert gern mal ab. Für ein RAID1 per gmirror sollte man daher auch wirklich hotplugfähige Hardware nutzen.

Die 3Ware sind sehr gut, laufen zuverlässig und haben das oben genannte Problem nicht. Fällt eine Platte aus, sieht das Betreibssystem selbst gar nicht und macht folglich auch keine Zicken :)
 
Oh Mann, erst gestern wieder 2-3 deadlocks meines Gmirror+Geli Verbunds unter 6.2 gehabt. Man muss nur nen rebuild anstarten (auf USB Platte), das device wieder deaktivieren und den rebuild erneut probieren -> I/O deadlock.

Mit ggate + gmirror auf SMP Maschinen hatte ich auch nur deadlocks unter Last. gmirror hat echt ein Haufen Probleme, aber pjd@ ist ja leider nicht an Code Maintenance interessiert sondern baut lieber immer mehr (halbherzig) implementierte Features ein. Siehe zB ZFS.

Seufz.

End-of-Rant.
 
Wie andere hier schon bemerkt haben ist gmirror auch nicht gerade fehlerfrei.

Mir ist dieses Wochenende eine Platte aus dem Verbund rausgefallen, vermutlich wegen eines defekten Kabels. Daten sind (auf den ersten Blick) keine verloren gegangen, allerdings brauchte das wiederherstellen des Mirrors, bestehend aus zwei 250 GByte IDE Platten, ca. 6h. Gemerkt hab ich den Defekt weil der Server stand - ob's aber am ATA Treiber oder an gmirror lag, kann ich nicht sagen.

Ob's mit einem Hardware RAID Controller besser gelaufen wäre, bleibt offen.
 
Ich schrieb es an anderer Stelle schon mal, aber hier noch einmal: gmirror und Snapshots auf UFS2 sind auch nicht gerade gute Freunde. Die Probleme beginnen bei plötzlich unsauberen Dateisystemen und enden bei Panics...
 
Da habe ich auch gleichmal eine Frage zu dem Thema. Wie Yamagi ja schrieb und es auch allgemein bekannt ist, versteckt ein Hardware-Raid Controller ja die Platten vor dem System.

Welche Möglichkeit habe ich bei einem 3ware Controller, den Ausfall einer Platte in einem RAID1 im laufenden Betrieb festzustellen? Bisher habe ich dazu nichts gefunden.

Ich selber habe noch keine Probleme mit gmirror und UFS2 Snapshots gehabt. Aber jetzt nagt es doch im Hinterkopf. :confused:

Gruß c.
 
Auf das Problem Snapshots + gmirror gingen die Ausfälle von BSDForen.de im Dezember 2006 und Januar 2007. Mir wurde damals versichert, dass die Fehler mit 6.2 eingeschränkt und mit 6.3 behoben sein. Tatsächlich sind sie nie wieder aufgetreten. Aber wirklich trrauen tue ich der ganzen Angelegenheit noch nicht, vor allem weil ich leicht paranoid bin :)

Zu 3Ware: Es gibt in den Ports Tools, um aus dem 3Ware den Status auszulesen. Also in welchem Zustand die Platten sind, einen Rebuild starten, usw.

Das sind im einzelnen:
http://www.freshports.org/sysutils/3dm/
http://www.freshports.org/sysutils/tw_cli/
 
also 3dm is der Prozess der die Daten vom Raidcontroller überwacht und zur not ne Mail sogar losschickt wenn ne Platte abbraucht oder das System plötzlich unterm arsch weggerissen wurd (stromausfall) ..
hatten wir bei uns am Masternode von unserem Cluster ne zeitlang (Hardwaredefekt am MoBo wohl)
der Prozess liefert übrigens auch n recht nettes WebGui.. wobei ich console doch mehr bevorzuge
Allerdings weiss ich nicht inwieweit das Programm unter BSD läuft, bei uns läuft es unter einem Linux
 
Läuft unter FreeBSD wie unter Linux, da beide Systeme vom Hersteller voll unterstützt und mit Software sowie Treibern (weshlab die OpenBSDler ihre Probleme mit 3Ware haben) versorgt werden.
 
Zurück
Oben