Festplattenschaden durch Magnete?

Wenn Load_Cycle_Count nicht alle 5 Sekunden inkrementiert, dann ist es ok. Die Festplatte ist eigentlich nicht so alt (von der Laufzeit her)... deswegen kann man nicht klar sagen ob das Teil wegen Load_Cycle_Count (gerade) spinnt.

Wenn der zpool keinen import mitmacht, dann sehe ich schwarz.
 
Wenn der zpool sich nicht importieren lässt, lässt sich vielleicht noch was mit zdb retten. Aber dafür bin ich der falsche Ansprechpartner.
 
Wenn der zpool sich nicht importieren lässt, lässt sich vielleicht noch was mit zdb retten. Aber dafür bin ich der falsche Ansprechpartner.

Danke, aber jetzt hab ich schon genullt, bzw. das geli device. Morgen werde ich die backups zurückspielen. Die andere Festplatte kommt hoffentlich bald aus der Reperatur und dann ist der Pool im Server auch erstmal self-healing, dann werden wir sehen ob eine Festplatte schlapp macht, die kann ja dann immernoch replaced werden...
 
The never-ending story continues.

Im Server laufen zwei neue Platten im RAID1 (zfs-mirror). ca. 6 Wochen problemlos 24/7 (auch mit zpool scrub 1x pro Woche). Das ganze diesmal mit anderem Netzteil, das mehr Spielraum hat als das Letzte. Die SATA_Kabel wurden auch alle getauscht.

Heute morgen, dann Lesefehler über NFS... zpool status gibt 540 "permanent errors". zpool scrub ist gerade druch, die Fehler sind auf ca 1500 hochgegangen, nach dem Srub jetzt wieder auf 936 runter. Bei der einen Platte sagt er 13.3G repaired, bei der anderen ca. 16G repaired.
Woher weiß ich danach, was repaired wurde und was kaputt ist? Sind alle Dinge, die jetzt noch als Fehler markiert sind, wirklich kaputt? Sollte ich nochmal einen clear und ein srub machen?

Beim Neustarten heute morgen kam der Server auch nicht hoch, weil er die Systemplatte (2GB CF-Modul, das über einen IDE-CF-Adapter angeschlossen ist) nicht erkannte. Nach einem Wackeln an allen Kabeln gings dann. Meint ihr das könnte ein Problem sein, und ich sollte es nochmal mit einer anderen Systemplatte (kleine SSD oder Flash-Modul ohne Kabel) versuchen, oder ist der SATA-Controller auf dem Mainboard auf jeden Fall im Eimer und sollte ausgetauscht werden?

Irgendwen glaube ich inzwischen eher an letzteres, eine kaputte Systemplatte sollte ja auch nicht zu Corruptions auf anderen Platten führen, oder? Ich meine die Kernel wird doch einmal in den Speicher geladen und dann ist gut...

Wie sollte ich jetzt überhaupt vorgehen, ich bin 14tage außer Haus und hatte eigentlich geplant per openvpn darauf zuzugreifen. Wäre es schlauer, die Kiste runterzufahren um weitere Fehler zu vermeiden? Oder ists eh latte?

Irgendwie Mist das Ganze :(
 
Also ne kaputte Systemplatte kann dazuführen das alles was von ihr gelesen wird potentiell kaputt ist. Ich habe keine Ahnung was dein System für Schäden hat, aber zpool status -v sollte betroffenen Datein auflisten. Wenn ZFS anhand der Prüfsummen eine kaputte Kopie der Daten erkennt versucht es automatisch die andere Kopie zu lesen ohne das Anwendung dies mitbekommen. Afaik bedeutet "permanent errors", das ZFS nicht in der Lage ist den Fehler mit Hilfe von Redundanz zu beheben d.h. die betroffnen Daten sind verloren.
 
So, ich habe jetzt die Platten aus dem Server in den Desktop gesteckt und dort nochmal ein Scrub laufen lassen und magischerweise sind jetzt alle Fehler verschwunden, auch die, die auf dem Server noch nach dem Scrub da waren.

Ein stichprobenartiger Test einiger als kaputt markierten Dateien, scheint zu bestätigen, dass der Pool repariert wurde. Ich gehe nun also davon aus, dass der Controller im Serverboard kaputt ist und werde das einschicken.
 
So, jetzt bin ich endgültig fertig mit den Nerven.

Im Desktop, wo die Platten jetzt neben einer SSD hängen, ist auch wieder alles im Arsch. Nach einem Start von KDE stürzten alle Programme ab, (die liegen noch auf der SSD mit UFS, laden ihre Einstellungen aber vom Pool). zpool scrub gestartet, innerhalb von Minuten über 1000 Fehler auf beiden Platten des RAID.
Dann dachte, ich checke erstmal den Host, wollte eine man-Seite angucken, wobei groff segfaultete. Habe dann ein pkg_info -ag gemacht, was mir hunderte Checksum-Mismatche gab und sich das System dann mit einer Panic verabschiedete.

Wenn ihr mir nicht erzählen wollt, der SATA-Controller im Desktop sei auch kaputt (der auch schon eine Weile vorher gut lief), dann gehe ich irgendwie davon aus, dass es an der Software liegt, also FreeBSD zwischen 8.0 und 8.1 irgendwann ziemlich kaputt gegangen ist. Alles andere kann ich mir echt nicht mehr erklären :confused:

Leider kann ich das System nicht mit einem älterem FreeBSD testen, da AES-XTS verwendet wird und die aktuellste Version ZFS.

Hat jemand irgendwelche Ideen?

Wenn mir nicht bald was einfällt, werde ich mir wahrscheinlich einen Migrationspfad auf Linux überlegen, obwohl ich da echt keinen Bock drauf habe. Aber das kostet mich einfach zuviel Zeit, jede Woche geht hier irgendwas kaputt, ich kann überhaupt nicht produktiv arbeiten :(
 
So, Flucht nach vorne: Ich lasse gerade mit einem Current Live-System einen Scrub über den Pool laufen, wenn der erfolgreich ist, aktualisier ich das System von der Live-CD auf aus Current und versuch es dann damit, was anderes fällt mir nicht mir ein.

Wenn das nicht klappt, werde ich die Dinge wohl oder Übel auf Linux migrieren müssen, obwohl ich es echt nicht verstehe. Wenn es FreeBSD-Probleme sind, müsste jemand anderes die ja auch haben, sind ja ganz normale AMD/ATI IXP700 SATA-Controller...
 
Also der Scrub von der CD aus ist durchgelaufen. Statt der vorher >1000 Fehler nach 1% gabs jetzt so gut wie keine, der Scrub hat ein paar MB repariert, nur zwei core-Dateien, die im kaputten Zustand geschrieben worden waren waren nicht repabel.

Ich habe jetzt current draufgebügelt. Im Moment scheint alles zu gehen, aber ich traue dem Frieden nicht so ganz (vorher gings ja auch ne Woche mit 8.2 problemlos).
 
Tja, und heute habe ich schon wieder ein paar Fehler im zpool...

Gibt es noch eine Möglichkeit wie das an Hardware liegen könnte? Wie kann ich möglichst sicher ausschließen, dass es an der Hardware liegt? Ich meine, ich habe die Probleme an zwei unterschiedlichen Mainboards, mit jeweils anderen CPUs und RAM. Ich habe die Probleme mit mehreren z.T. nagelneuen Platten, ich hab die Kabel mehrfach gewechselt und im BIOS alle möglichen SATA-Modi durchprobiert.

Ich habe hier noch ein Linux, mit dem ich aber nicht auf die Platten komme. Würde folgendes Szeneraio zum testen Sinn machen:
- Unter Linux ein Virtualbox-Image mit FreeBSD anlegen
- Dem Image die Platten übergeben und diese per NFS freigeben lassen (<- geht das überhaupt so einfach?)
- Unter Linux NFS mounten und fleißig nutzen, gucken ob was passiert

Dann gehen alle Hardware-zugriffe, doch durch den Linux-Kernel, oder nicht? Wenn es dann geht, weiß ich dass es ein Software-Problem ist, wenn es dann auch Probleme gibt, kann ich das zweite Mainboard auch einschicken…
 
Hmm, ist schon merkwürdig. Ich weis nicht, was d mit den anderen Mainboard, CPU und so weiter gemacht hast. Mein Vorschlag wäre, die vermeintliche defekte Hardware zusammenschustern, und dann das das System, was du auf dem zpool aufgebaut hast, auf das andere System überträgst, aber die Platten selbst nur im stink normalen Raidverbund laufen lässt, also komplett ohne zpool. So das du zwei gleiche Kisten hast. Vieleicht ist da im zpool noch irgendwo der Hund begraben. Ist nur so ein Gedanke. Kann mir kaum vorstellen, das in so kurzer Zeit, die schon wieder die Kiste abpfeift.
 
Man ganz allgemein gefragt. Wie alt und in welchem Zustand ist die Elektroinstallation deiner Wohnung?
 
Hmm, ist schon merkwürdig. Ich weis nicht, was d mit den anderen Mainboard, CPU und so weiter gemacht hast. Mein Vorschlag wäre, die vermeintliche defekte Hardware zusammenschustern,
Ich weiß ja nicht was defekt ist, es geht ja in beiden Systemen nicht.
und dann das das System, was du auf dem zpool aufgebaut hast, auf das andere System überträgst, aber die Platten selbst nur im stink normalen Raidverbund laufen lässt, also komplett ohne zpool. So das du zwei gleiche Kisten hast. Vieleicht ist da im zpool noch irgendwo der Hund begraben. Ist nur so ein Gedanke. Kann mir kaum vorstellen, das in so kurzer Zeit, die schon wieder die Kiste abpfeift.
Naja, die SSD mit UFS macht ja auch Probleme, insofern kanns an ZFS nicht liegen…

Man ganz allgemein gefragt. Wie alt und in welchem Zustand ist die Elektroinstallation deiner Wohnung?

Die Wohnung ist nicht wirklich modern, im Sicherungskasten sind noch diese Old-school-Sicherungen, die durchbrennen und ersetzt werden müssen. Kann schon sein, dass da was murks ist. Andererseits verwende ich auch eine Mehrfachsteckerleiste mit Überspannungsschutz und drei Notebooks, die es in der Wohnung gibt haben nie Probleme gehabt.
 
Notebooks haben auch ihre eigene USV eingebaut. Die üblichen Fragen nach unterdimensionierten Netzteilen brauchen wir dir nicht stellen oder?
 
dann denke ich ist das des Rätsels Lösung! Die Laptops sind gepuffert dank des eingebauten Akkus. Deine (Desktop)Rechner nicht. Am Sinnvollsten wäre es das mit einer USV zu testen. Das kann die kleinste sein die es gibt, es sollte nur eine Online-USV sein, also eine wo der Akku dauerhaft benutzt wird. Es gibt auch welche wo der Akuu nur falle des Stromausfalles gestartet wird.

Gruß ré
 
Notebooks haben auch ihre eigene USV eingebaut. Die üblichen Fragen nach unterdimensionierten Netzteilen brauchen wir dir nicht stellen oder?

Im Server hatte ich eins, das knapp war, habe dann aber auf ein größeres gewechselt. Der Server zieht max 60W, das alte Netzteil hatte 75W, aber ich habe es dann gegen ein 250W getauscht. Die ganze letzte "Welle" Probleme kam damit.

Im Desktop, wo jetzt alles hängt habe ich 300W, das ist möglicherweise etwas knapp, werde ich mal testen mit Messgerät.
 
dann denke ich ist das des Rätsels Lösung! Die Laptops sind gepuffert dank des eingebauten Akkus. Deine (Desktop)Rechner nicht. Am Sinnvollsten wäre es das mit einer USV zu testen. Das kann die kleinste sein die es gibt, es sollte nur eine Online-USV sein, also eine wo der Akku dauerhaft benutzt wird. Es gibt auch welche wo der Akuu nur falle des Stromausfalles gestartet wird.

Gruß ré

Ist das echt so, dass die Stromversorgung sowas anrichten kann? Ich meine, die Probleme bestehen erst, seit ich in diese Wohnung gezogen bin, das würde Sinn machen. Ich hab sowas aber noch nie gehört und kenn Leute, die in viel kaputteren Häusern wohnen ;)

Kann ich das irgendwie eindeutig überprüfen, ob da Schwankungen oder Unterbrechungen stattfinden, die außerhalb des normalen Bereichs sind?
 
Ich würde nirgendwo einen Rechner ohne USV betreiben. Seit der Privatisierung des Strommarktes gibt es in vielen Gegenden häufige Spitzen oder Abfälle die einen PC stören.

Damals noch zu Win95 Zeiten als ich noch bei meinen Eltern lebte und mir eine USV zulegte hörte ich das Relais mehrmals die Woche als die USV jeweils für ein paar Sekunden (zu kurz um den Alarm auszulösen) die Stromversorgung übernahm (ich mache dafür Spitzen verantwortlich, denn alles andere lief weiter).

Ganz allgemein wurde der Rechner damals stabiler. Die USV gibt einfach eine Zahnradspannung /\/\/ raus, egal was reinkommt. Und was reinkommt ist häufig bloß Staubsaugerqualität.

Wo ich jetzt wohne habe ich solche Probleme nicht. Aber es gab in der Zeit hier ein paar große Stromausfälle.
 
Ist das echt so, dass die Stromversorgung sowas anrichten kann? Ich meine, die Probleme bestehen erst, seit ich in diese Wohnung gezogen bin, das würde Sinn machen. Ich hab sowas aber noch nie gehört und kenn Leute, die in viel kaputteren Häusern wohnen ;)

Erstens kann niemend die Qualität der Leitungen einschätzen, Zweitens können starke Störer in unmittelbarer Nachbarschaft sein. Eine nicht entstörte WaMa, eine defektes PC-Netzteil, eine TV, irgendwelche Maschinen mit Wandlernetzteil die nicht richtig entstört sind oder falsche kompensiert sind. Da gibt es hunderte Möglichkeiten. Das in Verbindung mit einer schlechten Leitung kann dir alle Geräte killen.

Kann ich das irgendwie eindeutig überprüfen, ob da Schwankungen oder Unterbrechungen stattfinden, die außerhalb des normalen Bereichs sind?

Ja, aber diese Meßgeräte kosten verdammt viel, aber vielleicht leiht Sie dir dein befreundeter Elektriker?

Bei uns im Haus war die Hauptleitung fürs Haus 2,5qm Kupfer, verzinnt und mit Baumwolle Isoliert, die Sicherungen waren 3x25A (fürs ganze Haus). Dafür war in jeder Wohnung nur jeweils eine Phase ;-)

Gruß ré
 
Ja, aber diese Meßgeräte kosten verdammt viel, aber vielleicht leiht Sie dir dein befreundeter Elektriker?

Naja, irgendwie muss ich das ja rausfinden, kann ja nicht ins Blaue für mehrere Rechner USVs kaufen, das kostet Geld und verbraucht ja auch selber mehr Strom.

Überhaupt kommen die VFI-Dinger nicht in Frage, weil da das billigste 190€ kostet und laut WIkipedia verbraucht sowas im Idle >80W.

Und kann ich den Vermieter dafür nicht zur Kasse bitten? Ich meine, in meinem Mietvertrag steht nirgends, dass in der Wohnung keinen normalen Computer betrieben werden können. Deswegen muss ich irgendwie zweifelsfrei feststellen können obs an der Wohnung liegt :S
 
Naja, irgendwie muss ich das ja rausfinden, kann ja nicht ins Blaue für mehrere Rechner USVs kaufen, das kostet Geld und verbraucht ja auch selber mehr Strom.

Überhaupt kommen die VFI-Dinger nicht in Frage, weil da das billigste 190€ kostet und laut WIkipedia verbraucht sowas im Idle >80W.

Und kann ich den Vermieter dafür nicht zur Kasse bitten? Ich meine, in meinem Mietvertrag steht nirgends, dass in der Wohnung keinen normalen Computer betrieben werden können. Deswegen muss ich irgendwie zweifelsfrei feststellen können obs an der Wohnung liegt :S

Ich glaub nicht, dass der Vermieter für eine einwandfreie Stromversorgung zuständig ist. Da solltest du dich wenn dann an den Stromanbieter wenden.
 
der Energieversorger ist nur bis zum Zähler zuständig. Den Rest macht der Eigentümer des Hauses, aber der wird sagen das alles funktioniert, "brennt das Licht oder nicht?"

Gruß ré
 
Zurück
Oben