Festplattenschaden durch Magnete?

Passiert das auch mit einem anderen Dateisystem als ZFS?

Ja, die SSD, die als Hauptplatte in der WS fungiert, ist z.B.mit UFS formatiert. Da ist es natürlich schwieriger festzustellen wenn sie kaputt ist. Checksum mismatches in Paketen sind ein Weg. Heute ist der Rechner mir schon zweimal eingefroren, ich denke, dass ich ist ein Zeichen dafür, dass gerade das Basissystem erodiert.

Gestern hatte ich tausend Fehler beim Schreiben auf einen USB-Stick und beim Versuch des Unmountens eine Panic. Der kann natürlich auch kaputt sein, aber so langsam glaube ich nicht mehr dran :/
 
Hast du das alles an einem Ort getestet, oder bist du auch schon mal weiter entfernt bei Bekannten/Freunden gewesen und dort ist es auch passiert? Eventuell gibt es bei dir zu viele elektromagnetische Felder... Handymasten oder AKW in der Nähe?
 
Invertier das Problem mal: Was hast du noch nicht gewechselt?
Wie geasgt, Server und WS haben dieselben Probleme, auch ohne dass irgendeine Hardware zwischen denen getauscht wird.

Ist vllt. auch dein Kernel schon erodiert?
gut möglich, deswegen habe ich in den letzten zwei Monaten ja auch schon zwei Mal die WS neuaufgesetzt.

Hast du das alles an einem Ort getestet, oder bist du auch schon mal weiter entfernt bei Bekannten/Freunden gewesen und dort ist es auch passiert?
Ne, alles nur hier in der Wohnung getestet, und wie gesagt, die Probleme gibt es auch erst seit ich in dieser Wohnung bin (wobei viel der Hardware auch erst in diesem Zeitraum angeschafft wurde).
Eventuell gibt es bei dir zu viele elektromagnetische Felder... Handymasten oder AKW in der Nähe?
Mit der Vermutung hatte ich den Thread ja aufgemacht, da hieß es "alles Blödsinn mit Magneten".

UND -- wie gesagt -- drei Notebooks verrichten täglich ihren Dienst hier problemlos, auch im Betrieb ohne Akku.
 
Hallo h^2,

wie schon vermutet wird die Erklärung im Stromnetz liegen, Laptops haben einen Akkupuffer. Mache doch mal aus einem der Laptops den Aku raus für eine Weile und schau ob der dann immernoch problemlos läuft ;-)

Gruß ré
 
Hallo h^2,

wie schon vermutet wird die Erklärung im Stromnetz liegen, Laptops haben einen Akkupuffer. Mache doch mal aus einem der Laptops den Aku raus für eine Weile und schau ob der dann immernoch problemlos läuft ;-)

Gruß ré

Danke für eure Hilfe Leute, aber bitte lest die vorherigen Posts!

Ein Laptop läuft jeden Tag ca. 8 Stunden ohne Batterie, problemlos.

An der WS hängt jetzt ein Voltage Regulator, der die Ausgangsspannung auf genau 230V reguliert, und die WS hat trotzdem Probleme.
 
Evtl. mal frische Sourcen ziehen und den Kernel und die Welt neu bauen.
Ansonsten ist bei dir echt was faul. Dann solltest du mal die Idee von oenone aufgreifen und die Kiste mal an nem anderen Ort/Ortsteil aufstellen.
 
Danke für eure Hilfe Leute, aber bitte lest die vorherigen Posts!

Ein Laptop läuft jeden Tag ca. 8 Stunden ohne Batterie, problemlos.

An der WS hängt jetzt ein Voltage Regulator, der die Ausgangsspannung auf genau 230V reguliert, und die WS hat trotzdem Probleme.

Sorry, das _ohne Akku_ hatte ich in der Eile überlesen ;-)

aber was soll eine geographische Ortsänderung bringen? Das die Stromqualität einen nicht unerheblichen Einfluß hat ist verständlich, aber der Ort?

Gruß ré

P.S. oder den Rechner in den Keller stellen und den Strom direkt aus dem Sicherungskasten entnehmen?
 
Ja, so langsam wird es esotherisch hier. Aber sonst fällt mir keine mögliche Ursache mehr ein.
 
Gibt es für derartige Einflüsse wissenschaftliche Belege? Das halte ich doch für sehr an den Haaren herbeigezogen.
Ob es nun wissenschaftliche Belege gibt, kann ich nicht sagen, aber Einflüsse gibt es. 1989 gab es in Kanada einen größeren Ausfall in der Stromversorgung, der auf verstärkte solare Aktivitäten und den Sonnensturm zurückzuführen war.

Handy-Strahlung, Erdmagnetfeld und sonstige kosmische Strahlung werden lokal im Stromnetz messbar sein, aber ich kann mir nicht vorstellen, dass die Einfluss auf die Stabilität der Stromversorgung haben, wenn man bedenkt, welche Impedanz das Stromnetz hat und welch kleine Energien solche Strahlungen haben. Und dann gibt es noch die ganzen Zwischenstationen, wie Umspannwerke, Trafo-Stationen, Zähler, Netzteile usw. die alle im Prinzip als Filter dazwischen hängen.

Mein Tipp: Es liegt am Feng Shui, das verströmt beim TE negative Energie und sorgt für die Probleme. :D
 
Also bevor wir zu den Solarstürmen unter der Decke meines Altbauzimmers oder verstimmten Pflanzen auf meinem Balkon als Ursache zurückgreifen, muss es doch noch eine normale Erklärung geben.

memtest hat an mehreren Tage jeweils mehrere Passes komplett fehlerlos durchgemacht. ECC RAM ist nicht drin.

Ich habe jetzt ein neues Netzteil gekauft, da die anderen Netzteile schon was älter waren und z.T. mehrere SATA-Stromadapter verwendet wurden, die ja auch eine Quelle für Wackler sein können. Mit dem neuen Netzteil habe ich es aber auch direkt geschafft eine Panic auf der SSD zu kriegen.
Da natürlich Sachen von vorher kaputt sein könnten habe ich Kernel, base und libs von einer Install-CD neu rüberkopiert, neugestartet und nach 5min csup (Welt) direkt wieder panic.
Ich versuch jetzt nochmal ein bisschen IO in dem ArchLinux auf der Platte, bin aber nicht sehr zuversichtlich.

Glaubt ihr die Platten sind inzwischen schon Hardware-mäßig im Arsch? Selbst die SSD? Ich dachte die wären unkaputtbar…
 
Also ich hatte hier schon paar mal den Fall gehört, dass ne SSD nach 3-4 Monaten kaputt war. Also überzeugt bin ich von den Teilen net. Unkaputtbar gilt nur in Sachen, man kann sie im Betrieb schütteln ohne, dass was passiert.
Zu den Platten kann dir SMART oder ein Herstellertool was sagen. SSD würde ich mal auf verdacht austauschen.
 
ja, die SSD ist mindestens genauso anfällig für Spannugsschwankungen wie die HDD, wenn dein altes NT damit probleme hatte wäre möglich das die SSD einen Treffer hat.

Gruß ré
 
memtest hat an mehreren Tage jeweils mehrere Passes komplett fehlerlos durchgemacht. ECC RAM ist nicht drin.

Ich habe noch nie mit memtest einen Speicherfehler/Cachefehler entdeckt. Das Teil ist völlig nutzlos, denn wenn es einen Fehler findet, dann ist er meistens sehr offensichtlich und man findet ihn auch so, schon vorher.
 
Ich glaube nicht, dass die Platten hardwaremäßig im Allerwertesten sind. Das Filesystem könnte bei den vielen Crashs schon einen mitbekommen haben. Das hatte ich vor ein paar Monaten auch bei einer Maschine mit Hardwaredefekt und unzähligen Crashs. Nach dem Tausch der Hardware und Neumachen der Filesysteme schnurrt sie nun wie ein Kätzchen.

Zu SSDs kann ich nichts sagen, da ich noch keine habe und anderen den Vortritt beim Testen der Technik lasse.

Gruß c.
 
Ich habe noch nie mit memtest einen Speicherfehler/Cachefehler entdeckt. Das Teil ist völlig nutzlos, denn wenn es einen Fehler findet, dann ist er meistens sehr offensichtlich und man findet ihn auch so, schon vorher.

Kann ich bestätigen. Vor allen Dingen, wenn der Fehler mit einem anderen RAM-Riegel verschwindet ;)
 
Ja exakt so etwas würde ich ausprobieren. Irgendwas was richtig den Rechner auf allen Cores auslastet. Das legt den stärksten Gaul um, wenn er nicht stabil steht.
 
Gestern habe ich neuformatiert, neupartitioniert, von CD installiert, dann die Welt und Kernel neuausgeckeckt, beides gebaut mit -j4, danach kde4,qt4,xorg von ports gebaut... das hat so den Tag lang durchgerödelt, ohne Probleme und das macht sowohl Disk-I/O, Memory-IO, als auch CPU-Last.

Heute nach 10min uptime, g_vfs_done [....] error=5 -> Input/Output Error bei ner Datei -> Kernel-Panic.

Das Samsung Festplatten tool, sagt mir übrigens nach sehr langem Testen, dass die SSD 100% in Ordnung ist.

Da bleibt ja eigentlich nur das Mainboard, oder? Andererseits, verstehe ich dann nicht warum die Test-Tools nicht finden, die greifen ja auch über das Mainboard auf die SSD zu!?

Das Server-Mainboard habe ich ja schon eingeschickt. Ich warte mal bis ich das wiederhabe und schicke dann das WS-Board ein. Ich hatte ja auch früher schon erwähnt, dass es beides Boards von Sapphire sind, aber ich konnte auch nirgends "Schlechte Erfahrungen mit Sapphire Boards unter FreeBSD/linux" finden… Da wisst ihr auch nicht mehr, oder?
 
So, ich glaube ich komme des Rätsels Lösung näher:
1) Wenn ich mit einer 9-CURRENT CD boote, bekomme ich am Anfang:
Code:
ata2: <ATA channel 0> on atapci0
ata3: <ATA channel 1> on atapci0
ata3: port is not ready (timeout 0ms) tfd = 000001d0
ata3: software reset clear timeout
ata4: <ATA channel 2> on atapci0
ata4: port is not ready (timeout 0ms) tfd = 000001d0
ata4: software reset clear timeout
ata5: <ATA channel 3> on atapci0
ata5: port is not ready (timeout 0ms) tfd = 000001d0
ata5: software reset clear timeout
ata6: <ATA channel 4> on atapci0
ata7: <ATA channel 5> on atapci0
ata7: port is not ready (timeout 0ms) tfd = 00000180
ata7: software reset clear timeout
2) Also habe ich mir den Output von Linux nochmal angeguckt, da steht auch in der dmesg
Code:
ataX:Softreset failed (device not ready)
(X = nummer für jede angeschlossene Platte)
3) Danach habe ich dann gegoogelt und folgendes gefunden:
https://bugs.launchpad.net/fedora/+source/linux/+bug/285392

Scheint mein Problem zu sein, und es scheinen verdammt viele zu haben, also Instabilität unter IO-Load, Probleme beim Booten, FS-Error etc.

Ursache ist laut dem Thread nicht klar, wahrscheinlich Bug im AMD-Chipsatz einiger Hersteller, der vom Windows-Treiber abgefangen wird, aber vom Linux-Treiber nicht (und vom FreeBSD-Treiber offensichtlich auch nicht). Das tolle ist: Aus dem Thread ist überhaupt nicht ersichtlich ob das Problem behoben wurde.

Seht ihr das ähnlich?

Soll ich das Upstream melden?
 
Zurück
Oben