Festplatte kaputt -- noch was zu retten?

h^2

hat ne Keule +1
Ich habe von einem Freund eine kaputte Festplatte bekommen. Sie ist nicht komplett tot, sondern gibt noch ab und zu die klickenden Geräusche von sich. Aber leider taucht sie weder unter FreeBSD noch unter Linux als mehr als Disk auf, so dass ich gar nicht erst dd/ddrescue anschmeißen kann.

Linux meldet:
Code:
[    2.568694] ata5.00: failed to IDENTIFY (INIT_DEV_PARAMS failed, err_mask=0x80)

FreeBSD meldet:
Code:
(aprobe0:ahcich4:0:0:0): SETFEATURES SET TRANSFER MODE. ACB: ef 03 00 00 00 40 00 00 00 00 08 00
(aprobe0:ahcich4:0:0:0): CAM status: ATA Status Error
(aprobe0:ahcich4:0:0:0): ATA status: 51 (DRDY SERV ERR), error: 04 (ABRT )
(aprobe0:ahcich4:0:0:0): RES: 51 04 39 00 00 40 00 00 00 02 00
(aprobe0:ahcich4:0:0:0): Retrying command, 0 more tries remain
(aprobe0:ahcich4:0:0:0): SETFEATURES SET TRANSFER MODE. ACB: ef 03 00 00 00 40 00 00 00 00 08 00
(aprobe0:ahcich4:0:0:0): CAM status: ATA Status Error
(aprobe0:ahcich4:0:0:0): ATA status: 51 (DRDY SERV ERR), error: 04 (ABRT )
(aprobe0:ahcich4:0:0:0): RES: 51 04 39 00 00 40 00 00 00 02 00
(aprobe0:ahcich4:0:0:0): Error 5, Retries exhausted
(aprobe0:ahcich4:0:0:0): SET_MULTI. ACB: c6 00 00 00 00 40 00 00 00 00 01 00
(aprobe0:ahcich4:0:0:0): CAM status: ATA Status Error
(aprobe0:ahcich4:0:0:0): ATA status: 51 (DRDY SERV ERR), error: 04 (ABRT )
(aprobe0:ahcich4:0:0:0): RES: 51 04 00 00 00 40 00 00 00 01 00
(aprobe0:ahcich4:0:0:0): Retrying command, 0 more tries remain
(aprobe0:ahcich4:0:0:0): SET_MULTI. ACB: c6 00 00 00 00 40 00 00 00 00 01 00
(aprobe0:ahcich4:0:0:0): CAM status: ATA Status Error
(aprobe0:ahcich4:0:0:0): ATA status: 51 (DRDY SERV ERR), error: 04 (ABRT )
(aprobe0:ahcich4:0:0:0): RES: 51 04 00 00 00 40 00 00 00 01 00
(aprobe0:ahcich4:0:0:0): Error 5, Retries exhausted

Gibt es noch was das man tun könnte ohne einen kostspieligen Datenrettungsdienst?

Danke

P.S: Bitte keine Kommentare bzgl. Backups; es sind ja nicht meine Daten, ich versuche nur einem Freund auszuhelfen.
 
Eventuell hilft es die Elektronik der HDD zu tauschen. Es sollte dann allerdings eine Elektronik mit der gleichen Revisionsnummer sein. Einfach mal schauen, was solche Platten in der Bucht so gebraucht kosten. Es gibt auch Händler, welcher mit gebrauchter Hardware handeln, vielleicht haben die was günstiges auf Lager. Die professionellen Datenrettungsdienste gehen in der Regel genauso vor, also erst mal die Elektronik tauschen und schauen was so passiert.
 
Habe auch schon gehört, dass es was bringen kann die Platte ins Tiefkühlfach zu legen. Das würde ich aber nur als letzte Option tun. Das ist keine Empfehlung und ich selbst habe damit keine Erfahrung!
 
Habe auch schon gehört, dass es was bringen kann die Platte ins Tiefkühlfach zu legen. Das würde ich aber nur als letzte Option tun. Das ist keine Empfehlung und ich selbst habe damit keine Erfahrung!

Im Ernst? Habe ich noch nie gehört. Wie erklärt sich denn die Wirkung davon? Würde mich mal interessieren.
 
Wie gesagt habe ich selbst keine Erfahrung damit. Ich vermute, dass es sich dabei hauptsächlich um mechanische Themen handelt. Wenn das Ding kalt wird zieht sich das Material etwas zusammen und es entseht mehr Spiel. Vielleicht. Ein Bekannter hat mir mal berichtet, dass er so eine Defekte Platte noch auslesen konnte und habe es auch schon mal im Netz gelesen. Aber wie gesagt: Höhrensagen
 
Anstelle des Kühlfaches sollte man mit einem Kältespray arbeiten. Es geht dabei wohl um eine kalte Lötstelle oder sonstige Schäden auf der Platine der HDD welche dann auftritt, wenn diese warm oder heiß wird. Kann funktionieren, muss aber nicht. Würde im ersten Schritt auch bei der Fehlersuche helfen um den Fehler eventuell eingrenzen zu können.
 
Es kann auch helfen die erstmal ne stunde "warmlaufen" zu lassen und dann anschließend nochmal runterfahren, anklemmen und neu hochfahren. Insb. platten die langezeit dauergelaufen sind gewöhnen sich wohl an eine bestimmte Betriebstemperatur - so hab ich mir das zumindest immer zurechtgelegt.

Das mit dem Kühlschrank hab ich auch schon öfters gehört, probiert aber praktisch hat das bei meinen versuchen nie geholfen.

Wenn alles nichts nützt kann auch ein "kurzer schlag" mit etwas Glück die Platte zum leben erwecken soferns ein mechanisches Problem ist.

(Klackern kann auch durchaus auf ein mechanisches Problem hindeuten)
 
Für die ganz Mutigen gibt es noch den Staubsaugertrick: Einen Staubsauger auf das Druckausgleichloch, um den Innendruck abzusenken. Damit kommen die Schreibköpfe idealerweise näher an die Platter, was bei teildefekten Schreibköpfen helfen kann. Oder sie setzen auf, was dann Totalschaden ist.
 
Den Kühlschranktrick liest man häufig, aber es gibt auch ebensoviele Stimmen die davor warnen - Gefahr von Kondenswasserbildung.
Ich hab auch mal gelesen, man soll das Ding in den Backofen legen - 3-5 Minuten bei möglichst niedriger Stufe. Hat in meinem Fall aber nichts gebracht :D
 
Also, wenn das alles nicht hilft, versuche es als letzten Versuch mal hiermit. Man kann nie wissen . . . :p :

Um diese Inhalte anzuzeigen, benötigen wir die Zustimmung zum Setzen von Drittanbieter-Cookies.
Für weitere Informationen siehe die Seite Verwendung von Cookies.
 
zwischen Backofen und Kühlschrank gibt es noch die Methode: aufschrauben und nachsehen, was denn da klackert. Ich will das nun nicht beschreien, aber es könnte durchaus etwas gebrochen sein oder abgerissene Kleinstteile, die nun den Köpfen irgendwo im Weg sind. Nunja, wenn man mutig genug ist, kann man das mal versuchen.
Ich habe eine hier herumliegen, bei der ich das versucht hatte, nichts finden konnte und es als Fehler im Kontroller werte. Das Ding ist Uralt und noch irgendein DOS drauf. Da musste ich nichts retten, es ging mir nur ums Basteln.

Was auch immer du noch versuchst: erkläre dem Besitzer ganz deutlich, dass an der Stelle keine kostenlose und qualifizierte Hilfe mehr möglich ist. Die Daten sind eigentlich nicht mehr zu retten und wenn die wichtig genug sind, sollte man gleich einen professionellen Dienst einschalten. Wenn sie nicht wichtig sind, kann man es irgendwie probieren und vielleicht Glück haben. Das ist die berühmte "eins zu einer Million Chance", die bekanntlich immer nur in Romanen funktioniert und niemals im echten Leben.
 
Habe auch schon gehört, dass es was bringen kann die Platte ins Tiefkühlfach zu legen. Das würde ich aber nur als letzte Option tun. Das ist keine Empfehlung und ich selbst habe damit keine Erfahrung!
Ach wie schön dass ich das jetzt finde. Und dass es hier auftauchte. :)

Das hat sich wirklich abgespielt, weil das war nämlich ich. Irgendwann vor 1995.

Die Vorgeschichte war, dass mir ein Molex-Verteiler ohne Verpolungsschutz untergekommen ist, und ich damit die Vorgängerin verloren hab. Vertauschte 5 und 12 Volt mögen sie gar nicht. Der trauere ich immer noch nach, das war ein wunderschönes MFM Laufwerk mit 1380 Zylinder/74 MB, nicht so häßlich wie die ST4096, nur halbe Höhe und v.a. schneller - die aber niemand sonst brauchen konnte weil eben 1380 Zylinder - für Unix schon damals kein Problem.
Dann hab ich irgendwo gehört, dass SCSI besser sein soll, und versucht sowas zu kriegen; bin auch fündig geworden. Das war dann wieder volle Bauhöhe, 140MB. Aber was ich geschickt gekriegt hab, war in einem Karton, mit einer an zehn Fingern abzählbaren Anzahl Streifen aus dem Papiershredder als Polsterung.
Hatte dann auch hunderte kaputte Sektoren in einem bestimmten Bereich, aber die kann man ja ausmaskieren. Das andere Problem hat sich erst langsam eingstellt: dass man immer länger warten musste, wenn man sie mal ausgeschaltet hat, bis sie sich wieder einschalten läßt. Anderenfalls hat sie ihre 3600 Touren nicht in der vorgesehenen Zeit erreicht und sich abgemeldet. Das Problem wurde lange nicht akut, weil Rechner ja normalerweise nicht ausgeschaltet werden.
Den Rest kann man sich jetzt denken: irgendwann hat auskühlen lassen nicht mehr gereicht, und der Kühlschrank wurde fällig. Und irgendwann hat auch der Kühlschrank nicht mehr gereicht.

Als sie dann aus dem Gefrierfach wieder rauskam, war da ne Eisschicht rundherum. Und es hat hübsch gekracht, als sich die eingefrorene Spindel losgerissen hat. Aber es hat funktioniert. Dann - Rechner und Daten wieder da - hab ich erstmal ne halbe Stunde das Wasser abgewischt. Und dann die Daten runterkopiert. Inzwischen war ne bessere Nachfolgerin da, 330MB - die gibts noch, müsste noch funktionieren.

Momentan bin ich wieder mal in der Region am basteln. Ich dachte, anstatt neu kaufen, könnte ich auch nach gebrauchten HGST suchen, die wahrscheinlich eh besser sind als was so neu gebaut wird. Und dann ist was angeboten worden, als defekt, wegen ein paarhundert ausmaskierten Sektoren. Hat sich aber nicht als Deskstar (was ich eigentlich haben wollte) entpuppt sondern als Ultrastar. Und ist extrem zickig. Ohne Handauflegen zeigt sie sich dem Rechner erst gar nicht - wenn man sie beim Händchen nimmt, dann geht alles.
(Hintergrund: die rüttelt so stark, dass sie davon selber aus dem Takt kommt. Muss man also zwingend festhalten/festschrauben.) Ausserdem frisst sie Strom - und ist dabei gar nicht so viel schneller als die Deskstars.

Und dann dachte ich schon ich hab sie gebrickt, weil ich auch nur noch "error: 04 (ABRT )" gesehen hab und keine Platte - nachdem ich entdeckt hatte, dass man auch auf SATA mit camcontrol low-level Kommandos absetzen kann. Dabei war ich schon ziemlich weit - der (10 Stunden!) Selbsttest war ohne fehler durchgelaufen.
Und dabei hatte ich bloss die defekten Sektoren entfernt. Vorher:
Code:
ID# ATTRIBUTE_NAME          FLAGS    VALUE WORST THRESH FAIL RAW_VALUE
  1 Raw_Read_Error_Rate     PO-R--   100   100   016    -    0
  2 Throughput_Performance  P-S---   108   108   054    -    232
  3 Spin_Up_Time            POS---   253   253   024    -    146 (Average 145)
  4 Start_Stop_Count        -O--C-   100   100   000    -    181
  5 Reallocated_Sector_Ct   PO--CK   100   100   005    -    838
  7 Seek_Error_Rate         PO-R--   100   100   067    -    0
  8 Seek_Time_Performance   P-S---   128   128   020    -    18
  9 Power_On_Hours          -O--C-   094   094   000    -    43492
 10 Spin_Retry_Count        PO--C-   100   100   060    -    0
 12 Power_Cycle_Count       -O--CK   100   100   000    -    37
192 Power-Off_Retract_Count -O--CK   099   099   000    -    2062
193 Load_Cycle_Count        -O--C-   099   099   000    -    2062
194 Temperature_Celsius     -O----   125   125   000    -    48 (Min/Max 19/50)
196 Reallocated_Event_Count -O--CK   100   100   000    -    838
197 Current_Pending_Sector  -O---K   100   100   000    -    0
198 Offline_Uncorrectable   ---R--   100   100   000    -    1126
199 UDMA_CRC_Error_Count    -O-R--   200   200   000    -    0
Nachher:
Code:
ID# ATTRIBUTE_NAME          FLAGS    VALUE WORST THRESH FAIL RAW_VALUE
  1 Raw_Read_Error_Rate     PO-R--   100   100   ---    -    0
  2 Throughput_Performance  P-S---   108   108   ---    -    232
  3 Spin_Up_Time            POS---   141   141   ---    -    366 (Average 390)
  4 Start_Stop_Count        -O--C-   100   100   ---    -    209
  5 Reallocated_Sector_Ct   PO--CK   100   100   ---    -    0
  7 Seek_Error_Rate         PO-R--   100   100   ---    -    0
  8 Seek_Time_Performance   P-S---   128   128   ---    -    18
  9 Power_On_Hours          -O--C-   094   094   ---    -    43521
 10 Spin_Retry_Count        PO--C-   100   100   ---    -    0
 12 Power_Cycle_Count       -O--CK   100   100   ---    -    53
192 Power-Off_Retract_Count -O--CK   099   099   ---    -    2095
193 Load_Cycle_Count        -O--C-   099   099   ---    -    2095
194 Temperature_Celsius     -O----   150   150   ---    -    40 (Min/Max 19/53)
196 Reallocated_Event_Count -O--CK   100   100   ---    -    0
197 Current_Pending_Sector  -O---K   100   100   ---    -    0
198 Offline_Uncorrectable   ---R--   100   100   ---    -    1126
199 UDMA_CRC_Error_Count    -O-R--   200   200   ---    -    0

Das nennt man "refurbish". Ob man die power-on-hours auch zurücksetzen kann?
 
zwischen Backofen und Kühlschrank gibt es noch die Methode: aufschrauben und nachsehen, was denn da klackert. Ich will das nun nicht beschreien, aber es könnte durchaus etwas gebrochen sein oder abgerissene Kleinstteile, die nun den Köpfen irgendwo im Weg sind.
Ja, sehr kleine Kleinstteile. Wenn ich richtig rechne, sind das so ungefähr hundert Atome die da für ein Byte zuständig sind.
Nunja, wenn man mutig genug ist, kann man das mal versuchen.
Ich habe eine hier herumliegen, bei der ich das versucht hatte, nichts finden konnte und es als Fehler im Kontroller werte.
Und, hat sie's überlebt?
Ich hab das natürlich auch mal versucht. Die lief dann, offen, ungefähr noch ne halbe Stunde, bis gar nix mehr ging. Ist also ungefähr so wie wenn man ein Lebewesen aufschneidet. Ich seh die eh als beseelte Wesen - womit wir wieder beim Voodoo wären, was ja eine Naturreligion ist, und in den Naturrelligionen gilt die gesamte Natur als beseelt. Macht alles durchaus Sinn.
 
Und, hat sie's überlebt?
theoretisch ja.
Also, ich konnte sie offen tatsächlich auslesen und hatte damals begeistert auch einen Film davon gedreht, den ich aber nicht mehr finde.
Nach diesem Experiment ist sie aber nicht mehr benutzt sondern verschrottet worden.
Da war übrigens irgendein Plastik-Hebel lose gewesen, den ich wieder ausreichend befestigen konnte. So eine Wippe, aber ich weiß nicht mehr genau wie oder was. Jedenfalls deutlich mehr 100 Atome groß ;)
 
Also das mit dem Kühlschrank, kann ich bestätigen. Das hat bei mir mal geholfen. Und auch die HDD in verschiedenen Positionen zu starten, kopfüber, senkrecht etc. Die HDD aufschrauben, würde ich aber def. die Finger von lassen.
 
Ich bau mir mittlerweile standardmaessig ein RAID5 in meine Rechner. Kostet etwas mehr, braucht auch mehr Platz, aber ich bin insgesamt entspannter. :)
 
Also, ich konnte sie offen tatsächlich auslesen
unwichtig zwar, aber ich muss vielleicht ergänzen: der Thread ist ja schon alt und in meinem ersten Beitrag weiter oben war es um eine 5-1/4" Platte gegangen, die es mechanisch noch getan hatte, aber keine Daten mehr lieferte.
Danach hatte ich eine 3-1/2" mit klackenden Geräuschen, die auch keine Daten mehr lieferte, aber nach aufschrauben und provisorischer Korrektur für kurze Zeit durch hielt.
Das hatte ich nun irgendwie vermischt.

Vielleicht sollte ich in dem Zusammenhang erwähnen, dass ich jede Festplatte vor der Entsorgung zerlege. Nicht unbedingt wegen Paranoia, sondern vor Allem, weil ich auf die Magnete scharf bin. Meist haben SCSI (SAS) Platten hier echt starke Teile drin, die man gut gebrauchen kann. Zumindest früher fand ich SCSI-Platten auch deutlich aufwändiger und präziser verbaut.
Deshalb habe ich nicht nur alles notwendige Werkzeug, sondern auch sehr viel Übung darin und außerdem empfehle ich das keinesfalls als leichtsinnigen Spaß, sondern wollte nur eine Art letzte Möglichkeit erwähnen, wenn alles andere gescheitert ist. Ich meine, wenn ich sie zum Entsorgen eh zerlege...
 
Mich wunderte halt, dass sie offen überleben. Denn so wie ich's erlebt hab, war damit sehr bald schluss. Das war eine ST-251, die irgendwann nach längerer ordentlicher Funktion angefangen hat immer öfter bad sectors zu liefern, so dass sie nicht mehr brauchbar war. Dann hab ich, weil eh schon wurscht und v.a. neugierhalber, die Gelegenheit ergriffen mal reinzuschauen. Und innerhalb der nächsten Minuten sind die bad sectors dann erst so richtig exponentiell mehr geworden - was ich mir mit dem nichtvorhandenen Reinstraum und dem allgegemwärtigen Feinstaub erklärt hab.
Und das waren halt 40 MB in 5 1/4", und heute sind es >4 TB in 3 1/2".
 
Und das waren halt 40 MB in 5 1/4", und heute sind es >4 TB in 3 1/2".
ja, ich glaube sogar, dass es damit zusammen hängt.
In meiner Ausbildung haben wir noch Köpfe justieren gelernt, die über ca 30cm großen Scheiben schwebten und alles war furchtbar sensibel.
Die Größe der Laufwerke erinnere ich gar nicht mehr, aber sie maßen eher in MB.
Heute justiert niemand mehr Köpfe!
Die Mechanik ist derart viel genauer, als noch vor Jahren und alle Teile so robust und mit den Erkenntnissen der Jahrzehnte verbessert worden, dass das Öffnen heute vielleicht sogar eher gewagt werden kann.

Aber nochmal: natürlich nicht als Lösung für einen Zukünftigen Dauerbetrieb.
 
Durchaus möglich. Bei 75 Nanometer Trackabstand (aus dem Datenblatt der Zicke - und die ist auch schon 6 Jahre alt) ist da nix mit justieren.
HGST erzählt immerhin noch ein bischen was konkretes über die Funktion:
The read/write heads are mounted in the actuator. The actuator is a swing-arm assembly driven by a voice coil motor. A closed-loop positioning servo controls the movement of the actuator. An embedded servo pattern supplies feedback to the positioning servo to keep the read/write heads centered over the desired track.

Justiert wird da höchstens die Firmware. Aber das was sie hier erzählen, ist auch nur ein ganz grober Abriß. Da steckt sicher noch sehr viel mehr drin, was nicht gesagt wird; die Details werden gehütet.
ZB war die Zicke nicht mehr zugreifbar, nachdem ich versucht hab ein LowLevel Format anzustoßen. Bis ich auf die Idee gekommen bin, sie einfach mal zehn Stunden in ruhe zu lassen - und dann kam sie tatsächlich wieder und war funktional.
Aber jetzt kommt das bizarre: der gstopd hat dann einen Spindown veranlasst, und ich hab im Datenblatt rumgestöbert und gefunden, dass das Teil Drehzahlabsenkung (Low RPM Idle) unterstützt. Die hat auch funktioniert - aber nur per direktem Kommando, nicht über den eingebauten Timer. Stattdessen hat sie alle paar Sekunden, völlig unregelmäßig, kräftig gerumpelt und auch immer wieder mal eine menge long-seeks gemacht - ohne irgendeinen Zugriff vom OS. Da ich das Spielchen jetzt schon kenne (erstmal zehn Stunden warten) hab ich abgewartet, und prompt nach zehn Stunden ging die Drehzahl runter.
Nach dem abgeschlossenen Format, und obwohl volle Betriebsfähigkeit da ist (ich hab erstmal nen zpool angelegt und bespielt), will sie offenbar nochmal die ganze Oberfläche ablaufen und immer wieder irgendwas dokumentieren. Wenn sie das aber nicht kann (weil ich zB den gstopd laufen lasss und es nie zehn Stunden idletime gibt), dann muss das ja auch funktionieren. Also was wird da intern alles gemacht, und wozu?

Nee, aufschrauben würde ich so ein Teil nicht wollen. Aber es muss da ganz sicher noch einen Service-Zugang in die Firmware geben, wo man viel detaillierteres erfährt als was SMART so erzählt. Den wird einem aber auch niemand sagen wollen. :(
 
Die Mechanik ist derart viel genauer, als noch vor Jahren und alle Teile so robust und mit den Erkenntnissen der Jahrzehnte verbessert worden, dass das Öffnen heute vielleicht sogar eher gewagt werden kann.
Das Problem beim Öffnen ist, dass keiner von uns einen Reinraum zu Hause hat. Die Festplatte aufzuschrauben bedeutet zwangsläufig, dass Staubs ins Innere gelangt. Ein Staubkorn an der falschen Stelle zwischen Schreibkopf und Platter und das war es. Entweder, da sich der Staub unter dem Schreibkopf verhakt und ihn blockiert, oder da er das empfindliche Luftkissen stört, auf dem der Kopf gleitet und es zum Headcrash kommt. Bei Festplatten der letzten Generationen kommt noch dazu, dass sich die Heliumfüllung nicht ohne weiteres ersetzen lässt. Luft ist "dickflüssiger", weshalb die Platte nicht funktioniert.
 
u.U kann es auch sinnvoll das Gegenteil zu machen ... also anzuschalten und zu warten bis sie richtig warm ist, dann noch mal neuzustarten.

Imho insbesondere bei platten die 24/7 Betrieb "gewöhnt" waren und eine entsprechende wärme und dann nach nem spontenen längeren ausschalten /abkühlen nicht wieder anlaufen.
 
Das Problem beim Öffnen ist, dass keiner von uns einen Reinraum zu Hause hat. Die Festplatte aufzuschrauben bedeutet zwangsläufig, dass Staubs ins Innere gelangt. Ein Staubkorn an der falschen Stelle....
Soweit ich weiß stimmen nach dem öffnen ja auch die Positionen der Leseköpfe nicht mehr. Nehmen wir mal an jemand schafft es eine defekte Festplatte zurück ins Leben zu holen. Dann ist der einzige Verwendungszweck eigentlich nur noch die Daten so schnell wie möglich zu sichern und dann am besten entsorgen. Egal ob professionell oder Laie, danach ist das Gerät in meinen Augen nicht mehr vertrauenswürdig.
 
Zurück
Oben