Festplattendefekt? READ_DMA48

Illuminatus

in geheimer Mission
Hi,
http://www.bsdforen.de/showthread.php?t=14165 hier waren ähnliche Fehlermeldungen, jedoch hat bei ihm ein Kabelwechsel geholfen.
Hier scheint mein Problem anderer Natur zu sein:

Betroffen ist:
FreeBSD 6.1-RELEASE-p3
<Intel ICH5 SATA150 controller>... irq 18 at device 31.2 on pci0
ad4: 152627MB <SAMSUNG SP1614C SW100-34> at ata2-master SATA150
/dev/ad4s1g on /usr2 (ufs, local, soft-updates)

auf /usr2 ist mir zuerst der Fehler aufgefallen als ich ein paar Gigabyte darauf abgelegt habe, und diese Lesen wollte.
/dev/ad4s1g 7.1G 5.4G 1.1G 84% /usr2

Genaugenommen war es der Dump des Backups der abbrach und das System quasi einfrieren lies. Hohe CPU Last, nicht bedienbar, alle 15-20 Sekunden leicht weniger Last.
In der Console habe ich heute folgende Meldungen festhalten können.
ich habe usr2 mit Daten beschrieben, und eine Datei mit cat ausgelesen:

user@host /usr2/directory# cat file.img

ad4: FAILURE - READ_DMA48 status=51<READY,DSC,ERROR> error=40<UNCORRECTABLE> LBA=303056799
g_vfs_done():ad4s1g[READ(offset=2962079744, length=131072)]error = 5
ad4: FAILURE - READ_DMA48 status=51<READY,DSC,ERROR> error=40<UNCORRECTABLE> LBA=303056831
g_vfs_done():ad4s1g[READ(offset=2962096128, length=131072)]error = 5
ad4: FAILURE - READ_DMA48 status=51<READY,DSC,ERROR> error=40<UNCORRECTABLE> LBA=303056863
g_vfs_done():ad4s1g[READ(offset=2962112512, length=131072)]error = 5
ad4: FAILURE - READ_DMA48 status=51<READY,DSC,ERROR> error=40<UNCORRECTABLE> LBA=303056895
g_vfs_done():ad4s1g[READ(offset=2962194432, length=131072)]error = 5
ad4: FAILURE - READ_DMA48 status=51<READY,DSC,ERROR> error=40<UNCORRECTABLE> LBA=303056895
g_vfs_done():ad4s1g[READ(offset=2962194432, length=16384)]error = 5
ad4: TIMEOUT - READ_DMA48 retrying (1 retry left) LBA=303056959
ad4: TIMEOUT - READ_DMA48 retrying (0 retries left) LBA=303056959
ad4: FAILURE - READ_DMA48 timed out LBA=303056959
g_vfs_done():ad4s1g[READ(offset=2962227200, length=131072)]error = 5

ein fsck -f gibt keine Beanstandungen.
Die Fehlermeldung ist für LBA=303056895 reproduzierbar.

Habe ich es hier mit defekten Sektoren zu tun?
Danke für eure Ratschläge und Beurteilungen.
 
Hallo Illuminatus,

lass doch mal das Samsung-eigene Testprogramm die Platte prüfen.
Ich habe da ein wenig ge-google-t und keine Antworten gefunden, was dieser "error = 5" vom GEOM eigentlich bedeutet.

Viele Grüße

Jürgen
 
Danke juedan :) hatte den gleichen Gedanken wie du und bereits von der ultimatebootcd.com das HUTIL angeworfen (SHDIAG auch von Samsung konnte mit SATA nichts anfangen).
S.M.A.R.T. Werte seien noch innerhalb der Fehlertoleranz. Random Surface Scan sagt auch noch keine Fehler. Jetzt warte ich den vollständigen Surface Scan ab.

Was mich verwundert: Warum gab es nicht die ersten Input/Output errors als ich bereits Daten geschrieben habe?

Nochmals Danke für eure Tipps
 
so, Surface San ist fertig. Ausgabe nicht hierhin pastebar, aber die Errors lagen im gleichen LBA Bereich.... PLEASE ASK YOUR LOCAL DEALER

Immerhin greift noch die Garantie (und wer die Austausch-Story bei Atelco vom letzten Mal hören möchte, der soll mich im irc fragen)
 
Guten Abend Illuminatus,

sorry, aber da muß mal eine Lanze für SCSI brechen: Mit SCSI-Platten hatte ich bis heute die wenigsten Ausfälle - öhm, eigentlich keine. Auch in der Firma bestücken wir die Clients ausschließlich mit SCSI-Platten (Adaptec 29160 mit Fujitsu-HDD), weil die Hardware funktionieren muß.
Sorry, mußte ich loswerden ;)

Trotzdem schönen Abend und viel Erfolg beim Umtausch.

Jürgen
 
ich gebe dir Recht, SCSI macht das Leben mit Daten ein wenig sorgenfreier.
Lustigerweise war das also ein Bereich auf der Platte, welcher relativ weit 'hinten' lag. Und dort hatte ich bislang nie was hinkopiert - bis jetzt ;). Hätte ich die Daten nicht wieder gelesen, wäre das nicht aufgefallen.

In meinem Desktop System hatte ich mir das Geld für SCSI Controller und HDDs gespart - man kann auch argumentieren dass SCSI preiswerter sei, und verlorene Daten und Plattenneukauf teurer sein werden.. ich weiß. Bislang ging aber die Rechnung auf, da noch alles innerhalb der Garantiezeit war, sowie BACKUP! exisitert.
(will nun aber nicht vom IDE/SCIS zum BACKUP/RESTORE Thema kommen)
 
Hallo, was für ein zufall: mir verreckt gerade auch wieder eine Samsung Platte. :-\ Schnell alles auslesen, was sich noch lesen lässt, Vorwarnzeit bei Samsung Festplatten ist nahezu null. Klick, klick, klickerdicklack und das wars dann gewesen, Tod ist die Samsung Festplatte. Sowohl Smart als auch HDutil von Samsung ist nicht aussagekräftig. Solange die Samsung Festplatte noch irgendwie läuft ist da nichts mit zu finden, bis dann halt eines Tages die Samsung Festplatte ihr Todeslied singt: "klick, klick, klickerdicklack". Gruß, Fusselbär
 
juedan said:
sorry, aber da muß mal eine Lanze für SCSI brechen: Mit SCSI-Platten hatte ich bis heute die wenigsten Ausfälle - öhm, eigentlich keine.

Die fallen leider genauso gerne aus wie alle anderen Platten. Im Normalfall laufen sie aber 24/7, was die Mechanik besser verkraftet als ständiges Ein- und Ausschalten.

Auch in der Firma bestücken wir die Clients ausschließlich mit SCSI-Platten (Adaptec 29160 mit Fujitsu-HDD), weil die Hardware funktionieren muß.

Das halte ich ehrlich gesagt für Geldverschwendung. Für erhöhte Ausfallsicherheit braucht man sowieso ein RAID, und im Umfeld von Clients sind die Vorteile des SCSI-Interfaces bedeutungslos (sofern man keine andere SCSI-Hardware am Client in Betrieb hat).
Außerdem haben wir ja bei OpenBSD jüngst mitbekommen, wie es inzwischen um die Qualität der Adaptec-Controller steht.

Ich habe da ein wenig ge-google-t und keine Antworten gefunden, was dieser "error = 5" vom GEOM eigentlich bedeutet.

Siehe errno.h:
Code:
#define EIO             5               /* Input/output error */
 
Azazyel said:
Die fallen leider genauso gerne aus wie alle anderen Platten. Im Normalfall laufen sie aber 24/7, was die Mechanik besser verkraftet als ständiges Ein- und Ausschalten.
Ja, genau das werde ich jetzt praktisch herausfinden. Habe mir ne SCSI Platte gekauft, die jetzt t"aglich genau wie die Anderen mitl"auft und dann werden wir ja sehen wie lange das Ding h"alt.
 
Fusselbär said:
Sowohl Smart als auch HDutil von Samsung ist nicht aussagekräftig. Solange die Samsung Festplatte noch irgendwie läuft ist da nichts mit zu finden, bis dann halt eines Tages die Samsung Festplatte ihr Todeslied singt: "klick, klick, klickerdicklack". Gruß, Fusselbär

Nunja, die SMART Werte sind mir ins Auge gefallen - Software (HUTIL und smartctl) meinten aber OK. Erst der vollständige Surface Scan brachte gewissheit und Fehlermeldungen. Außerdem war hier kein Klacken zu hören.
In Puncto Vorwarnzeit gebe ich dir Recht - die war quasi NULL
 
Hallo Azazyel,

Das halte ich ehrlich gesagt für Geldverschwendung. Für erhöhte Ausfallsicherheit braucht man sowieso ein RAID, und im Umfeld von Clients sind die Vorteile des SCSI-Interfaces bedeutungslos (sofern man keine andere SCSI-Hardware am Client in Betrieb hat).
Bloß, was nützt mir ein IDE-RAID, wenn die Qualität der IDE-Platten nicht besonders ist. Für das Geld baue ich lieber SCSI in die Clients.
Außerdem haben wir ja bei OpenBSD jüngst mitbekommen, wie es inzwischen um die Qualität der Adaptec-Controller steht.
Stimmt, die LSI-Teile sind besser, aber bis einschließlich Chipsatz 53c1020 funktionieren sie nicht mehr mit FreeBSD 6.x.

Aber das geht jetzt am Topic vorbei.

Viele Grüße

Jürgen
 
Last edited by a moderator:
Moin Fusselbär, moin Illuminatus

scheint mir allgemein ein Problem bei SATA-Platten von Samsung zu sein. Habe schon offt SATA-Platten den Besteckkasten suchen sehen um den Löffel abzugeben. Ich habe auch eine Samsungplatte drinne allerdings eine PATA und die ist schon 2 Jahre drinn.

ad0: 152627MB <SAMSUNG SP1614N TM100-24> at ata0-master UDMA100

Das UDMA100 hat nichts zu sagen in meinem Falle, habe nur nen UDMA100 Kabel drinne. Controller und HDD haben beide aber UDMA133. Zumindest was Samsung angeht denke ich mal haben die generell ein Problem mit dem SATA.
 
Hallo Forum,
leider hat mich meine SAMSUNG-Platte <SAMSUNG HD300LD WK100-12> auch nicht vor Ausfällen verschont :-[
kernel: g_vfs_done():ad2s1c[WRITE(offset=268362432512, length=131072)]error = 6

Stefan
 
stefan said:
leider hat mich meine SAMSUNG-Platte <SAMSUNG HD300LD WK100-12> auch nicht vor Ausfällen verschont :-[
kernel: g_vfs_done():ad2s1c[WRITE(offset=268362432512, length=131072)]error = 6
Hallo,

SAMSUNG HD300LD (300 GB Modell) ist aber doch eine ziemlich neue Samsung Festplatte. :eek:
Werden die Samsung Festplatten schlechter?

Ich brauche eine neue zuverlässige Festplatte,
bloß für welche (ca. 400GB) entscheiden?

Gruß, Fusselbär
 
Vieleicht sind meine Hirnzellen am Wochenende im Uerlaub ;-))
aber der Server liefert mir das zurück:

root@t9serv4:/var/log 140 #:smartctl -a /dev/ad2
smartctl version 5.33 [i386-portbld-freebsd6.1] Copyright (C) 2002-4 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

Smartctl: Device Read Identity Failed (not an ATA/ATAPI device)

A mandatory SMART command failed: exiting. To continue, add one or more '-T permissive' options.

???? Soll das heissen, das Modell kennt keinen SMART ???

Stefan

PS.: Jeden abend schreibe ich per cron alle wichtigen Verzeichnisse auf eine 2. Platte

edit: ich hatte noch ein "n" übrig
 
Fusselbär said:
Ich brauche eine neue zuverlässige Festplatte,
bloß für welche (ca. 400GB) entscheiden?

Ich steh grad auch vor der Anschaffung neuer Platten und werde mir welche von Western Digital zulegen. Von Seagate kann ich nur abraten (es gibt wesentlich bessere [P|S]ATA-Platten). Maxtor bleibt uns als Marke erhalten, allerdings nur im Einstiegsbereich; der "High-End"-Bereich wird von Seagate abgedeckt. :ugly:
Alternativ noch Hitachi, wobei das angeblich nur umfirmierte IBM-Ware sein soll. Ob das stimmt weiss ich nicht - Erfahrungen mit Hitachi-Platten habe ich auch noch keine. ;)

Sorry fürs off-topic. :rolleyes:
 
Hat das denn vorher schon mal Funktioniert? Oder haste im Bios die Option nicht eingeschalten, zumindest kann ich das im Bios bei mir Aktivieren.
 
-Daemon- said:
Maxtor bleibt uns als Marke erhalten, allerdings nur im Einstiegsbereich; der "High-End"-Bereich wird von Seagate abgedeckt. :ugly:

Hmm also High-End oder Einsteigerbereich wage ich bei den heutigen Festplatten zu bezweifeln, denn alle Hersteller liefern zumindest was die Zugriffsgeschwindigkeit, Cache und Drehzahl identische Werte. Mag sein das eventuelle Übertragungsgeschwindigkeiten trotz der angegeben Werten so stark unterschieden werden können das man sie in diese Bereiche einteilen kann. Ich bin der Meinung ob die Zugriffsgeschwindigkeit nun 8,5 ms oder 9 ms ist nur durch Benchmarks messbar. Die Datenrate ist dann eher schon fühlbar.
 
@bluebyte: Ja, da hast du schon recht.
Ich habe mich da wohl etwas undeutlich ausgedrückt - Maxtor stellt nur noch Festplatten mit maximal 320GB Kapazität her, alles darüber kommt von Seagate. Das verstehen die unter Einstiegbereich (wird wohl der "normale" Consumer-Krams sein). ;)

Aber jetzt zurück zum Thema :)
 
Ok, oder ich dich etwas Missverstanden :).

Ganz deiner Meinung. Etwas OT muss zwar auch mal sein aber sollte nicht das Thema wenden :). Eines ist jedoch merkbar das die SATA-Platten allesamt irgendwie eine kürzere Lebensdauer zuhaben wie mir scheint.
 
bluebyte said:
Eines ist jedoch merkbar das die SATA-Platten allesamt irgendwie eine kürzere Lebensdauer zuhaben wie mir scheint.
Woran machst du das fest? Hast du irgendwelche Quellen oder sind das Erfahrungswerte? Ich bin bis jetzt immer davon ausgegangen, das S-ATA auch qualitätsmäßig besser als P-ATA ist...
Ich frage deshalb, weil ich mir zwei neue Platten für meinen Rechner anschaffen wollte/muss. Da hab ich an S-ATA gedacht, aber wenn selbst die nicht so toll sind, dann bleib ich glaub ich doch bei IDE :ugly:
 
Naja so genau festmachen will ich es nicht aber in meinen vier wöchigen Praktikum letzes jahr waren alleine 3 Kunden in der Werkstatt drinn die ihre Platten austauschen ließen und alles waren SATA-Platten die ncihtmal ein halbes Jahr alt waren, dann hier auch im Forum 2 oder 3 Leute bei denen die Platten gerade von Samsung die Hufe hochreißen. Auch alles SATA. Kann natürlich auch täuschen da die Rechner nur noch mit SATA ausgerüstet werden und nur noch billigteile von Rechnern(Ladenhüter) mit PATA ausgeliefert werden. Wie gesagt der schein kann trügen und ich wills nicht am SATA festmachen. Verdächtig ist das aber schon.
 
Bei mir sind in der letzten Woche drei SATA Platten abgeraucht. Drei mal bei einem Update von FreeBSD 5.4 auf 6.1 (READ_DMA...). Habe alles versucht: Kabel wechseln,
hw.ata.ata_dma, hw.ata.atapi_dma, acpi. Platte ausgetauscht, 6.1 neu installiert und alles wieder im Butter.

Anscheinend vertragen diese häufige schreibaktivitäten nicht.

Das waren meine Erfahrungen.

Gruss
Dom
 
Was ich ganz stark vermute sind es die Treiber. Kanns zwar nicht belegen oder auch in irgendeiner anderen Weise Beweisen. Für mich sind etweder die Controller schrott oder die Treiber. Und in beiderlei Hinsicht OS-Übergreifend. Sei es Windows, Linux oder *BSD.
 
Wieso erwarten einige Leute, dass billige SATA Platten auch nur einen Hauch besser sind als olle PATA Platten?
Bei ATA Platten zaehlt die Masse, der Markt ist sehr hart umkaempft und die Qualitaet bzw. Haltbarkeit ist bestenfalls mittelpraechtig und leider oftmals mies. Wer dann meint er musse fuer seine "wichtigen" Daten noch ein einfaches (onboard) ATA-RAID benutzen, der hat ein sehr eigenartiges Verhaeltnis zu seinem Rechner.
 
Back
Top