Crashanalyse ... wo fange ich am besten an?

hazelnut

Well-Known Member
Hi,

offensichtlich läuft mein System nicht so stabil, wie ich mir das so vorgestellt habe. Genau genommen bootet der (für mich) nicht nachvollziehbar regelmäßig neu, wenn ich die Kiste mal über Nacht oder so anlasse.

Das ist nicht wirklich toll. Leider hab ich keinen Monitor dran oder bin auch so nicht da, wenn der sich mal wieder aufhängt. Daher meine Frage - wo kann ich anfangen, nach Fehlermeldungen von kurz vor dem Crash zu suchen?

Ich vermute den Fehler irgendwo bei den Festplatten bzw. bei einem Promise SATA Controller. Ganz sicher bin ich aber nicht. Von daher möcht ich jetzt hier mal nachfragen, an welcher stelle ich anfangen könnte.

Im Voraus schon mal Danke

Hazel
 
Logfile-Analyse

/var/log/messages lesen, nach coredumps suchen, versuchen, ob remote Login noch funktioniert sind die ersten Schritte.
 
um wirklich alles mitzuschreiben was im System vorgeht, schau doch mal in /etc/syslog.conf nach. Dort k"onnte man sich "uberlegen ob Du /var/log/all.log anwirfst...
 
Hi,

wo würde ich denn den Coredump finden, wenn ich ihn suchen würde? Die Logdateien werd ich mal heute Abend durchstöbern, wenn ich wieder zu Hause bin. Bis dahin danke ich euch erst mal.

Hazelnut
 
find / -type -f -name "*core" findet alle coredumps auf der Platte.

:belehren: Da coredumps doch ein wenig größer als die Durchschnittsdatei sind, sollte man mit diesem Befehl periodisch nach coredumps suchen und diese hin und wieder löschen... oder neue Platten kaufen.
 
find / -type -f -name "*core" findet alle coredumps auf der Platte.

:belehren: Da coredumps doch ein wenig größer als die Durchschnittsdatei sind, sollte man mit diesem Befehl periodisch nach coredumps suchen und diese hin und wieder löschen... oder neue Platten kaufen.

Ich korregiere:

find / -type f -name '*.core'
 
Zwei Dinge ...

1. Welche der beiden Anführungszeichen hier bei find(1) verwendet werden ist völlig egal. Wichtig ist nur, dass man überhaupt welche verwendet, damit einem die $SHELL nicht reinpfuscht.

2. Ist korregieren nicht ein Oxymoron? ;)
 
Und um noch etwas halbwegs Sachdienliches beizutragen:

Wer alle anfallenden corefiles in einem Verzeichnis sammeln möchte, sollte mal einen Blick in die manpage von core(5) werfen. Sollte das wider Erwarten nicht klappen, einfach nochmal durchlesen und entsprechende Schreibrechte für das Verzeichnis setzen ...
 
hallo hazelnut,
hast du zufällig einen Promise PDC40718 SATA300 controller?
habe nämlich auf meinem fileserver unter 6.2 ähnliche probleme sobald ich via samba etwas grössere datenmengen transferiere..

meldungen gibts folgende..
Code:
Nov  4 18:43:13 LasVegas kernel: ad6: WARNING - SETFEATURES SET TRANSFER MODE taskqueue timeout - completing request directly
Nov  4 18:43:29 LasVegas kernel: ad6: WARNING - SETFEATURES SET TRANSFER MODE taskqueue timeout - completing request directly
Nov  4 18:43:29 LasVegas kernel: ad6: WARNING - SETFEATURES ENABLE RCACHE taskqueue timeout - completing request directly
Nov  4 18:43:29 LasVegas kernel: ad6: WARNING - SETFEATURES ENABLE WCACHE taskqueue timeout - completing request directly
Nov  4 18:43:29 LasVegas kernel: ad6: WARNING - SET_MULTI taskqueue timeout - completing request directly
Nov  4 18:43:29 LasVegas kernel: ad6: TIMEOUT - READ_DMA retrying (1 retry left) LBA=63796254
Nov  4 18:48:34 LasVegas kernel: ad6: TIMEOUT - READ_DMA48 retrying (1 retry left) LBA=333837598
Nov  4 18:48:34 LasVegas kernel: ad6: WARNING - READ_DMA48 UDMA ICRC error (retrying request) LBA=333837598
Nov  4 18:48:43 LasVegas kernel: ad6: WARNING - SETFEATURES SET TRANSFER MODE taskqueue timeout - completing request directly
Nov  4 18:48:47 LasVegas kernel: ad6: WARNING - SETFEATURES SET TRANSFER MODE taskqueue timeout - completing request directly
Nov  4 18:48:51 LasVegas kernel: ad6: WARNING - SETFEATURES ENABLE RCACHE taskqueue timeout - completing request directly
Nov  4 18:48:55 LasVegas kernel: ad6: WARNING - SETFEATURES ENABLE WCACHE taskqueue timeout - completing request directly
Nov  4 18:48:59 LasVegas kernel: ad6: WARNING - SET_MULTI taskqueue timeout - completing request directly
Nov  4 18:48:59 LasVegas kernel: ad6: FAILURE - READ_DMA48 timed out LBA=333837598
Nov  4 18:48:59 LasVegas kernel: g_vfs_done():ad6s2d[READ(offset=167782793216, length=16384)]error = 5
Nov  4 18:50:04 LasVegas kernel: ad6: TIMEOUT - WRITE_DMA48 retrying (1 retry left) LBA=687757598
Nov  4 18:50:04 LasVegas kernel: ad6: WARNING - WRITE_DMA48 UDMA ICRC error (retrying request) LBA=687757598
Nov  4 18:50:44 LasVegas kernel: ad6: WARNING - SETFEATURES SET TRANSFER MODE taskqueue timeout - completing request directly
Nov  4 18:50:44 LasVegas kernel: ad6: WARNING - SETFEATURES SET TRANSFER MODE taskqueue timeout - completing request directly
Nov  4 18:50:44 LasVegas kernel: ad6: WARNING - SETFEATURES ENABLE RCACHE taskqueue timeout - completing request directly
Nov  4 18:50:44 LasVegas kernel: ad6: WARNING - SETFEATURES ENABLE WCACHE taskqueue timeout - completing request directly
Nov  4 18:50:44 LasVegas kernel: ad6: WARNING - SET_MULTI taskqueue timeout - completing request directly
Nov  4 18:50:44 LasVegas kernel: ad6: FAILURE - WRITE_DMA48 timed out LBA=687757598
Nov  4 18:50:44 LasVegas kernel: g_vfs_done():ad6s2f[WRITE(offset=26867286016, length=131072)]error = 5
Nov  4 18:50:44 LasVegas kernel: ad6: FAILURE - device detached
Nov  4 18:50:44 LasVegas kernel: subdisk6: detached
Nov  4 18:50:44 LasVegas kernel: ad6: detached
Nov  4 18:50:44 LasVegas kernel: g_vfs_done():ad6s2f[WRITE(offset=26867548160, length=131072)]error = 6
Nov  4 18:50:44 LasVegas kernel: g_vfs_done():ad6s2f[WRITE(offset=26867679232, length=131072)]error = 6
Nov  4 18:50:44 LasVegas kernel: g_vfs_done():ad6s2f[WRITE(offset=26867810304, length=131072)]error = 6

das mit dem "LasVegas kernel: g_vfs_done():ad6s2f[WRITE(offset=26867810304, length=131072)]error = 6" geht dann so weiter bis er rebootet..

habe testweise acpi, dma mode und write cache via sysctl deaktiviert, aber hat auch nichts gebracht..
hätte auch sata kabel getauscht weil ich schon gedacht hatte die sind kaputt, aber alles nix geholfen :(
auf den mailinglisten bzw. via google findet man leider auch nichts wirklich nützliches, allerdings sieht es so aus als wären wir mit dem problem nicht alleine, siehe: http://groups.google.com/groups/search?q=g_vfs_done+promise

hat hier vielleicht jemand ahnung woran das liegen könnte?

lg
christian
 
Hi,

den Vorgänger ...

dmesg: Promise PDC40518 SATA150 controller

sollte ich mich da nach einer Alternative umsehen?

Gruß

Hazel ...

PS: Sorry, dass ich so spät antworte - hab über beide Ohren zu tun ...wird dann aber hoffentlich in Kürze besser.
 
Bei sponanten Reboots (verursacht durch panics?) ist syslog leider nicht wirklich geeignet, da die panic-message nicht gelogged wird.

Du willst sowas wie '-Dh' in /boot.config schreiben und ein Nullmodemkabel an den Rechner anschliessen. Dann zB mit script/screen von einem anderen Rechner die Ausgaben der seriellen Konsole mitschneiden.

Falls es panic's sind, ist es meist ein Softwarefehler und man kann weiter recherchieren (Handbuch -> Kernel Debugging). Wenn die Reboots komplett spontan sind (vielleicht immer zwischen 3-4 Uhr?) kommt die Hardware als Schuldiger in Frage.
 
Hi,

also, ich hab in den letzten Tagen mal etwas Zeit zum googlen gehabt.

Hierbei sind mir verschiedene Sachen aufgefallen. Zum einen scheint der Fehler nicht Promise-spezifisch zu sein. Ninscho hatte sowas eingeworfen, aber wenn man da anstelle des Promise ein Highpoint reinschreibt sieht die Bilanz ähnlich aus.

Wo wir grad dabei sind - Ninscho, welche Version nutzt du? Ich hab den Umstieg auf Releng 6 immer noch nicht hinter mich gebracht. :-)

Tja, und Hardware ... kann sicher sein. Hier kann ich, denk ich, aber auch schon einiges ausschließen. Zum einen den Ram, den ich nunmehr zusammengenommen schon fast eine Woche mit Memtest gequält habe. Alles ohne Ergebnis.

Vermutungen über ein zu schwaches Netzteil konnte ich durch Neukauf eines entsprechend ausgelegten Enermax Teils auch ausschließen.

Tja - das Board ist ein A7V8X mit einem 2800 AMD Prozessor. Lief bisher immer stabil und zuverlässig.

Ansonsten steckt der SATA-Controller drin und halt noch ein normaler Promise-Raid Controller.

(Hmm, ich poste noch mal das DMESG - geht vielleicht schneller :-))

Ansonsten scheinen die Reboots spontan zu sein. Ob das aussteigen des Raids da nur eine Folge oder der Auslöser ist, vermag ich eben nicht zu sagen. Aber was solls. Ich hab mir hier eine serielle Konsole eingerichtet und werd mal sehen, was das Hyperterminal so alles bietet. sprich, ich werd einfach mal den Rat befolgen und die Logmeldungen mitprotokollieren. Mal sehen, was dabei herauskommt.

Im Übrigen war das Gesicht des Händlers unbezahlbar, als ich nach einem Nullmodemkabel gefragt habe. Und er hat so gar noch eine (nicht wirklich verstaubte) Tüte mit einem dagehabt. Wird aber offensichtlich nicht all zu Häufig nachgefragt sowas. LOL

Dann euch erst einmal Danke und ich warne euch schon mal vor - ich werde weiterfragen, wenn ich mehr weiß.

:-)

Bis denne

Hazel

Code:
Copyright (c) 1992-2006 The FreeBSD Project.
Copyright (c) 1979, 1980, 1983, 1986, 1988, 1989, 1991, 1992, 1993, 1994
        The Regents of the University of California. All rights reserved.
FreeBSD 5.5-STABLE #0: Sun Oct 29 13:45:07 UTC 2006
    hazelnut@feuer:/usr/obj/usr/src/sys/SERVER
Timecounter "i8254" frequency 1193182 Hz quality 0
CPU: AMD Athlon(TM) XP 2800+ (2083.11-MHz 686-class CPU)
  Origin = "AuthenticAMD"  Id = 0x6a0  Stepping = 0
  Features=0x383fbff<FPU,VME,DE,PSE,TSC,MSR,PAE,MCE,CX8,APIC,SEP,MTRR,PGE,MCA,CMOV,PAT,PSE36,MMX,FXSR,SSE>
  AMD Features=0xc0400000<AMIE,DSP,3DNow!>
real memory  = 536854528 (511 MB)
avail memory = 519950336 (495 MB)
ACPI APIC Table: <ASUS   A7V8X   >
pnpbios: Bad PnP BIOS data checksum
ioapic0: Changing APIC ID to 2
ioapic0 <Version 0.3> irqs 0-23 on motherboard
npx0: <math processor> on motherboard
npx0: INT 16 interface
acpi0: <ASUS A7V8X> on motherboard
acpi0: Power Button (fixed)
Timecounter "ACPI-fast" frequency 3579545 Hz quality 1000
acpi_timer0: <32-bit timer at 3.579545MHz> port 0xe408-0xe40b on acpi0
cpu0: <ACPI CPU> on acpi0
acpi_button0: <Power Button> on acpi0
pcib0: <ACPI Host-PCI bridge> port 0xcf8-0xcff on acpi0
pci0: <ACPI PCI bus> on pcib0
agp0: <VIA 8377 (Apollo KT400/KT400A/KT600) host to PCI bridge> mem 0xf0000000-0xf7ffffff at device 0.0 on pci0
pcib1: <ACPI PCI-PCI bridge> at device 1.0 on pci0
pci1: <ACPI PCI bus> on pcib1
pci1: <display, VGA> at device 0.0 (no driver attached)
bfe0: <Broadcom BCM4401 Fast Ethernet> mem 0xe5800000-0xe5801fff irq 18 at device 9.0 on pci0
miibus0: <MII bus> on bfe0
bmtphy0: <BCM4401 10/100baseTX PHY> on miibus0
bmtphy0:  10baseT, 10baseT-FDX, 100baseTX, 100baseTX-FDX, auto
bfe0: Ethernet address: 00:e0:18:b7:b5:5e
atapci0: <Promise PDC20271 UDMA133 controller> port 0xb400-0xb40f,0xb800-0xb803,0xd000-0xd007,0xd400-0xd403,0xd800-0xd807 mem 0xe5000000-0xe500ffff irq 19 at device 12.0 on pci0
ata2: channel #0 on atapci0
ata3: channel #1 on atapci0
atapci1: <Promise PDC40518 SATA150 controller> port 0xa800-0xa8ff,0xb000-0xb07f mem 0xe4000000-0xe401ffff,0xe4800000-0xe4800fff irq 17 at device 14.0 on pci0
atapci1: failed: rid 0x20 is memory, requested 4
ata4: channel #0 on atapci1
ata5: channel #1 on atapci1
ata6: channel #2 on atapci1
ata7: channel #3 on atapci1
em0: <Intel(R) PRO/1000 Network Connection, Version - 1.7.35> port 0xa400-0xa43f mem 0xe3000000-0xe301ffff,0xe3800000-0xe381ffff irq 18 at device 15.0 on pci0
em0: Ethernet address: 00:0e:0c:6b:d8:c7
uhci0: <VIA 83C572 USB controller> port 0xa000-0xa01f irq 21 at device 16.0 on pci0
usb0: <VIA 83C572 USB controller> on uhci0
usb0: USB revision 1.0
uhub0: VIA UHCI root hub, class 9/0, rev 1.00/1.00, addr 1
uhub0: 2 ports with 2 removable, self powered
uhci1: <VIA 83C572 USB controller> port 0x9800-0x981f irq 21 at device 16.1 on pci0
usb1: <VIA 83C572 USB controller> on uhci1
usb1: USB revision 1.0
uhub1: VIA UHCI root hub, class 9/0, rev 1.00/1.00, addr 1
uhub1: 2 ports with 2 removable, self powered
uhci2: <VIA 83C572 USB controller> port 0x9400-0x941f irq 21 at device 16.2 on pci0
usb2: <VIA 83C572 USB controller> on uhci2
usb2: USB revision 1.0
uhub2: VIA UHCI root hub, class 9/0, rev 1.00/1.00, addr 1
uhub2: 2 ports with 2 removable, self powered
ehci0: <VIA VT6202 USB 2.0 controller> mem 0xe2800000-0xe28000ff irq 21 at device 16.3 on pci0
usb3: EHCI version 1.0
usb3: companion controllers, 2 ports each: usb0 usb1 usb2
usb3: <VIA VT6202 USB 2.0 controller> on ehci0
usb3: USB revision 2.0
uhub3: VIA EHCI root hub, class 9/0, rev 2.00/1.00, addr 1
uhub3: 6 ports with 6 removable, self powered
umass0: USB Flash Disk, rev 2.00/2.00, addr 2
isab0: <PCI-ISA bridge> at device 17.0 on pci0
isa0: <ISA bus> on isab0
atapci2: <VIA 8235 UDMA133 controller> port 0x9000-0x900f,0x376,0x170-0x177,0x3f6,0x1f0-0x1f7 at device 17.1 on pci0
ata0: channel #0 on atapci2
ata1: channel #1 on atapci2
fdc0: <floppy drive controller> port 0x3f7,0x3f2-0x3f5 irq 6 drq 2 on acpi0
fd0: <1440-KB 3.5" drive> on fdc0 drive 0
sio0: <16550A-compatible COM port> port 0x3f8-0x3ff irq 4 flags 0x10 on acpi0
sio0: type 16550A, console
sio1: <Generic IRDA-compatible device> port 0x2f8-0x2ff irq 3 on acpi0
sio1: type 16550A
orm0: <ISA Option ROMs> at iomem 0xe0000-0xe0fff,0xd8000-0xdcfff,0xcc000-0xd57ff on isa0
pmtimer0 on isa0
atkbdc0: <Keyboard controller (i8042)> at port 0x64,0x60 on isa0
atkbd0: <AT Keyboard> irq 1 on atkbdc0
kbd0 at atkbd0
sc0: <System console> at flags 0x100 on isa0
sc0: VGA <16 virtual consoles, flags=0x100>
vga0: <Generic ISA VGA> at port 0x3c0-0x3df iomem 0xa0000-0xbffff on isa0
Timecounter "TSC" frequency 2083105548 Hz quality 800
Timecounters tick every 10.000 msec
ad0: 157066MB <HDS722516VLAT20/V34OA6MA> [319120/16/63] at ata0-master UDMA100
acd0: DVDROM <DVD-ROM BDV316E/VER B552> at ata0-slave PIO4
ad2: 157066MB <HDS722516VLAT20/V34OA6MA> [319120/16/63] at ata1-master UDMA100
ad4: 78533MB <HDS722580VLAT20/V32OA63A> [159560/16/63] at ata2-master UDMA100
ad6: 78533MB <IC35L090AVV207-0/V23OA63A> [159560/16/63] at ata3-master UDMA100
ad8: 157066MB <HDS722516VLSA80/V34OA6MA> [319120/16/63] at ata4-master SATA150
ad10: 157066MB <HDS722516VLSA80/V34OA6MA> [319120/16/63] at ata5-master SATA150
ad12: 157066MB <HDS722516VLSA80/V34OA6MA> [319120/16/63] at ata6-master SATA150
ad14: 157066MB <HDS722516VLSA80/V34OA6MA> [319120/16/63] at ata7-master SATA150
ar0: 78533MB <ATA RAID1 array> [10011/255/63] status: READY subdisks:
 disk0 READY on ad4 at ata2-master
 disk1 READY on ad6 at ata3-master
da0 at umass-sim0 bus 0 target 0 lun 0
da0: <OTi Flash Disk 2.00> Removable Direct Access SCSI-2 device 
da0: 40.000MB/s transfers
da0: 122MB (249856 512 byte sectors: 64H 32S/T 122C)
Mounting root from ufs:/dev/ar0s1a
em0: Link is up 1000 Mbps Full Duplex
 
So, ich hab das mal mitloggen lassen ... das ganze sieht dann irgendwann so aus:

Code:
feuer# tail -f /var/log/messages
...
Dec  6 22:22:25 feuer su: hazelnut to root on /dev/ttyd0
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=666159902720, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=666358599680, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=666557296640, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=666755993600, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=666954690560, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=667153387520, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=667352084480, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=667550781440, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=667749478400, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=667948175360, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=668146872320, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=668345569280, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=668544266240, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=668742963200, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=668941660160, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=669140357120, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=669537751040, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=669935144960, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=670133841920, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=670332538880, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=670531235840, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=670729932800, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=670928629760, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=671127326720, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=671326023680, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=671524720640, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=671723417600, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=671922114560, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=672120811520, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=672319508480, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=672518205440, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=672716902400, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=672915599360, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=673114296320, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=673312993280, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=673511690240, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=673710387200, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=673909084160, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=674107781120, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=674306478080, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=674505175040, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=674703872000, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=674902568960, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=675101265920, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=675299962880, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=675498659840, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=675697356800, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=675896053760, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=676094750720, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=676293447680, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=676492144640, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=676889538560, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=677088235520, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=677286932480, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=677485629440, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=677684326400, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=677883023360, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=678081720320, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=678280417280, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=678479114240, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=678677811200, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=678876508160, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=679075205120, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=679273902080, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=679472599040, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=614101299200, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=629997056000, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=499651833856, length=16384)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=499651850240, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=643508449280, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=656821145600, length=512)]
GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=669339054080, length=512)]
ad8: WARNING - WRITE_DMA interrupt was seen but timeout fired LBA=174375984
ad10: WARNING - WRITE_DMA interrupt was seen but timeout fired LBA=186561888
ad12: WARNING - WRITE_DMA interrupt was seen but timeout fired LBA=237011904
ad2: WARNING - WRITE_DMA interrupt was seen but timeout fired LBA=176471392
Dec  7 03:02:59 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=666159902720, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=666358599680, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=666557296640, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=666755993600, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=666954690560, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=667153387520, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=667352084480, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=667550781440, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=667749478400, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=667948175360, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=668146872320, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=668345569280, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=668544266240, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=668742963200, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=668941660160, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=669140357120, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=669537751040, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=669935144960, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=670133841920, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=670332538880, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=670531235840, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=670729932800, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=670928629760, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=671127326720, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=671326023680, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=671524720640, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=671723417600, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=671922114560, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=672120811520, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=672319508480, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=672518205440, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=672716902400, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=672915599360, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=673114296320, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=673312993280, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=673511690240, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=673710387200, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=673909084160, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=674107781120, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=674306478080, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=674505175040, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=674703872000, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=674902568960, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=675101265920, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=675299962880, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=675498659840, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=675697356800, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=675896053760, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=676094750720, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=676293447680, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=676492144640, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=676889538560, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=677088235520, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=677286932480, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=677485629440, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=677684326400, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=677883023360, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=678081720320, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=678280417280, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=678479114240, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=678677811200, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=678876508160, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=679075205120, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=679273902080, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=679472599040, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=614101299200, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=629997056000, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=499651833856, length=16384)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=499651850240, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=643508449280, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=656821145600, length=512)]
Dec  7 03:03:06 feuer kernel: GEOM_VINUM: plex request failed for gvinum/plex/data.p0[READ(offset=669339054080, length=512)]
Dec  7 03:03:06 feuer kernel: ad8: WARNING - WRITE_DMA interrupt was seen but timeout fired LBA=174375984
Dec  7 03:03:06 feuer kernel: ad10: WARNING - WRITE_DMA interrupt was seen but timeout fired LBA=186561888
Dec  7 03:03:06 feuer kernel: ad12: WARNING - WRITE_DMA interrupt was seen but timeout fired LBA=237011904
Dec  7 03:03:06 feuer kernel: ad2: WARNING - WRITE_DMA interrupt was seen but timeout fired LBA=176471392
^C

So, an der Stelle hat mich mein Windows gefragt, ob weiterkopieren soll. Irgend ein Ordner war schon da und Windows hat aufgehört, Daten Richtung Samba zu schieben. Sprich, die BSD Kiste hat nicht neu gebootet - das ist gut.

Der Fehler scheint wirklich nur beim kopieren großer Datenmengen aufzutreten. Ich habe hier im konkreten Fall mal so ca. 40GB im Kreis geschoben.

Interessant war, dass vinum das offensichtlich alles weggesteckt hat. Das sah dann so aus:

Code:
feuer# gvinum

gvinum -> list
6 drives:
D raid56                State: up       /dev/ad14s1d    A: 0/157065 MB (0%)
D raid55                State: up       /dev/ad12s1d    A: 0/157065 MB (0%)
D raid54                State: up       /dev/ad10s1d    A: 0/157065 MB (0%)
D raid53                State: up       /dev/ad8s1d     A: 0/157065 MB (0%)
D raid52                State: up       /dev/ad2s1d     A: 0/157065 MB (0%)
D raid51                State: up       /dev/ad0s1d     A: 0/157065 MB (0%)

1 volume:
V data                  State: up       Plexes:       1 Size:        766 GB

1 plex:
P data.p0            R5 State: up       Subdisks:     6 Size:        766 GB

6 subdisks:
S data.p0.s5            State: up       D: raid56       Size:        153 GB
S data.p0.s4            State: up       D: raid55       Size:        153 GB
S data.p0.s3            State: up       D: raid54       Size:        153 GB
S data.p0.s2            State: up       D: raid53       Size:        153 GB
S data.p0.s1            State: up       D: raid52       Size:        153 GB
S data.p0.s0            State: up       D: raid51       Size:        153 GB
gvinum -> exit
feuer# umount /home/data

Ich hoffe, dass da jemand eine Idee hat. Den Controller kann ich zwischenzeitlich fast ausschließen, da nicht nur die HDD's am SATA-Controller sondern auch die am IDE-Controller betroffen sind (ad0 ad2).

Kann das ein Problem mit dem Systembus sein? Ich meine, kann der "Überfüllt" sein oder so?

Im Voraus schon mal Danke

Hazel
 
jo, schon gemacht. Die einzige Pladde, die einen Fehler aufgewiesen hat ist die, die nicht in der Liste mit den Fehlermeldungen aufgeführt ist ...
Das nennt man glaub ich ironie ... :-)

Bringt mich also nicht weiter ...

Dank dir dennoch ...

Hat noch jemand eine Idee?

Hazel
 
Hatte mit einem Promise auch timeouts und sporadische Reboots. Die Platten auf SATA I runter zu jumpern (Tip von Conny von der de-Bsd Mailingliste) hat dann geholfen.
 
Hi,

das kann eine Lösung sein. Zumal ich hier auch (nur) einen SATA 150 Controller habe (Siehe DMESG; wieviel schaffen die HDD's eigentlich physisch? 50MB/s?).

Allerdings glaube ich (sorry, ich schaue jetzt nicht in die Kiste rein) dass die Platten auch auf dem Niveau waren und gar nirgends einen entsprechenden Jumper haben...

Finde ich die Tage aber auch noch raus.

Ansonsten bin ich mir ziemlich sicher, dass ich, wenn ich denn meinen nächsten Urlaub habe, einfach mal auf NetBSD umsteigen werde.

... in der wahnwitzigen Hoffnung, dass es dann doch am OS liegt ... ;'( :zitter:

(die begründet sich in etwas googlen, wo ich festgestellt habe, dass auch andere Leute mit vor allem anderen Controllern und Platten gleiche Probleme haben)

Na mal sehen...

n8

Hazel
 
sata platten die keinen jumper besitzen, lassen sich angeblich mit software vom hersteller "jumpern".
hatte bei meinen maxtorplatten ewig gesucht bis ich einfach gemerkt hatte, dass:
1. aktuelle treiber her müssen (zumindest unter windows)
2. die raidfunktion im bios nichts verloren hat
2. die firmware der platten aktuell sein sollte, die erkennt ob sata1 oder sata2 gefahren werden muss
3. der chipsatz aufm board nicht (/&%$ sein sollte

das treiberproblem hatte sich unter fbsd erledigt, raid konnte ich ausschalten. die firmware gabs durch google und das neue board ist mir zugeflogen.
oh und eine promise sata 300 tx4 hatte ich mir auch gekauft, da ich nciht gleich ein neues board holen wollte. war wie sich nach dem boardkauf herausstellte eine eine fehlinvestition :D

dma fehler hatte ich auch, auch sporadische reboots, allerdings müsste ich die fehlermeldungen suchen... das neue board hatt alles bereinigt *dreimalaufholzklopf"
 
Zuletzt bearbeitet:
Den 300 TX4 habe ich auch :-(. Wie gesagt Platten auf SATA 1 jumpern hat geholfen. Offenbar muß man den Controller zur Langsamkeit zwingen. Jmd. anders hat im Mainboard BIOS für PCI jegliche Geschwindigkeitsoptimierenden Einstellungen deaktiviert.
Mittefristig muß dann aber schon ein neuer Controller her.
Übrigens gibt es Probleme mit diesem und anderen Promise Controllerchipsätzen genauso unter Linux und OpenBSD.
 
Das S-ATA-I / S-ATA-II Problem ist doch altebekannt. Es liegt daran, dass die Hersteller es nicht geschaft haben, sich auf ein System zu einigen, mit welchem die Platte erkennen kann, an welchem Controller sie hängt. Eine S-ATA-II Platte an einem S-ATA-I Controller spricht diesen daher gerne mal schlicht falsch an, was zu Problemen führen kann. Gerade Maxtor war dabei sehr berüchtigt, vor allem weil sie es lange nicht nötig hatten den entsprechenden Jumper einzubauen. Dies war auch mit einer der hauptgründe für ihren Fast-Bankrott und die Übernahme durch Seagate (die das Prob übrigens selten bis nie hatten).
 
Zurück
Oben