[FBSD] SATA-Platten melden sich im RAID1 (gmirror) ab...

sir_eidrien

Nuklearer Mailhamster...
Hallo liebe Gemeinde

Ich gelange mal wieder mit einem kleinen Anliegen an Euch, mit der Hoffnung einen Tip zu bekommen um das Problem zu lösen.


Grundlagen:

- Eigenbau-Serverchen
- 2x80GB SATA-Festplatten an Motherboardcontroller, RAID1 mit gmirror, System => keine Probleme
- 2x200GB SATA-Festplatten an Promise SATA 300 tx2plus-Controller, RAID1 mit gmirror => Probleme
- System FreeBSD 6.1-Stable, gestern frisch aus Quellen gebaut


Problembeschreibung:

Die Maschine läuft einwandfrei, die Dienste (NFS, ssh) ebenso. Leider, leider ist es aber so, dass sich die beiden grossen Platten im laufenden Betrieb aus dem RAID1 "verabschieden", d.h. folgende Fehlermeldungen sind in /var/log/messages anzutreffen:

Code:
May  5 03:01:17 HAM kernel: ad8: FAILURE - device detached
May  5 03:01:17 HAM kernel: subdisk8: detached
May  5 03:01:17 HAM kernel: ad8: detached
May  5 03:01:17 HAM kernel: GEOM_MIRROR: Device gm1: provider ad8 disconnected.
May  5 03:01:17 HAM kernel: g_vfs_done():mirror/gm1s1e[READ(offset=8863860736, length=2048)]error = 6

Code:
Jun  6 03:01:16 HAM kernel: ad10: FAILURE - device detached
Jun  6 03:01:16 HAM kernel: subdisk10: detached
Jun  6 03:01:16 HAM kernel: ad10: detached
Jun  6 03:01:16 HAM kernel: GEOM_MIRROR: Device gm1: provider ad10 disconnected.
Jun  6 03:01:16 HAM kernel: g_vfs_done():mirror/gm1s1e[READ(offset=114688, length=16384)]error = 6

Auffallend hierbei dass es um die gleiche Zeit geschehen ist, aber unabhängig von der bisherigen Laufzeit. Auch fällt auf dass es nicht die gleiche Platte ist.


Bisherige Massnahmen:

- Verwendung des zweiten Motherboardcontrollers => gleiches Ergebnis
- Test der Platten mit dem Herstellertool => keine Fehler
- Kontrolle der Temperaturen => 26 - 30°C
- Einbau eines zusätzlichen Lüfters für die beiden Problemplatten => kein Erfolg


Zusätzliche Informationen:

dmesg:
Code:
Copyright (c) 1992-2006 The FreeBSD Project.
Copyright (c) 1979, 1980, 1983, 1986, 1988, 1989, 1991, 1992, 1993, 1994
        The Regents of the University of California. All rights reserved.
FreeBSD 6.1-STABLE #0: Mon Jun  5 19:04:47 CEST 2006
    root@HAM.annen.netz:/usr/obj/usr/src/sys/GENERIC
Timecounter "i8254" frequency 1193182 Hz quality 0
CPU: Intel(R) Celeron(R) CPU 2.80GHz (2806.38-MHz 686-class CPU)
  Origin = "GenuineIntel"  Id = 0xf41  Stepping = 1
  Features=0xbfebfbff<FPU,VME,DE,PSE,TSC,MSR,PAE,MCE,CX8,APIC,SEP,MTRR,PGE,MCA,CMOV,PAT,PSE36,CLFLUSH,DTS,ACPI,MMX,FXSR,SSE,SSE2,SS,HTT,TM,PBE>
  Features2=0x651d<SSE3,RSVD2,MON,DS_CPL,TM2,CNTX-ID,CX16,<b14>>
  AMD Features=0x20000000<LM>
real memory  = 502202368 (478 MB)
avail memory = 482033664 (459 MB)
ACPI APIC Table: <AWARD  AWRDACPI>
ioapic0 <Version 1.4> irqs 0-23 on motherboard
kbd1 at kbdmux0
acpi0: <AWARD AWRDACPI> on motherboard
acpi0: Power Button (fixed)
Timecounter "ACPI-fast" frequency 3579545 Hz quality 1000
acpi_timer0: <24-bit timer at 3.579545MHz> port 0x1008-0x100b on acpi0
cpu0: <ACPI CPU> on acpi0
acpi_button0: <Power Button> on acpi0
acpi_button1: <Sleep Button> on acpi0
pcib0: <ACPI Host-PCI bridge> port 0xcf8-0xcff,0x480-0x48f,0x1000-0x10df,0x10e0-0x10ff on acpi0
pci0: <ACPI PCI bus> on pcib0
agp0: <SiS 661 host to AGP bridge> mem 0xd0000000-0xd7ffffff at device 0.0 on pci0
pcib1: <PCI-PCI bridge> at device 1.0 on pci0
pci1: <PCI bus> on pcib1
pci1: <display, VGA> at device 0.0 (no driver attached)
isab0: <PCI-ISA bridge> at device 2.0 on pci0
isa0: <ISA bus> on isab0
atapci0: <SiS 964 UDMA133 controller> port 0x1f0-0x1f7,0x3f6,0x170-0x177,0x376,0x4000-0x400f at device 2.5 on pci0
ata0: <ATA channel 0> on atapci0
ata1: <ATA channel 1> on atapci0
atapci1: <SiS 180 SATA150 controller> port 0xa800-0xa807,0xac00-0xac03,0xb000-0xb007,0xb400-0xb403,0xb800-0xb80f irq 17 at device 5.0 on pci0
ata2: <ATA channel 0> on atapci1
ata3: <ATA channel 1> on atapci1
atapci2: <Promise PDC40775 SATA300 controller> port 0xbc00-0xbc7f,0xc000-0xc0ff mem 0xe1122000-0xe1122fff,0xe1100000-0xe111ffff irq 18 at device 10.0 on pci0
ata4: <ATA channel 0> on atapci2
ata5: <ATA channel 1> on atapci2
ata6: <ATA channel 2> on atapci2
xl0: <3Com 3c905C-TX Fast Etherlink XL> port 0xc400-0xc47f mem 0xe1125000-0xe112507f irq 19 at device 11.0 on pci0
miibus0: <MII bus> on xl0
ukphy0: <Generic IEEE 802.3u media interface> on miibus0
ukphy0:  10baseT, 10baseT-FDX, 100baseTX, 100baseTX-FDX, auto
xl0: Ethernet address: 00:0a:5e:43:20:cd
acpi_tz0: <Thermal Zone> on acpi0
fdc0: <floppy drive controller> port 0x3f0-0x3f5,0x3f7 irq 6 drq 2 on acpi0
fdc0: [FAST]
sio0: <16550A-compatible COM port> port 0x3f8-0x3ff irq 4 flags 0x10 on acpi0
sio0: type 16550A
ppc0: <ECP parallel printer port> port 0x378-0x37f,0x778-0x77b irq 7 drq 3 on acpi0
ppc0: Generic chipset (ECP/PS2/NIBBLE) in COMPATIBLE mode
ppc0: FIFO with 16/16/16 bytes threshold
ppbus0: <Parallel port bus> on ppc0
plip0: <PLIP network interface> on ppbus0
lpt0: <Printer> on ppbus0
lpt0: Interrupt-driven port
ppi0: <Parallel I/O> on ppbus0
atkbdc0: <Keyboard controller (i8042)> port 0x60,0x64 irq 1 on acpi0
atkbd0: <AT Keyboard> irq 1 on atkbdc0
kbd0 at atkbd0
atkbd0: [GIANT-LOCKED]
psm0: <PS/2 Mouse> irq 12 on atkbdc0
psm0: [GIANT-LOCKED]
psm0: model Generic PS/2 mouse, device ID 0
pmtimer0 on isa0
orm0: <ISA Option ROMs> at iomem 0xc0000-0xc7fff,0xc8000-0xccfff,0xcd000-0xcd7ff,0xef000-0xeffff on isa0
sc0: <System console> at flags 0x100 on isa0
sc0: VGA <16 virtual consoles, flags=0x300>
sio1: configured irq 3 not in bitmap of probed irqs 0
sio1: port may not be enabled
vga0: <Generic ISA VGA> at port 0x3c0-0x3df iomem 0xa0000-0xbffff on isa0
Timecounter "TSC" frequency 2806375635 Hz quality 800
Timecounters tick every 1.000 msec
ad0: 78167MB <Maxtor 6Y080L0 YAR41BW0> at ata0-master UDMA133
GEOM_MIRROR: Device gm0 created (id=2113116160).
GEOM_MIRROR: Device gm0: provider ad0 detected.
acd0: DVDR <TSSTcorpCD/DVDW SH-W162C/TS07> at ata0-slave UDMA33
ad2: 78167MB <Maxtor 6Y080L0 YAR41BW0> at ata1-master UDMA133
GEOM_MIRROR: Device gm0: provider ad2 detected.
GEOM_MIRROR: Device gm0: provider ad2 activated.
GEOM_MIRROR: Device gm0: provider ad0 activated.
GEOM_MIRROR: Device gm0: provider mirror/gm0 launched.
ad8: 239372MB <Maxtor 6V250F0 VA111610> at ata4-master SATA300
ad10: 239372MB <Maxtor 6V250F0 VA111610> at ata5-master SATA300
GEOM_MIRROR: Device gm1 created (id=2572203646).
GEOM_MIRROR: Device gm1: provider ad8 detected.
GEOM_MIRROR: Device gm1: provider ad10 detected.
GEOM_MIRROR: Device gm1: provider ad10 activated.
GEOM_MIRROR: Device gm1: provider ad8 activated.
GEOM_MIRROR: Device gm1: provider mirror/gm1 launched.
Trying to mount root from ufs:/dev/mirror/gm0s1a

Temperaturangaben:
Code:
Folgende Temperaturen wurden registriert:

Temperatur Festplatte ad0:  30
Temperatur Festplatte ad2:  27
Temperatur Festplatte ad8:  26
Temperatur Festplatte ad10:

gmirror list:
Code:
Geom name: gm0
State: COMPLETE
Components: 2
Balance: round-robin
Slice: 4096
Flags: NONE
GenID: 0
SyncID: 1
ID: 2113116160
Providers:
1. Name: mirror/gm0
   Mediasize: 81964301824 (76G)
   Sectorsize: 512
   Mode: r5w5e6
Consumers:
1. Name: ad0
   Mediasize: 81964302336 (76G)
   Sectorsize: 512
   Mode: r1w1e1
   State: ACTIVE
   Priority: 0
   Flags: DIRTY
   GenID: 0
   SyncID: 1
   ID: 2923323886
2. Name: ad2
   Mediasize: 81964302336 (76G)
   Sectorsize: 512
   Mode: r1w1e1
   State: ACTIVE
   Priority: 0
   Flags: DIRTY
   GenID: 0
   SyncID: 1
   ID: 84922961

Geom name: gm1
State: DEGRADED
Components: 2
Balance: round-robin
Slice: 4096
Flags: NONE
GenID: 1
SyncID: 9
ID: 2572203646
Providers:
1. Name: mirror/gm1
   Mediasize: 251000192512 (234G)
   Sectorsize: 512
   Mode: r2w2e4
Consumers:
1. Name: ad8
   Mediasize: 251000193024 (234G)
   Sectorsize: 512
   Mode: r1w1e1
   State: ACTIVE
   Priority: 0
   Flags: NONE
   GenID: 1
   SyncID: 9
   ID: 714297418

Ich hoffe ich habe genug Infos. Falls was fehlt oder jemand eine Vermutung hat => immer her damit. Schon mal besten Dank!

Grüsse, s_e
 
Ich weiss, dass du das Herstellertool schon benutzt hast, aber mach vielleicht trotzdem mal ein
smartctl -t long /dev/ad8
und für 10 auch. und paste dann mal die Ausgabe von smartctl -a
 
Hier die Ausgabe von smartctl -a /dev/ad8:

Code:
smartctl version 5.36 [i386-portbld-freebsd6.1] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Device Model:     Maxtor 6V250F0
Serial Number:    V50317CH
Firmware Version: VA111610
User Capacity:    251,000,193,024 bytes
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   7
ATA Standard is:  ATA/ATAPI-7 T13 1532D revision 0
Local Time is:    Tue Jun  6 20:21:14 2006 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x02)	Offline data collection activity
					was completed without error.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (  41)	The self-test routine was interrupted
					by the host with a hard or soft reset.
Total time to complete Offline 
data collection: 		 (2282) seconds.
Offline data collection
capabilities: 			 (0x5b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					No Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 ( 117) minutes.

SMART Attributes Data Structure revision number: 32
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  3 Spin_Up_Time            0x0027   252   252   063    Pre-fail  Always       -       4197
  4 Start_Stop_Count        0x0032   253   253   000    Old_age   Always       -       18
  5 Reallocated_Sector_Ct   0x0033   253   253   063    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000a   253   252   000    Old_age   Always       -       0
  8 Seek_Time_Performance   0x0027   249   242   187    Pre-fail  Always       -       62357
  9 Power_On_Hours          0x0032   252   252   000    Old_age   Always       -       412
 10 Spin_Retry_Count        0x002b   252   252   157    Pre-fail  Always       -       0
 11 Calibration_Retry_Count 0x002b   253   252   223    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   253   253   000    Old_age   Always       -       32
189 Unknown_Attribute       0x003a   100   100   000    Old_age   Always       -       0
190 Unknown_Attribute       0x0022   073   057   000    Old_age   Always       -       454754331
192 Power-Off_Retract_Count 0x0032   253   253   000    Old_age   Always       -       0
193 Load_Cycle_Count        0x0032   253   253   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0032   038   253   000    Old_age   Always       -       27
195 Hardware_ECC_Recovered  0x000a   253   252   000    Old_age   Always       -       544
196 Reallocated_Event_Count 0x0008   253   253   000    Old_age   Offline      -       0
197 Current_Pending_Sector  0x0008   253   253   000    Old_age   Offline      -       0
198 Offline_Uncorrectable   0x0008   253   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0008   199   199   000    Old_age   Offline      -       0
200 Multi_Zone_Error_Rate   0x000a   253   252   000    Old_age   Always       -       0
201 Soft_Read_Error_Rate    0x000a   253   252   000    Old_age   Always       -       0
202 TA_Increase_Count       0x000a   253   252   000    Old_age   Always       -       0
203 Run_Out_Cancel          0x000b   253   252   180    Pre-fail  Always       -       0
204 Shock_Count_Write_Opern 0x000a   253   252   000    Old_age   Always       -       0
205 Shock_Rate_Write_Opern  0x000a   253   252   000    Old_age   Always       -       0
207 Spin_High_Current       0x002a   252   252   000    Old_age   Always       -       0
208 Spin_Buzz               0x002a   252   252   000    Old_age   Always       -       0
210 Unknown_Attribute       0x0032   253   252   000    Old_age   Always       -       0
211 Unknown_Attribute       0x0032   253   252   000    Old_age   Always       -       0
212 Unknown_Attribute       0x0032   253   252   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Interrupted (host reset)      90%       412         -
# 2  Short offline       Completed without error       00%        16         -
# 3  Short offline       Completed without error       00%        16         -
# 4  Short offline       Completed without error       00%        10         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.


Hier die Ausgabe von smartctl -a /dev/ad10:
Code:
smartctl version 5.36 [i386-portbld-freebsd6.1] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Device Model:     Maxtor 6V250F0
Serial Number:    V503135H
Firmware Version: VA111610
User Capacity:    251,000,193,024 bytes
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   7
ATA Standard is:  ATA/ATAPI-7 T13 1532D revision 0
Local Time is:    Tue Jun  6 20:21:21 2006 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x80)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		 (2222) seconds.
Offline data collection
capabilities: 			 (0x5b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					No Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 ( 115) minutes.

SMART Attributes Data Structure revision number: 32
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  3 Spin_Up_Time            0x0027   191   190   063    Pre-fail  Always       -       7881
  4 Start_Stop_Count        0x0032   253   253   000    Old_age   Always       -       32
  5 Reallocated_Sector_Ct   0x0033   253   253   063    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000a   253   252   000    Old_age   Always       -       0
  8 Seek_Time_Performance   0x0027   251   245   187    Pre-fail  Always       -       40731
  9 Power_On_Hours          0x0032   252   252   000    Old_age   Always       -       479
 10 Spin_Retry_Count        0x002b   253   252   157    Pre-fail  Always       -       0
 11 Calibration_Retry_Count 0x002b   253   252   223    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   253   253   000    Old_age   Always       -       32
189 Unknown_Attribute       0x003a   100   100   000    Old_age   Always       -       0
190 Unknown_Attribute       0x0022   074   058   000    Old_age   Always       -       437911578
192 Power-Off_Retract_Count 0x0032   253   253   000    Old_age   Always       -       0
193 Load_Cycle_Count        0x0032   253   253   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0032   037   253   000    Old_age   Always       -       26
195 Hardware_ECC_Recovered  0x000a   253   252   000    Old_age   Always       -       3805
196 Reallocated_Event_Count 0x0008   253   253   000    Old_age   Offline      -       0
197 Current_Pending_Sector  0x0008   253   253   000    Old_age   Offline      -       0
198 Offline_Uncorrectable   0x0008   253   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0008   199   199   000    Old_age   Offline      -       0
200 Multi_Zone_Error_Rate   0x000a   253   252   000    Old_age   Always       -       0
201 Soft_Read_Error_Rate    0x000a   253   252   000    Old_age   Always       -       0
202 TA_Increase_Count       0x000a   253   252   000    Old_age   Always       -       0
203 Run_Out_Cancel          0x000b   253   252   180    Pre-fail  Always       -       0
204 Shock_Count_Write_Opern 0x000a   253   252   000    Old_age   Always       -       0
205 Shock_Rate_Write_Opern  0x000a   253   252   000    Old_age   Always       -       0
207 Spin_High_Current       0x002a   253   252   000    Old_age   Always       -       0
208 Spin_Buzz               0x002a   253   252   000    Old_age   Always       -       0
210 Unknown_Attribute       0x0032   253   252   000    Old_age   Always       -       0
211 Unknown_Attribute       0x0032   253   252   000    Old_age   Always       -       0
212 Unknown_Attribute       0x0032   253   252   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%         8         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay

Das smartctl -t - Ergebnis liefere ich nach.
 
evtl bin ich ja ein kleiner hinterwäldler, aber seit wann gibts unter fbsd smartctl für sata?
 
d4mi4n schrieb:
seit wann gibts unter fbsd smartctl für sata?
Kann smartctl unter FreeBSD nicht schon immer mit SATA? SATA Platten werden vom System ja wie IDE Platten behandelt.

Ciao.
Markus Mann
];-)
 
hmmm cool, muss ich mir nochmal viel genauer anschaun, ich habe nur fehlermeldungen bekommen, wollte nicht starten, mal schaun
 
Die Smartmontools können sogar mir SCSI/CAM :)

Die Ausgabe von Smart sieht sonst eingentlich normal und harmlos aus, alle kritischen Werte sind im grünen Bereich. Allerdings sind bei den neueren Maxtorserien (Diamon Max 10 und 11) Kompatiblitätsprobleme zu einigen SATA-Controllern bekannt. Zu dem TX2 weiß ich dort direkt nichts, aber zum Beispiel mögen sie das NV-Raid der nForce-Boards gar nicht.
Um das jetzt ausschließen zu können, solltest du die beiden zickigen Platten einmal an den anderen Controller umstecken und sie einige Zeit (20 Min sollten reichen) mit Tools wie dd belasten. Steigen sie dann nicht wieder aus, hast du das Problem gefunden.
In dem Fall wäre Maxtor deine nächste Anlaufstelle. Zu dem nForce-Problem - und damit eventuell auch zu deinem - gibt es ein Firmwareupgrade für die Platte, welches sie dir dann auf Wunsch zuschicken.
 
Guten Morgen allerseits

@Yamagi: Besten Dank für die Hinweise. Ich habe die Platten bereits am zweiten Motherboardcontroller angeschlossen mit dem selben negativen Ergebnis :(
Bei einem Rebuild des RAID's werden die Platten während ca. 1h voll belastet, ich denke das sollte als Lasttest ausreichen ;)

@all:
- Der Ausstieg einer Platte geschieht im laufenden Betrieb bei Leerlauf sozusagen, nicht unter Last.
- Die ausgestiegene Platte lässt sich nur nach einem Reboot wieder "finden".


Folgende Vermutungen hätte ich noch:

- Der Ausstieg ist ja augenfällig um die gleiche Zeit erfolgt - hat es einen Zusammenhang mit einem Cron-Job (security, daily, weekly)?
- Kann es sein dass die Platte anfährt und dass das Netzteil zu schwach ist, zu niedrige Spannung bringt und sich eine Platte abmeldet?

Besten Dank für Eure bisherigen Anregungen.

Grüsse, s_e
 
Noch eine Frage: Wäre es möglich dass allenfalls ACPI mir da auch noch einen Streich spielt?

Greets, s_e
 
Du hast nicht die Testergebnisse von -t long mitgeteilt, das wäre schon noch interessant.
Die Ergebnisse siehst du i.d.R. mit -a
 
@Maledictus: Werde die Ergebnisse am Abend nachliefern, habe eben keinen Zugriff nach Hause von der Arbeit aus. Du meinst, dass ein Test mit -t long die Ausgabe von -a um die Testergebnisse erweitert?

Grüsse, s_e
 
yamagi: maxtor Diamond MaxLine3 hat auch probleme, vor allem mit dem VIA VT8237R ......................
 
Um drei uhr nachts und eine minute laufen die cronjobs 'daily' (/etc/periodic/daily). Vielleicht hilft dir das weiter..

Lass uns wissen wenn du weiterkommst. Habe selbst gerade ein gmirror server und wirklich keine lust dass mir das gleiche passiert ;)
 
boesemar schrieb:
Habe selbst gerade ein gmirror server und wirklich keine lust dass mir das gleiche passiert ;)
Papperlapapp! Ich habe seit Anfang April neun Server (davon einen schon seit 11/2005) mit gmirror herumstehen, da zeigte noch keiner so ein Verhalten und ehrlich gesagt ist da auch nicht unbedingt Hardware vom feinsten drin. An gmirror liegt es IMHO eher nicht.

Ciao.
Markus Mann
];-)
 
Hallo zusammen

Habe meinen Server mal heruntergefahren, als sich diesmal wieder eine Platte "abgemeldet" hat. Ich werde nun mal am Wochenende ohne ACPI booten und versuchen das Problem einzukreisen. Bericht wird am Montag erstattet ;)

@boesemar: Danke für den Hinweis. Werde mal gucken was da abgeht...

Grüsse, s_e
 
Zurück
Oben