Hardwarefehler finden

till

Active Member
Ich hab einen "bockigen" Server. So wie ich es sehe, bricht er unter Last zusammen. Hat jemand eine Idee wie man auf den Fehler kommen koennte? Im Moment startet er sich neu und faehrt neu hoch.

Ich hab nen Haufen komische "Fehler" bzw. Warnings in der dmesg.

Kennt jemand ein paar Programme, mit denen man so etwas testen kann? Mein stresstest bis jetzt war distributed.net. Den hat er nicht bestanden - so scheint mir. Er bootet halt neu. Ausschliessen, dass es am Client liegt, kann ich natuerlich nicht.

Dmesg:
Pentium Pro MTRR support enabled
md0: Malloc disk
Using $PIR table, 13 entries at 0xc00f4880
npx0: <math processor> on motherboard
npx0: INT 16 interface
pcib0: <Host to PCI bridge> on motherboard
pci0: <PCI bus> on pcib0
agp0: <Intel 82865G (865G GMCH) SVGA controller> port 0xec00-0xec07 mem 0xfe780000-0xfe7fffff,0xf0000000-0xf7ffffff irq 10 at device 2.0 on pci0
agp0: detected 8060k stolen memory
agp0: aperture size is 128M
pcib1: <Intel 82801BA/BAM (ICH2) Hub to PCI bridge> at device 30.0 on pci0
pci1: <PCI bus> on pcib1
rl0: <RealTek 8139 10/100BaseTX> port 0xd800-0xd8ff mem 0xfe5ffc00-0xfe5ffcff irq 11 at device 5.0 on pci1
rl0: Ethernet address: 00:0b:6a:6a:4c:de
miibus0: <MII bus> on rl0
rlphy0: <RealTek internal media interface> on miibus0
rlphy0: 10baseT, 10baseT-FDX, 100baseTX, 100baseTX-FDX, auto
isab0: <PCI to ISA bridge (vendor=8086 device=24d0)> at device 31.0 on pci0
isa0: <ISA bus> on isab0
atapci0: <Intel ICH5 SATA150 controller> port 0xfc00-0xfc0f,0-0x3,0-0x7,0-0x3,0-0x7 irq 0 at device 31.2 on pci0
ata0: at 0x1f0 irq 14 on atapci0
ata1: at 0x170 irq 15 on atapci0
pci0: <unknown card> (vendor=0x8086, dev=0x24d3) at 31.3 irq 10
orm0: <Option ROM> at iomem 0xc0000-0xc9fff on isa0
pmtimer0 on isa0
fdc0: ready for input in output
fdc0: cmd 3 failed at out byte 1 of 3
atkbdc0: <Keyboard controller (i8042)> at port 0x60,0x64 on isa0
vga0: <Generic ISA VGA> at port 0x3c0-0x3df iomem 0xa0000-0xbffff on isa0
sc0: <System console> at flags 0x100 on isa0
sc0: VGA <16 virtual consoles, flags=0x300>
sio0: configured irq 4 not in bitmap of probed irqs 0
sio0 at port 0x3f8-0x3ff irq 4 flags 0x10 on isa0
sio0: type 8250
sio1: configured irq 3 not in bitmap of probed irqs 0
ppc0: parallel port not found.
ad0: 157066MB <HDS722516VLAT20> [319120/16/63] at ata0-master UDMA100
Mounting root from ufs:/dev/ad0s1a
WARNING: / was not properly dismounted

Das OS ist FreeBSD 4.9. War die Mini-ISO.

Klingt komisch, aber sonst hab ich Dell-Hardware - da gab es nie Probleme. Das hat der Anbieter zusammengekauft. Eventuell am falschen Ende gespart.

Hat jemand eine Idee?

Danke,
Till
 
was steht denn in der /var/log/messages ? hast du vielleicht ein hitzeproblem mit cpu oder anderen komponenten, speicher schonmal getauscht ?
 
[moR-pH-euS] schrieb:
was steht denn in der /var/log/messages ? hast du vielleicht ein hitzeproblem mit cpu oder anderen komponenten, speicher schonmal getauscht ?

Ja, also laut Anbieter wurde nun alles getauscht. Netzteil, Speicher, Mobo. Die CPU und die HDDs wohl noch nicht. Aber sonst alles.

messages hatte ich vergessen. Beim booten kommt folgendes. Der Rest ist dann identisch zur dmesg oben.

Sep 27 15:21:26 newyork /kernel: Fatal trap 12: page fault while in kernel mode
Sep 27 15:21:26 newyork /kernel: fault virtual address = 0x44
Sep 27 15:21:26 newyork /kernel: fault code = supervisor read, page not present
Sep 27 15:21:26 newyork /kernel: instruction pointer = 0x8:0xc034a69c
Sep 27 15:21:26 newyork /kernel: stack pointer = 0x10:0xe82e0cb4
Sep 27 15:21:26 newyork /kernel: frame pointer = 0x10:0xe82e0cbc
Sep 27 15:21:26 newyork /kernel: code segment = base 0x0, limit 0xfffff, type 0x1b
Sep 27 15:21:26 newyork /kernel: = DPL 0, pres 1, def32 1, gran 1
Sep 27 15:21:26 newyork /kernel: processor eflags = interrupt enabled, resume, IOPL = 0
Sep 27 15:21:26 newyork /kernel: current process = 682 (dnetc)
Sep 27 15:21:26 newyork /kernel: interrupt mask = net tty bio cam
Sep 27 15:21:26 newyork /kernel: trap number = 12
Sep 27 15:21:26 newyork /kernel: panic: page fault
 
Zurück
Oben