Absturz Fatal trap 12: page fault while in kernel mode

Illuminatus

in geheimer Mission
Code:
uname -a
FreeBSD host.domain.tld 4.10-RELEASE-p2 FreeBSD 4.10-RELEASE-p2

NVIDIA-FreeBSD-x86-1.0-6113 Treiber ist installiert und läuft ohne Fehler.
apmd ist eingeschaltet, ebenso Hyperthreading, DMA

hin und wieder (es ist nicht eindeutig reproduzierbar) und meist unter Last friert das System ein und ein Neustart erfolgt.
In /var/log/messages steht dann:
Code:
Aug 26 12:39:28 korg /kernel: kernel trap 12 with interrupts disabled
Aug 26 12:39:28 korg /kernel: 
Aug 26 12:39:28 korg /kernel: 
Aug 26 12:39:28 korg /kernel: Fatal trap 12: page fault while in kernel mode
Aug 26 12:39:28 korg /kernel: mp_lock = 00000001; cpuid = 0; lapic.id = 00000000
Aug 26 12:39:28 korg /kernel: fault virtual address	= 0x6e12
Aug 26 12:39:28 korg /kernel: fault code		= supervisor read, page not present
Aug 26 12:39:28 korg /kernel: instruction pointer	= 0x8:0x6e12
Aug 26 12:39:28 korg /kernel: stack pointer	        = 0x10:0xf0939c98
Aug 26 12:39:28 korg /kernel: frame pointer	        = 0x10:0x5310
Aug 26 12:39:28 korg /kernel: code segment		= base 0x0, limit 0xfffff, type 0x1b
Aug 26 12:39:28 korg /kernel: = DPL 0, pres 1, def32 1, gran 1
Aug 26 12:39:28 korg /kernel: processor eflags	= resume, IOPL = 0
Aug 26 12:39:28 korg /kernel: current process		= Idle
Aug 26 12:39:28 korg /kernel: interrupt mask		= none <- SMP: XXX
Aug 26 12:39:28 korg /kernel: trap number		= 12
Aug 26 12:39:28 korg /kernel: panic: page fault
Aug 26 12:39:28 korg /kernel: mp_lock = 00000001; cpuid = 0; lapic.id = 00000000
Aug 26 12:39:28 korg /kernel: boot() called on cpu#0
Aug 26 12:39:28 korg /kernel: 
Aug 26 12:39:28 korg /kernel: syncing disks... 
Aug 26 12:39:28 korg /kernel: 
Aug 26 12:39:28 korg /kernel: Fatal trap 12: page fault while in kernel mode
Aug 26 12:39:28 korg /kernel: mp_lock = 00000002; cpuid = 0; lapic.id = 00000000
Aug 26 12:39:28 korg /kernel: fault virtual address	= 0x30
Aug 26 12:39:28 korg /kernel: fault code		= supervisor read, page not present
Aug 26 12:39:28 korg /kernel: instruction pointer	= 0x8:0xc035ca19
Aug 26 12:39:28 korg /kernel: stack pointer	        = 0x10:0xf09399a0
Aug 26 12:39:28 korg /kernel: frame pointer	        = 0x10:0xf09399a8
Aug 26 12:39:28 korg /kernel: code segment		= base 0x0, limit 0xfffff, type 0x1b
Aug 26 12:39:28 korg /kernel: = DPL 0, pres 1, def32 1, gran 1
Aug 26 12:39:28 korg /kernel: processor eflags	= interrupt enabled, resume, IOPL = 0
Aug 26 12:39:28 korg /kernel: current process		= Idle
Aug 26 12:39:28 korg /kernel: interrupt mask		= bio  <- SMP: XXX
Aug 26 12:39:28 korg /kernel: trap number		= 12
Aug 26 12:39:28 korg /kernel: panic: page faul5 in via em0
Aug 26 12:39:28 korg /kernel: Rebooting...
Aug 26 12:39:28 korg /kernel: cpu_reset called on cpu#0
Aug 26 12:39:28 korg /kernel: cpu_reset: Stopping other CPUs

hier habe ich ein portsdb -Uu gestartet und zwischendurch zu fluxbox ALT+F9 und wieder zur Konsole gewechselt.
Code:
Aug 26 12:58:04 korg /kernel: Fatal trap 12: page fault while in kernel mode
Aug 26 12:58:04 korg /kernel: mp_lock = 00000002; cpuid = 0; lapic.id = 00000000
Aug 26 12:58:04 korg /kernel: fault virtual address	= 0xffffaf29
Aug 26 12:58:04 korg /kernel: fault code		= supervisor read, page not present
Aug 26 12:58:04 korg /kernel: instruction pointer	= 0x8:0xc037a20c
Aug 26 12:58:04 korg /kernel: stack pointer	        = 0x10:0xf0c6ce48
Aug 26 12:58:04 korg /kernel: frame pointer	        = 0x10:0xf0c6ce58
Aug 26 12:58:04 korg /kernel: code segment		= base 0x0, limit 0xfffff, type 0x1b
Aug 26 12:58:04 korg /kernel: = DPL 0, pres 1, def32 1, gran 1
Aug 26 12:58:04 korg /kernel: processor eflags	= interrupt enabled, resume, IOPL = 0
Aug 26 12:58:04 korg /kernel: current process		= 26849 (make)
Aug 26 12:58:04 korg /kernel: interrupt mask		= none <- SMP: XXX
Aug 26 12:58:04 korg /kernel: trap number		= 12
Aug 26 12:58:04 korg /kernel: panic: page fault
Aug 26 12:58:04 korg /kernel: mp_lock = 00000002; cpuid = 0; lapic.id = 00000000
Aug 26 12:58:04 korg /kernel: boot() called on cpu#0
Aug 26 12:58:04 korg /kernel: 
Aug 26 12:58:04 korg /kernel: syncing disks... 66 
Aug 26 12:58:04 korg /kernel: done
Aug 26 12:58:04 korg /kernel: Uptime: 17m51s
Aug 26 12:58:04 korg /kernel: Automatic reboot in 15 seconds - press a key on the console to abort
Aug 26 12:58:04 korg /kernel: Rebooting...
Aug 26 12:58:04 korg /kernel: cpu_reset called on cpu#0
Aug 26 12:58:04 korg /kernel: cpu_reset: Stopping other CPUs

Das System selbst kann allerdings auch Stundenlang unter Last funktionieren. Früher waren diese Abstürze äusserst selten. Seit ich aber nvidia-driver benutze (vor allem die neuste Version) häufen sich Abstürze dieser Art. Das Netzteil ist ausreichend dimensioniert für die verbaute HW. memtest gibt keine Fehler aus und auch cpu stress Tools gaben keine Hinweise.

Ich werde weiter testen. Sollte jemand von euch eine Idee haben, immer her damit.
 
Ich hatte mit dem alten NVidia Treiber auch solche Probleme. Die Kiste schmierte einfach ab. Panic. Page fault.
Nimm doch mal den NVidia Treiber raus, lade nicht das Modul und dann schau mal ob es die Box immer noch macht.
 
Illuminatus schrieb:
Das System selbst kann allerdings auch Stundenlang unter Last funktionieren. Früher waren diese Abstürze äusserst selten. Seit ich aber nvidia-driver benutze (vor allem die neuste Version) häufen sich Abstürze dieser Art. Das Netzteil ist ausreichend dimensioniert für die verbaute HW. memtest gibt keine Fehler aus und auch cpu stress Tools gaben keine Hinweise.

Ich werde weiter testen. Sollte jemand von euch eine Idee haben, immer her damit.

festplatte testen?
kann vieles sein, und wenn's fruher auch vorgekommen ist, und jetzt haeufiger wird, koennte das an der hardware liegen.
du kannst dir auch 'kernel debugging', im 'developers-handbook' anschauen, so kommst du an mehr infos:
http://www.freebsd.org/doc/en_US.ISO8859-1/books/developers-handbook/kerneldebug.html
normaler weise sollten solche probleme nur bei systemen unter hoher last auftreten, oder eben entwickler systemen - es kann aber durchaus sein das spezielle hardware in verbindung mit irgendwelchen treiber das system zum abschwirren bringen.
 
"äusserst selten" sollte ich ausführlicher beschreiben: es war eine Zeit in der ich noch KDE benutzte, als ich aber fluxbox verwendete war alles wunderbar, die seltenen Abstürze kamen nicht mehr vor. Es ist aktuell nur das Phänomen mit nvidia - zumal praktisch immer ein X hier läuft.

*edit*
die bisherigen stress Durschläufe waren i.O. und ergaben keine Auffäkkigkeiten. Eine klar Reproduzierbarkeit der Abstürze ist noch nicht gegeben. Einen HW Fehler möchte ich zunächst ausschließen.
 
könnte bitte jemand mit nvidia Treibern per "X :1" einen X auf STRG+ALT+F10 starten und diesen mit STRG+ALT+BACKSPACE abschießen. Und vor allem berichten was danach mit seinem System geschieht.
 
Zurück
Oben