kernel panic immer wieder nach 15 minuten bei einem OBSD35 server und router in einem

Herakles

Profifragensteller
Moin!

Gestern Abend habe ich einen neuen OpenBSD-Router und Server in einem zusammengebastelt und alle Dienste, die ich wollte (NFS, Samba, no-ip) funktionieren auch.

Als ich gestern jedoch an einem Windows-client meines Kumpels hier inner WG Gleichzeitig mp3 gehört habe und eine DVD aus dem Netz von besagtem Server brennen wollte, fing die Musik an zu haken, also aussetzer zu haben und nach einer gewissen Zeit war der Server gar nicht mehr erreichbar.

Ein blick auf den Konsolenbildschirm des Servers sagte mir folgendes:

Code:
01:43:50 server last message repeated 490 times
01:45:51 server last message repeated 1973 times
01:55:52 server last message repeated 6971 times
01:59:48 server last message repeated 1967 times
panic: smashed stack in tcp_input
stopped at Debugger+0x4: leave
ddb>

Als ich heute morgen einen neustart des servers versucht habe, fingen die Meldungen von oben direkt wieder an. Natürlich mit anderer Zeit ;-)

Wie bekomme ich nun heraus, was denn nun die "last message" war und dann: wie löse ich dieses Scheissproblem, daß der Server ganze 15 minuten online ist und dann in kernel panic geht?

Danke im Voraus!


Herakles
 
hm, vielleicht kommst du über Knoppix oder der Shell von der Installations CD an die "last massages" (wird doch hoffentlich in irgendwelchen Logs stehen). Bin aber newbie im Bereich OBSD. So würd ichs allerdings unter Linux machen ;).

Havoc][
 
Bist du 100% sicher das deine Hardware ok ist? Vorallem der Hauptspeicher? Das die Ram-Timings stimmen usw?

NFS, Samba usw cachen wie wilde. Deswegen kann es gut sein das du 15min Musik hören kannst, sich dabei der Hauptspeicher (Cache) langsam füllt, eine kritische Stelle erreicht und dann das System panict.

Hab mir an falschen Spannungswerten für den RAM mal ziemlich die Zähne ausgebissen. Das führte damals zu unergründlichen Kernelpanics...

r0b0
 
Hi Jungs!

Also, Eure Hinweise scheinen echt in die richtige Richtung zu gehen. Habe folgendes gemacht:
Code:
cd /var/log
gunzip messages.0.gz
vi messages.0
Dabei habe ich gesehen, daß wohl die Meldung
Code:
Nov 20 11:24:43 server /bsd: nfsd send error 55
tausendmal in Wiederholung gemeint ist.

Laut /usr/include/sys/errno.h besagt diese Fehlernummer

/* No buffer space available */

Es geht also in der Tat um Speicher...

Was die Netzwerkkarten angeht, so sind zwar billige Realteks eingebaut, die funktionierten aber einwandfrei bis ich gestern Abend das System neu aufgesetzt habe. Hier bezweifle ich also den Fehler. Da ich jedoch ein anderes Board jetzt verwende, könnte der Fehler durchaus am Speicher liegen, werde den also jetzt mal kurz tauschen.

Es fällt im übrigen auf, daß das System jetzt schon ne halbe Stunde stabil läuft. Es scheint mit ein zusammenhang mit nfs zu bestehen, weil ich in dieser letzten halben Stunde lediglich ins Internet gehe und einen Knoppix-Client, der nur amule rennen hat (mit den temps auf dem Server) ausgeschaltet habe. Es sind also im Moment keinerlei samba und/oder nfs aktivitäten beim server. Ich tausch jetzt mal den Speicher und frittiere mir ein paar Tintenfischringe. Und danach das Fett in erkalten lassen und schön in Scheiben schneiden... LECKER!

Herakles
 
*lol*

ähm, *.gz logs kannst du normalerweise auch mit zless öffnen. Gibts bestimmt auch unter *BSD.

Zum Fehler: Wenn du ihn doch in Samba und/oder NFS vermutest stopp doch einfachmal die beiden Dienste?!

btw. Wie kann man Samba starten und stoppen *doof frag* (Ich weiss es wirklich nicht. Mit Sambactl komm ich irgendwie nich weiter....)

Havoc][
 
Danke für die Info bezüglich zless!

Also, der Speicher wars nicht. Ich hab die beiden Speicherchips getauscht und sobald ich den Küchenrechner (der mit amule und der so nach Frittenfett stinkt) anschalte und amule starte, fangen die gleichen Messages wieder an.

Es scheint also ein Problem mit dem nfsd zu geben. Abschalten will ich den Service aber nicht, kann ich sogar gar nicht, weil ich dann ja mit meinem FBSD-System keinen Zugriff auf die Dateien des Servers habe und ich auf lange Sicht gesehen ja auch den amule wieder rennen haben will...

Also: neue Ideen?

Samba starten:

Code:
/usr/local/libexec/nmbd -D
/usr/local/libexec/smbd -D

Samba stoppen: keine Ahnung, brauch ich nie ;-)
 
Nein. Es ging mir beim "abschalten" lediglich um einen Temporären Zustanden um zu überprüfen ob das Problem wirklich an einem der beiden Dienste liegt.

THX für den Samba tipp :).

Havoc][
 
Update auf OpenBSD 3.6 (GENERIC, kein haendisch verkonfigurierter Kernel) und dann noch mal testen.

Wenn es dann immer noch knallt, entweder auf misc@openbsd.org nachfragen oder gleich einen Bug eintueten. Aber die Ausgabe von dmesg(1) nicht vergessen :-)

Ciao,
Kili
 
Glaube ich nicht, da sitzt genügend Puffer zwischen dass die Musik bei überlasteten Netzwerkarten ins Stocken gerät. Und die Realtek-Karten haben zwar eine hohe CPU-Last, aber die gehen nie kaputt - selbst wenn sie tagelang im Schlamm gelegen, dabei nachts gefroren und morgens wieder aufgetaut, sauber gewaschen und trocken gerubbelt wurden.

Ich habe selber solche Erfahrungen gemacht, allerdings ohne weitere Netzwerklast, dass die Musik hakte, knisterte und kreischte, und in nicht seltenen Fällen der Player abstürzte (iTunes).

Ich habe ewig lang gerätselt. Eine neuere Version von Samba installiert (die nicht ging), wieder zurück installiert, Festplatten mit smartctl (damals wars noch Linux) überprüft - nichts.

Erst ein Speichertest (mit memtest, ist bei SuSE Linux dabei und bei der c't-Version von Knoppix, obs auch so dabei ist weiß ich nicht), brachte mich auf die Lösung: ein defekter Speicherriegel. Also raus damit, OBSD installiert und seitdem läuft die Kiste ununterbrochen ohn Schwierigkeiten.

Gruß
Morgoth
 
@Baseballbatboy: Einen Speicherschaden möchte ich ausschließen, weil ich, wie schon weiter oben beschrieben, den Speicher bereits getauscht habe...

Ich habe mittlerweile aufgegeben, weil auch mit einer anderen Netzwerkkarte keine Lösung zu erzielen war. Schade drum, aber na. Dafür hab ich jetzt ein neuen Problem, das ich aber wohl in einen neuen Thread scheiben werde. Kacke!

Herakles
 
Wie wäre es, wenn du erst einmal auf die neue 3.6 umsteigst?

Ich meine, es ist zwar nicht die Lösung des genannten Problems, aber das Herumkramen in den Mailinglisten bezüglich 3.5 ist auch nicht das Blaue vom Himmel.
 
Herakles schrieb:
@Baseballbatboy: Einen Speicherschaden möchte ich ausschließen, weil ich, wie schon weiter oben beschrieben, den Speicher bereits getauscht habe...

Sorry, habe ich überlesen.

Trotzdem solltest Du mal memtest ausführen, es muss ja nicht unbedingt am Speicher selber liegen, kann auch der Controller sein.

Gruß
Morgoth
 
@CW, hatte das wohl noch nicht erwähnt, aber ein Wechsel auf 3.6 ist bereits erfolgt, nach dem Hinweis von kili wollte ich auch diese Möglichkeit möglichst erstmal ausmerzen. Sorry, daß ich das noch nicht erwähnt hatte...

@ Baseballbatboy: Okay, no prob. memtest wird direkt mal durchgezogen!
 
Ich weiss nicht ob ich irgendwo was überlesen habe, aber vielleicht postest Du mal dmesg, wenn denn OpenBSD noch auf der Platte ist.

Ein Bug-Report kannst Du Dir wohl getrost sparen, so wie ich misc@ kenne, wird man Dir mit "check your hardware" antworten. Wenn das Problem nur auf Deiner Kiste auftritt (ich konnte mit smbd, nmbd, realtek und OpenBSD keine Probleme feststellen) und Du den Fehler nicht finden kannst würde dein Bug-Report wohl nur Sinn machen, wenn Du Deinen Rechner gleich mitschickst.
 
nickers schrieb:
Ein Bug-Report kannst Du Dir wohl getrost sparen, so wie ich misc@ kenne, wird man Dir mit "check your hardware" antworten.

Dazu faellt mir gerade ein aeusserst skurriles Problem ein, das neulich ueber misc@ lief. Jemand hatte seltsame Fehler beim compilieren des Kernels bekommen. Das Problem war dann wohl eine kaputte Netzwerkkarte :-)

http://marc.theaimsgroup.com/?l=openbsd-misc&m=110085169219306&w=2

Und da es hier ja speziell um ein Netzwerkproblem geht, waere ein Ueberpruefen bzw. probeweises Austauschen der Netzwerkkarte vielleicht wirklich nicht verkehrt.
 
Jungs, der Stand der Dinge:

Ich habe die Netzwerkarte getauscht, ich habe OpenBSD3.6 installiert, ich habe den Speicher getauscht. Jedesmal dasselbe Problem. Ich bin jetzt soweit, daß ich es aufgegeben habe, den neuen Rechner als Router und Server zu benutzen und fahre jetzt einen Rechner in der Küche mit Knoppix. Nach den letzten Tagen habe ich keinen Bock, mich jetzt noch damit zu befassen, einen OBSD-Rechner neu zu installieren und den X-Server bereit zu machen und alle mögliche Multimedia Hard- und Software zu installieren. Schade drum, aber vielleicht ein anderes Mal. Fürs Erste hab ich die Nase voll.

Danke für Eure Hilfe, auch wenns alles nicht geholfen hat! Herakles
 
Zurück
Oben