OpenBSD-Host nach einiger Zeit nicht mehr erreichbar

moe

Well-Known Member
[Solved] OpenBSD-Host nach einiger Zeit nicht mehr erreichbar

Hallo,

ich bin gerade dabei meinen Linux-Router auf OpenBSD umzurüsten, nicht weil de Raadt mich überzeugt hat :) , sondern weil ich schon seit längerem auch mal ein Unix genauer kennenleren will.

Das momentane Setup des Rechners ist eine OpenBSD-Installation aus dem Snapshot vom 20.07.05 und inzwischen auf den Snapshot vom 21.07.05 geupdated. Installiert wurden base,comp,misc,man und etc. Kernel ist unverändert, also Generic, ebenfalls aus der -current Serie. Grossartige Zusatzsachen wurden nicht installiert, nur kleinere Programme aus den (auch aktuellen) Ports. Also ein Fehler bei der Installation/inkompatible Versionen von irgendwas wage ich mal auszuschliessen.

Im Rechner stecken folgende Netzwerkkarten:
Code:
xl0 at pci0 dev 13 function 0 "3Com 3c905C 100Base-TX" rev 0x74: irq 11, address xx:yy:...
bmtphy0 at xl0 phy 24: Broadcom 3C905C internal PHY, rev. 6
xl1 at pci0 dev 14 function 0 "3Com 3c905C 100Base-TX" rev 0x74: irq 11, address xx:yy:...
bmtphy1 at xl1 phy 24: Broadcom 3C905C internal PHY, rev. 6
xl2 at pci0 dev 15 function 0 "3Com 3c900B 10Mbps-Combo" rev 0x04: irq 11, address xx:yy:...
ral0 at pci0 dev 16 function 0 "Ralink RT2560" rev 0x01: irq 11, address xx:yy:...
Momentan ist nur xl0 aktiv, da temporär ein Hardware-Billigrouter das Routing übernimmt. xl0 bekommt vom selbigen per DHCP Adresse und NS und Gateway, was auch problemlos funktioniert.

Nun zum eigentlichen Problem: An sich geht alles wunderbar, ich starte den Rechner, logge mich per ssh ein und mache irgendwas.. Zwischendurch muss man ja auch mal zur Uni oder sonstwohin, also bleibt er eine Zeitlang unbeachtet. Wenn ich nun nach einiger Zeit (ca. 1h) mich wieder per ssh einloggen will, gibts den nicht mehr. Also ein Ping läuft mit unreachable ins Leere, ssh geht dann natürlich auch nicht mehr. Sobald ich aber direkt an den Rechner gehe, und irgendeine Netzaktivität erzeuge (ping google.de z.B.) gehts wieder.

In dmesg sind keine Fehlermeldungen, auch alle Lampen an Karte und Switch leuchten wie es sein sollte. Der Fehler trat mit dem Snapshot vom 20. und vom 21. gleichermassen auf. pf o.ä. ist noch nicht konfiguriert, ausser ssh laufen keine Netzwerkdienste.

WIe weiter vorgehen, bzw. wo anfangen zu suchen? Hardwaredefekte schliesse ich auch aus, unter Linux gings mit seitdem nicht veränderter HW.
ifconfig sagt das:
Code:
lo0: flags=8049<UP,LOOPBACK,RUNNING,MULTICAST> mtu 33224
        groups: lo
        inet 127.0.0.1 netmask 0xff000000
        inet6 ::1 prefixlen 128
        inet6 fe80::1%lo0 prefixlen 64 scopeid 0x8
xl0: flags=8843<UP,BROADCAST,RUNNING,SIMPLEX,MULTICAST> mtu 1500
        lladdr xx:yy:...
        groups: egress
        media: Ethernet autoselect (100baseTX full-duplex)
        status: active
        inet6 fe80::204:76ff:fe90:3ad%xl0 prefixlen 64 scopeid 0x1
        inet 192.168.0.236 netmask 0xffffff00 broadcast 192.168.0.255
xl1: flags=8802<BROADCAST,SIMPLEX,MULTICAST> mtu 1500
        lladdr xx:yy:...
        media: Ethernet autoselect (none)
        status: no carrier
xl2: flags=8802<BROADCAST,SIMPLEX,MULTICAST> mtu 1500
        lladdr xx:yy:...
        media: Ethernet 10baseT (10baseT half-duplex)
        status: active
ral0: flags=8802<BROADCAST,SIMPLEX,MULTICAST> mtu 1500
        lladdr xx:yy:...
        media: IEEE802.11 autoselect
        status: no network
        ieee80211: nwid "" 100dBm
pflog0: flags=0<> mtu 33224
pfsync0: flags=0<> mtu 2020
enc0: flags=0<> mtu 1536
Also auch nichts auffälliges, obwohl mich die Ausgabe "no carrier" bei xl1 wundert, die Karte ist weder konfiguriert, noch steckt etwas drin, und warum sind eigentlich alle Karten aktiv obwohls nur eine hostname.xl0 gibt? Wird unter OpenBSD alles automatisch ge"up"t?

Alle Tipps sind willkommen,
Gruss und Danke Maurice
 
Zuletzt bearbeitet:
moe schrieb:
Das momentane Setup des Rechners ist eine OpenBSD-Installation aus dem Snapshot vom 20.07.05 und inzwischen auf den Snapshot vom 21.07.05 geupdated.
hmm, ich wuerde keine software aus der zukunft benutzen. -current aus der gegenwart ist schon experimentell genug. nimm lieber 3.7.

ifconfig sagt das:
Code:
lo0: flags=8049<UP,LOOPBACK,RUNNING,MULTICAST> mtu 33224
        groups: lo
        inet 127.0.0.1 netmask 0xff000000
        inet6 ::1 prefixlen 128
        inet6 fe80::1%lo0 prefixlen 64 scopeid 0x8
xl0: flags=8843<UP,BROADCAST,RUNNING,SIMPLEX,MULTICAST> mtu 1500
        lladdr xx:yy:...
        groups: egress
        media: Ethernet autoselect (100baseTX full-duplex)
        status: active
        inet6 fe80::204:76ff:fe90:3ad%xl0 prefixlen 64 scopeid 0x1
        inet 192.168.0.236 netmask 0xffffff00 broadcast 192.168.0.255
xl1: flags=8802<BROADCAST,SIMPLEX,MULTICAST> mtu 1500
        lladdr xx:yy:...
        media: Ethernet autoselect (none)
        status: no carrier
xl2: flags=8802<BROADCAST,SIMPLEX,MULTICAST> mtu 1500
        lladdr xx:yy:...
        media: Ethernet 10baseT (10baseT half-duplex)
        status: active
ral0: flags=8802<BROADCAST,SIMPLEX,MULTICAST> mtu 1500
        lladdr xx:yy:...
        media: IEEE802.11 autoselect
        status: no network
        ieee80211: nwid "" 100dBm
pflog0: flags=0<> mtu 33224
pfsync0: flags=0<> mtu 2020
enc0: flags=0<> mtu 1536
Also auch nichts auffälliges, obwohl mich die Ausgabe "no carrier" bei xl1 wundert, die Karte ist weder konfiguriert, noch steckt etwas drin, und warum sind eigentlich alle Karten aktiv obwohls nur eine hostname.xl0 gibt? Wird unter OpenBSD alles automatisch ge"up"t?
nur lo0 und xl0 sind "up", siehe flags=. und wenn ein device existiert, dann kannst du auch den link status abfragen, auch wenn es nicht up ist afaik.

zum eigentlichen problem: no clue. versuch 3.7. ansonsten wuerde ich es auf ein anderes geraet schieben, evtl das billig-blackbox-kistchen davor?
 
manchmal machen hardwarerouter oder isps auch einfach die leitung dicht, wenn kein traffic mehr darueber laeuft.
ein einfaches
Code:
ping www.bsdforen.de
sollte die aber offen halten.
 
moe schrieb:
Also auch nichts auffälliges, obwohl mich die Ausgabe "no carrier" bei xl1 wundert, die Karte ist weder konfiguriert, noch steckt etwas drin, [...]
Und eben weil nichts drin steckt also kein "Link" da ist hats auch keinen Carrier...

Zum Problem an sich, schon mal versucht den apmd abzuschalten (in der /etc/rc.conf)? Oder hast Du gar im BIOS irgendwas powersaviges eingestellt, was kein aufwecken durch die NIC von aussen zulässt? Höhrt sich nach irgendwtwas in der Richtung an...
 
@dettus, es geht ja um die interne Leitung, und da es im selben Subnetz liegt, sollte der HW-Router ja eh nichts damit zu tun haben, oder?

@sticky bit
An Powersaving o.ä. hab ich auch schon gedacht, ich kenn das zwar nicht bei Netzwerkkarten, aber man weiß ja nie.. Im Bios ist nichts dergeleichen eingestellt (btw. es ist ein Compaq DeskPro PII-400, das Bios ist ja eh recht abgesteckt) aber das mit dem apmd werd ich mal ausprobieren..

Danke Maurice

edit: Schade, der apmd war schon per default aus..
 
@TCM, oh hab deine Antwort jetzt erst gesehen..
Meinte natürlich den Juni, nicht Juli ;-)

-current ist experimentell, ich hätte auch lieber ein 3.7 -stable genommen, allerdings hätte ich dann um einen funtionstüchtigen Treiber für die WLan-Karte zu bekommen, den Kernel patchen müssen, und das erschien mir ähnlich experimentell.
 
Was passiert denn wenn du mal folgendes probierst:
1. Maschine einschalten
2. Connectivität z. B. mit ping testen
3. Zur Uni o. Ä. gehen
4. Connectivität z. B. mit ping testen, von einem anderen Rechner
5. Zu der Maschine gehen und mal ne Taste drücken, so dass der normalerweise "geblanke" Bildschirm n Bild zeigt aber nichts machen was Netzwerkverkehr erzeugt, ggf. irgendwas anders ausführen df meinetwegen, dann sind alle Platten auch mal wieder angesprungen und das meiste andere auch "wach" sein, ausser Du hast NFS-Shares eingehängt, dass würde dann nämlich wieder Netzverkehr versursachen
6. Connectivität z. B. mit ping testen, von einem anderen Rechner, wenn dann was geht, scheint es eben irgendwo ein "Aufwach-Problem" zu sein...

Oder, andere Alternative installier mal eine normale 3.7er (nicht Snapshot) und schau was da passiert um eingrenzen zu können obs an daran liegen könnte...

Nur son paar Ideen um näher an das Problem zu kommen...
 
Da er gerade mal wieder nicht erreichbar war (ca 3/4h Inaktivität) hab ich das gleich mal probiert, und es klappt. Also am eingeschlafenen Rechner df getippt (nfs oder ander netzwerkfilesysteme gibts da nicht) und er war wieder erreichbar.

Ich habe dann auch mal neugestartet und ins Bios geguckt, und da gibts doch einen Punkt "Power Management" der stand auf "Advanced" (keine Ahnung wo man dort irgendetwas advanced einstellen könnte) und ich hab ihn jetzt auf disable gestellt, und zusätzlich die IRQs etwas anders verteilt, so dass sich max. 2 Geräte einen IRQ teilen.
Mal ne Stunde abwarten und gucken obs geht..
 
Das wars wohl gewesen, jedenfalls hat er von gestern abend bis jetzt durchgehalten.
Danke für die Tipps, dann kann ich jetzt ja weiter einrichten und mich mit den nächsten Problemen melden ;-)
 
Zurück
Oben