Unvermittelter reboot, was tun?

Dieses Thema im Forum "FreeBSD - Allgemein" wurde erstellt von ruiin, 25 März 2012.

  1. ruiin

    ruiin Member

    Registriert seit:
    13 August 2011
    Beiträge:
    69
    Ort:
    Essen, Germany
    Hi,

    ich hab einen alten Desktop als NAS und FreeBSD Server auf 8.2 laufen. Ich denke mir das die Hardware nicht auf den Dauerbetrieb ausgelegt ist, doch merke ich immer wieder wie der Rechner unvermittelt neu startet. Ich frag mich natürlich wo der Fehler ist und deswegen währe meine Frage wie ich das monitoren kann?

    danke
  2. Kamikaze

    Kamikaze Bottom Poster Mitarbeiter

    Registriert seit:
    26 Mai 2005
    Beiträge:
    10.206
    Ort:
    /Earth/Europe/Germany/Karlsruhe
    Erst einmal, hast du eine swap-Partition, die größer als dein Arbeitsspeicher ist?

    Mein Kernel erzeugt nur dumps, wenn das der Fall ist. Obwohl für einen Mini-Dump bei weitem nicht so viel Platz gebraucht wird.
  3. ruiin

    ruiin Member

    Registriert seit:
    13 August 2011
    Beiträge:
    69
    Ort:
    Essen, Germany
    Der Arbeitsspeicher ist 2GB Swap ist 4GB.
    Das Filesystem der NAS-Festplatten ist ZFS, aber ohne den Kernel dafür konfiguriert zu haben (also ich nutz es so wie es installiert ist ohne tuning). Die Systemfestplatte ist grundsätzlich UFS. Ich habe schon meine laufenden Jails ausgeschaltet.
  4. [KB]

    [KB] Member

    Registriert seit:
    20 April 2010
    Beiträge:
    89
    Ich würde erst einmal mit "find / -name '*.core' alle dump-Dateien suchen und löschen.
    Dann auf den nächsten Neustart warten und wieder nach dump-Dateien suchen.
    Somit stellst Du evtl. fest, welches Programm ein Problem hat.
    Anschließend könntest Du diese Programm dann mit der Debug-Option neu kompilieren und weitere Detailinformationen aus der core-Datei gewinnen.
  5. ruiin

    ruiin Member

    Registriert seit:
    13 August 2011
    Beiträge:
    69
    Ort:
    Essen, Germany
    bevor ich die datei finden konnte hat der rechner neu gestartet. Wo ist die Datei denn im default?

    EDIT:
    ich hab mal mit top meine prozesse angeschaut und fsck_ufs ist der einzige prozess der ständig seinen status ändert. swap ist frei und der arbeitsspeicher wird kaum belastet (90% idle). Sollte ich die Systemplatte mal mit einer repair-disk und fsck checken? Die Systemplatte ist die älteste in meinem NAS, doch Smart sagt noch nichts dazu.

    EDIT:
    hab fsck mal im singel-user-mode ausgeführt und so einige fehler gefunden und behoben. Nach dem Reboot läuft der Prozess nicht mehr. Mal schaun ob es sich jetzt erledigt hat. Danke für die schnelle Hilfe.
    Zuletzt bearbeitet: 25 März 2012
  6. dettus

    dettus Bicycle User

    Registriert seit:
    9 August 2004
    Beiträge:
    2.549
    Ort:
    nuernberg
    beim "unvermittelten reboot vom alten rechner" wiederhole ich es auch immer wieder gerne gebetsmuehlenartig: guck mal nach ob das ding nicht einfach nur zugestaubt ist!!
  7. ruiin

    ruiin Member

    Registriert seit:
    13 August 2011
    Beiträge:
    69
    Ort:
    Essen, Germany
    wie ich schon schrieb. es lag an der systemfestplatte. lustigerweise hatte ich den Rechner vor Tagen neu zusammengeschraubt und dabei auch eine menge Staub entfernt, ich dachte eher an einen Wackelkontakt oder Hardwaredefekt. Bin erleichtert das es "nur" an der systemplatte lag. Die muss ich dann erst einmal nicht neu kaufen.
  8. juedan

    juedan FreeBSDler

    Registriert seit:
    24 September 2007
    Beiträge:
    682
    Ort:
    Weyarn - kennt eh keiner
    Hallo ruiin,

    schau auch mal in /var/log/messages nach, ob dort irgendwelche Meldungen vom HDD-Controller oder von der Festplatte drinstehen. Vielleicht haben einer von beiden oder sogar beide einen kleinen Knacks weg. Auch wenn es jetzt wieder funktioniert...

    JueDan
  9. ruiin

    ruiin Member

    Registriert seit:
    13 August 2011
    Beiträge:
    69
    Ort:
    Essen, Germany
    ich wüsste jetzt nicht wo nach ich suchen soll aber seh auch nichts ungewöhnliches. unerklärliches. Währe schlecht wenn der Controller einen Schaden hat. Da hängt auch mein ZFS dran und das müsste ja schon Alarm geschlagen haben wenn die Daten nicht stimmen.
  10. juedan

    juedan FreeBSDler

    Registriert seit:
    24 September 2007
    Beiträge:
    682
    Ort:
    Weyarn - kennt eh keiner
    Hallo ruiin,

    meist sind das in kurzen Abständen wiederkehrende Meldungen, dass ein Lese- oder Schreibfehler vorliegt oder es treten vermehrt Timeouts auf. Die Smartmontools helfen auch hier weiter.

    JueDan