Stabilitaetsproblem

Elessar

Huldigt dem _/\_
Hi,

ich hab vor zwei drei Tagen mein System ein bisschen ausgebaut, bekomme die Kiste jetzt aber nicht mehr stabil.

Hardware Eckdaten:
Board: MSI Pro266TD Master-LR (MS-9105LR)
CPU: 2* Intel PIII-S 1400MHz
Chip: VIA Apollo Pro266T
RAM: 1* 512MByte DDR-266 Unbuffered ohne ECC
Video: GeForce2 Pro 64MB
NIC: Intel EtherExpress Pro/100+ Management
SCSI: Adaptec AHA-2940 U/UW
Sound: Creative SndBlaster PCI 512
OnBoards:
- Promise RAID aktiviert (aber nicht genutzt)
- USB deaktiviert
- Intel NIC aktiviert
Laufwerke:
IDE: Maxtor 5T060H6, IBM-DTLA-305040, WDC WD800JB
SCSI: Plextor PX40, Plextor PX-R820

Vorher: ASUS CUSL-2 mit PIII CuMine 733MHz und 2* 256 MB PC133, i815E Chipsatz. Ansonsten gleich (bis auf die onboard Komponenten eben).

Leider kann ich das Problem nicht allzu klar umschreiben da ich noch nichts genaues weiss. Das System friert zufaellig und ohne fuer mich ersichtlichen Grund ein. Es reagiert dann nicht auf Tastatur/Maus, auch ein Zugriff per SSH ist nicht moeglich. XMMS zB haengt dann in einer Schleife von ein paar ms.
Manchmal verlaesst es diesen Livelock Status allerdings auch wieder (nach ~1min Tastaturgequetsche). Ca 20min spaeter kommt dann allerdings der freeze der zumindest laenger dauert als ich zu warten bereit bin.
Jedoch lief das System auch schon zwei Naechte durch, einmal in der Shell ohne Login, und einmal mit gestartetem XF86.
Soviel zum booten mit SMP Kernel.

Boote ich mein System mit meinem alten Uniprocessor Kernel laeuft die Kiste subjektiv stabil (bisher noch kein Freeze).
Fuer Ideen und Vorschlaege bin ich jederzeit offen.

Ach ja, AGP FastWirtes, SideAdressing etc. sind abgeschalten, der AGP Port laeuft auf 2x etc. Kuehlung erfolgt durch die Boxed Kuehlkoerper/Luefter Kombination. CPU Temp nach einigen Stunden Last laut BIOS 43 Grad, Kuehlkoerper werden nichtmal handwarm.

Kernel Conf SMP
Kernel Conf Uni
dmesg -a SMP
dmesg -a Uni
pciconf -lv Output
 
Moin.

Logs?

Hm.Hm.
Leider kann ich Dir keine Patentlösung präsentieren aber ein paar Möglichkeiten die Du mal austesten könntest, evtl. ist die Lösung ja dabei.

1. Es kann, warum auch immer, bei der Unterstützung von USB und SMP zu Problemen kommen. Meist dann wenn ein USB Gerät eingesteckt wird (umschalten von von MPS 1.4 auf MPS 1.1 soll helfen, so habe ich es gelesen, oder gleich ein BIOS update).

2. APM deaktivieren, hat bei manchen auch zu Problemen in Verbindung mit SMP geführt.

3. *grübel* Da verliessen sie ihn....
Hmm, evtl. liegt auch ein Hardwaredefekt vor, das eine CPU nicht mehr so rennt wie sie soll, wenn es ohne SMP tadellosfunktioniert...

Schon mal bei den PRs von FreeBSD nachgesehen ob das Problem bekannt ist?
Wenn nicht, dann schreibe doch einen PR.
 
Kann es an einer neuen Hardwarekomponente liegen?

Villeicht ein Bios-Update ?

@Elessar HDR-Fan ?
 
Zuletzt bearbeitet:
Thx fuer die Antworten.

Logs hab ich aus einem einfachen Grund keine gepostet.
Weder in /var/log/messages noch in /var/log/XFree86.0.log steht irgendwas drin was ich irgendwie mit dem Absturz in Zusammenhang bringen kann. Es steht eigentlich nur das normale drin...
Wenn du n spezielles Logfile im Sinn hast, sag bescheid, ich werd es nachreichen.

USB is wie gesagt abgeschalten, der eingesteckte ausgeschaltene Drucker sollte nichts machen.

Das mit APM werd ich mal ausprobieren. Evtl werd ich auch mal meinen Router abschalten und aus dem die SCSI [Boot] Platte entwenden.
Aber das sicher erst naechste Woche.

Meinst ein Wechsel auf 5.0 koennte was bringen? Und hoer mit Hardwaredefekt auf, meinem Geldbeutel wird schon ganz anders.

[Edit]
@Manwe: neu is ja nur CPU/RAM/Motherboard. Die Onboard Intel Nic und den Promise koennt ich eigentlich mal abschalten. Alle anderen neuen Komponenten lass ich mal lieber an...
BIOS is mit v1.2 aktuell bzw das einzig verfuegbare. Also auch kein Downgrade moeglich.

HdR? Wie kommst du da drauf *hust*? Warum nennst du dich nicht gleich Eru oder Illuvatar? Darauf waers jetzt auch nimmer angekommen =:]
 
Zuletzt bearbeitet:
Ich möchte keine Wetten abschliessen, aber je mehr ich google und den PR lese, umso wahrscheinlicher wird es, das es schlicht und ergreifend am APM liegt.
Rausnehmen, Kernel neu bauen. ACPI im BIOS ausschalten. Neu booten. Abwarten.

Ein update auf FreeBSD 5.0 KANN etwas bringen, insbesondere bei SMP, da dort SMP_NG zu Einsatz kommt. In wie weit Du dort aber auf andere Probleme stossen könntes will und kann ich hier nicht sagen.

Was den evtl. hardware defekt angeht, eine CPU rausnehmen, ohne SMP rennen lassen, dann mit der anderen. Wenn er abjodelt bei einer CPU, na dann....
Aber eher sehr sehr unwahrscheinlich.

Poste einen PR bei freebsd.org und schreibe an die mailingliste von SMP. Evtl. kennt jemand das Problem schon.
 
Ich hab jetzt erstmal #apm_enable="YES" und #apmd_enable="YES" gemacht. Ausserdem isses aus dem Kernel geflogen.
Onboard NIC und Promise RAID wurden abgeschalten.

Neues SMP-DMESG

Mal schauen wie er jetzt laeuft.
 
Onboard NIC und Promise RAID hätte ich zuerst drin gelassen. Wenn es jetzt geht, woran liegt es dann? An APM, an onboard NIC, an RAID....

Naja, ich hoffe das Deine Box nun rennt.
 
Schaut ganz gut aus.

(14:41:22) elessar@aragorn: ~> uptime
2:41PM up 2:12, 2 users, load averages: 2.25, 2.15, 2.07

Das is schon mal um Faktor zwei besser vorher.
Werd nochma Statusbericht abgeben, aber jetzt schon mal DANKE. Sieht gut aus bisher.

Zu den OnBoard sachen: die fueg ich einzeln wieder hinzu wenn ich die Kiste erstmal am laufen hab. Das is mir grad wichtiger.
 
Ich hoffe Du hast Dich nicht zu früh gefreut ;).
Hauptsache die Box rennt stabil, alles andere ist, so sehe ich das, erstmal nicht so wichtig. Kann ich nachfühlen wenn einem die Kiste immer wieder abschmiert.

Was rennt denn auf der Box das der load dementsprechend ist, bzw. was soll mal darauf rennen?
 
Das hoffe ich auch, aber sie rennt immernoch. Bin weiterhin optimistisch.

Der Load erklaert sich durch Distributed Net :D Ansonsten ist das meine Workstation bzw mein Dektop Rechner .oO( wie das klingt ).
Naja, mein persoenlicher Rechenknecht eben.
 
Ok, zu freuh gefreut.

16:34, die Kiste haengt.

Ich geh jetzt erstmal ins Wochenende, evtl faellt mir ja was ein .oO( warum glaub ich das nur nicht so recht ).
 
Hmm. Schreibe einen PR. Ich kanns nur wiederholen.

Ansonsten, evtl. mal mit FreeBSD 5.x probieren.
Was will man schon mit ollen 4.x Zeug ;), das ist bald hoffnunglos "veraltet"....
 
Gut möglich das es ein Bug im Chipsatz ist, kennt man ja von VIA :rolleyes:

Läuft der Rechner unter einem anderen OS stabil ?
 
Auch Moin,
an den Ursprungsposter:
Ich durchforste gerade mal das Kernelfile, da
könnte noch einiges rausgenommen werden:

options AHD_REG_PRETTY_PRINT
device aha0 at isa?
device aic0 at isa?
device sio1 (brauchst du alle seriellen?)

Das folgende kann verkürzt werden (ich hab da 4000
stehen, dann dauert der SCSI-Scan nicht so lang):

options SCSI_DELAY=15000

So, das war mal der erste Teil von der Softwareseite (APM wurde ja schon angesprochen.)

Weiter gehts:
Du hast da 5 Laufwerke drin und eine verhältnismäßig "stromhungrige" Grafikkarte.
Reicht dein Netzteil überhaupt aus, bzw. arbeitet
es denn auch korrekt (liefert es sauberen Strom)?

Nächster Punkt:
Irgendwas passt mit deinen BIOS-Settings nicht, deine IRQs sind total "schief":
Grafik, ATA und LAN auf IRQ5,
Sound und SCSI auf IRQ2.
Dafür fehlen IRQ14,15,9 komplett, die sind noch
frei.
Kannst du das irgendwie einstellen?

Nächster Punkt:
Dein Speicher ist in Ordnung?
Was macht ein Kernel-Compile mit Single-Kernel
und 64 Jobs (make -j 64)?
Bricht es irgendwann mal ab, dann ist da watt
faul. (Bei 256MB sollte ein -j64 problemlos durchlaufen, bei meiner ollen Pentium1-Büchse tuts
das unter 4.7-Release).

Nächster Punkt:
Speichereinstellungen im BIOS überprüfen, die
Default-Werte können schon zu scharf eingestellt sein,
hatten wir (ich und ein anderer SMP-Benutzer mit einem alten PentiumPro) erst vor einen halben Jahr.
Lieber mal etwas langsamer stellen, sogar bei mir hat das damals geholfen.

Wenn das auch nichts hilft: Terminierung des SCSI-Adapters ist ok?

Und zuallerletzt:
Wenn alle von mir genannten Punkte abgecheckt sind,
und es noch immer nicht sauber laufen sollte,
dann wende dich doch mal direkt an MSI, vielleicht
haben die ja schon etwas parat liegen (stabiles Beta-Bios), die wissen da AFAIK recht gut Bescheid.

-Gregor.
PS: Sollte dein Board denn mal stabil laufen, schicke mir 'nen dmesg+mptable-Auszug, damit ich
es auf meine Webseite stellen kann.
 
Moin.

Sagt mal, da ihr beide ja SMP Boards habt, welche könnt ihr dabei empfehlen und wie sieht es mit den Preisen aus?
 
Originally posted by grunix
Moin.

Sagt mal, da ihr beide ja SMP Boards habt, welche könnt ihr dabei empfehlen und wie sieht es mit den Preisen aus?

Naja, ich spreche mal nur für mich:
Wirklich empfehlen kann ich eigentlich nur das, was ich selbst am laufen habe - Soyo-5TH5.
(Andere Empfehlungen gebe ich ungerne, manch einer
mag dies oder jenes an Firma XY nicht, der andere hat schon schlechte Erfahrungen mit Firma ABC gemacht und zieht sie dann voll in den Dreck.)

Die beste Empfehlung gibt eigentlich die Datei
Hardware.txt auf den FreeBSD-CDs:
(Sinngemäß übersetzt und aufs wesentliche gekürzt):
"Prinzipiell wird jedes SMP-Board von FreeBSD unterstützt, welches sich an die (Intel)-Multiprozessorspezifikation 1.4 hält.
Ausnahmen sind hierbei Boards, die ein fehlerhaftes Bios besitzen."

Aber ich schweife zu sehr von der Frage ab.
Meinst du gebrauchte oder nagelneue Boards?
Von den gebrauchten sind eine ganze Menge einen
Tip wert.
Bei den neuen gibts einige Boards, die (noch) nicht unter FreeBSD laufen (Intels SE7500CW2 zum
Beispiel).
Preise: Naja, es geht halt von billig bis edel,
von Dual bis 4fach (8fach habe ich bisher nur komplette Systeme gesehen).
Wenn wir bei den neuen Boards bleiben:
Es kommt auf den jeweiligen Verwendungszweck an,
wie es eingesetzt werden soll.
Ich mache mir für solche Zwecke immer im Kopf eine kleine Checkliste, in etwa so:
Soll der Rechner zuhause stehen (J/N), wenn Nein, dann ist die serielle Konsole über BIOS fast schon
Pflicht (Ich würde keine 10km fahren wollen, nur um eine Bios-Einstellung zu verändern - soweit ich dieses Feature zumindest verstanden habe).

Soll der Rechner ein Server sein (J/N), wenn Nein,
dann sollte er einen Slot für eine Grafikkarte haben (8MB onboard-ATI sind für eine Workstation nicht so der Renner).

Soll alte Hardware weiterverwendet werden (J/N)?
Wenn Ja, dann ist ja 32Bit-PCI praktisch Pflicht,
viele Xeon-Boards haben diese ja nicht mehr...

So gestaltet sich auch das preisliche:
Wenn ich Feature XYZ dringend brauche, mir aber
nur Hersteller ABC dieses anbietet, dann muss
ich eben den Preis dafür bezahlen...

Und so weiter und so fort, eine generelle
Empfehlung, wie man sie zu den Zeiten der ersten
Boards machen konnte, gestaltet sich zunehmend
schwieriger, und genau deshalb muss man also schon
wissen, was man möchte ;-)

-Gregor.
 
Grüsst euch,

also um rel. günstig an Dualboards ranzukommen lohnt sich immer mal bei ebay vorbei zuschauen.

Habe dort selber ein Intel STL2 Serverboard (FCPGA) + Netzteil ersteigern können und ich bin richtig zufrieden mit dem Board, hatte bisher keine Probleme.

(Habe FreeBSD 4.7 Stable drauf laufen. Zu dem Problem mit dem 2ten IDE Kanal welches auf Gregors Webseite angesprochen ist kann ich nix sagen da ich nur einen IDE Kanal verwende.)
 
So, bin grad heim gekommen und hab jetzt wieder physikalischen Zugriff auf den Rechner. Werd nacher und morgen mal all eure Vorschlaege durcharbeiten und Statusbericht abgeben.
Stay tuned.
 
Zurück
Oben