Free-Bereich im RAM einstellbar?

pit234a

Well-Known Member
Ich benutze einen PC vom Schrott, der aber für mich bis vor Kurzem sehr gut lief. Seit einiger Zeit startet er nun aber sporadisch neu. Ich sehe keinen direkten Zusammenhang bei diesen Abstürzen, vermute ein MotherBoard-Problem und suche auch schon nach einem Ersatz.
Aber:
Das Problem trat erst auf, nachdem ich Speicher aufgerüstet hatte. Mit zuvor 4x4G war das Problem nicht aufgetaucht. Seit 4x8G spätestens alle paar Tage.
Natürlich denkt man unweigerlich an einen Fehler auf dieser Seite und ich habe etliche Tage memtest und unterschiedliche Konfigurationen mit unterschiedlicher Speicherbelegung hinter mir, um da was besser eingrenzen oder ausschließen zu können. Der RAM sieht für mich vollkommen unverdächtig aus, allerdings habe ich auch nicht mehr die alten Riegel, um das nochmal gegen zu checken. Leider.

Was ich aber sehe, das ist tatsächlich, dass die Abstürze nie erfolgen, wenn ich nicht irgendeine Aktion vornehme (ein Programm starte, eines beende oder einen Link klicke) und dass noch nie ein Absturz erfolgt ist, wenn der Bereich Free im RAM noch größer als vielleicht 800M gewesen ist.
Das mag Zufall sein.

FreeBSD "verbraucht" ja RAM, lässt also im Laufe der Zeit nur noch wenig Free-RAM stehen.
Nun würde mich interessieren, ob ich diesen Bereich irgendwie mal vergrößern könnte, also minimal freien RAM etwa auf ein 1G setze und sehen, ob das irgendwas ändert.
Ich bin da neugierig und habe nichts dazu finden können.
 
Also, soweit ich weiß, ist das was in "Free" angezeigt wird, ein rein passiver Wert, welcher sich ja aus der Speicherbelegung ergibt, also quasi das, was immer übrigbleibt...
Vergrößern kann man meines Erachtens nur, wenn man den RAM physisch vergrößert...
 
Also, soweit ich weiß, ist das was in "Free" angezeigt wird, ein rein passiver Wert, welcher sich ja aus der Speicherbelegung ergibt, also quasi das, was immer übrigbleibt...
Vergrößern kann man meines Erachtens nur, wenn man den RAM physisch vergrößert...
Leider bleibt das mit FreeBSD nicht dauerhaft frei, egal, wie groß auch immer der RAM ist.
Irgendwann hat FreeBSD den RAM nahezu komplett mit Inactive, Wired/Cache gefüllt.
Im Grunde genommen ist das sicher auch sinnvoll. Was nutzt einem schon Freier RAM?
Mich ärgert das Verhalten generell schon länger, weil es auch dazu führt, dass SWAP irgendwann genutzt wird, egal, wieviel Speicher man nun hat. Ich nutze deshalb meist gar keinen SWAP und lieber mehr RAM.

Diesmal habe ich es mit und ohne SWAP und mit einem einzigen Riegel und gemischten Kombinationen und unterschiedlicher Verteilung der Riegel versucht: irgendwann schaltet der PC ab und startet neu.
Aber bisher nicht ein einziges Mal, wenn ich noch "viel" RAM frei hatte.

Ich will das mal beschreiben.
Ich kam durchaus schon in den Swap und habe dann Anwendungen geschlossen und andere gestartet und dabei wird Speicher hin und hergeschoben. Alles, genauso, wie es sein soll und lange Zeit problemlos.
Dann, und bisher nur dann, wenn ich nur ganz wenig RAM Frei hatte (ich schaue gleichzeitig mit top und xosview, arbeite aber auch mit dem PC und sehe nicht immer und jede Sekunde auf die Ausgabe), dann kommt es manchmal zu diesen Abstürzen.
Ein Absturz ist bisher noch nie erfolgt, wenn noch "viel" RAM frei war.
Aber, natürlich läuft dann der Rechner noch nicht für lange, denn, wenn er lange läuft, ist irgendwann nur noch wenig RAM frei.
Deshalb würde ich das gerne mal testen und quasi RAM "sperren".
Ich bin überzeugt, dass dann trotzdem nach einiger Zeit die HW crasht, aber ich wäre glücklicher, wenn ich das auch tatsächlich sehen könnte.
 
um RAM zu "sperren" fiele mir spontan ein C Programm ein, welches mit malloc() einen gewissen Speicherbereich übernimmt;
müsste man mal testen, inwieweit man das steuern kann...

Aus dem Bauch heraus würde ich sagen, ggf passen die RAM Riegel welche du jetzt verwendest "elektrisch" nicht in den Rechner, weil sie vllt unter gewissen Konstellationen den Bus "zu stark belasten" - unter der Maßgabe, dass memtest nichts negatives findet...
Fällt aber gewissermaßen unter "Esoterik" geb ich zu - aber ich hab grad mit Motherboards und RAM Riegeln schon Pferde kotzen sehen...
 
ggf passen die RAM Riegel welche du jetzt verwendest "elektrisch" nicht in den Rechner,
Das hatte ich mir auch schon derart esoterisch zurecht gelegt.
Tatsächlich gehörten diese Riegel in einen Rechner, der geringfügig schneller gewesen ist. Ich weiß nicht mehr genau und will nun nicht nachsehen, sagen wir, es sind 1333er und ich betreibe sie mit 1066 oder in der Art. Eigentlich sollte das nichts ausmachen und es macht auch Tagelang nichts aus. Es kommt nicht einmal zu einem Hänger oder zu Auffälligkeiten, bis dann irgendwann alles dunkel wird und der PC neu startet.
Vielleicht ist es tatsächlich eine Unverträglichkeit, aber eine ziemlich merkwürdige.
Ich möchte auch nicht mehr neu in CPU/Motherboard/RAM investieren (wobei ich die Chance habe, gleichen RAM (also 8G-Riegel) nochmals umsonst bekommen zu können, nur, wieviel Sinn macht das? Ich habe jeden Riegel einzeln und in unterschiedlichen Kombinationen und an unterschiedlichen Steckplätzen getestet, immer mit dem gleichen Ergebnis).
Deshalb ist meine Entscheidung quasi schon getroffen, dass eine Neuanschaffung sein soll.
Aber, es gefällt mir gar nicht. Das ist vorzeitiges Aufgeben.

Andererseits bekäme ich dann nach über zehn Jahren mal wieder neue HW. Ausreichend ausgelegt, bringt die mich dann vermutlich bis zur Rente. Der Gedanke gefällt mir so langsam...
 
um RAM zu "sperren" fiele mir spontan ein C Programm ein, welches mit malloc() einen gewissen Speicherbereich übernimmt;
müsste man mal testen, inwieweit man das steuern kann...
Die Idee ist ansich nicht schlecht. Das Problem ist, dass die Adressen die man zu sehen bekommt nix mit der physikalischen Adresse zu tun haben. Man muss also den betreffenen RAM nicht nur als Nicht-Swapable markieren, was sich noch machen ließe, sondern man muss auch dafür sorgen, dass er nicht umgemapped wird. Theoretisch geht das auch, wenn man dem Betriebssystem verkaufen kann, dass darüber Hardwaredevices gesteuert werden.

Im Grunde genommen ist das sicher auch sinnvoll. Was nutzt einem schon Freier RAM?
Ich weiß nur von Linux, dass es da die Möglichkeit gibt(gab?), die Größe des zu benutzenden RAMs anzugeben. Gedacht für den Fall, wenn die korrekte RAM-Größe nicht erkannt wurde.
Ob es sowas für FreeBSD auch gibt, ist mir nicht bekannt. Ich weiß auch nicht, ob es überhaupt in Deinem Fall helfen würde. Weil man ja eben nicht weiß, welche Stelle des RAM es betrifft.

Ob man die Cache-Größe beschränken kann, müsste man mal recherchieren.
 
Also, die minimale Anzahl verfügbarer Speicherseiten - das ist "free" in top und co. - lässt sich mit dem sysctl "vm.v_free_min" einstellen. Aber das wird dir hier nicht helfen. Denn FreeBSD belegt grundsätzlich erstmal allen verfügbaren RAM und erst, wenn er gewusste Untergrenzen unterschreitet werden Anhand einer Heuristik belegte Speicherseiten ausgewählt, durch die sogenannte Laundry gewaschen und sind dann wieder verfügbar. Grund dafür ist, dass es sinnlos ist bereits im RAM liegende Daten zu verwerfen und später wieder teuer von der Festplatte oder SSD nachladen zu müssen, wenn der Speicher im Moment gar nicht gebraucht wird. Man kann daher also gar nicht vorhersagen, welche Speicherseiten wann bereinigt und wann wieder von Programmen genutzt werden. Irgendwann wird auch die kaputte Seite darunter sein und das System stürzt ab.
 
Irgendwann wird auch die kaputte Seite darunter sein und das System stürzt ab
ist das dann ein Defekt auf der HW, sprich, auf einem bestimmten Speicher-Riegel?
Ich konnte mit all meinen Tests nämlich keinen bestimmten Riegel als Defekt und verantwortlich ausmachen.
Wodurch kann eine Speicherseite noch defekt sein, beziehungsweise, woran kann sie sterben?
Würde es Sinn machen, die angebotenen Ersatz-Speicher-Riegel zu nehmen und es damit wieder zu probieren, oder deutet das alles eher auf einen generellen Fehler, eine Unverträglichkeit?

Wie gesagt, ich habe mich beinahe damit abgefunden, eh neue HW zu kaufen.
Aber das ist so eine Sache. Ich kann die alte HW nutzen und kostenfrei RAM hinzu bekommen. Die alte HW macht alles, was ich derzeit brauche und ich habe lieber mehr Kerne und mehr RAM, als mehr Takt und weniger RAM.
Ich bin da schon schräg.
Einen großen Teil meines Tages habe ich damit verbracht, meinen defekten Rasierapparat umzubauen, damit ich den weiter nutzen kann. Der kostete damals vielleicht 50€ und arbeitete wenigstens fünf Jahre. Aber ich mag den nicht einfach wegwerfen, wenn ich noch eine Chance sehe, ihn weiter zu nutzen.
Das liegt mir im Blut und so will ich nicht einfach diesen PC ausmustern, der es noch tut und für mich ausreichend ist, wenn er noch eine Chance hat.
Andererseits will ich mich nicht unnötig über Wochen quälen und ärgern: es ist immerhin nur ein PC und ich kann mir einen neuen leisten, oder zumindest Motherboard, RAM und CPU ersetzen.

Seit Gestern läuft er jetzt durch und ich habe allen RAM eingesteckt, den ich noch finden konnte.
Irgendwann wird er wieder crashen.
Desto mehr RAM ich einsetze, desto länger scheint es zu dauern, bis er nicht mehr kann. Ich könnte natürlich auch jeden Abend abschalten und am nächsten Tag neu starten. Dann hätte ich womöglich gar keine Probleme. Vielleicht teste ich das auch noch.
 
Hast du den schonmal geguckt, was in den Logs steht? Gibt es nen Crashdump vom Kernel? Für mich siehts sehr danach aus, als hättest du dich sehr auf den RAM eingeschossen. Vorallem wenn der RAM etliche Tage Memtest übersteht.
Das es nur vorkommst wenn du größere Programme öffnest kann auch daran liegen, dass IO von / auf Platte kommt. Defekte SATA Controller? Korruptes FS?
 
Hast du den schonmal geguckt, was in den Logs steht? Gibt es nen Crashdump vom Kernel? Für mich siehts sehr danach aus, als hättest du dich sehr auf den RAM eingeschossen. Vorallem wenn der RAM etliche Tage Memtest übersteht.
Das es nur vorkommst wenn du größere Programme öffnest kann auch daran liegen, dass IO von / auf Platte kommt. Defekte SATA Controller? Korruptes FS?
Nachdem ich ein System eingerichtet habe, schalte ich alle Logs aus und sie nützen mir auch nicht wirklich was, wenn ich sie denn mal bekomme. Ich kann sie nicht lesen.
Das soll nicht gejammert klingen, aber ich bin nun mal nur unbedarfter Endanwender und fühle mich daher ja schon häufiger bei FreeBSD unpassend.

Andere Ursachen habe ich nicht ausgeschlossen.
In meinem Leben habe ich schon viele Rechner-Probleme gehabt und konnte oft finden, was denn die Ursache war. Defekte HW finden ist mein Beruf. Ich habe mich auf den RAM eingeschossen und fühlte mich dabei gleich nicht glücklich. Es war zwar logisch, aber ich glaube tatsächlich, dass der RAM dafür nicht verantwortlich ist.
Ich habe drei SSDs in einem ZFS-Pool, auf denen das System liegt und der SWAP als ein gmirror-Device. Ob ich SWAP enable oder nicht, ist dem Fehler egal.
ZFS ist für mich über alle Zweifel erhaben.
Ob eine defekte SSD innerhalb des Pools das Problem verursachen kann?
Ich weiß das nicht. Es hört sich für mich nicht richtig an.
Mein Bauchgefühl sagt: Motherboard defekt. Das könnten durchaus auch mal Kontakt-Probleme sein und ich habe natürlich alles in der Richtung versucht.

Ob es überhaupt einen Dump gäbe, bezweifele ich.
Es sieht für mich wie ein vollkommen überraschender und unmotivierter Neustart aus.
Als würde jemand den Stecker kurz ziehen.
 
So ist das halt Kaffeesatzlesen. Wenn das Ding neu startet und nicht einfach einfriert spricht es aber dafür, dass noch irgenwas funktioniert und man dem Kernel auch Infos entlocken könnte.

//edit

Um mal einiges an Fehlerquellen auszuschließen kannst du ja z.b. von einem USB Stick ein Livesystem deiner Wahl starten und Lasttests machen. Am besten vielleicht ein Linux, das kommt erst garnicht auf die Idee irgenwas zu Initialisieren (Gmirror, zfs, ..).
 
ist das dann ein Defekt auf der HW, sprich, auf einem bestimmten Speicher-Riegel?
Das ist - wie @medV2 schon sagt - schwer zu sagen... So Pi mal Daumen gesagt führen RAM-Fehler zu undefinierten Verhalten. Je nach dem wo sie im physischen Speicher liegen stürzt entweder der Kernel öfter mit unterschiedlichen Panics ab oder Programme stürzen aus unerklärlichen Gründen ab. Wichtig ist, dass RAM-Fehler meistens - aber natürlich nicht immer, das wäre zu einfach - zu einer Panic führen.

Während plötzliche Reboots ohne vorherige Panic meistens andere Ursachen haben. Instantan-Reboots sind unter x86 eigentlich nur durch Triple Faults [0] möglich. Bekommst du so einen, ist das System in sich wirklich extrem inkonsistent. Sprich da muss vorher schon etwas böse schief gegangen sein. Das kann dann alles sein... RAM, CPU, Board, eine schlecht gelaunte Soundkarte, etc. Mir hat mal eine defekte Netzwerkkarte durch Schreiben von Datenmüll quer durch den RAM einen zpool gekostet.

Und natürlich der Klassiker Unterspannung. Das Netzteil ist alt, hat seine besten Tage hinter sich und irgendwann kommt eine Spannungsspitze, die es nicht mehr abfangen kann. Das führt zum Brown Out, die CPU bekommt nicht genügend Futter, wird inkonsistent und resetet sich. Alternative Kandidaten sind auch die Spannungswandler auf dem Mainboard, gerade wenn sie nicht im Luftstrom des CPU-Kühlers liegen und im eigenen Saft schmoren.

Um das finden wirst du zumindest nicht drum herum kommen Komponenten zu tauschen. Nach und nach, bis das Problem verschwindet. Und da ist dann die Frage, ob sich das noch lohnt. Ich würde das Ding, sofern es finanziell möglich ist, abschreiben.

0: https://en.wikipedia.org/wiki/Triple_fault
 
Das Problem trat erst auf, nachdem ich Speicher aufgerüstet hatte.

Darauf sollte es zu schieben sein. Um das schwarz auf weiß zu bekommen, wär es ganz gut, wenn du mit komplett anderen Riegeln gegentesten könntest. Habe eigentlich immer mindestens ein Pärchen jeder Generationen aufgehoben, aber vor ein paar Monaten habe ich dann doch mal aufgeräumt....hätt' ich dir gern gegen Porto zukommen lassen.
Edit: Ich hab doch noch was gefunden. Einige DDR2 und ein Modul DDR3 kann ich anbieten.

Wenn memtest mal nicht anschlägt, könnten es auch schwache Kontakte sein. Fussel/Staubkorn hat sich zwischen die Kontakte geklemmt. Oder auch Nikotin, falls du Raucher bist.
Wenn die Kontakte auf den Riegeln schwach angelaufen sind (Patina :p), wäre es auch erklärbar.
Hast du ja schon durch, sehe ich gerade...

Und der Klassiker, wir haben ja alle schon kotzende Pferde gesehen: Hast du das BIOS mal gelöscht?
 
Und da ist dann die Frage, ob sich das noch lohnt. Ich würde das Ding, sofern es finanziell möglich ist, abschreiben.
Und das frage ich mich schon die ganze Zeit. Ich kenn das ja auch, verwahre alles und bemühe mich um Nachhaltigkeit. Aber ich lerne gerade, das sich nicht jeder "Schrott" reanimieren läßt. Ob sich der Zeitaufwand und der auch damit verbundenen Ärger bei den heutigen Hardwarepreisen wirklich lohnt? Nun meine Entscheidung ständ fest...;)
 
Hast Du mal den Rechner gereinigt? Evtl. ist beim Einbauen der RAM-Riegel auch etwas Staub in die Slots gedrückt worden. Evtl. mal mit Druckluft und weichem Pinsel reinigen.
 
Klar, ein RAM-Fehler ist recht wahrscheinlich.
Dennoch: Im Sommer und Herbst hatte ich fast identische Symphtome, allerding mit einem OpenBSD-Rechner. Reboots, manchmal lief die Kiste nicht hoch, manchmal hing sie im Betrieb eingefroren fest.
Hatte auch den RAM in Verdacht, aber es war ......... die SSD. Jeder Test lief prima durch, aber sie war dennoch defekt. Nur mal so als Hinweis.
 
Ich würde das Ding, sofern es finanziell möglich ist, abschreiben.
das ist natürlich möglich. Ich bin ja nicht mehr auf der Uni, also als Student.

Bevor ich diesen PC auf dem Schrott gefunden hatte, war eine Neuanschaffung schon fest geplant. Der zuvor benutzte PC hatte mit über zehn Jahre gut gedient und ich trennte mich nur schweren Herzens davon, weil manche Dinge einfach nicht mehr liefen.
Nun ist es aber so, dass ich grundsätzlich versuche, Ressourcen zu schonen (auch meine eigenen) und noch dazu sehr anspruchslos bin und deshalb war ich natürlich begeistert, einen PC auf dem Schrott zu finden, der nicht nur meinen Ansprüchen voll genügt, sondern auch wirklich gut und professionell gebaut ist. Wenn man Lüfter nützt, dann tut dieser PC das ausgezeichnet und ist auch für Dauerbetrieb ausgelegt.
Es macht mich froh, diesen PC nutzen zu können.

Vielleicht würde es mich tatsächlich noch froher machen, nach über zehn Jahren mal wieder aktuelle HW in den Fingern zu haben und ich erwäge das sehr sehr ernsthaft.
Allerdings bin ich überhaupt nicht auf dem Laufenden und muss dann anfangen, mich wieder einzulesen und zu interessieren, um nicht eine ganz falsche Entscheidung zu treffen. Davor graust es mir ebenso, wie vor der Entscheidung, den Rechner wirklich aufzugeben.

Fatal ist nämlich etwa dies:
Code:
pit@Celsius ~:- > uptime
10:55nachm.  up 3 days, 14:37, 4 users, load averages: 8,32 7,36 4,45
Und das ist nun der dritte solche Versuch, den ich jeweils durch Ausschalten, bzw Neustart dann selbst beendet hatte.
Das ist kein unbelastetes System. Nachdem ich heute erkannte, dass stress-ng nicht verünglückte Optionen zu stress sind, sondern ersteres ein ganz anderes Tool ist, lasse ich dies gerade nebenbei laufen. Mal sehen , was das ergibt.

Und das ist eben total blöd, weil ich dadurch natürlich den Eindruck gewinne, der Rechner sei Rock-Solid und stable.
Es erinnert mich ein ganz klein wenig an anderen Beitrag hier, wo jemand mit Debian keine Probleme hatte und mit FreeBSD Abstürze erlebte. IOch habe mit diversen Live Systemen nie ein Problem erlebt, darunter war allerdings auch ein nomad-BSD.

Deshalb nehme ich natürlich auch den Hinweis mit der SSD sehr ernst. Ich habe drei in einem ZFS-Pool zusammengefasst.
Gerade, weil Live-Systeme diese SSDs nicht brauchen, nehme ich den Hinweis eben sehr ernst.
Aber, ich halte ZFS in FreeBSD über jeden Zweifel erhaben, besonders, weil ich ja einen "mehrfach redundanten Spiegel" mit den drei SSDs betreibe. Da müsste eine SSD schon voll die HW-Grätsche herbeiführen. Kann sein, will ich mir aber nicht wirklich so vorstellen.

Wie gesagt, fatale Situation.
Erst lief das Ding Monate lang gut, dann crashte es wenigstens alle drei Tage, dann einmal am Tag, dann alle paar Stunden und nun ist es wieder seit Tagen stabil.
Natürlich habe ich nach und nach etliches geändert und getauscht und hoffe, dass etwas davon die Lösung ist, glaube aber nicht wirklich daran, sondern an einen Zufall und das Ding wird irgendwann wieder abschmieren.

Was ich nicht gemacht habe, ist ein BIOS-Update.
Ich finde schon gar nicht die konkrete Bezeichnung des MotherBoards und dann brauche ich dazu irgendein DOS? Vielleicht sollte ich mich da auch mal einlesen.

Wie auch immer, vielen Dank für die guten Tips bisher.
 
Allerdings bin ich überhaupt nicht auf dem Laufenden und muss dann anfangen, mich wieder einzulesen und zu interessieren, um nicht eine ganz falsche Entscheidung zu treffen. Davor graust es mir ebenso, wie vor der Entscheidung, den Rechner wirklich aufzugeben.
Die Entscheidung kann dir keiner nehmen. Wenn du aber anspruchslos bist, dann musst du ja keine nagelneue Hardware kaufen. Zumindest beim Stromverbauch solltest du nicht anspruchslos sein und da tuts ja auch was 2-3 Jahre altes. Ggf. hat hier ja jemand sogar ein Set CPU,Board,Ram über, das er abgeben mag. Wenn du es ganz auf die Spitze treiben willst, kannst du mal gucken, ob du das gleiche Board nochmal wo her bekommst. Mehr als 20€ in den Wind schießen kann dann auch nicht passieren.

Aber, ich halte ZFS in FreeBSD über jeden Zweifel erhaben, besonders, weil ich ja einen "mehrfach redundanten Spiegel" mit den drei SSDs betreibe. Da müsste eine SSD schon voll die HW-Grätsche herbeiführen.
Es ist auch erhaben und ich glaube nicht daran, dass die SSD schuld ist, wenn ZFS nicht muckt und nichts im dmesg auftaucht. Du könntest dennoch mal eine SSD nach der anderen zupfen und jeweils im 'degraded'-Zustand testen.

dann brauche ich dazu irgendein DOS? Vielleicht sollte ich mich da auch mal einlesen.
Seit ca. 10 Jahren gibt es die Möglichkeit vom BIOS aus direkt einen Stick einzulesen, welcher das neue BIOS enthält. Für sowas halte ich einen alten 2GB-Stick bereit. Wenn ich sowas durchführte, habe ich den Stick immer mit FAT32 formatiert um die Chance zu erhöhen, dass es das BIOS frisst.

Ich finde schon gar nicht die konkrete Bezeichnung des MotherBoards
sysutils/dmidecode
'dmidecode -t bios' oder 'dmidecode -t system'

oder klassisch: aufs Board gucken

Wenn alles nix hilft, steht mein Angebot mit dem Ram noch.

Viel Erfolg! :)
 
wie schon erwartet: er hat es wieder gemacht!
Diesmal aber etwas verzögert, in Zeitlupe. Während der stress-ng noch lief (er hatte die Nacht zuvor überstanden), startete ich VirtualBox, weil ich das runter-geladene BIOS-Update in einem Windows entpacken musste. Es ist ein selbst-extrahierendes File, das dann gleich ein FreeDOS und das neue BIOS auf einen USB-Stick installiert. Weil ich nicht finden konnte was ich hätte manuell machen müssen, nahm ich lieber diese automatische Version, die aber ein Windows benötigt.
Also, mit vollem stress und bereits aktiviertem SWAP, startete VB sehr lahm und als ich eine VM anwählte, da startete der PC dann neu.

Ich habe ja in meinem Leben schon viele HW-Fehler aufgestöbert und baue deshalb ein wenig auf Intuition.
Diesmal setze ich sehr auf einen Speicherfehler, der aber nicht direkt auf defektem RAM oder CPU basiert, sondern auf einer Unverträglichkeit. Die neuen Riegel scheinen nicht zuverlässig zu funktionieren.

Deshalb habe ich (eigentlich schon zuvor) entschieden, neue HW anzugehen.
Bis das so weit ist, probiere ich jetzt noch das neue BIOS aus. Es gab da einige Veränderungen in Richtung Memory. Mal sehen.

Nochmals Dank für die vielen guten Hinweise und Ratschläge. Ich werde den nächsten Absturz wieder berichten, habe aber schon Bekannte gebeten, mir mal eine HW zusammen zu stellen, die derzeit aktuell ist. Die spielen mit ihren PCs, was ich ja nicht mache, aber dadurch haben die eine gute Vorstellung, was gerade modern ist.
 
trotz neuem BIOS und wieder alles extrem penibel gereinigt und neu gesteckt: irgendwann, aber (bisher) niemals zu Beginn einer Sitzung, wenn noch wenig Speicher benutzt wird, sondern immer nur, wenn die Belegung ziemlich voll ist und deshalb bei neuer Aktion Speicherseiten frei geräumt und neu zugeteilt werden sollen, dann crashed er.
Also, nach dem letzten Beitrag nun ein Mal.
Aber das genügt ja auch.
Wird neu gemacht!
 
Vielleicht hat es auch gar nix mit dem RAM oder dessen Füllstand zu tun, sondern ist ein Temperatur Problem?
soweit ich die Temperatur im Auge behalten habe (man schaut natürlich nie genau dann hin, wenn ein Absturz erfolgt), war die immer ziemlich gleich. Nur beim dem Test mit stress-ng ging sie etwas höher, hielt aber über Stunden konstannt und ohne einen Absturz zu erzeugen.

Wie auch immer, ich will mich morgen für neue HW entscheiden und werde dann wohl so kaufen, dass ich zumindest Entwicklungstechnisch damit bis in die Rente komme. PCs sind nie mein Hobby gewesen. Ich finde Probleme immer interessant und hänge deshalb auch lange mit diesen Geräten herum, aber im richtigen Leben habe ich auch Probleme genug um mein Leben damit zu erfüllen. Ich brauche PCs und habe gewisse Vorstellungen, wie ich damit arbeiten möchte.
Alle zehn Jahre mal einen neuen kaufen, ist nun nicht gerade die große Verschwendung.
Ich finde, das sollte ich mir nun mal wieder gönnen und dann, vielleicht mit mehr Muße, mal wieder diesen hier ausgiebig testen. Vielleicht auch nicht und weg damit. Wir werden sehen.

Nochmal Dank an alle.
 
Code:
uptime
 9:38nachm.  up 24 days, 11:10, 4 users, load averages: 0,53 0,85 0,84
Ich bin nach wie vor vorsichtig optimistisch.
Nachdem mit neuem Motherboard, neuer CPU, neuem RAM, neuer GraKa und neuem Netzteil tatsächlich am dritten Tag der PC wieder am login-Screen hing, musste er also einen unkontrollierten Reboot hinter sich gebracht haben. Zuvor war nachvollziehbar immer mit einer neuen Aktion der Rechner neu gestartet. Das Fehlerbild war also jedenfalls unterschiedlich.
Seit dem Update nach 12.0-RELEASE liefen nur geplante Neustarts und nun hält das alles schon seit 24 Tagen.
Deshalb halte ich die Platten (SSDs) nun für unverdächtig und werde die nicht auch noch tauschen. Oder vielleicht doch, weil sie mir inzwischen etwas zu klein vorkommen.

Die alte HW habe ich auch wieder in ein Gehäuse gesetzt.
Nach vielen Versuchen mit unterschiedlichen Lüftern und unterschiedlicher Luftführung durch das System, erreichte ich nach einigen Tagen dann einen recht stabilen Zustand. Der Rechner heizte mein Verlies zusätzlich auf, wenn ich ihn mit stress-ng forderte.
Er läuft aber durchaus stabil und stürzte nur ein einziges Mal ab, wie gehabt, bei Vollast mit neuer Anforderung, war dabei aber auch schon heiß geworden.

Die Auslastung des Speichers, was ja mein Ausgangs-Beitrag war, wird bei mir hauptsächlich durch meine nächtlichen Sicherungen mittels rsync bewirkt. rsync belastet nicht wirklich den Speicher, aber Inactive Bereiche werden voll geschüttet, wodurch der Free-Bereich schließlich auf Minimum geht.
Würde ich den rsync weg lassen, wäre der Speicher trotzdem irgendwann "verbraucht" (wobei Inactive ja nicht wirklich verbrauchter Speicher ist).
Wegen des rsync von ca 80G jede Nacht, ist mein Speicher halt am zweiten Tag schon "voll".

Das hatte ich zunächst im Zusammenhang mit meinem Fehler für verdächtig gehalten, weil es mir eben nicht klar gewesen ist.

Nun sieht es mal auf jeden Fall nach einem HW-Fehler aus und ich tippe noch immer auf RAM-Unverträglichkeit.
Ich kann aber den Fehler nun nicht mehr wirklich reproduzieren. Dafür läuft die alte HW nun erstaunlicherweise zu stabil. Ein Absturz in drei Wochen, der auch durch zu hohe Temperatur verursacht sein könnte, das ist ja nichts!
 
Zurück
Oben