MemTest86 - EIN Fehler - Muss man sich Gedanken machen?

Bei meinem Ryzen 3700X war es letztens nach diversen Speicherfehlern notwendig, die Spannung des Speichercontrollers im UEFI von 1,1V auf 1,125V zu erhöhen, nachdem das System fast 5 Jahre lang mit den vom EXPO-Profil gesetzten 1,1V stabil lief. Anscheinend waren AMD beim Binning des I/O-Die, Corsair beim EXPO-Profil der Speicherriegel oder Asus beim Zusammenrechnen der beiden Werte etwas zu konservativ und über die Jahre ist der Chip dann soweit degradiert, dass die Standardwerte nicht mehr ausreichten. 1,125V ist auch noch weit in AMDs Spezifikation, die bis 1,2V erlaubt.

Man muss dazu aber sagen, dass AMD damals den 3200 MHz RAM zwar als obere Grenze des spezifizierten Bereichs angab, aber die JEDEC-Spezifikation damals nur bis ich meine 2333 MHz ging. So gesehen lief das System übertaktet. Außerdem hatte es dank Corona mit über 17.000 Laufstunden einiges an Betriebszeit gesammelt, dazu habe ich das System eigentlich immer im Standby und damit den RAM unter Strom... Egal, einige Monate bis Ryzen 9000 wird es auf jeden Fall noch funktionieren und in der Zweitverwertung geht's dann auf 2666 MHz RAM runter. Da tut der Leistungsverlust nicht weh.
 
So hab in der Zwischenzeit mehrere Neustarts probiert und memtest86 die Nacht über laufen lassen: Bis jetzt keine Probleme
Vor 2 Stunden habe ich die anderen drei Riegel wieder eingebaut (plus den neuen drin gelassen), UEFI nochmal aktualisiert, Reset gemacht und bisher läuft es.

@Yamagi Das mit der Spannung sollte aber meines Wissens nach mit den Firmware updates angepasst worden sein.
Die Spannung steht bei mir auf 1.2V.
XMP/EXPO/DOCP wird von den Riegeln wohl gar nicht unterstützt, denn die Option ist bei mir ausgeblendet (mit Non-ECC Riegeln war die Option da).
Anmerkung aus dem Handbuch: This item is present only when you install a CPU and a memory module that support this feature

Ich war am überlegen den Takt zu senken, aber leider finde ich keine Info welche andere Takt-Raten unterstützt werden und SPD reportet nur 3200.

Naja, ich lass jetzt memtest86 noch bis morgen laufen und machen gelegentlich Neustarts, wenn es funktioniert fasse ich die Kiste erst mal nicht mehr an :D

Danke für euren Input :)
 
Zur Vollständigkeit: Bevor du den Takt senkst, lieber mehr Spannung drauf ausprobieren. Ich weiß, es klingt widersprüchlich. ;) Im dummen Fall senkt es die fabric clock und das will man eher vermeiden.
Das aber manuell und vorsichtig in kleinen Schrittchen, alles unabhängig davon, ob die Riegel diese XMP/DOCP Profile haben.

Aber ja, wenn das jetzt auf auto soweit stabil vor sich hinblubbert, freuen und nicht anfassen. :D
 
Kurzes Update:
Bis jetzt scheint es gut zu laufen? Hab die Maschine mehrfach neugestartet, ohne das die einfriert und memtest86 lief ebenfalls ohne Fehler/Abstürze.

Klar, das bedeutet nicht automatisch das alles in Ordnung ist, aber es scheint zumindest soweit zu funktionieren?
Ich fasse die Hardware erst mal nicht weiter an und lass es so laufen, bis ich mir gegen Herbst was neues besorge.

Nochmals vielen dank für eure Hilfe und Input :)
 
bis ich mir gegen Herbst was neues besorge.
Egal ob nochmal DDR4 oder DDR5: Wenn du wieder vier Module stecken willst, willst du auf jeden Fall ein Board mit T-Topology. Daisy-chained bereut man bei mehr als zwei Modulen. XMP/EXPO/DOCP kann man direkt vergessen, JEDEC ist dann schon kritisch.
Um diese Inhalte anzuzeigen, benötigen wir die Zustimmung zum Setzen von Drittanbieter-Cookies.
Für weitere Informationen siehe die Seite Verwendung von Cookies.

4x16GB klappt vielleicht noch, 4x32 = nope
Max. Speichergeschwindigkeit
2x1R
DDR5-5200
2x2R
DDR5-5200
4x1R
DDR5-3600
4x2R
DDR5-3600
 
Lustig, das Thema ist erst diese Woche an mir vorbei gekommen - glaube wir schauen Videos von der gleichen Person :D aber danke für den Input.

Hoffe das wenn es soweit ist, die Preise von DDR5 etwas angenehmer sind, aktuell kosten die fast das 3-fache :(
 
Mit Ryzen 9000 kann man zumindest im Moment mehr als 2 Module praktisch vergessen. Offiziell garantiert AMD DDR5-5600 für 2 Module, was ganz ordentlich ist. Wenn man 4 Module steckt, sind es allerdings nur noch DDR5-3600, was ziemlich langsam und zumindest für die größeren Modelle mit 12 und 16 Kernen auch klar zu wenig ist. In den Reviews ergab sich dann auch, dass mit 2 Modulen DDR5-6400 meist problemlos klappt. Was ein Fortschritt gegenüber der letzten Generation ist. Mit 4 Modulen die Sache aber teils schon bei DDR5-3800 instabil wird. Was ein deutlicher Rückschritt ist.

Das mag noch nicht das letzte Wort sein, denn schon bei den letzten Generationen haben AGESA-Updates gerade Konfigurationen mit mehr Modulen stabiler gemacht und es kommen ja noch die X870 und X870E Boards, die dank verbesserter (und wahrscheinlich drastisch teurerer) Signalqualität zusammen mit Unterstützung für einen 1:2 Teiler des Takts zwischen Infinity Fabric und IMC angeblich zumindest in der Theorie bis auf DDR5-8000 für vier Module kommen sollen.
 
Lustig, das Thema ist erst diese Woche an mir vorbei gekommen
Bin "Betroffener", da neues Spielzeug hier eingezogen ist. ;)

Mir war das mit der Topologie zwar schon von DDR4 bekannt, aber die Kapazität ua. ist mir wichtiger und im Hinterkopf war "mit DDR5 wirds schon halbwegs passen". Großes NAJA!

wenn es soweit ist, die Preise von DDR5 etwas angenehmer sind, aktuell kosten die fast das 3-fache
Den Schnick mit Beleuchtung an den Modulen kann man sich sparen und wenn du eh auf vier Module planst, kannst du entweder direkt zu den langsameren greifen (es muss dann auch kein penibles Kit sein) oder die Suche nach der T-Topologie wagen und den Mittelweg mit 5600er-Modulen probieren.

Übrigens1 hat DDR5 on-die-ECC, das macht das Modul selbst und kann man als ECC light verstehen. Echtes ECC rangiert beim doppelten Preis.
Übrigens2 gibts bei ASUS-Boards in den Untiefen der Einstellungen die ECC-Einstellung (AUTO/enabled/disabled) und der Hinweistext besagt, dass AUTO=disabled bedeutet. Keine Ahnung, ob das auch fürs on-die-ECC gilt oder ob es das auch schon bei DDR4 so gab. Das nur am Rande, weil du ja wunderliche Sachen mit dem RAM-Tausch erlebt hattest.

Dieses initiale DRAM-Training dauert gefühlt auch immer länger, fast zwei Minuten bis es POST gibt. Kennt man das nicht, resettet man viel zu schnell CMOS oder geht von einem Defekt aus.

Offiziell garantiert AMD DDR5-5600 für 2 Module
Mit nur zwei gesteckten Modulen klappte das auch problemlos via DOCP 1, sowohl beim 8600G als auch beim 7950X.

Ich hab Hynixchips, die stecken mehr Spannung gut weg. Also auf beiden Boards 4x32GB manuell DDR5-4000@1,4V gibt POST und memtest läuft fehlerfrei durch. Sobald ich was anderes setze, gibts keinen POST, bei 1,39V auch schon nicht mehr. Fünf Minuten hab ich immer gewartet, dann resettet.
 

Eine Menge Zahlen, die Tabelle taugt als Kaufberatung und viel Input zum OC. ;)

Um diese Inhalte anzuzeigen, benötigen wir die Zustimmung zum Setzen von Drittanbieter-Cookies.
Für weitere Informationen siehe die Seite Verwendung von Cookies.
Um diese Inhalte anzuzeigen, benötigen wir die Zustimmung zum Setzen von Drittanbieter-Cookies.
Für weitere Informationen siehe die Seite Verwendung von Cookies.

ODT=on-die-Termination, es scheint der heilige Gral zu sein. Dabei wollte ich doch gar nicht in die OC-Szene mit dem ganzen RGB-Geblinke eintauchen. :ugly:

Edit:
Fünf Minuten hab ich immer gewartet, dann resettet.
Also doch mehr Geduld aufbringen.
 
Zuletzt bearbeitet:
Cinebench läuft zumindest damit (screenshots) durch. Memory Context Recovery und Power down aktiv, das BIOS stürzt sonst direkt weg. Training laut Stoppuhr immer um die 4:35min oder auch mal ~2min, alles drüber verstehe ich weiterhin als Absturz, da ich das bis 11 Minuten getestet hatte. Es empfiehlt sich sehr, ein BIOS-Profil mit 'guten' Einstellungen zu erstellen und das zusätzlich auf einen Stick zu kopieren. ;)
 

Anhänge

  • Screenshot 2024-08-17 133339.webp
    Screenshot 2024-08-17 133339.webp
    35 KB · Aufrufe: 253
  • Screenshot 2024-08-17 133413.webp
    Screenshot 2024-08-17 133413.webp
    24,1 KB · Aufrufe: 250
  • Screenshot 2024-08-17 133421.webp
    Screenshot 2024-08-17 133421.webp
    19,8 KB · Aufrufe: 244
  • Screenshot 2024-08-17 133431.webp
    Screenshot 2024-08-17 133431.webp
    28,9 KB · Aufrufe: 243
  • Screenshot 2024-08-17 133532.webp
    Screenshot 2024-08-17 133532.webp
    44 KB · Aufrufe: 245
  • ZenTimings_Screenshot.webp
    ZenTimings_Screenshot.webp
    34,6 KB · Aufrufe: 247
Ich habe mich mal etwas ausführlicher damit auseinandergesetzt. Das memtraining ist essentiell und kann durchaus auch mal länger dauern, 7:10min hatte ich als Rekord.
Speziell dieses Board hat keine Q-LED aufgelötet, wo man irgendwas an Status abschätzen könnte und eine Debug-Karte habe ich auch nicht. Jedoch kann man mit einem einfachen Steckermessgerät ablesen, ob sich was tut...die Nachkommastelle zappelt. ;)
Da habe ich auch rausgefunden, dass der währenddessen gesteckte USB-Stick den ganzen Ablauf blockt und crashen lässt, aber nicht reproduzierbar. Ohne USB-Stick lief es absolut zuverlässig und sogar jedes Mal in failsafe, wenn die Einstellungen nicht passten.

ProcODT: Ich habe verstanden, dass bei zu viel Widerstand das Signal absaufen kann (und damit nicht erst am Ziel ankommt) und bei zu wenig Widerstand es Reflektionen gibt. Was ich nicht verstanden habe ist, ob die 240 Ohm das verschaltbare Maximum des einzelnen Riegels sind, der Widerstand einer Leiterbahn eines Channels (r/w oder komplett mit sideband?) oder das der gesamtem Kette. Ebenfalls habe ich nicht verstanden, wie man händisch jeweils gute Werte errechnen sollte, damit man mittig gut hinkommt und welche Spannungswerte (außer MEM VDD) relevant sind.

Glücklicherweise funktionierte das mit einer anderen Rangehensweise zum Hochtakten automatisch sehr gut. ;)
CMOS resetten, mit 3600/JEDEC booten lassen. Screenshot von den RAM-Profilen machen oder mit ner Software (AIDA64/Typhoon Burner) auslesen. Kein DOCP wählen, dieses Feld auf AUTO lassen. Den Teiler MCLK=UCLK manuell setzen. Dann FCLK fest auf 2000, abspeichern und checken, ob das stabil funktioniert. Ich weiß, AUTO:1:1 ist das neue 1:1:1 ( https://www.igorslab.de/wp-content/uploads/2022/09/zen4guide_slide_3.png ), FCLK2000 bringt hier dennoch mehr Stabilität rein.

Jetzt schrittweise Takt erhöhen und testen. -> 3600,3800...bis inkl. 4400 reichte MEM VDD 1,1.
1,25V steht im XMP-Profil, nehmen wir mal das. 4600 klappt, 4800 komischerweise nicht. 5200 funktioniert stabil, das braucht dann die 7 Minuten Training. Jetzt noch etwas die primären Timings nachfeilen aus dem schnellsten Profil: 40-40-40-80 und testen, hier läufts so stabil.
5400 und 5600 klappen nicht, ist aber auch für den Einsatzzweck egal. Zum Einen drückts nicht wirklich die Gesamtlatenz runter und fürs Optimum bräuchte ich eh 6000er Module (3000:2000:3000), zum anderen geht der Idle-Verbrauch irre hoch.
Alles unnötige im BIOS deaktiviert, QFan auf autotune, Wasserpumpe auf Vollgas:
~41W@4400 1,1V im Windows idle, ~39W ohne Monitor
~51W@5200 1,25V im Windows idle, ~49W ohne Monitor

Da könnte es lohnenswerter sein, wieder etwas runterzutakten, einen weiteren Zusatzlüfter 1W saugen lassen und den auf die CPU richten, damit dort hoher Takt länger gehalten werden kann. Mit cinebench ist das messbar, aber für den Normalbetrieb ist der RAM-Takt nicht mehr soooo relevant wie das noch bei AM4 war.

Fazit: Mehr als zufriedenstellend, dafür dass es daisy-chained ist und vier Module normalerweise so schlecht funktionieren, dass davon abgeraten wird. :D

Bonus: Ich habe jetzt nicht genau recherchiert, aber ich habe den Eindruck, dass es derzeit (noch? oder nie?) gar keine T-Topology Boards für AM5 gibt.
Bonus2: Die ECC-Einstellung im BIOS bezieht sich rein auf echtes ECC. On-die-ECC braucht keine Einstellung und da die Magie nur im Modul selbst passiert, ist das weder Fisch noch Fleisch.
 

Anhänge

  • 5200_prim_timings.webp
    5200_prim_timings.webp
    90,5 KB · Aufrufe: 238
Mein Wissensstand: ProcODT-Werte sind pro Riegel ca. 40 - 60 Ohm, je nach MT und Spannung, aber keine 240;
Ich schätze das wäre dann eher als ein Gesamt-Widerstandswert zu sehen - wobei ich hier nicht schlüssig bin, denn zwo Riegel auf derselben Bank wären dann ja eigentlich parallel verschalten(?) und somit wäre der Widerstandswert dann kleiner 40-60 Ohm (da gilt 1/Ges_R == 1/R + 1/R)
 
Um diese Inhalte anzuzeigen, benötigen wir die Zustimmung zum Setzen von Drittanbieter-Cookies.
Für weitere Informationen siehe die Seite Verwendung von Cookies.

Er erklärt es ganz ok wo man folgen kann, mir fehlt aber die Abrundung irgendwie und ggf. schematisch an nem Mainboard gezeigt oder einfach mal ne Beispielrechung.
Vielleicht sehe ich das Offensichtliche auch nur nicht, bin kein E-Techniker. :p
 
Um diese Inhalte anzuzeigen, benötigen wir die Zustimmung zum Setzen von Drittanbieter-Cookies.
Für weitere Informationen siehe die Seite Verwendung von Cookies.

Er erklärt es ganz ok wo man folgen kann, mir fehlt aber die Abrundung irgendwie und ggf. schematisch an nem Mainboard gezeigt oder einfach mal ne Beispielrechung.

Ah, er sagt "es tritt immer nur mit 4 RAM Sticks auf"

4x 60 Ohm wäre 240 Ohm...
so würde sich der Kreis schon schließen... :D
 
Um diese Inhalte anzuzeigen, benötigen wir die Zustimmung zum Setzen von Drittanbieter-Cookies.
Für weitere Informationen siehe die Seite Verwendung von Cookies.

Er erklärt es ganz ok wo man folgen kann, mir fehlt aber die Abrundung irgendwie und ggf. schematisch an nem Mainboard gezeigt oder einfach mal ne Beispielrechung.
Vielleicht sehe ich das Offensichtliche auch nur nicht, bin kein E-Techniker. :p
Ach ja. Ohmsches Gesetz für die ersten Menschen. :)
Aber hier hast du es mit einer Impedanz zu tun. Das ist was anderes, das ist ein Wellenwiderstand für Wechselstrom.

Geichstromwiderstand ist trivialer Dreisatz: Batterie (3Volt), Glühlampe(1.2Watt) -> 0.4 Ampere -> 7.5 Ohm.
Impedanz kennen wir zB von den alten Netzwerken mit dem Koaxkabel (10base2, RG58) - die haben 50 Ohm - das ist der Wert, mit dem die Leitung am ende abgeschlossen sein muss. sonst kriegt die Schwingung unterwegs Beulen und fällt aus der Leitung. :mad:

Und genau dasselbe, was man da mit RG58 gemacht hat, macht man da offenbar bei DDR mit den Signalleitungen: am ende einen Terminator anschliessen. Das ist der ODT.

Dann weiter:
"To calibrate output driver impedance, an external precision resistor, RZQ, is connected between the ZQ pin and VSSQ. The value of this resistor must be 240 Ω ± 1%. If you are using a DD R3 SDRAM DIMM, RZQ is soldered
on the DIMM so you do not need to layout your board to account for it."


Das gibts also schon etwas länger als DDR5.
 
jaja, die elektr(on)ische Signalübertragung... die dunkelste Magie der dunklen Magien der Elektrotechnik... mit ihren Leitungsimpedanzen (weil, immer auf korrekte Leistungsanpassung schauen, gell!) und den putzigen µV oder sogar dbµV...
:D
 
jaja, die elektr(on)ische Signalübertragung... die dunkelste Magie der dunklen Magien der Elektrotechnik... mit ihren Leitungsimpedanzen (weil, immer auf korrekte Leistungsanpassung schauen, gell!) und den putzigen µV oder sogar dbµV...
:D
Jaja, ich hätte das mal lernen sollen, war aber zu faul. Dunkle Magie, in der tat.

Ich weiss nur, dass diese Geschichten frequenzabhängig sind. Also wenn man die Memory nun höhertakten will...
 
Alle Werte (ProcODT, ProcCaDs, ProcDqDs, DramDqDs, RttNomWr, RttNomRd, RttWr, RttPark, RttParkDqs) wurden hier von der Automagie des Boards gesetzt.

Manuell von mir gesetzt wurde FCLK (das scheint auf die Impedanzien keine Auswirkung zu haben), der RAM-Takt selbst und ab 4400MT/s dann auch MEMVDD 1,25V.

Anbei auch noch die Infos zum RAM, zum Ablesen und besseren Nachbasteln, für den nächsten armen Tropf der erstmal verzweifelt. :D
 

Anhänge

  • 3600.webp
    3600.webp
    89,9 KB · Aufrufe: 242
  • 3600FCLK2000.webp
    3600FCLK2000.webp
    89,4 KB · Aufrufe: 242
  • 4000.webp
    4000.webp
    92,5 KB · Aufrufe: 238
  • 4000FCLK2000.webp
    4000FCLK2000.webp
    90,3 KB · Aufrufe: 243
  • 4400FCLK2000.webp
    4400FCLK2000.webp
    87,4 KB · Aufrufe: 240
  • 5200FCLK2000.webp
    5200FCLK2000.webp
    92,6 KB · Aufrufe: 242
  • KF556C40BB-32.pdf
    KF556C40BB-32.pdf
    687,5 KB · Aufrufe: 234
  • Kingston KF556C40-32.txt
    Kingston KF556C40-32.txt
    6,5 KB · Aufrufe: 238
  • Kingston KF556C40-32-full.pdf
    Kingston KF556C40-32-full.pdf
    25,1 KB · Aufrufe: 349
Bei dem was Ihr hier so schreibt, wird mir mal wieder bewusst, wie wenig ich eigentlich weiß :(
Trotzdem muss ich das Thema nochmal kurz hijacken und hoffe Ihr könnt etwas Licht ins Dunkle bringen.

Ich habe jetzt zum zweiten mal folgende Fehlermeldung im Log gefunden:
Code:
# erste Meldung
Aug  9 16:59:25 storage kernel: MCA: Bank 17, Status 0x9c2041000000011b
Aug  9 16:59:25 storage kernel: MCA: Global Cap 0x000000000000011c, Status 0x0000000000000000
Aug  9 16:59:25 storage kernel: MCA: Vendor "AuthenticAMD", ID 0xa20f12, APIC ID 0
Aug  9 16:59:25 storage kernel: MCA: CPU 0 COR EN GCACHE LG RD error
Aug  9 16:59:25 storage kernel: MCA: Address 0x4000003d087c980
Aug  9 16:59:25 storage kernel: MCA: Misc 0xd01b0fff01000000

# zweite Meldung
Aug 22 11:02:56 storage kernel: MCA: Bank 17, Status 0x9c2041000000011b
Aug 22 11:02:56 storage kernel: MCA: Global Cap 0x000000000000011c, Status 0x0000000000000000
Aug 22 11:02:56 storage kernel: MCA: Vendor "AuthenticAMD", ID 0xa20f12, APIC ID 0
Aug 22 11:02:56 storage kernel: MCA: CPU 0 COR EN GCACHE LG RD error
Aug 22 11:02:56 storage kernel: MCA: Address 0x4000003d087c980
Aug 22 11:02:56 storage kernel: MCA: Misc 0xd01b0fff01000000

Die Ausgabe von mcelog --no-dmi --ascii hilft mir da leider auch nicht sonderlich weiter:
Code:
mcelog: Unknown CPU type vendor 2 family 25 model 1
mcelog: Unknown CPU type vendor 2 family 25 model 1
Hardware event. This is not a software error.
CPU 0 BANK 17
MISC d01b0fff01000000 ADDR 4000003d087c980
STATUS 9c2041000000011b MCGSTATUS 0
MCGCAP 11c APICID 0 SOCKETID 0
CPUID Vendor AMD Family 25 Model 1 Step 2

Ich vermute das es wieder mal das Thema Arbeitsspeicher ist, weswegen ich hier poste, anstatt ein neues Thema aufzumachen, aber wirklich sicher bin mir da nicht.

Grobe Info zur Hardware:
AMD Ryzen 5 5600
GIGABYTE X570S AORUS Pro AX
2x Mushkin Proline DIMM 32GB, DDR4-3200, CL22-22-22-52, ECC (MPL4E320NF32G28)
Mellanox ConnectX-3 (MCX353A-FCBS)
 
Trotzdem muss ich das Thema nochmal kurz hijacken und hoffe Ihr könnt etwas Licht ins Dunkle bringen.
Es ist ja noch dein Thread und thematisch passts doch auch ;)

Ich vermute das es wieder mal das Thema Arbeitsspeicher ist, aber bin mir da nicht wirklich sicher.

hilft mir da leider auch nicht sonderlich weiter
Doch, Bank 17 wird bemeckert.
 
Danke für die Bestätigung, also Riegel raus/rein und ein paar Runden memtest laufen lassen.
Hast du eventuell eine Idee wie man die Info "Bank 17" einem physischen Slot zuordnen kann?
Klar sind es nur zwei Riegel/Slots, aber es wäre schon interessant, zu wissen welcher Riegel das auslöst.
 
Ich würde da das normale Prozedere durchführen, also ein Riegel raus, memtest. Den anderen Riegel dann in beiden Slots testen und nochmal wechseln, bis du reproduzierbar den Riegel mit Fehlern bei memtest rausbekommst.

Hast du eventuell eine Idee wie man die Info "Bank 17" einem physischen Slot zuordnen kann?
Nicht wirklich. Das Handbuch zu dem Board sagt:
For optimum performance, when enabling Dual Channel mode with two memory modules, we recommend that you install them in the DDR4_A2 and DDR4_B2 sockets.

Bank17 sollte sich auf A1/A2 beziehen und wenn da nur ein Riegel steckt, wirds A2 sein. Das setzt voraus, dass Bank17 die erste ist und Bank18 die zweite. Vielleicht ist es aber auch andersrum und Bank16 ist die "nullte" und warum man da nicht bei 0 oder 1 anfängt zu nummerieren, verstehe ich nicht.

Davon abgesehen könnte es sich auch lohnen, das ganze Board zu resetten, damit das memtraining zunächst nur mit einem Riegel durchläuft.
 
Zurück
Oben