darktrym
Fahnenträger
Hallo,
da hier Programmierthemen so viel Zuspruch bekommen, mal was neues wo ich gerade Verständnisschwierigkeiten habe.
Ich setzte mal voraus jeder kennt den Minimax-Algorithmus, gibt dazu genug YT-Videos und das Spielprinzip von TicTacToe(TTT).
Nun findet die Bewertung des Spielbrettes im Blatt des Baumes statt und die Ergebnisse werden zurückpropagiert(nach oben).
Im Falle von TTT gibt es drei Endergebnisse: S(1), N(-1), U(0).
Da in der Vielzahl der Erklärungen nicht auf die Bewertungsfunktion eingegangen wird, frage ich mich wie da sinnvolles rauskommen soll, wenn nur abwechselnd minimiert und maximiert wird?
Ich würde meinen man müsste bei den Knoten noch die Ergebnisse darunter addieren um wirklich den besten Pfad zu wählen. Andernfalls wandern nur diese 3 Zahlen(1, -1, 0) nach oben und jegliche Information welche Abbiegung am vielversprechendsten ist geht verloren. Ich sehe meinen Denkfehler nicht, kann das jemand mir erklären?
da hier Programmierthemen so viel Zuspruch bekommen, mal was neues wo ich gerade Verständnisschwierigkeiten habe.
Ich setzte mal voraus jeder kennt den Minimax-Algorithmus, gibt dazu genug YT-Videos und das Spielprinzip von TicTacToe(TTT).
Nun findet die Bewertung des Spielbrettes im Blatt des Baumes statt und die Ergebnisse werden zurückpropagiert(nach oben).
Im Falle von TTT gibt es drei Endergebnisse: S(1), N(-1), U(0).
Da in der Vielzahl der Erklärungen nicht auf die Bewertungsfunktion eingegangen wird, frage ich mich wie da sinnvolles rauskommen soll, wenn nur abwechselnd minimiert und maximiert wird?
Ich würde meinen man müsste bei den Knoten noch die Ergebnisse darunter addieren um wirklich den besten Pfad zu wählen. Andernfalls wandern nur diese 3 Zahlen(1, -1, 0) nach oben und jegliche Information welche Abbiegung am vielversprechendsten ist geht verloren. Ich sehe meinen Denkfehler nicht, kann das jemand mir erklären?