0

Hallo,

ich hätte gerne mir einen Crashkurs angeschaut bzgl. Stochastik und Spieletheorie.

Hintergrund ist der Folgende:

Sagen wir, ich spiele Blackjack, nur ich alleine vs den Dealer.

Nun kann ich programmiertechnisch mir eine Liste mit allen rigendwie denkbaren Konfigurationen,

Die dann kürzen auf die konfigurationen wo der Spieler gewinnt.

 

Dann soll mein programm hingehen, als Input eine "Konfiguration" erhalten, also sowas wie "bisher hat der Spieler die Karten 1, As, 5 offen liegen und der Dealer hat einen König".

Und Output soll sein, welche Aktzion der Spieler in der Situation am besten macht.

Und Angabe, wenn er diese Aktion macht, wie hoch dann seine Gewinnwahrshceinlichkeit ist.

Wie ich das berechnen kann/will:
für den Fall "Halten" (also es wird keine weitere Karte gezogen vom Spieler) gucke ich mir eben alle konfigurationen aus der Liste an, bei denen die ersten 4 Spielerkarten übereinstimmen, der Spieler auch genau 4 karten hat und der Dealer die ersten 1 Karten übereinstimmen.

Für jede dieser betroffenen Konfigurationen lässt sich ja durch Multiplikation der Einzelwahrscheinlichkeiten (kein Card Counting, jede Karte hat die selbe 1/12 oder so Wahrscheinlichkeit) die Eintrittswahrshceinlichkeit dieser Konfiguration bestimmen.

Alle Wa<hrscheinlichkeiten addieren und wir wissen wie wahrscheinlich man mit der Aktion "Halten" gewinnt.

Ähnlich auch die Gewinnwahrshceinlichkeit für "eine weitere Karte ziehen", also

4 Spielerkarten gleich, Anzahl der Spielerkarten >5 und 1. Dealerkarte gleich.

gleiches Prozedere, Einzelwahrshceinlichkeiten berechnen, addieren, gibt eine Gewinnwahrscheinlichkeit.

Dann simpel vergleichen, bei der aktion halten und bei der aktion karte ziehen, welche Gewinnwahrscheinlichkeit höher ist.

Diese ist die "beste Aktion", die der Spieler in der Situation machen kann.

 

Gut und Recht, so würde ich also den "besten Move" im kampf spieler vs Dealer bestimmen.

Nun scheitern meine Spieltheoretischen Fähigkeiten aber dran, wenn es mehr Spieler gibt.

Sagen wir, ausser unserem helden Spieler1, gibt es auch noch Spieler2.


In unseren obigen Betrachtungen gingen wir ja davon aus dass die K0onfigurationen alle gleich wahrscheinlich in einem gewissen Sinne waren, einfach weil ja der Dealer sich nciht für die Aktion des Spielers interessierte weil er eh random agiert.

Bei einem Spieler 2 geht das ja aber vermutlich nicht.
Da kann man ja Konfigurationen, die der "Halten" Aktion von Spieler 1 zugehörig sind, nicht "gleich gewichten" sozusagen wie Konfigurationen die zu "1 Karte ziehen" gehören.

Weil ja Spieler 2 ggbfls. nicht unabhängig on Spieler1 zieht.
Ich müsste jetzt natürlichdie Regeln nachschlagen aber nehmen wir einfahc mal an, die Aktionsreihenfolge ist Speielr 1->Spieler2 und zum Shcluss der Dealer.

Dann wird ja Spieler 2 seine Aktion danahc ausrichtung was Spieler 1 machte und davon ausgehend was für in im Angesicht dieses neuen "Wissens" der beste zug ist.

Demnach kann ein bester Zug von Spieler 1, der darauf basiert dass man das Vehralten von Spieler 2 als random ansieht, am Ende zu einem sehr wahrscheinlichen Verlsut führen weil Spieler 2 sich nach Spieler 1 Zugs natürlich ganz anders verhält.

 

Da hänge ich dran fest.

Vermutlich wird da mein Abgleichen mit den fertigen konfigurationen nicht mehr funktionienen weil hier ja jede Einzelaktion eines Spielers von den Einzelaktionen der anderen Spieler abhängt und umgekehrt.

Jedenfalls wäre das wohl kram, wo es zweifellos fortgeschrittener Spieltheorie bedarf und es wäre cool wenn mir jemand sagen könnte, wie oder wo ich mir das geistig einverleiben könnte :-)

Diese Frage melden
gefragt

Student, Punkte: 304

 
Kommentar schreiben
0 Antworten