Salut p2tiens et p2tiennes!
Voici une variation sur le thème de mon micro poker de la dernière fois, disponible ici:
http://www.prise2tete.fr/forum/viewtopic.php?id=8691
(Si vous n'avez pas fait le premier vous ne trouverez a priori pas d'intérêt direct à cette variation et ca sera assez difficile)
RAPPEL:
Règles de "mon" micro poker:
-C'est un duel, il n'y a que deux joueurs.
-On va les appeler respectivement l'ouvreur et le suiveur. (chacun garde définitivement son rôle)
-Il n'y a que 3 types de cartes: numérotées 1, 2, ou 3. (plus grande = plus forte).
Une manche:
-On distribue au hasard une carte à chaque joueur, un joueur ne voit que sa propre carte, on considère que tout est équiprobable dans la distribution et rien ne s'oppose à ce que les joueurs aient le même type de carte.
-L'ouvreur est le premier à parler il a le choix entre:
* Se coucher: la manche s'arrête, perdue pour lui, il donne 1 euro à l'autre.
* Ouvrir: la manche continue, le suiveur a maintenant la parole.
-Le suiveur lorsqu'il a la parole a le choix entre:
* Se coucher: la manche s'arrête, perdue pour lui, il donne 2 euros à l'autre.
* Suivre pour voir: On dévoile les carte, celui qui a la plus faible donne 5 euros
à l'autre. En cas d'égalité il ne se passe rien.
-La partie débute avec 20 euros pour chaque joueur.
-La partie se termine lorsqu'un des deux est plumé, évidemment c'est le perdant.
La partie en gras est nouvelle.
Le problème est assez compliqué et demande (de mon point de vu) un petit programme pour être résolu, c'est pourquoi je ne demande pas la solution mais pose simplement quelques questions:
1)Voyez vous en quoi ce probleme est diffèrent du premier ?
2)Comment procèderiez vous pour obtenir la solution ? (je ne demande pas le programme mais juste la méthodologie dans les grandes lignes)
Indice 1:
Spoiler : [Afficher le message] Tenter de trouver quand et pourquoi un joueur aurait intérêt à ne plus jouer ici comme dans la solution optimale de micro poker I. Puis généraliser.
Et comme je suis curieux je tenterais d'obtenir la solution exacte avec mathématica! ->>> maintenant chose faite voir plus bas
Bonne chance.
He be! quel fiasco!.
Solution:
Spoiler : [Afficher le message]
Je reformulerais plus en détail bientôt:
1) La différence est que maintenant on ne cherche plus à maximiser ses gains sur une manche mais à maximiser sa probabilité de gagner la partie (quelque soit le temps que ca prend). On le voit clairement pour des positions proches du KO pour un des deux joueurs, il est évidemment que lorsqu'il ne reste que 2 euros au suiveur par exemple il va suivre 100% du temps.
2) Dans micro poker I on avait exprimé le gain en fonction des fréquences d'ouverture/suivi des deux joueurs par rapport à leur carte, ici on peut simplement exprimer la probabilité que l'ouvreur gagne. Cette expression fera intervenir la probabilité de gagner à d'autres positions de jeux (une position de jeu étant déterminée par les tas de chacun), par exemple la probabilité de gagner pour l'ouvreur lorsque chacun à 20 fait intervenir la probabilité de gagner lorsqu'il à 25 et l'autre 15. Comme pour le gain l'ouvreur va chercher à maximiser ceci et le suiveur à le minimiser. On voit cependant que c'est un calcul relativement circulaire faisant intervenir une 40aines de positions de jeu, ma méthode pour obtenir une solution numérique consiste à initialiser arbitrairement les probabilité de gagner de chaque position puis à les recalculer un grand nombre de fois jusqu'à obtenir une convergence suffisamment bonne.
Mathematica permet d'obtenir les résultats numériques sans trop d'effort de programmation: ->>> maintenant chose faite voir plus bas