|
#1 - 14-04-2011 11:44:56
- Clydevil
- Expert de Prise2Tete
- Enigmes résolues : 29
- Messages : 914
- Lieu: Seahaven island
Micro pokr
J'ai mis les mains dans le cambouis pour construire celui-ci (avec des valeurs intéressantes) alors j'espère que les inconditionnels me feront honneur
Règles de "mon" micro poker: -C'est un duel, il n'y a que deux joueurs. -On va les appeler respectivement l'ouvreur et le suiveur. -Il n'y a que 3 types de cartes: numérotées 1, 2, ou 3. (plus grande = plus forte). Une manche: -On distribue au hasard une carte à chaque joueur, un joueur ne voit que sa propre carte, on considère que tout est équiprobable dans la distribution et rien ne s'oppose à ce que les joueurs aient le même type de carte. -L'ouvreur est le premier à parler il a le choix entre: * Se coucher: la manche s'arrête, perdue pour lui, il donne 1 euro à l'autre. * Ouvrir: la manche continue, le suiveur a maintenant la parole. -Le suiveur lorsqu'il a la parole a le choix entre: * Se coucher: la manche s'arrête, perdue pour lui, il donne 2 euros à l'autre. * Suivre pour voir: On dévoile les carte, celui qui a la plus faible donne 5 euros à l'autre. En cas d'égalité il ne se passe rien.
Comment l'ouvreur et le suiveur doivent ils jouer? Qui préférez vous être?
PS: je me suis arrangé pour qu'un phénomène intéressant se produise Je donnerais des indices si besoin au fur et à mesure.
Indice 1: Spoiler : [Afficher le message] Il faut envisager les stratégies mixtes. C'est à dire les stratégies faisant apparaitre du hasard dans des proportions à déterminer. Par exemple à pierre papier ciseau la stratégie optimale est une stratégie mixte consistant à jouer chaque options au hasard dans des proportions égales. Ici les stratégies sont en partie mixtes.
Indice 2: Spoiler : [Afficher le message] Le problème peut être simplifié. Si on note o1 o2 o3 s1 s2 s3 respectivement les fréquences avec lesquelles l'ouvreur et le suiveur doivent ouvrir/suivre lorsqu'ils voient 1 2 ou 3 alors on peut voir facilement les valeurs de o3, s3. Et avec très peu de calcul supplémentaire les valeurs de o2 s1. Ne reste donc que deux paramètres à déterminer: o1 et s2.
Indice 3: Spoiler : [Afficher le message] Que veut dire "jouer optimalement" de manière claire. Vous fixez une stratégie mixte(cf indice1) pour l'un des deux joueurs, elle est optimale lorsqu'elle minimise ce que l'autre peut faire au mieux contre. La théorie des jeux assure (au moins dans notre contexte) qu'il en existe une. (Ce qui n'est pas nécessairement trivial car il aurait pu y avoir une stratégie B contrant A une stratégie C contrant B et A contrant C mais on a pas à se poser cette question) Il ne reste que des calculs à faire!
Solution: Spoiler : [Afficher le message] Résultat: La stratégie optimale de l'ouvreur: Ouvrir à 1: 1 fois sur 7 au hasard. Ouvrir à 2: Toujours. Ouvrir à 3: Toujours. La stratégie optimale du suiveur: Suivre à 1: Jamais. Suivre à 2: 2 fois sur 7 au hasard. Suivre à 3: Toujours. Lorsque les deux joueurs jouent optimalement il y a une dérive moyenne en faveur de l'ouvreur de 2/63 euros par partie. Le phénomène intéressant dont je parlais est la proportion non nulle d'ouverture à 1 dans la stratégie optimale. C'est ce qu'en langage courant on nomme "le bluff" mais j'illustrais ici le fait que la notion n'est pas uniquement psychologique mais bien une réalité mathématique. Autour du résultat: On va appeler "stratégie intelligente"" les gammes de stratégie ou l'ouvreur ouvre toujours avec 2 et 3 et ou le suiveur ne suit jamais avec 1 et toujours avec 3. Et "stratégie optimale" les 2 stratégies intelligentes particulières déjà données ci dessus. On remarque: Si l'ouvreur joue optimalement, le suiveur peut faire n'importe quel stratégie intelligente ca n'aggravera pas la dérive moyenne qui restera constante a 2/63 en faveur de l'ouvreur. Si le suiveur joue optimalement, l'ouvreur peut faire n'importe quel stratégie intelligente ca n'aggravera pas la dérive moyenne qui restera constante à 2/63 en faveur de l'ouvreur. Si l'ouvreur adopte une stratégie intelligente ou il ouvre à 1 dans moins de 1/7 des cas le suiveur à intérêt à adopter la stratégie intelligente ou il ne suit plus jamais avec 2. Si l'ouvreur adopte une stratégie intelligente ou il ouvre à 1 dans plus de 1/7 des cas le suiveur à intérêt à adopter la stratégie intelligente ou il suit systématiquement avec 2. Si le suiveur adopte une stratégie intelligente ou il suit à 2 dans plus de 2/7 des cas l'ouvreur à intérêt à adopter la stratégie intelligente ou il n'ouvre jamais avec 1. Si le suiveur adopte une stratégie intelligente ou il suit à 2 dans moins de 2/7 des cas l'ouvreur à intérêt à adopter la stratégie intelligente ou il ouvre systématiquement avec 1. Calcul: Voir les calculs de ceux étant parvenu à ce résultat
#2 - 14-04-2011 12:31:53
- Nombrilist
- Expert de Prise2Tete
- Enigmes résolues : 10
- Messages : 568
micro pokzr
On va imaginer un ouvreur qui ouvre quand il a 2 et 3 et se couche quand il a 1, et un suiveur qui suit uniquement quand il a 2 ou 3. Soit A:"Ouvreur donne un euro à suiveur" Soit B:"Suiveur donne deux euros à ouvreur" Soit C:"A gagne 5 euros" Soit D:"B gagne 5 euros" Soit E:"Egalité"
P(A) = 3/9 P(B) = (2/3)*(1/3) = 2/9 P(C) = (1/3)*(1/3) = 1/9 P(D) = (1/3)*(1/3) = 1/9 P(E) = (2/3)*(1/3) = 2/9
E(Gain Ouvreur) = 3/9*-1 + 2/9*2 + 1/9*5 + 1/9*-5 + 2/9*0 = 1/9 E(Gain Suiveur) = 3/9*1 + 2/9*-2 + 1/9*-5 + 1/9*5 + 2/9*0 = -1/9
Ouvreur a un léger avantage.
#3 - 14-04-2011 13:51:09
- Clydevil
- Expert de Prise2Tete
- Enigmes résolues : 29
- Messages : 914
- Lieu: Seahaven island
Microo poker
@Nombrilist: Pour ne rien dévoiler je vais le formuler ainsi: Au moins un de tes joueurs ne joue pas optimalement.
#4 - 14-04-2011 14:52:56
- Nombrilist
- Expert de Prise2Tete
- Enigmes résolues : 10
- Messages : 568
micro pokrr
Ah. Bon, si l'on modifie juste que A ouvre systématiquement:
P(A) = 0 P(B) = 3/9 P(C) = (1/3)*(1/3) = 1/9 P(D) = (1/3)*(2/3)+(1/3)*(1/3) = 3/9 P(E) = 2/9
E(gain ouvreur) = 0*-1+3/9*2+1/9*5+3/9*-5+2/9*0 = -4/9.
Conclusion: c'est pire pour A.
Par rapport à mon premier post, si le suiveur ne suit qu'avec 3, alors:
P(A) = 3/9 P(B) = (2/3)*(2/3) = 4/9 P(C) = 0 P(D) = (1/3)*(1/3) = 1/9 P(E) = 1/9
E(gain ouvreur) = 3/9*-1+4/9*2+1/9*0+1/9*-5+1/9*0 = 0 E(gain suiveur) = 3/9*1+4/9*-2+0*-5+1/9*5+1/9*0 = 0
Avec ces stratégies, le jeu est égal pour un grand nombre de parties. J'ai bon ?
#5 - 14-04-2011 15:09:17
- L00ping007
- Elite de Prise2Tete
- Enigmes résolues : 49
- Messages : 2010
- Lieu: Paris
micro poler
Je n'ai Internet qu'avec l'Iphone tout de suite, donc je peux pas poster le pavé que j'ai écrit sur le PC... Je trouve une stratégie optimale pour les 2 qui les amènent a ne rien gagner ni perdre : l'ouvreur se couche avec 1, et suit avec 2 ou 3, et ensuite le suiveur se couche avec 1 et 2, et suit avec 3.
Mais les calculs supposent la stratégie de l'ouvreur lisible par le suiveur, et si l'ouvreur se met a bluffer et changer de stratégie, je ne sais pas comment faire répondre le suiveur ! Ca devient vraiment du poker !
#6 - 14-04-2011 15:33:47
- Clydevil
- Expert de Prise2Tete
- Enigmes résolues : 29
- Messages : 914
- Lieu: Seahaven island
iMcro poker
@Nombrilist: Tu as amélioré ta stratégie du suiveur par rapport à ton premier jet ^^ Cela dit pour ne rien dévoiler : Il y a toujours au moins un de tes joueurs qui ne joue pas optimalement.
@L00ping007: Spoiler : [Afficher le message] Il y a encore mieux. Ton "Ça devient vraiment du poker !" fait référence à quelque chose de parfaitement mathématisable dans ce cas.
#7 - 14-04-2011 16:05:14
- L00ping007
- Elite de Prise2Tete
- Enigmes résolues : 49
- Messages : 2010
- Lieu: Paris
Micro pokre
L'ouvreur ouvre avec un 2, avec un 3, et une fois sur 7 avec un 1. Son espérance de gain est de 2/63 Ca ressemble a quelque chose ?
#8 - 14-04-2011 16:28:06
- Clydevil
- Expert de Prise2Tete
- Enigmes résolues : 29
- Messages : 914
- Lieu: Seahaven island
Micro pokr
@L00ping007: Wow, 5h à temps partiel pour modéliser/calculer sans erreur moi je dis chapeau. Il te reste à trouver comment doit jouer le suiveur.
#9 - 14-04-2011 16:36:30
- L00ping007
- Elite de Prise2Tete
- Enigmes résolues : 49
- Messages : 2010
- Lieu: Paris
Miro poker
Plutôt temps presque plein, ca ne me prend pas tant de temps que ca que de surveiller les travaux de la cuisine
Le suiveur se couche avec un 1, suit avec un 3, et peut suivre ou se coucher indépendamment avec un 2.
Des que je récupère le PC j'écris mon raisonnement.
Ca redonne envie de rejouer au poker, ces stats
#10 - 14-04-2011 16:45:32
- Clydevil
- Expert de Prise2Tete
- Enigmes résolues : 29
- Messages : 914
- Lieu: Seahaven island
micro ooker
@L00ping007: Spoiler : [Afficher le message] Ta stratégie du suiveur est toujours incomplète. Pense que Alice et Bob joue à pierre papier ciseau, si Alice joue correctement oui c'est vrai Bob peut jouer n'importe comment, mais ce n'est pas "bien" car il suppose quelque chose. En gros d'une certaine manière tu as bien raisonné avec Alice mais moins bien avec Bob.
#11 - 14-04-2011 16:53:23
- Nombrilist
- Expert de Prise2Tete
- Enigmes résolues : 10
- Messages : 568
Miicro poker
Alors, si A n'ouvre que si il a 3 et B ne suit que si il a 3, alors:
P(A) = 6/9 P(B) = 1/3*2/3 = 2/9 P(E) = 1/9
E(A) = -2/9 E(B) = 2/9
J'imagine que la stratégie gagnante est pour B qui ne doit suivre que quand il tire 3, indépendamment de ce que A peut bien avoir comme stratégie ?
#12 - 14-04-2011 16:57:42
- Clydevil
- Expert de Prise2Tete
- Enigmes résolues : 29
- Messages : 914
- Lieu: Seahaven island
Micro poekr
@Nombrilist: Spoiler : [Afficher le message] Si je lis bien ce que tu as écris alors il y a sans doute une erreur de raisonnement, car depuis ta proposition de stratégies à espérance nulle tu n'as changé que la stratégie du premier, pour obtenir moins bien pour lui! Ou alors c'était simplement une démo qu'il ne doit pas faire ainsi?
#13 - 14-04-2011 17:29:28
- Nombrilist
- Expert de Prise2Tete
- Enigmes résolues : 10
- Messages : 568
Micro pokre
Disons que j'ai l'impression que quoi que fasse A, B a toujours un moyen de contrer, notamment en ne suivant que si il a 3. A a alors intérêt à ouvrir si il a 2 ou 3. Mais il y a sans doute une erreur ou un oubli de cas de figure si la solution n'est pas celle-ci.
#14 - 14-04-2011 17:46:59
- Clydevil
- Expert de Prise2Tete
- Enigmes résolues : 29
- Messages : 914
- Lieu: Seahaven island
Mcro poker
@Nombrilist: Spoiler : [Afficher le message] Si ton suiveur ne suit qu'avec 3 alors magie, ca va devenir subitement intéressant pour l'ouvreur d'ouvrir avec tout même 1. Ce que tu as oublié de considérer dans le probleme, c'est la même chose que tu ferais à pierre, papier, ciseau, tu ne me dirais jamais de jouer "toujours pierre" tu dirais qq chose de plus subtil ^^
#15 - 14-04-2011 23:41:10
- godisdead
- Expert de Prise2Tete
- Enigmes résolues : 22
- Messages : 747
Micro ppoker
Bon, je mets toutes mes reflexions, ça permet de me dire là ou j'ai fabulé !
9 cas de figure. O/S 1/1 1/2 1/3 2/1 2/2 2/3 3/1 3/2 3/3
Cas 1 : (ouvreur prudent) Si l'ouvreur a un 3, il ne se pose pas de question, il ouvre. Le suiveur a un 1, il se couche (+2€), il a un 2, il se tate , il a un 3, il suit. (0€)
Si l'ouvreur a un 1, il se couche. (-1€)
Reste le cas de figure avec le 2, si on calcule la probabilité de la deuxième main, il a 1 chance sur 3 de gagner 2€, une chance sur 3 de gagner 2€ ou rien du tout, et 1 chance sur 3 de perdre 5€. Avec une espérance de gain négative, il se couche et perd 1€.
Sachant tout ça, le suiveur ne suivra pas avec un 2, et l'espérance de gain de l'ouvreur est négative.
Cas 2 : (ouvreur aggressif) D'après tout ça, l'ouvreur doit forcement jouer différement. S'il suit tout le temps. Le suiveur se couchera sur un 1 (+2€), se couchera sur un 2 (+2€) et suivra avec un 3 (-5€ / -5€ / 0) Dans ce cas là, l'ouvreur a un espérence de gain supérieur à 0.
Comment le suiveur peut casser cette dynamique ? Il faudrait qu'il suive lorsqu'il a un 2, alors l'espérance de gain serait (-5€ / 0 / +5€) et là, c'est l'ouvreur qui perd.
Comment l'ouvreur peut améliorer sa situation ? S'il se couche sur un 1 et n'ouvre que sur un 2. Alors, son espérance de gain redevient positive. Mais dans ce cas, le suiveur ne suivra plus avec un 2 puisqu'il ne peut plus gagner. Là, les deux joueurs ne gagnent rien !
Sachant que 2 fois sur 3, le suiveur ne suivra pas, il faut qu'il ouvre sur un 1 et on revient dans le cas au dessus ! Bref, on se mord la queue !
Pour gagner de l'argent, l'ouvreur doit etre plus vicieux que ça, il doit bluffer. N'ouvrir qu'une fois sur 7 lorsqu'il a un 1, et ouvrir avec un 2 et un 3.
Est-ce que le suiveur doit suivre avec un 2 ? Si oui, espérance de gain de l'ouvreur (63 tirages) = -3 * 6 + 2 - 5 - 5 + (2 + 0 - 5 + 2 + 5 + 0) * 7 = +2 si non, espérance de gain de l'ouvreur (63 tirages) = -3 * 6 + 2 + 2 - 5 + (2 + 2 - 5 + 2 + 2 + 0) * 7 = +2
Là, ça sent la strategie gagnante !!! Je veux être ouvreur !
#16 - 15-04-2011 00:03:51
- Clydevil
- Expert de Prise2Tete
- Enigmes résolues : 29
- Messages : 914
- Lieu: Seahaven island
Miro poker
@godisdead: Spoiler : [Afficher le message] Très intéressant tout cela ^^. Tout ce que tu dis sur les stratégies pures (déterministe et constante d'une manche à l'autre) semble tout à fait exacte. Et oui en restant avec des stratégies pures on se mort la queue, exactement comme à pierre papier ciseau, si on ne fait pas intervenir de hasard on risque de toujours trouver une parade et une parade de parade etc... Il faut donc faire intervenir une stratégie mixte comme tu l'as fait. Dans l'absolu rien ne permet facilement de déclarer que certain coeff saturent à 1, comme par exemple l'ouverture sur 2 ce n'est pas "directement évident" qu'on doit "toujours" ouvrir avec 2. Mais bon en dehors des réflexions sous le tapis et les valeur magiques qui sortent du chapeau les conclusions sont justes :p Il te manque la stratégie optimale du suiveur elle ne changera pas l'espérance des gains du premier si celui ci joue optimalement mais elle permettra d'empêcher que le premier puisse avoir "mieux" avec une autre stratégie. Comme a pierre papier ciseau, si l'un des deux joue 1/3 de chaque quoi que fasse l'autre ca change rien certes, mais si l'autre ne fait que pierre il va s'exposer à ce que le premier change pour toujours feuille. Ainsi l'autre aussi doit faire 1/3 de chaque. C'est ce genre de résultat concernant le suiveur de notre micro poker qu'il te manque.
#17 - 15-04-2011 00:12:51
- irmo322
- Professionnel de Prise2Tete
- Enigmes résolues : 36
- Messages : 203
Micro poke
-On distribue au hasard une carte à chaque joueur, un joueur ne voit que sa propre carte, on considère que tout est équiprobable dans la distribution et rien ne s'oppose à ce que les joueurs aient le même type de carte.
Je comprends ça comme: les cartes des deux joueurs suivent des lois aléatoires uniformes et indépendantes. J'espère que j'interprète bien tes propos.
Passons à la stratégie. La stratégie de l'ouvreur se résume à 3 probabilités: les probabilités qu'il ouvre selon la carte qu'il a en main. Je les appelle O1, O2 et O3 (où Oi est la proba d'ouvrir avec la carte de valeur i). La stratégie du suiveur se résume aussi à 3 probabilités: les probas qu'il suive selon la carte qu'il a en main. Je les appelle cette fois-ci S1, S2 et S3 (Sj: proba de suivre avec une carte de valeur j). Je crois que la théorie des jeux assure qu'il existe une stratégie optimale pour chacun des joueurs.
Il reste à calculer le gain moyen de l'ouvreur en fonction de O1, O2, O3, S1, S2 et S3. Il est inutile de calculer le gain moyen du suiveur car il est opposé à celui de l'ouvreur (jeu à somme nulle). Avant de se lancer dans les calculs, on peut deviner quelques valeurs. Il est clair que le suiveur va suivre si sa carte est un 3, donc S3=1. De même, il est clair que l'ouvreur va ouvrir s'il a un 3, donc O3=1. Le gain moyen de l'ouvreur vaut: [TeX]Gain=-\frac{1}{3}(1-O1)-\frac{1}{3}(1-O2) +\frac{1}{9}O1.(2.(1-S1)+2.(1-S2)-5.S2-5) +\frac{1}{9}O2.(2.(1-S1)+5.S1+2.(1-S2)-5) +\frac{1}{9}(2.(1-S1)+5.S1+2.(1-S2)+5.S2) [/TeX] On arrange un peu l'expression: [TeX]9.Gain=-2+3.S1+3.S2+O1.(2-2.S1-7.S2)+O2.(2+3.S1-2.S2) [/TeX] Ha la la... Je suis fatigué, je suis sûr qu'il doit y avoir des erreurs de calcul alors je reprends ça plus tard...
#18 - 15-04-2011 09:03:27
- Clydevil
- Expert de Prise2Tete
- Enigmes résolues : 29
- Messages : 914
- Lieu: Seahaven island
Micro pokre
@irmo322: Tres bon début ^^ Oui uniformes et indépendantes ce sont les vrais mots pour la situation, tu as bien interprété. C'est marrant tu as pris les même notations que moi. Je te laisse vérifier/continuer/conclure.
#19 - 15-04-2011 18:20:20
- L00ping007
- Elite de Prise2Tete
- Enigmes résolues : 49
- Messages : 2010
- Lieu: Paris
Micro oker
Je suis en train de mettre en forme le texte, pas de panique
Je remarque d'abord qu'avec un 3, on ne peut pas perdre d'argent en ouvrant/suivant (au pire gain nul), alors qu'on en perd si on se couche : il faut donc toujours ouvrir/suivre quand on a un 3.
J'appelle : p la probabilité de l'ouvreur d'ouvrir s'il a tiré un 1 q la probabilité de l'ouvreur d'ouvrir s'il a tiré un 2
r la probabilité du suiveur de suivre s'il a tiré un 1 s la probabilité du suiveur de suivre s'il a tiré un 2
Je suppose que [latex]q \ge p[/latex] et [latex]s \ge r[/latex], ce qui paraît logique : on veut plus souvent ouvrir/suivre avec un 2 qu'avec un 1. Avec un petit tableau Excel qui recense tous les cas possibles suivant les valeurs des cartes, et en utilisant les probabilités suivantes :
P(ouvreur a un 1 et il ouvre)=p/3 P(ouvreur a un 1 et il se couche)=(1-p)/3 P(ouvreur a un 2 et il ouvre)=q/3 P(ouvreur a un 2 et il se couche)=(1-q)/3 P(ouvreur a un 3 et il ouvre)=1/3 P(ouvreur a un 3 et il se couche)=0
P(suiveur a un 1 et il suit)=r/3 P(suiveur a un 1 et il se couche)=(1-r)/3 P(suiveur a un 2 et il suit)=s/3 P(suiveur a un 2 et il se couche)=(1-s)/3 P(suiveur a un 3 et il suit)=1/3 P(suiveur a un 3 et il se couche)=0
En combinant ces probabilités aux différents gains (je passe les calculs), je trouve cette formule pour l'espérance de gain de l'ouvreur : [TeX]E(ouvreur)=\frac{2(p+q)}9+\frac{r+s}3-\frac{7ps}9+\frac{qr}3-\frac{2qs}9-\frac{2pr}9-\frac29[/TeX] Plaçons nous maintenant du côté du suiveur qui veut minimiser cette espérance de gain.
Le coefficient de r dans cette formule est : [TeX]\frac13+\frac q3-\frac{2p}9=\frac{3+3q-2p}9 > 0[/TeX] Pour minimiser le gain de l'ouvreur, le suiveur a donc intérêt à prendre r=0
La formule s'écrit alors : [TeX]E=\frac{p(2-7s)+q(2-2s)+3s-2}9[/TeX] Le suiveur veut choisir un s tel que la meilleure valeur que l'ouvreur puisse obtenir en faisant varier p et q soit la plus faible possible. Si on prend s entre 0 et 2/7, alors l'ouvreur pourra prendre p=1 et q=1 (les coeff de p et q sont positifs). Le gain sera alors [latex]\frac{2-6s}9[/latex]. Le gain maximal que le suiveur laissera à l'ouvreur dans ce cas est pour s=2/7 et vaut 2/63 Si on prend s entre 2/7 et 1, alors l'ouvreur aura intérêt à prendre p=0 (coeff négatif), et q=1. Le gain devient alors s/9, minimal pour s=2/7 et valant 2/63.
Le suiveur a donc intérêt à prendre les valeurs r=0,s=2/7
Du côté de l'ouvreur Le coeff de q est [latex]\frac29+\frac r3-\frac{2s}9[/latex], qui est positif car s<=1. Donc l'ouvreur a intérêt à prendre q=1.
La formule devient [TeX]E=\frac{r(6-2p)+s(1-7p)+2p}9 [/TeX] si on prend p entre 0 et 1/7, le suiveur choisira r=s=0 et le gain sera [latex]\frac{2p}9[/latex], avec un gain max de 2/63 pour p=1/7 si on prend p entre 1/7 et 1, le suiveur prendra r=0 et s=1, ce qui donnera un gain de [latex]\frac{1-5p}9[/latex], maximisé pour p=1/7 et valant 2/63
On en déduit donc que l'ouvreur a intérêt à choisir p=1/7 et q=1
Conclusion : L'ouvreur ouvre 1 fois sur 7 avec un 1, et tout le temps avec un 2 ou un 3 Le suiveur se couche avec un 1, suit 2 fois sur 7 avec un 2, et tout le temps avec un 3
#20 - 15-04-2011 19:12:43
- Clydevil
- Expert de Prise2Tete
- Enigmes résolues : 29
- Messages : 914
- Lieu: Seahaven island
Micr opoker
Bravo à Looping qui a été le premier à trouver la stratégie optimale de l'ouvreur et est maintenant également le premier à avoir trouver la stratégie optimale du suiveur!
#21 - 17-04-2011 10:02:21
- Clydevil
- Expert de Prise2Tete
- Enigmes résolues : 29
- Messages : 914
- Lieu: Seahaven island
Micrro poker
Indice 1: Spoiler : [Afficher le message] Il faut envisager les stratégies mixtes. C'est à dire les stratégies faisant apparaitre du hasard dans des proportions à déterminer. Par exemple à pierre papier ciseau la stratégie optimale est une stratégie mixte consistant à jouer chaque options au hasard dans des proportions égales. Ici les stratégies sont en partie mixtes.
#22 - 19-04-2011 09:08:14
- Clydevil
- Expert de Prise2Tete
- Enigmes résolues : 29
- Messages : 914
- Lieu: Seahaven island
Micro opker
Indice 2: Spoiler : [Afficher le message] Le problème peut être simplifié. Si on note o1 o2 o3 s1 s2 s3 respectivement les fréquences avec lesquelles l'ouvreur et le suiveur doivent ouvrir/suivre lorsqu'ils voient 1 2 ou 3 alors on peut voir facilement les valeurs de o3, s3. Et avec très peu de calcul supplémentaire les valeurs de o2 s1. Ne reste donc que deux paramètres à déterminer: o1 et s2.
#23 - 19-04-2011 17:15:30
- Clydevil
- Expert de Prise2Tete
- Enigmes résolues : 29
- Messages : 914
- Lieu: Seahaven island
Micro poke
Indice 3: Spoiler : [Afficher le message] Que veut dire "jouer optimalement" de manière claire. Vous fixez une stratégie mixte(cf indice1) pour l'un des deux joueurs, elle est optimale lorsqu'elle minimise ce que l'autre peut faire au mieux contre. La théorie des jeux assure (au moins dans notre contexte) qu'il en existe une. (Ce qui n'est pas nécessairement trivial car il aurait pu y avoir une stratégie B contrant A une stratégie C contrant B et A contrant C mais on a pas à se poser cette question) Il ne reste que des calculs à faire!
#24 - 21-04-2011 13:34:56
- Clydevil
- Expert de Prise2Tete
- Enigmes résolues : 29
- Messages : 914
- Lieu: Seahaven island
micro pokzr
Solution: Spoiler : [Afficher le message] Résultat: La stratégie optimale de l'ouvreur: Ouvrir à 1: 1 fois sur 7 au hasard. Ouvrir à 2: Toujours. Ouvrir à 3: Toujours. La stratégie optimale du suiveur: Suivre à 1: Jamais. Suivre à 2: 2 fois sur 7 au hasard. Suivre à 3: Toujours. Lorsque les deux joueurs jouent optimalement il y a une dérive moyenne en faveur de l'ouvreur de 2/63 euros par partie. Le phénomène intéressant dont je parlais est la proportion non nulle d'ouverture à 1 dans la stratégie optimale. C'est ce qu'en langage courant on nomme "le bluff" mais j'illustrais ici le fait que la notion n'est pas uniquement psychologique mais bien une réalité mathématique. Autour du résultat: On va appeler "stratégie intelligente"" les gammes de stratégie ou l'ouvreur ouvre toujours avec 2 et 3 et ou le suiveur ne suit jamais avec 1 et toujours avec 3. Et "stratégie optimale" les 2 stratégies intelligentes particulières déjà données ci dessus. On remarque: Si l'ouvreur joue optimalement, le suiveur peut faire n'importe quel stratégie intelligente ca n'aggravera pas la dérive moyenne qui restera constante a 2/63 en faveur de l'ouvreur. Si le suiveur joue optimalement, l'ouvreur peut faire n'importe quel stratégie intelligente ca n'aggravera pas la dérive moyenne qui restera constante à 2/63 en faveur de l'ouvreur. Si l'ouvreur adopte une stratégie intelligente ou il ouvre à 1 dans moins de 1/7 des cas le suiveur à intérêt à adopter la stratégie intelligente ou il ne suit plus jamais avec 2. Si l'ouvreur adopte une stratégie intelligente ou il ouvre à 1 dans plus de 1/7 des cas le suiveur à intérêt à adopter la stratégie intelligente ou il suit systématiquement avec 2. Si le suiveur adopte une stratégie intelligente ou il suit à 2 dans plus de 2/7 des cas l'ouvreur à intérêt à adopter la stratégie intelligente ou il n'ouvre jamais avec 1. Si le suiveur adopte une stratégie intelligente ou il suit à 2 dans moins de 2/7 des cas l'ouvreur à intérêt à adopter la stratégie intelligente ou il ouvre systématiquement avec 1. Calcul: Voir les calculs de ceux étant parvenu à ce résultat
Mots clés des moteurs de recherche
|
|