Comment battre n’importe qui à pierre-papier-ciseaux, selon un mathématicien

La question de savoir comment gagner à pierre-papier-ciseaux préoccupe, croyez-le ou non, les mathématiciens et les théoriciens des jeux depuis un certain temps. Alors qu’ils avaient déjà trouvé une réponse théorique à cette question, une expérience menée par Zhijian Wang à l’université de Zhejiang en Chine (PDF) avec de vrais joueurs a révélé une faille intéressante dans la théorie originale.

Dans l’expérience, Zhijian a remarqué que les joueurs gagnants avaient tendance à s’en tenir à leur stratégie gagnante, tandis que les perdants avaient tendance à passer à la stratégie suivante dans la séquence de pierre-papier-ciseaux, suivant ce qu’il appelle des “flux cycliques persistants”.

Voici comment cela fonctionne en pratique : Le joueur A et le joueur B commencent tous deux par utiliser des stratégies aléatoires. Si le joueur A utilise la pierre et le joueur B le papier, le joueur A perd. Au tour suivant, le joueur A peut supposer que le joueur B utilisera à nouveau du papier et devrait donc utiliser des ciseaux pour gagner. Au tour suivant, comme le joueur B a perdu, le joueur A peut supposer que le joueur B utilisera la stratégie suivante dans la séquence – les ciseaux – et le joueur A devrait alors utiliser la pierre, gagnant ainsi à nouveau.

Si l’on considère le jeu sur un plan théorique, la façon la plus mathématique de jouer à pierre-papier-ciseaux est de choisir sa stratégie au hasard. Étant donné qu’il y a trois issues – une victoire, une défaite ou une égalité – et que chaque stratégie a une autre stratégie qu’elle peut battre et une autre stratégie qui peut la battre, et que nous ne nous soucions pas de la stratégie avec laquelle nous gagnons, il est plus logique de choisir le papier exactement un tiers du temps, la pierre un tiers du temps et les ciseaux un tiers du temps. C’est ce que l’on appelle l’équilibre de Nash du jeu.

Alors que l’équilibre de Nash devrait être la meilleure stratégie dans la vie réelle, M. Zhijian a découvert un schéma résolument différent lorsque lui et d’autres chercheurs ont recruté 72 étudiants pour jouer au jeu. Ils ont divisé les étudiants en 12 groupes de six joueurs et leur ont fait jouer 300 tours de pierre-papier-ciseaux les uns contre les autres. Zhijian a également ajouté un paiement proportionnel au nombre de victoires.

Lorsqu’il a examiné les résultats, Zhijian a constaté que les étudiants choisissaient chaque stratégie près d’un tiers du temps, ce qui suggère la théorie de l’équilibre de Nash. Cependant, en y regardant de plus près, il a remarqué un schéma plus inhabituel.

Le schéma que Zhijian a découvert – les gagnants répétant leur stratégie et les perdants passant à la stratégie suivante dans la séquence – est appelé “réponse conditionnelle” dans la théorie des jeux. Les chercheurs ont émis l’hypothèse que cette réponse pourrait être câblée dans le cerveau, une question qu’ils ont l’intention d’étudier dans le cadre de nouvelles expériences.

Pour l’instant, Zhijian suggère que l’exploitation du fait que la plupart des gens utilisent la stratégie conditionnelle pourrait permettre de gagner beaucoup plus de parties de pierre-papier-ciseaux.