https://frosthead.com

Cette intelligence de jeu de poker sait quand les tenir et quand les plier

Un programme informatique appelé Pluribus a battu les pros du poker dans une série de jeux Texas Hold'em sans limite à six joueurs, atteignant ainsi un tournant dans la recherche sur l'intelligence artificielle. C'est le premier bot à battre les humains dans une compétition multijoueur complexe.

Comme le rapportent des chercheurs du laboratoire d'intelligence artificielle de Facebook et de l'Université Carnegie Mellon dans la revue Science, Pluribus est sorti victorieux des matchs dominés par les algorithmes et par l'homme. Initialement, Merrit Kennedy écrit pour NPR, cinq versions du bot se sont affrontées à un joueur de poker professionnel; lors de la prochaine série d'expériences, un bot a joué contre cinq humains. Selon un blog de Facebook, l'IA a gagné en moyenne environ 5 dollars par main, ou 1 000 dollars par heure, face à cinq adversaires humains. Ce taux est considéré comme une «marge de victoire décisive» parmi les professionnels du poker.

S'exprimant avec Kennedy, Darren Elias, quadruple champion du World Poker Tour, explique qu'il a participé à la formation de Pluribus en affrontant quatre tables de rivaux et en alertant les scientifiques lorsque l'IA avait commis une erreur. Bientôt, le bot «s'améliorait très rapidement, passant de joueur médiocre à un joueur de poker de niveau mondial en quelques jours et semaines.» L'expérience, a déclaré Elias, était «plutôt effrayante».

Selon James Vincent, Verur’s, Pluribus - une IA étonnamment peu coûteuse formée avec moins de 150 $ de ressources d’informatique en nuage - a encore mieux maîtrisé la stratégie de poker en jouant contre ses copies et en apprenant par essais et erreurs. Comme Jennifer Ouellette le note pour Ars Technica, le bot a vite compris que son meilleur plan d'action était une combinaison de gameplay et de mouvements imprévisibles.

La plupart des pros humains évitent les «jeux de hasard», dans lesquels un joueur termine un tour avec un appel et commence le suivant avec un pari, mais Pluribus a immédiatement adopté la stratégie impopulaire. En même temps, rapporte Ouellette, l'IA a également proposé des tailles de mises inhabituelles et présenté une meilleure randomisation que ses adversaires.

"Sa principale force réside dans sa capacité à utiliser des stratégies mixtes", a déclaré Elias, selon un communiqué de la CMU. «C'est la même chose que les humains essaient de faire. C'est une question d'exécution pour les humains: le faire de manière parfaitement aléatoire et cohérente. La plupart des gens ne peuvent tout simplement pas.

Pluribus n'est pas la première IA au poker à avoir vaincu des professionnels. En 2017, les créateurs du bot, Noam Brown et Tuomas Sandholm, ont développé une version antérieure du programme appelée Libratus. Cette IA a définitivement battu quatre professionnels du poker sur 120 000 mains de Texas Hold'em à deux joueurs, mais comme l'explique le blog sur Facebook, elle était limitée par le fait qu'elle ne faisait face qu'à un seul adversaire à la fois.

Selon Will Knight du MIT Technology Review, le poker représente un défi pour l’intelligence artificielle car il implique plusieurs joueurs et une pléthore d’informations cachées. Comparativement, les jeux tels que chess and Go n'impliquent que deux participants et les positions des joueurs sont visibles pour tous.

Pour surmonter ces obstacles, Brown et Sandholm ont créé un algorithme conçu pour prédire les deux ou trois prochains mouvements de leurs adversaires plutôt que de mesurer leur progression jusqu'à la fin de la partie. Bien que cette stratégie semble donner la priorité aux gains à court terme par rapport aux gains à long terme, le Verge ’s Vincent écrit que« l’incertitude à court terme est tout ce dont vous avez besoin ».

À l'avenir, les programmes multijoueurs tels que Pluribus pourraient être utilisés pour concevoir des médicaments capables de lutter contre les bactéries résistantes aux antibiotiques, ainsi que d'améliorer la cybersécurité et les systèmes robotiques militaires. Comme Ouellette note Ars Technica, d’autres applications potentielles incluent la supervision de négociations multipartites, la tarification de produits et la mise au point de stratégies d’enchères en cascade.

Pour le moment, dit Brown à Knight, l'algorithme restera en grande partie dissimulé, principalement pour protéger le secteur du poker en ligne contre des pertes financières dévastatrices.

Le chercheur conclut: "Cela pourrait être très dangereux pour la communauté du poker."

Cette intelligence de jeu de poker sait quand les tenir et quand les plier