https://frosthead.com

La dernière intelligence artificielle apprend à jouer sans aide humaine

L'année dernière, un programme d'intelligence artificielle appelé AlphaGo, créé par l'équipe DeepMind de Google, a battu un champion humain à Go, un ancien jeu de stratégie chinois qui est à bien des égards plus complexe que les échecs. Comme le rapportait Emily Matchar pour Smithsonian.com à l’époque, c’était un exploit remarquable, puisqu’en 1997 encore, certaines personnes prédisaient qu’il faudrait 100 ans à un ordinateur pour battre un humain à Go.

Alors que l'exploit est impressionnant, AlphaGo a appris à jouer au jeu en analysant les jeux précédents joués par des humains. Mais comme le rapporte Merrit Kennedy de NPR, une nouvelle version de l’intelligence artificielle appelée AlphaGo Zero a montré comment maîtriser le jeu sans aucune intervention humaine ni manipulation, un progrès qui a de grandes implications pour le développement futur de l’IA.

Selon un communiqué de presse de DeepMind, les versions précédentes d'AlphaGo ont appris à jouer au jeu en étudiant les correspondances entre joueurs professionnels et amateurs, en assimilant les règles du jeu et en développant des stratégies de jeu réussies. AlphaGo Zero, cependant, n'a pas regardé les jeux joués par les humains. Au lieu de cela, il a reçu les règles du jeu et a ensuite été joué contre lui-même, en utilisant l'apprentissage par renforcement pour apprendre à lui-même les bons et les mauvais mouvements et les stratégies à long terme. Lorsque l'IA a joué au jeu, elle a mis à jour son réseau de neurones avancé pour mieux prédire les mouvements de son adversaire.

Les chercheurs ont observé l'IA maîtriser le jeu en temps réel. Trois jours plus tard, il était capable de vaincre une version précédente, AlphaGo Lee, qui battait le coréen Go Sedan Lee Sedol en quatre matchs sur cinq en 2016. Après 21 jours, il battait AlphaGo Master, la version qui battait 60 des meilleurs joueurs de Go en ligne et meilleur joueur du monde Ke Jie plus tôt cette année. La dernière version a battu AlphaGo Master 100 à 0. Après 40 jours, il a atteint des niveaux de jeu inégalés. La recherche apparaît dans la revue Nature.

«En très peu de temps, AlphaGo Zero a compris toutes les connaissances acquises par les humains au cours de milliers d'années de jeu», explique le chercheur principal David Silver de DeepMind chez Google dans une vidéo Youtube. «Parfois, il est en fait choisi d'aller au-delà de cela et a découvert quelque chose que les humains n'avaient même pas découvert à cette époque. Il a également découvert de nouvelles connaissances qui sont créatives et novatrices à bien des égards."

Comme le rapporte l'Agence France-Presse, AlphaGo Zero a atteint ce niveau de maîtrise bien plus efficacement que ses prédécesseurs. Alors que l’itération précédente comptait 48 unités de traitement de données et joué 30 millions de parties d’entraînement sur plusieurs mois, Zero ne comptait que 4 unités de traitement et 4, 9 millions de parties d’entraînement sur trois jours. «Les gens ont tendance à penser que l'apprentissage automatique est basé sur le Big Data et des quantités énormes de calculs, mais en réalité, ce que nous avons vu avec AlphaGo Zero, c'est que les algorithmes importent beaucoup plus», explique Silver à l'AFP.

Mais la recherche ne se limite pas à la maîtrise d’un jeu de plateau. Comme le rapporte Ian Sample du Guardian, ce type d'apprentissage peut mener à une nouvelle génération d'intelligence artificielle polyvalente qui pourrait aider à résoudre des problèmes dans des domaines pouvant être bien simulés sur ordinateur, comme la composition de médicaments., repliement des protéines ou physique des particules. En construisant ses connaissances à partir de la base, sans préjugés ni limitations humaines, les algorithmes pourraient aller dans des directions que l'homme n'a pas encore pensé à regarder.

Alors que de nombreux membres de la communauté de l'IA considèrent AlphaGo Zero comme une grande réussite, Gary Marcus, professeur de psychologie à l'Université de New York, spécialiste de l'intelligence artificielle, a déclaré à Kennedy de NPR qu'il ne pensait pas que l'algorithme était vraiment tabula rasa dans la construction de l'algorithme. Il ne pense pas non plus que la tabula rasa AI est aussi importante qu'il y paraît. «En biologie, les cerveaux humains réels ne sont pas des tabula rasa ... Je ne vois pas la raison théorique principale pour laquelle vous devriez faire cela, pourquoi vous devriez abandonner beaucoup de connaissances que nous avons sur le monde», dit-il.

Malgré tout, la maîtrise rapide du jeu par Alpha Go est impressionnante et un peu effrayante.

La dernière intelligence artificielle apprend à jouer sans aide humaine