Alan Turing, l'un des pères de l'ère de l'informatique, était un homme extraordinairement intelligent. Tellement intelligent, en fait, qu'il comprit que le terme «intelligence de la machine» n'avait presque aucun sens. Mieux, raisonna-t-il, de parler de ce qu'une machine peut réellement faire: peut-elle parler? Peut-il tenir une conversation? Au moins, c'est quelque chose que nous pouvons essayer d'étudier. Turing a finalement proposé ce qu'on appelle désormais le «test de Turing»: si un juge ne sait pas laquelle des deux entités cachées est un humain et qui est un artificiel, la machine a «réussi» le test - ce qui est exactement ce que aurait eu lieu samedi dernier à Londres.
Contenu connexe
- La Silicon Valley doit son succès à ce génie de la technologie dont vous n'avez jamais entendu parler
- La prédiction de 60 ans d'Alan Turing sur les modèles dans la nature est vraie
"Nous sommes ... fiers de déclarer que le test d'Alan Turing a été passé pour la première fois", a déclaré l'un des organisateurs, Kevin Warwick de l'Université de Reading, au moment de l'annonce des résultats. Le chatbot gagnant porte le nom de «Eugene Goostman», un programme informatique qui imite la personnalité d'un garçon ukrainien de 13 ans. "Eugene" a réussi à convaincre 33% des juges que c'était humain lors de la manifestation de samedi, qui s'est déroulée dans les bureaux de la Royal Society à Londres, à l'occasion du 60e anniversaire de la mort de Turing. (Turing, un homosexuel, a été reconnu coupable de grossière indécence en 1952 et condamné à un «traitement» hormonal dans le cadre d'un accord de plaidoyer. Il est décédé deux ans plus tard d'une intoxication au cyanure dans un suicide apparent.)
Mais une mise en garde s'impose. «L'intelligence» a toujours été un sujet glissant, et le test de Turing en particulier a longtemps été sujet à controverse. Turing a expliqué comment cela fonctionnerait dans un article de 1950 intitulé «Machines à calculer et intelligence». Il a repris l’idée d’un jeu de société victorien traditionnel, dans lequel vous essayez de déterminer si la personne cachée derrière un rideau est un homme ou une femme. en posant des questions. (Les réponses aux questions devaient être écrites, car la voix serait un cadeau.) Voici comment la version de Turing fonctionnerait: vous auriez un juge assis devant deux rideaux, sans aucun moyen de savoir ce qu'il y a derrière. . Derrière un rideau est un humain; derrière l'autre est un ordinateur. Le juge peut poser des questions à l'une ou l'autre des deux entités cachées. Sur la base des réponses, le juge tente de déterminer si l'entité cachée est un humain ou une machine. (Turing a envisagé que la conversation soit médiatisée par des machines de type télétype; aujourd'hui, nous pouvons utiliser tout type d'interface électronique à base de texte, comme celle utilisée dans les salons de discussion Internet ou la messagerie instantanée.)
Turing a émis l'hypothèse que d'ici l'an 2000 «un interrogateur moyen n'aura plus que 70% de chances de faire la bonne identification», c'est-à-dire que les programmes informatiques bloqueraient les juges 30% du temps, après cinq minutes d'interrogatoire. Les «cinq minutes» sont importantes. Turing n'a pas parlé d'une limite de temps comme faisant partie intégrante du test, et on pourrait affirmer que pour qu'une machine réussisse vraiment le test, elle devrait pouvoir traiter n'importe quel nombre de questions. Vraisemblablement, le critère des cinq minutes était une limite arbitraire mais nécessaire. L'année 2000 s'est écoulée, les chatbots ne faisant que freiner les progrès. (Dans un moment plus sobre, répondant à une question d’un intervieweur de la BBC en 1952, Turing a déclaré qu’il faudrait 100 ans pour qu'une machine réussisse le test.)
En 2012, j'étais juge dans un «marathon de tests de Turing», le plus grand ensemble de tests de Turing jamais réalisé à la fois. elle s'est déroulée à Bletchley Park, en Angleterre, lieu de travail essentiel de Turing pour briser le code au cours des dernières années de la Seconde Guerre mondiale. (C'était organisé par la même équipe qui avait organisé l'événement de samedi, et une version antérieure d'Eugene était également lauréate.) La configuration de l'événement de samedi était la même qu'en 2012: les juges tapaient leurs questions à l'ordinateur., a ensuite attendu que les réponses apparaissent sur leurs écrans; les chatbots, avec les «humains cachés», étaient dans une autre pièce, à l'abri des regards.
La première chose dont je suis devenu hyper-consciente, c'est que lorsque vous êtes juge dans un test de Turing, cinq minutes s'écoulent assez rapidement. Et plus la conversation est courte, plus l'avantage de l'ordinateur est grand; plus l'interrogatoire est long, plus la probabilité que l'ordinateur se dévoile est grande. J'aime appeler cela l'effet de mannequin: vous êtes-vous déjà excusé auprès d'un mannequin de grand magasin, en supposant que vous veniez de tomber sur un être humain? Si la rencontre ne dure qu'une fraction de seconde, face à face, vous pouvez imaginer que vous venez de vous frotter à un humain. Plus la rencontre est longue, plus le mannequin du mannequin est évident.
C'est la même chose avec les chatbots. Un échange de hellos ne révèle rien - mais plus on y avance, plus les problèmes se posent. J'ai trouvé que les chatbots semblent enclins à changer de sujet sans raison. Souvent, ils ne peuvent pas répondre à des questions simples. Au risque de paraître vague, ils ne semblent tout simplement pas humains . Dans l'une de mes conversations en 2012, j'ai écrit une simple blague - et l'entité avec laquelle je conversais a immédiatement changé le sujet en hamburgers. (L'informaticien Scott Aaronson a récemment eu une expérience similaire lorsqu'il a discuté avec Eugene via le site Web du bot. Aaronson a demandé à Eugene combien de jambes a un chameau; il a répondu: «Quelque chose entre 2 et 4. Peut-être, trois? :-)))» Plus tard, quand Aaronson demanda combien de pattes avait une fourmi, Eugene cracha exactement la même réponse, triple smiley et tout.)
Notez également qu'Eugene n'émule pas un adulte de langue maternelle anglaise; il prétend être un adolescent ukrainien jeune et quelque peu désinvolte, conversant en anglais raisonnablement bon (mais loin d'être parfait). Comme l'expliquait Mashable.com, Vladimir Veselov, l'un des développeurs du programme, a déclaré: «Nous avons passé beaucoup de temps à développer un personnage doté d'une personnalité crédible.» Bien qu'Eugene engagera n'importe qui sur n'importe quel sujet, son âge «rend parfaitement raisonnable le fait qu'il «Je ne sais pas tout». Eugene ne sort pas et n'annonce pas son âge et sa nationalité; mais il le révélera à la demande - et le résultat final pourrait être une certaine clémence de la part des juges, notamment en ce qui concerne la grammaire anglaise et l'utilisation de mots. (Je suppose que la plupart des juges de samedi étaient des anglophones, bien que je ne le sache pas avec certitude.) Les rôles auraient probablement été inversés si Eugene rencontrait un juge de langue ukrainienne.
La lutte pour construire une machine à parler met en évidence la complexité du langage. Ce n'est pas juste une question de discussion - vous devez parler de quelque chose et ce que vous dites doit avoir un sens - et cela doit l'être dans le contexte de ce que l' autre personne vient de dire. Pour nous, c'est facile. pour les ordinateurs, pas tellement. Ainsi, les chatbots s’appuient sur une panoplie d’astuces: mémoriser des mégaoctets de réponses prédéfinies ou rechercher sur Internet des dialogues qui pourraient se rapprocher de la conversation pour laquelle ils sont en train de prendre part. En d’autres termes, ce qu’une machine manque d’intelligence peut être compensée par une puissance de calcul brute. C’est la raison pour laquelle Google ou Siri (l’assistant personnel de l’iPhone) peuvent nous paraître si intelligents: Siri n’a peut-être pas un «esprit», mais il a accès à une base de données aussi vaste, il peut agir comme si c’était le cas. C’est le même type d’approche brutale qui a permis à «Watson» d’IBM de gagner à Jeopardy! en 2011.
Tout cela soulève une question cruciale: qu'est-ce que le test de Turing mesure exactement? Certains critiques ont suggéré que cela récompensait la ruse plutôt que l'intelligence. Le psychologue de l'Université de New York, Gary Marcus, écrit sur NewYorker.com que Eugene réussit «en exécutant une série de« stratagèmes »conçus pour masquer les limites du programme.» Steven Harnad, psychologue et informaticien à l'Université du Québec à Montréal, était encore plus sceptique, disant au Guardian qu'il était «complètement absurde» de prétendre qu'Eugene avait réussi le test de Turing. (À son crédit, Turing était bien conscient de ce problème; il a qualifié son idée de "jeu d'imitation" et n'a parlé que d'intelligence.) Encore plus maladroitement, l'ordinateur, contrairement à l'humain, est obligé de tromper. «Le test de Turing est vraiment un test de succès en tant que menteur», m'a confié Pat Hayes, informaticien à l'Institute for Human and Machine Cognition de Pensacola, en Floride, à la suite du marathon de test de Turing en 2012. "Si vous aviez quelque chose qui pourrait vraiment passer à côté du jeu d'imitation de Turing, ce serait un" imitateur humain très réussi "."
Et «humain» est l’autre élément clé: n’est-il pas possible qu’il existe d’autres types de renseignements dans le monde, autres que ceux de notre espèce? Une machine vraiment intelligente aurait d'innombrables applications pratiques, mais pourquoi se concentrer sur la création de plus de «personnes»? Après tout, nous avons déjà beaucoup de monde. Comme l’a souligné le linguiste Noam Chomsky, lorsque nous nous efforçons de construire une machine qui se déplace sous l’eau, nous n’avons pas besoin de «nager» - et un sous-marin n’est pas moins une réussite pour son incapacité à faire le dos.
Oui, Eugene est impressionnant, au moins par petites rafales. Et pourtant, même les meilleurs chatbots trébuchent sur des questions qu'un enfant à moitié d'âge d'Eugene pourrait traiter avec désinvolture. Il n’est peut-être pas surprenant que la plupart des chercheurs en intelligence artificielle consacrent peu de temps au test de Turing. En fait, l'intelligence artificielle progresse rapidement. Le logiciel de traduction de la voix en texte, qui était assez pathétique il y a quelques années à peine, s'améliore rapidement, de même que les programmes de traduction de langues. Amazon a souvent une assez bonne idée de ce que vous voulez acheter avant même de le faire. Et la voiture autonome de Google n'aurait été qu'un fantasme il y a dix ans. Mais nous continuons à redécouvrir, mais la conversation est vraiment difficile, et ce n’est pas la frontière dans laquelle l’intelligence artificielle brille le plus. Pour le moment, si vous cherchez quelqu'un avec qui discuter, je vous recommande un vrai humain.
Dan Falk est un journaliste scientifique basé à Toronto.