La plupart d’entre nous en conviendrons probablement, le logiciel de reconnaissance vocale est une bonne chose. Mais le fait de parler aux machines, qu’il s’agisse d’un smartphone, d’un écran de télévision ou d’un tableau de bord, n’est pas si grave. Demander conseil à un appareil? Des relents de geek. Énoncer chaque mot pour que vous puissiez être compris? Comment cool pouvez-vous vraiment être?
Mais Apple, fidèle à lui-même, a pris cette tête en embauchant trois icônes du cool pour jouer dans la dernière campagne publicitaire de Siri, la voix de l'iPhone 4S. Il y a Zooey Deschanel (Adorable Cool), John Malkovich (Cerebral Cool) et Samuel L. Jackson (Ultimate Cool), et tous font que s'engager dans un jeu de mots avec un téléphone semble être le sport des dieux.
Les critiques soulignent néanmoins que, dans la vie réelle, Siri n’est ni aussi réactive, ni aussi informative que ce qu’elle décrit dans des publicités. Vous aussi, j'en suis sûr, êtes choqué d'entendre cela. D'autres voient cela comme mûr pour la parodie - voyez le frère de Zooey, Jooey, faire une version Funny or Die du jour de pluie de Zooey et de Siri ensemble.
Peu importe. Siri est devenue la chanteuse principale du choeur de robots, la voix «You Got Mail» d'une nouvelle génération.
Il est à la mode dans certains milieux de suggérer que Siri n’est pas digne de Steve Jobs, que s’il était encore en vie, Jobs l’aurait retiré du marché ou, à tout le moins, n’aurait jamais approuvé une publicité aussi prestigieuse. campagne pour un produit si imparfait.
Mais comme le successeur de Jobs, Tim Cook, a déclaré plus tôt cette semaine, les propriétaires d’iPhone 4S comme Siri. Selon un sondage publié en mars, près de 90% des personnes interrogées l'utilisent au moins une fois par mois. Et gardez à l'esprit que Siri, l'un des rares produits Apple censés être en version bêta lors de sa sortie, ne fêtera pas son premier anniversaire avant octobre. Elle apprend toujours la langue et, ce qui est encore plus important, commence à exploiter le potentiel de l'intelligence artificielle.
Siri sera probablement une pièce maîtresse de l’Apple TV, qui devrait faire ses débuts en décembre. Mais il y a de fortes chances que l'endroit où parler aux machines se généralise soit dans nos voitures.
Conduire, dit-elle
Bien sûr, cela se produit déjà, mais vous devez toujours passer à la parole du robot si vous voulez être compris. Et même alors il n'y a aucune garantie. Cela commencera à changer cet été lorsque de nouveaux modèles seront équipés de quelque chose appelé Dragon Drive!
C'est l'invention de Nuance Communications, une entreprise du Massachusetts devenue un acteur majeur dans le secteur de la reconnaissance vocale. (On pense généralement que Siri est le cerveau). Nuance et la reconnaissance vocale dans les voitures ont fait un bond en avant la semaine dernière lorsque la firme a annoncé que Dragon Drive! sera en mesure de puiser dans le nuage.
Cela signifie que le système augmentera considérablement sa puissance de calcul et sa capacité de mémoire. Et cela signifie que la voix de votre tableau de bord deviendra plus semblable à Siri et vous permettra de converser réellement avec elle. Plus de cris monosyllabiques. Le jour vient où vous pourrez mentionner avec désinvolture que vous vous sentez comme un Allman Brothers et quelques secondes plus tard, «Whipping Post» viendra pomper à travers les haut-parleurs.
La clé est notre capacité à enseigner le contexte et la pragmatique des machines - comment le langage est utilisé dans des situations sociales. Et c'est une affaire délicate. Pour commencer, même le dispositif de reconnaissance vocale le plus sophistiqué doit attendre qu'un humain ait fini de parler pour pouvoir analyser et interpréter la phrase entière. Ensuite, il y a la «théorie de l'esprit», la capacité de comprendre que d'autres personnes peuvent avoir des croyances et des intentions différentes des nôtres. Autant que nous sachions, seuls les humains peuvent le faire.
Une étude récente réalisée par deux psychologues de Stanford peut vous donner une idée de ce qui est impliqué pour aider les machines intuitivement. Les chercheurs Michael Frank et Noah Goodman ont mis en place une expérience en ligne dans laquelle les participants étaient invités à examiner un ensemble d’objets, puis à choisir celui qui correspondait à un mot particulier. Par exemple, un groupe de participants a vu un carré bleu, un cercle bleu et un carré rouge. La question pour ce groupe était: Imaginez que vous parlez à quelqu'un et que vous voulez vous référer à l'objet du milieu. Quel mot utiliseriez-vous, «bleu» ou «cercle»?
On a demandé à l’autre groupe: Imaginez que quelqu'un vous parle et utilise le mot «bleu» pour désigner un de ces objets. De quel objet parlent-ils?
Les réponses ont aidé les chercheurs à mieux comprendre comment un auditeur comprend un orateur et comment un orateur décide quoi dire. À partir de là, ils ont développé le type de modèle mathématique capable d’élargir et d’affiner le processus de pensée d’un ordinateur.
Frank a déclaré: "Cela va prendre des années de travail, mais le rêve est d'un ordinateur qui pense vraiment à ce que vous voulez et à ce que vous voulez dire plutôt qu'à ce que vous avez dit."
Une manière de parler
Voici quelques développements plus récents dans la reconnaissance vocale:
- Siri se tait: IBM a tendance à être très nerveux à l'idée de dévoiler des secrets d'entreprise. Par conséquent, il interdit désormais à ses employés d'utiliser des sites publics de transfert de fichiers, tels que Dropbox. Mais il interdit également l'utilisation de Siri au bureau, car les responsables de la sécurité craignent que quelqu'un, tout en conversant avec leur téléphone, puisse révéler des informations sensibles qui aboutissent sur les serveurs d'Apple.
- Prenez cela, Apple!: Samsung a lancé son nouveau smartphone Galaxy X III à Londres cette semaine. Bien que son grand écran tactile retienne toute l'attention, il propose également un nouveau logiciel de reconnaissance vocale et faciale.
- Fais ce que je dis, pas ce que je fais: Et Samsung ne s'arrête pas là. Elle a récemment déposé une demande de brevet pour un robot qui comprend la parole humaine. Le robot serait capable d'ajuster ses capacités d'écoute pour prendre en compte le bruit ambiant susceptible d'interrompre ou de perturber les commandes qui lui ont été données. Il serait également capable de reconnaître qui parle, même si le bruit de fond est très fort.
Bonus d'infographie: vous pensez que votre voiture est informatisée maintenant. Attendez qu'il soit complètement branché sur Internet. Obtenez des informations sur ce qu'une voiture connectée peut faire.