https://frosthead.com

Embrasser les barrières linguistiques

Pendant longtemps, le traducteur universel a été une obsession de la culture pop. Star Trek le présente comme un ordinateur de poche, ressemblant à un microphone, capable de traduire immédiatement la plupart des langues . Le Guide de l'auto-stoppeur de la galaxie comprend un poisson Babel, une créature qui, coincée à l'oreille, offre une traduction instantanée de toutes les langues de la galaxie.

Il n’est donc pas surprenant que les humains actuels essaient de créer un appareil qui fonctionne aussi bien. Des dizaines d’applications de traduction pour smartphone existent, mais la plupart traduisent les mots sur une base simple et personnalisée. un utilisateur tape ou parle un mot et l'application rebondit avec une traduction. À présent, l’objectif, et la véritable aubaine monétaire, est de permettre aux ingénieurs et aux entrepreneurs de permettre à deux personnes de converser dans des langues différentes, tandis qu’un petit appareil génère des traductions en temps réel.

Applications de traduction existantes

Lors d'un voyage en Grèce, Andrew Lauder, anglophone, est tombé malade.

«Je suis allé à la pharmacie et, comme ils ne comprenaient pas l'anglais, je n'ai aucun médicament», déclare Lauder, PDG de Vocre Translate. Les étiquettes de drogue étaient littéralement grecques pour lui. Les barrières linguistiques sont courantes chez les voyageurs du monde entier. Dans un pays étranger, de petites transactions telles qu'acheter des médicaments ou obtenir des instructions - une autre difficulté que Lauder a rencontrée - deviennent des tâches herculéennes.

À son retour aux États-Unis, Lauder crée Vocre Translate, une application de traduction vocale et textuelle. Cela a commencé comme une application de texte à texte (appelée MyLangauge), qui a ensuite été transformée en un modèle de synthèse vocale qui, comme d’autres applications comme SayHi Translate, utilisait un modèle traditionnel dans lequel un mot était traduit directement en un autre. Dites «Bonjour» et le smartphone ou la tablette émettra un «Hola» automatisé. «Au revoir» devient «Sayonara». Et ainsi de suite, un peu comme un traducteur de texte.

Pour créer la traduction audio simple, les créateurs de ces applications avaient besoin de données. Vocre a puisé ses informations dans des enregistrements et des documents du domaine public, tels que de vieux films ou des auditions publiques. «Nous avons essentiellement demandé à un service de transcription de messagerie vocale de nous laisser utiliser leur cloud pour la reconnaissance vocale», a déclaré Lee Bossier, PDG de SayHi.

Une fois que les ingénieurs disposaient de données audio et texte, ils ont couplé l’audio et le texte, mot pour mot. Le logiciel de reconnaissance vocale reconnaît le «fromage» et le convertit en texte. Cela est converti en français et l'application trouve la prononciation française de «fromage».

Cela dit, si un utilisateur appelle de façon effrontée quelque chose de "ringard", le traducteur ne fonctionne pas aussi bien, car le langage parlé n'est pas aussi statique que le langage écrit. La cadence, l'argot, la flexion, la prononciation, le dialecte et l'écoulement conversationnel peuvent changer de sens

Au fil du temps, Lauder souhaitait un appareil plus conversationnel. Dans un courrier électronique, il déclare: «D'après nos données d'utilisation, nous avons constaté que les gens parlent très différemment de la façon dont ils écrivent. Les mots parlés sont beaucoup plus spontanés et beaucoup moins formels et littéraux. »Il a donc eu recours à la traduction automatique statistique, une approche également utilisée par Google qui utilise les données pour rechercher un usage courant des mots, en renonçant au modèle traditionnel de traduction mot à mot. Fondamentalement, Vocre apprend comme il est utilisé. «Il apprend en fonction de chaque conversation, de chaque phrase qui la traverse. C'est quelque chose qui devient plus intelligent avec le temps », déclare Lauder.

Cependant, pour le moment, les deux applications mettent quelques secondes à traduire, mais sont sans aucun doute efficaces, en particulier de concert avec le langage corporel, pour les conversations transactionnelles telles que la commande d'un repas. Après tout, les humains commandent des aliments dans des langues non autochtones depuis des années et parviennent toujours à manger. Mais ils n'ont pas pu avoir de conversations approfondies et complexes.

Avec Vocre et SayHi, les conversations peuvent très difficilement se dérouler, mais ce n'est pas la même chose que de bavarder dans votre langue maternelle. Google a l'intention de changer cela complètement.

Approche de Google (traduction automatique statistique)

Lors de l’apprentissage d’une nouvelle langue à l’école, nous commençons par les termes individuels du vocabulaire. Mais la langue est plus fluide - les mots ont besoin de contexte.

«L’approche adoptée par Google est une approche plus générale», explique Josh Estelle, ingénieur logiciel pour Google Translate. "Au lieu d'essayer de coder en dur toutes ces règles, nous essayons de les apprendre en examinant des données."

La société de technologie évite la méthode un-à-un mot-à-mot et utilise plutôt une traduction automatique statistique, ne cherchant pas à déterminer le sens des mots mais la manière dont le langage est modélisé, qu’elle apprend au moyen de données . Donc, il vise la forêt, pas les arbres. Un exemple en anglais: nous connaissons les définitions du mot «break» et «up». Mais l'expression «break up» n'est pas la combinaison littérale des deux mots.

La traduction automatique statistique nécessite des données. Des montagnes. Pour que la méthode fonctionne, il faut non seulement que fromage soit français, mais 100 exemples de fromage et de fromage utilisés dans des phrases réelles.

Estelle dit que si un anglophone a deux menus, identiques à l'exception du fait que son imprimé est en anglais et l'autre en chinois, "vous pouvez probablement déterminer le caractère chinois de" soupe ". Le contexte est roi. Mais pour créer ce contexte, vous devez avoir accès à des millions de menus et à tout autre document imaginable.

Ce qui est exactement ce que Google a. Sans le géant du Web pour rassembler des tas de données, un poisson Babel du monde réel ne pourrait exister. Il explore le Web et collecte tout - le texte et l'audio. Ensuite, il introduit ces données dans des algorithmes qui comparent tout à tout le reste. Ces comparaisons aident à comprendre le fonctionnement naturel du langage.

«Une chose qui surprend les gens quand nous parlons de Translate, c'est que notre équipe ne compte aucun linguiste», déclare Estelle. «Nous avons lancé 71 langues et je dirais que notre équipe ne sait pas parler la grande majorité d’entre elles. Un traducteur humain ne pourra pas apprendre tous ces termes et ces choses aussi rapidement que nos [données] ne peuvent apprendre du Web. ”

À quoi ça sert?

Comme Google, Facebook voit des avantages. Considérez la propre incursion du site de média social dans la traduction.

«La mission de Facebook consiste à connecter le monde entier et l'un des obstacles à la connexion au monde n'est pas que tout le monde parle la même langue», déclare Tom Stocky, directeur de l'ingénierie chez Facebook. «En ce qui concerne la traduction, je pense que la vision la plus ambitieuse du futur est de pouvoir utiliser Facebook dans votre langue maternelle et d’interagir avec n’importe quelle autre langue.»

En août dernier, Facebook a acquis Jibbigo, une application de traduction vocale disponible pour les appareils Android et iOS.

Les utilisateurs enthousiastes de Facebook noteront que le site social utilise déjà quelques traductions. Si vous avez déjà eu une publication en espagnol sur votre page en anglais, vous avez immédiatement eu la possibilité de la traduire dans votre langue maternelle.

Mais Stocky voit la composante vocale comme un changeur de jeu potentiel. La montée en puissance des smartphones et des tablettes accueille un monde toujours interconnecté, et la montée en puissance des logiciels de reconnaissance vocale invite de nouveaux moyens d’interaction sur le Web. Stocky envisage un avenir dans lequel les utilisateurs peuvent simplement dire une commande à leur smartphone et interagir avec d'autres utilisateurs, à part les différences de langue.

«Il ne fait aucun doute que cela finira par se produire, car les seules limites sont la puissance du moteur de langage et bien sûr le temps de traitement et la puissance de traitement», déclare-t-il.

Laura Murphy, professeure au département des systèmes de santé mondiaux et du développement à l'Université Tulane, et sceptique quant à la technologie, s'interroge sur la valeur d'un traducteur universel et ne nécessite pas de connaître plus d'une langue.

Elle pense que l'appareil pourrait être quelque peu utile avec les voyages, les affaires et les relations internationales mais pas révolutionnaire. À un certain niveau, nous avons déjà des traducteurs (personnes) en place, et la plupart des personnes travaillant dans les relations extérieures connaissent les langues appropriées. Selon Murphy, un appareil pourrait avoir des conséquences négatives.

«Je pense que cela peut rendre les gens paresseux», dit Murphy. Traduire des langues peut être un défi mental en forçant le cerveau - en particulier celui qui connaît plus de deux langues - à travailler de manière différente, mais l'exercice est néanmoins gratifiant. Le cerveau tire d'un lieu d'empathie linguistique que même le meilleur traducteur vocal ne pourrait jamais atteindre.

Murphy reconnaît que cette communication universelle pourrait être positive, "cela pourrait amener les gens à penser qu'ils communiquent quand ils ne le font pas". La culture n'est pas toujours totalement incarnée dans le langage (prenez le sarcasme, par exemple), et la communication ne l'est pas toujours à propos de l'information transmise.

Quand pouvons-nous espérer voir cette technologie?

«En 2005, il nous a fallu 40 heures pour traduire 1 000 phrases», explique Estelle de Google. «Aujourd'hui, nous traduisons l'équivalent de 1 000 phrases toutes les 10 millisecondes.»

Comme Richard Anderson l'a dit dans la série télévisée des années 1970 The Six Million Dollar Man : «Nous avons la technologie.» Il ne reste plus qu'à attendre la collecte et l'analyse des données. Combien de temps cela prendra-t-il, reste inconnu, selon Estelle. Mais des estimations prudentes mettent un tel dispositif entre nos mains dans une décennie.

Bien que les créateurs d'applications comme Bossier ou les sociétés géantes telles que Google et Facebook ne veuillent pas construire leurs propres versions de la Tour biblique de Babel, il souhaite mettre fin au babillage. Il envisage un monde où nous communiquons tous, à propos de la médecine, de la politique, des idées.

Et, ce monde pourrait ne pas être loin.

Note de la rédaction: Nous avons mis à jour cette histoire le 4 avril 2014 afin de décrire avec précision la technologie Vocre Translate.

Embrasser les barrières linguistiques