Une machine neuronale pour améliorer Google Translate

Mickaël Bazoge |

Google Translate est un outil formidable mais à utiliser avec parcimonie — on ne sait jamais trop si la traduction donnée est correcte, si elle fait un contre-sens… ou si elle a un sens tout simplement ! Le moteur de recherche a néanmoins annoncé une nouveauté qui devrait sensiblement améliorer la qualité de ce service.

Google a modifié en profondeur le moteur de traduction en y injectant des techniques de machine neuronale. L’entreprise planche sur le sujet depuis un bon moment, et ses chercheurs sont parvenus à lui faire traduire des phrases entières plutôt que des morceaux de phrases. Cette technique utilise « un contexte élargi » qui aide le service à trouver la traduction la plus appropriée et la plus pertinente. L’objectif est de faire en sorte que la traduction soit la plus proche de celle que produirait un « humain parlant avec sa propre grammaire ».

Voici un exemple de l’allemand vers l’anglais, avec l’ancien moteur de traduction d’un côté, et le nouveau qui carbure à la machine neuronale de l’autre — Cliquer pour agrandir

Huit langues profitent de cette machine neuronale : de l’anglais vers le français, l’allemand, l’espagnol, le portugais, le chinois, le japonais, le coréen et le turc. Cela représente 35% de l’ensemble des requêtes de Google Translate. À terme, Google veut que les 103 langues de son service soient prises en charge de la même manière.

avatar TKZ | 

Bonne nouvelle! Les traductions étaient vraiment mauvaises. Personnellement j'utilise Linguee qui est pas mal pour avoir la traduction de mots ou expressions dans différents contextes.

avatar Lz | 

Effectivement Linguee est une excellente appli !

avatar twistan_ | 

Ils ont leur propre NDD en .google
Ça va bien chez eux

avatar rikki finefleur | 

Cela serait bien de déjà comprendre le contexte, ou que l'utilisateur lui dise.

avatar occam | 

@rikki finefleur

La méta-analyse de contexte est un des problèmes les plus ardus en traduction automatisée. C'est d'ailleurs une difficulté majeure pour un traducteur humain, des qu'il doit rendre compte du cadre de référence élargi.

Exemple : la phrase de Trump « I'll ask Apple to make all its iPhones in America » se traduit en chinois par « Xiaomi Huawei ».

avatar cecemf | 

@occam

XPTDR ??????

avatar PiRMeZuR | 

Moi qui pensait qu'ils faisaient appel au deep learning depuis des années pour ce produit ! Ça annonce une amélioration considérable de la traduction (qui est honnêtement déjà pas mal) !

avatar mrlupin | 

Bonne nouvelle , c'est pour bientôt le babelfish alors :)

avatar Hideyasu | 

Seulement 35% des requêtes pour les langues qui doivent représenter 90% de la population, amusant

avatar macinoe | 

Ce n'est pas le même calcul.

Les requêtes de traduction c'est d'une langue vers une autre. Les 35% représentent donc des combinaisons de 2 langues.

Les combinaisons possibles avec les 8 langues sont au nombre de 49.
10404 combinaisons avec les 103 langues.

35% des requêtes sont donc composées des 49 combinaisons parmi les 10404 possibles.

CONNEXION UTILISATEUR