dimanche 28 octobre 2018

«Deep learning»: L'homme prend sa première grosse raclée par la machine en matière de traduction
REVOLUTION Une intelligence artificielle a traduit « Deep Learning », considéré comme un ouvrage de référence du genre…



Illustration
Illustration — Creative Commons
  • Quantmetry, expert en IA, et DeepL, start-up allemande spécialisée dans la traduction automatisée, se sont lancé le défi de faire traduire un livre de 800 pages par une intelligence artificielle.
  • L’Apprentissage profond, en précommande depuis plusieurs semaines, paraît le 18 octobre aux éditions Massot-Quantmetry.
  • Il a fallu seulement une dizaine d’heures à la machine pour venir à bout des 800 pages.
Le « monstre » merveilleux n’aura bientôt plus besoin de l’aide de son créateur. Dans le domaine de la traduction en tout cas. Pour la première fois de l’histoire, une intelligence artificielle a réussi à traduire un livre de 800 pages (presque) toute seule. Deep Learning -L'Apprentissage profond, en français-, paraît la semaine prochaine en VF aux éditions Massot-Quantmetry. Le texte original, écrit en 2016 par trois stars du deep learning, Yoshua Bengio (l’un des pères fondateurs des réseaux de neurones profonds), Ian Goodfellow et Aaron Courville, s’est rapidement imposé comme la bible du genre par la communauté scientifique.
Quantmetry, expert français en IA, et DeepL, start-up allemande spécialisée dans la traduction automatisée, ont développé un outil capable de porter le texte en français en très peu de temps (une dizaine d’heures pour donner une petite idée). « Au départ, nous voulions faire appel à des traducteurs classiques mais nous nous sommes confrontés à la problématique du temps et du coût », explique Alexandre Stora, manager du développement commercial chez Quantmetry. Avec un cerveau humain, il aurait fallu vendre 100.000 exemplaires pour rentabiliser l’ouvrage, sans compter le temps que ça lui aurait pris de travailler sur un texte de 800 pages.

L’IA produit du sens

DeepL, qui a doublé tout le monde en matière de traduction grâce au deep learning (la boucle est bouclée), s’imposait comme le parfait complice pour Quantmetry. « Son outil a un niveau de performance beaucoup plus fort que les solutions grand public du type Google Translate ou Bing Microsoft Translator qui font du mot à mot sur des phrases courtes », insiste Alexandre Stora. La start-up allemande, derrière Linguee, a nourri son intelligence artificielle d’un corpus de textes parfaitement traduits par l’homme : des textes de loi internationaux, des romans libres de droits… La machine cherche des équivalences, replace dans un contexte, elle produit du sens.
Mais l’ouvrage, composé de texte et de mathématiques, était écrit en format LateX, une sorte de Word pour les scientifiques. Il a fallu développer un outil spécifique, avec l’aide de quatre chercheurs français spécialisé dans le deep learning (Fabien Navarro et Salima El Kolei de l’ENSAI, Benjamin Guedj de l’Inria, Christophe Chesneau de l’Université Caen), pour traduire ce langage communément utilisé pour l’édition de livres ou d’articles scientifiques. « On a traduit une sorte de programme informatique qui dessine des maths sur une page, détaille Nicolas Bousquet, directeur scientifique de Quantmetry et professeur associé à Sorbonne Université, qui a chapeauté le projet. Ca ressemble à Microsoft Word, mais dedans, il y a des commandes qui font des maths et il a fallu les traduire de façon à ce qu’elles passent en français ». En bref, il fallait retrouver une cohérence entre les mots, qui représentent 35-40 % de l’ouvrage, et les formules scientifiques.

Les traducteurs bientôt au chômage ?

Et le résultat est impressionnant : aucune faute de sens n’a été repérée. Des petites corrections à la marge sur des formulations ont été apportées au texte final par l’équipe de chercheurs. C’est une première pour un livre de cette longueur. Cette expérience pourrait ouvrir l’accès à des ouvrages plus pointus qui, aujourd’hui, ne sont pas traduits, faute de lecteurs suffisants : des livres de recettes de cuisine nippones, des livres académiques très techniques… Moins cher et plus rapide, cette révolution technologique pose aussi la question du futur de ce métier.
Le traducteur a-t-il encore une raison d’être si une machine, développée en quelques semaines et entraînée quelques jours, arrive à traduire parfaitement un texte de près de mille pages ? « Les personnes qui écrivent des traductions de comptes rendus de réunion ou de notices d’aspirateur peuvent se sentir menacés, pas les traducteurs littéraires », nuance Nicolas Bousquet. La machine n’a pas les capacités de s’attaquer à un roman.
Tout le travail lié à la créativité, l’émotion, le second degré, la machine en est très loin. « L’outil de DeepL pourrait au moins servir à distinguer la littérature de ce qui n’en est pas », sourit le directeur scientifique de Quantmetry. Espérons que l’intelligence artificielle ne se dote pas d’un sens de l’humour tout de suite.

(Sur un champ de bataille, est-ce que les robots feront des prisonniers ou tueront-ils tout le monde ? note de rené)

Aucun commentaire: