"La traduction automatique, c'est pour demain !" nous claironne-t-on depuis de nombreuses années. Dans ce cas, pourquoi ses progrès sont-ils aussi lents et ses résultats parfois aussi ridicules ? Quelques éléments de réponse.


Photo : (c) Loïc Bourigault via Traductions de m...

Il ne se passe pas une semaine sans que l'on ne nous annonce à grand renfort de communiqués de presse joyeusement repris par certains médias les immenses progrès réalisés par tel éditeur de logiciels, tel autre géant de l'internet proposant un service de traduction en ligne, ou encore les millions investis par le Pentagone dans une hypothétique machine à traduire qui permettrait à ses soldats de dialoguer avec les habitants d'une contrée reculée du monde sans l'intervention, délicate et coûteuse, d'un interprète humain.

Pourtant, il est évident pour quiconque se trouve amené à évaluer les résultats bruts de la traduction automatique dans les domaines où elle pourrait être utile, que cette dernière demeure à ce jour, dans le meilleur des cas, un outil permettant, malgré une forme plus qu'imparfaite, d'appréhender le sens approximatif d'un texte rédigé dans une langue étrangère que l'on ne déchiffre pas, et dans le pire des cas, une source d'hilarité pour les dizaines de milliers d'abonnés aux pages diffusant les grossières erreurs de traduction commises par ces outils.

C3PO, droïde de protocole maîtrisant plus de 6 millions de langues, flanqué de Luke Skywalker, pitoyable humain monolingue - Photo : (c) LucasFilm


Frustration technologique

Au-delà de l'optimisme teinté de marketing affiché par les créateurs des outils de traduction automatique, on peut aisément comprendre la frustration d'une grande partie du public. L'humanité a envoyé des hommes sur la Lune, des robots parfaitement autonomes sur Mars, fabriqué des ordinateurs dont la puissance augmente de manière exponentielle chaque année, sur lesquels on exécute des logiciels capables de prouesses dont on n'aurait pas rêvé il y a seulement une décennie. On a photographié chaque mètre carré habité de la planète depuis l'espace et l'on peut aujourd'hui visualiser n'importe quelle ruelle située à l'autre bout du monde en quelques clics sur Internet, réseau sur lequel on peut par ailleurs avoir accès à la majeure partie des connaissances actuelles dans à peu près tous les domaines de l'activité humaine. Et parallèlement, on ne serait pas en mesure de concevoir un logiciel capable de traduire de manière intelligible et sans erreur entre plusieurs langues ? C'est presque incompréhensible.

Nous sommes encore loin ne serait-ce que de l'ombre d'un C3PO, que George Lucas imaginait maîtriser plus de 6 millions de formes de communication. En réalité, même la traduction de messages relativement anodins entre les langues les plus parlées sur terre, telles que l'anglais, le mandarin, l'espagnol ou le français, peut se révéler semée d'embûches pour les logiciels de traduction. Alors, à quand une traduction automatique fiable ?

Capture d'écran : (c) Clo Ning via Traductions de m...

De la méthode linguistique à la méthode statistique

Il faut admettre que la traduction automatique a accompli d'immenses progrès ces dernières années, principalement grâce à un radical changement de méthodologie. En effet, plutôt que de tenter, comme on le faisait jusque là, d'établir des équivalences lexicales et syntaxiques entre les langues et des règles de conversion entre ces dernières, on a fait le choix d'exploiter d'immenses bases de données de traductions existantes, généralement réalisées par des traducteurs humains. A partir de l'analyse du contexte verbal, un algorithme complexe détermine quelle est la traduction qui, statistiquement, a le plus de probabilités de correspondre.

C'est ainsi que l'on est passé du charabia incompréhensible produit par les traducteurs automatiques du début des années 2000 à des textes parfois tout à fait intelligibles… puisque rédigés, à l'origine, par des humains. Néanmoins, si la forme s'est améliorée, force est de constater que des éléments pourtant d'une grande simplicité peuvent être à l'origine d'erreurs grossières, qu'un traducteur humain même novice ne ferait pas.

Un parcours semé d'embûches

Sur quoi butent donc les machines ? Les obstacles que l'on cite le plus souvent sont la polysémie, l'absence ou l'insuffisance de contexte, les erreurs ou imprécisions du texte source ou encore les aléas de la reconnaissance vocale.

La polysémie est l'éternel écueil de tout traducteur automatique. Un "présent" peut ainsi désigner un cadeau… ou une personne présente à une assemblée ou dans une salle de classe. Un "sol" peut être une surface plane sur laquelle on marche, mais également une note de musique, une pièce de monnaie péruvienne, et au féminin, une bière mexicaine. Une "action" peut désigner ce que l'on fait, mais également une participation dans le capital d'une entreprise. Quant à une "obligation", il peut s'agir d'une contrainte légale ou morale, d'un devoir, d'un engagement pris, d'une responsabilité, d'une dette contractée, ou encore, en matière financière, d'un titre de créance. Le problème est, bien évidemment, que dans la plupart des cas, chacune de ces notions se traduira différemment dans la langue cible.


Photo : (c) Maurin Ciquié via Traductions de m...

L'analyse du contexte verbal sur lequel se fonde la méthode statistique permet d'éviter un certain nombre de ces écueils… mais encore faut-il qu'il y ait un contexte verbal suffisant, et c'est souvent pour les messages courts, typiquement ceux que l'on affiche à destination du public, que les erreurs de traduction sont les plus spectaculaires. Or, c'est bien souvent pour ce type de messages, pour lesquels on a besoin d'une traduction disponible rapidement et à moindre coût, que l'on choisit de se passer des services d'un traducteur humain, avec les résultats que l'on connaît et qui font rire au quotidien les réseaux sociaux.

Par ailleurs, l'erreur dans le texte source, qu'il s'agisse d'une faute de frappe, d'orthographe, de l'absence d'une majuscule ou d'un trait d'union, peut modifier sensiblement le sens d'un mot, et induire ainsi en erreur le logiciel de traduction.

Enfin, lorsqu'il s'agit des logiciels d'interprétation, qui en sont à leurs balbutiements mais qui sont appelés à se développer, on peut également citer comme obstacles les différences d'élocution d'un individu à l'autre, les accents régionaux, les expressions familières ou argotiques, le contexte sonore ou encore le caractère parfois décousu du langage oral.

Le sens, pièce manquante du puzzle

Néanmoins, ces problématiques sont en réalité de l'ordre du détail si l'on considère ce que tout traducteur humain sait plus ou moins consciemment, selon qu'il ait acquis ses compétences par l'expérience ou qu'il ait étudié cette matière : le fait que l'on ne traduise pas des langues, mais du sens.

Ce postulat, qui peut paraître obscur au néophyte, est pourtant la règle fondamentale qui prévaut en traduction : traduire ne consiste pas à trouver des mots et des expressions dans la langue cible correspondant à d'autres mots et expressions formulées dans la langue source; en procédant ainsi, on ne traduit pas, on transcode; c'est ce que l'on appelle dans le langage courant une "traduction mot-à-mot", qui, vous l'aurez compris, n'a de traduction que le nom. Traduire, cela consiste à comprendre le message du texte source, à en extraire le sens, puis à reformuler ce même message dans la langue cible, de la manière dont un locuteur natif de cette langue aurait formulé ce message dans des circonstances similaires.

Pour éclairer cette définition de la gymnastique mentale du traduire, il est utile de signaler que le sens d'un message ne découle pas exclusivement des mots couchés sur le papier ou prononcés à un pupitre. Le sens découle également du contexte : du contexte verbal que l'on retrouve dans d'autres parties du texte, mais aussi et surtout du contexte cognitif, en d'autres termes, de la connaissance que possède l'auteur du message et ses lecteurs (ou son public) sur le sujet dont il est question, ainsi que des circonstances dans lesquelles le message est délivré. C'est ce à quoi fait référence l'expression courante "lire entre les lignes": de nombreux textes et discours ont un contenu elliptique, que les circonstances et les connaissances des lecteurs rendent pourtant limpides.

Bien évidemment, le travail du traducteur consiste, au moment de la traduction, à évaluer si le message sera compris du lecteur étranger, dont les connaissances et références culturelles ne sont pas forcément équivalentes, et le cas échéant, à reformuler de manière à ce que le sens explicite et implicite du message soit transmis. 

Le rôle essentiel de la compréhension du sens et du contexte dans le processus de traduction explique également le fait que le traducteur humain, même peu expérimenté, ne butera ni sur la polysémie, ni sur les erreurs éventuelles contenues dans le texte source: dès lors que le "vouloir-dire" de l'auteur est clair dans l'esprit du traducteur, la question du sens ne se posera généralement pas, et dans l'exercice de cette profession, nombre de traducteurs vous diront que neuf textes sur dix contiennent des erreurs, fautes de frappe ou d'orthographe. L'erreur est humaine, et le traducteur rétablit le sens là où la machine trébuche et s'étale lamentablement.

Photo : (c) Marc Moreau via Traductions de m...

Retour à la case départ

Il est dès lors évident que la traduction automatique, en l'état actuel des connaissances technologiques, est encore à mille lieues du but recherché.

Tout au plus parvient-elle à trouver, dans des bases de données en constante croissance, des phrases ou bouts de phrases traduites par le passé par des humains, et à l'aide d'un calcul de probabilités basé exclusivement sur le contexte verbal, lorsqu'il y en a un, arrive-t-elle dans certains cas à tomber juste.

Avec la croissance des bases de données, il est probable que l'intelligibilité des traductions automatiques ainsi obtenues s'améliore encore davantage. C'est en cela que réside l'illusion d'optique qui fait croire aujourd'hui à nombre d'observateurs que des outils de traduction automatiques fiables seront à notre portée dans quelques années.

Le caractère intelligible de certaines traductions obtenues est d'ailleurs à double tranchant, puisque leur intelligibilité n'est en rien une garantie de fidélité au texte source.

En réalité, malgré des résultats bien plus intelligibles que par le passé, à aucun moment la traduction automatique telle qu'elle est conçue aujourd'hui n'intègre la compréhension du sens, du contexte ou encore de l'intention de l'auteur du texte ou des propos traduits, qui est pourtant fondamentale à la mécanique même de la traduction, et constitue la clé d'une traduction réussie.

Pour en arriver là, il faudra développer des formes d'intelligence artificielle à proprement parler. S'il est fort possible que l'humanité y parvienne un jour, ce jour n'est pas pour demain, les traducteurs humains ont encore de belles années devant eux… et les réseaux sociaux ne sont pas à court de "perles" issues de la traduction automatique.



 A propos de l'auteur:

Jack Przybylski est traducteur juridique et financier à Paris et fondateur du cabinet JP Stemler. Il est également chargé de cours en traduction à l'Université Sorbonne-Nouvelle - Paris 3, administrateur de la page humoristique Traductions de m…  et membre de la SFT, syndicat français des traducteurs professionnels.