juil 20

La traduction automatique séduit de plus en plus de sites Web d’actualité. Ces solutions semblent répondre à un problème difficile à résoudre avec les moyens traditionnels : comment diffuser en plusieurs langues un contenu rédigé dans une seule quand on publie des actualités plusieurs fois par jour ?

Un problème qui se pose pour les blogs les plus connus, mais qui apparaît encore plus crucial pour les journaux en ligne. C’est ainsi que le site du Ministère de la Culture (malgré l’indignation, justifiée, de la profession) et celui de La Tribune, dont les contenus ont peu de points communs, sont tous deux traduits dynamiquement par des logiciels, sans relecture humaine. Dans les deux cas, le contenu de la page Web active est envoyé au moteur de traduction lorsque l’internaute indique qu’il veut prendre connaissance de la version étrangère en cliquant sur un bouton. Quelques instants plus tard, la page traduite est affichée par le navigateur en lieu et place de la page d’origine.

Le résultat ? Catastrophique, pour le moment (lire à ce sujet la dépèche de l’AFP). Et pourtant, il y a de fortes chances qu’il s’améliore assez vite, au moins dans le cas de La Tribune. En effet, le quotidien économique a fait appel à Systran* pour assurer la traduction automatisée de son actualité. Systran, on le sait, exploite désormais un moteur de traduction hybride, qui complète l’analyse syntaxique traditionnelle du texte source par une analyse statistique, qui se fonde sur un corpus de textes similaires, et dont le fruit permet au logiciel de choisir la solution la plus fréquente entre deux propositions du moteur syntaxique. Le système de traduction de La Tribune fonctionne en ce moment à titre de test. On imagine sans peine qu’il s’agit en fait de constituer le corpus qui, une fois relu (espérons-le), alimentera le moteur après la période de test. Si c’est bien de cette façon que sont menées les opérations, il y a de grandes chances pour que la qualité de la traduction s’améliore subitement. D’autant que le champ lexical reste relativement restreint : tous les textes traitent de finances et d’entreprise.

Le Ministère de la Culture n’aura sans doute pas cette chance. En effet, le moteur de Reverso (qui a été développé à l’origine par promt) n’a pas connu de modification majeure ces dernières années. Quoique donnant d’excellents résultats, il fonctionne toujours sur la base d’une analyse syntaxique seule : la seule amélioration possible consiste à personnaliser les dictionnaires employés par le logiciel. Mais, pour cela, il faut savoir de quoi traiteront les textes à traduire. Il est probable que le degré de personnalisation apporté aux dictionnaires utilisés par le logiciel qui traduit le site du Ministère de la Culture est assez faible, puisque les textes ne sont pas connus à l’avance, et que les traductions ne sont pas modifiées par la suite. Comme, par ailleurs, le logiciel peut pas prendre en compte l’analyse statistique d’un corpus de documents, et qu’il traite des textes dont le spectre sémantique est très large, il a peu de chances d’améliorer ses performances dans ce cas précis**.

De toutes les façons, la traduction « à la volée » d’une page Web ne peut pas donner de résultats vraiment satisfaisants, quelles que soient les qualités des logiciels qui s’en chargent. Il faudrait confier la révision des textes traduits à des traducteurs professionnels, et intégrer les mémoires de traduction ainsi constituées au corpus de textes qui servent de base à l’analyse statistique réalisée par le logiciel. Et confier aux mêmes traducteurs le soin de mettre à jour, en cours de révision, les dictionnaires personnalisés employés par le logiciel. On obtiendrait alors un cercle vertueux, où pourraient se concilier rapidité et qualité. Le logiciel de Systran en a les capacités. Et c’est ce que souhaite réaliser Google avec son Google Translator’s Toolkit. Mais là où Google tente d’exploiter gratuitement le travail de traducteurs indépendants professionnels, il est possible de construire une véritable offre de service, payante, qui réponde aux besoins des donneurs d’ordre pour lesquels la rapidité est cruciale, sans pour autant sacrifier la qualité.

Ou bien les éditeurs de presse préfèrent-ils prendre le risque de diffuser des informations… fausses*** ?

———-
*Bien entendu, les produits de traduction automatique en question dans ce billet n’ont rien à voir avec ceux disponibles sur les sites Web de leurs éditeurs. Il s’agit des versions professionnelles, dont les résultats sont bien supérieurs.

** Sans compter que le site est desservi par une navigabilité particulièrement désastreuse depuis quelque temps. La traduction ne fonctionne pas sur toutes les pages, par exemple. Ou bien le nouveau Ministre aurait-il décidé de supprimer la traduction automatique de ces pages ? Affaire à suivre…

***Sur la question de la traduction automatique, ne pas manquer cet article du Monde.

Popularity: 59% [?]

icon1 Par: Guillaume | icon2 Actualité de la traduction
icon4 20 juil 2009| icon35 Commentaires »

copyright 2008 - 2012 © Anyword - Tous droits réservés