juin 10

Nous l’avions déjà évoqué plusieurs fois sur ce blog par le passé, et… ça y est ! Google lance le Google Translator Toolkit, un nouvel outil qui semble constituer la première pierre du service Google Translation Center, ou, tout simplement, le remplacer intégralement. En effet, l’accès à la version d’évaluation du service renvoie vers la page d’accueil du Toolkit.

Le Toolkit agit à la fois comme une mémoire de traduction et comme un moteur de traduction automatique. Il permet au traducteur de charger un fichier et de le traduire segment par segment, d’une façon très semblable à SDL Trados, Wordfast, Similis ou DéjàVu pour ne citer que ses principaux compétiteurs. Lorsque le segment est trouvé dans une des mémoires de traduction disponibles, c’est le segment cible correspondant qui est renvoyé à l’utilisateur en colonne de droite. Si le segment n’est pas reconnu, Google renvoie une traduction automatique issue de son moteur. Toutefois, si le traducteur refuse de faire appel à la traduction automatique, la phrase source s’affiche à la place du segment-cible pour permettre au traducteur de travailler par écrasement.

Mais Google ne se contente pas de concurrencer les éditeurs de logiciels de mémoires de traduction. Il va plus loin encore puisqu’il encourage les traducteurs à partager leurs mémoires. Dès qu’une mémoire est publiée, elle s’aggrège à la mémoire de traduction « globale », d’où proviennent les suggestions cibles renvoyées à tous les travaux de traduction. Tous les traducteurs peuvent noter la traduction de telle ou telle phrase issue de la mémoire globale ou des mémoires partagées auxquelles ils ont accès, cette note étant ensuite utilisée pour hiérarchiser les résultats des recherches de segments. Chaque traducteur gère autant de mémoires qu’il le souhaite dans son environnement (le workbench…). Les travaux déjà réalisés avec d’autres outils ne sont pas perdus, puisque les mémoires de traduction existantes peuvent être téléchargées dans le Toolkit à condition d’avoir été enregistrées au format TMX, et de ne pas dépasser les 50 Mo*. La mémoire globale et les mémoires partagées alimentent bien entendu le système d’apprentissage du moteur de traduction statistique de Google Translate, qui se perfectionne ainsi sans cesse.

Comme l’outil cible en particulier les traducteurs professionnels indépendants, il est facile d’importer des glossaires (au format CSV), dont le contenu est disponible en cours de traduction. Comme toujours avec Google, l’interface est d’une simplicité enfantine, et personne n’aura de difficulté à la prendre en main.

Pour l’instant, le Google Translator Toolkit n’est disponible que pour l’anglais en langue source, et 47 autres langues en langue cible. Il est aussi possible que la question des droits d’exploitation du contenu posté par les utilisateurs ne soit pas encore réglée. Mais l’outil est disponible et il va sûrement contribuer à modifier profondément la façon de traduire et de vendre les services de traduction professionnels. Les agences de traduction ont sans doute une réflexion approfondie à mener sur la question.

Plus d’informations sur Blogoscopped, et sur Google Blog

Vidéo de présentation du Toolkit :

*Merci à Nicolas (<a href= »http://www.anotherword.fr/ »>http://www.anotherword.fr/</a>) d’avoir signalé mon erreur : j’avais lu 50 Go, mais c’est « seulement » 50 Mo, ce qui fait quand même pas mal pour une mémoire en TXT…

Popularity: 97% [?]

copyright 2008 - 2010 © Anyword - Tous droits réservés