Systran et Multicorpora préparent un outil de traduction automatique intelligent

Systran et MultiCorpora annoncent qu’ils mettent en commun leurs technologies pour intégrer le moteur de traduction automatique de l’un à MultiTrans, le logiciel à mémoire de traduction de l’autre. L’objectif avoué est de concilier qualité de traduction et capacités à traiter des volumes élevés. Le projet, qui semble pour le moment limité à la version client-serveur de MultiTrans, ressemble à ce que propose déjà SDL Trados dans sa dernière version.

Toutefois, l’annonce est à mettre en liaison avec un précédent communiqué de presse de Systran. En juillet dernier, l’éditeur de logiciels de traduction automatique annonçait en effet que la version en cours de développement intègrerait plusieurs approches pour accroître la pertinence de ses suggestions (nous en parlions ici).

C’est ce futur moteur de traduction, dont les résultats ont toutes les chances d’être grandement améliorés par rapport à aujourd’hui, qu’il s’agit sans doute d’intégrer à MultiCorpora. Et ça change tout quant à ce qu’on peut en espérer. Ajoutez à l’ensemble des dictionnaires « maison » et vous avez effectivement toutes les chances d’obtenir des traductions de très bon niveau. Si les traducteurs professionnels indépendants pouvaient bénéficier d’outils de traduction aussi avancés, nul doute que la productivité du métier ferait des bonds de géant, et que nous serions tous mieux placés pour concilier qualité professionnelle humaine et productivité industrielle machine.

Google veut rendre le Web polyglotte avec la traduction automatique des sites

Google a développé pour les entreprises un programme que le grand public a toutes les chances de retrouver en ligne d’ici peu de temps. Il s’agit, pour une requête donnée, d’afficher les résultats dans la langue de l’internaute, quelle que soit la langue d’origine du document indexé.

Aujourd’hui, si je fais une recherche sur « agence de traduction » dans Google, j’obtiens en retour 2 780 000 résultats renvoyés par www.google.fr. Mais, si je tapais « translation agency », j’en obtiendrais 3 530 000 renvoyés par www.google.co.uk et www.google.com. Il ne s’agit évidemment pas des mêmes sites et documents, certains étant situés en France, d’autres au Royaume Uni et aux États-Unis. Le projet consiste en fait à renvoyer les résultats, en français, pour « agence de traduction » comme si j’avais tapé la requête dans chacune des 35 langues du moteur de traduction de Google. Car, bien évidemment, la traduction « à la volée » des résultats serait assurée par Google Translate.

Je ne suis pas sûr qu’il faille se réjouir de la disponibilité d’une telle fonction. Sans même évoquer la question de la qualité de la traduction automatique assurée par Google (il y aurait pourtant beaucoup à dire), je crains que l’usage principal du Web ne soit en fait local, et pas du tout mondial. Les internautes qui tapent « agence de traduction » cherchent pour la plupart à contacter une agence dans leur pays (et même souvent dans leur région ou leur ville). Ceux qui tapent « cadeaux de Noël » ou « vêtements en soldes » ou « voitures d’occasion » (des requêtes beaucoup plus fréquentes que « agence de traduction ») sont aussi à a recherche d’un service ou d’un produit local. Que leur apporteront des résultats en provenance des États-Unis ou d’Asie ?

Mon autre préoccupation est liée au référencement des sites Web renvoyés en résultat : quelles règles s’appliqueront pour le classement des sites ? Les sites cités en premier seront-ils ceux considérés comme les plus proches de l’internaute ? Ou bien s’agira-t-il de ceux les plus fréquentés ? Dans ce cas, les zones géographiques comportant le plus d’internautes seraient privilégiées et, loin de devenir multilingue, le Web diffuserait encore plus la culture américaine.

Un traducteur électronique en langue des signes au CES de Las Vegas

Cette année, le CES (Consumer Electronic Show) de Las Vegas présente comme toujours de nombreuses nouveautés technologiques, parmi lesquelles un traducteur électronique en langue des signes.
Ce petit dispositif, fabriqué par la société Viable, a la taille d’un simple cadre photo numérique auquel on aurait ajouté un webcam. Il reconnaît les gestes d’une personne s’exprimant devant lui en langue des signes, et les interprète à l’oral et en anglais à destination d’un interlocuteur téléphonique. Glenn Lockart, PDG de Viable, est lui-même sourd et voulait pouvoir discuter par téléphone avec sa famille. On espère que l’appareil sera bientôt disponible dans de nombreuses autres langues…

Un traducteur automatique pratique et simple

le site de traduction nicetranslator est un traducteur automatique pratique et simpleLe site de traduction nicetranslator propose une élégante façon de traduire des phrases courtes en autant de langues que vous le souhaitez. S’appuyant sur les API de traduction automatique que Google a mis dans le domaine public, nicetranslator constitue essentiellement une interface différente pour le même service.

C’est précisément le point fort du site, dont l’usage est d’une facilité déconcertante. on tape une phrase dans la zone de texte du haut, on sélectionne dans le menu du bas les langues dans lesquelles on veut obtenir la traduction de son texte d’origine et hop, c’est fait! On peut aussi préselectionner ses langues de destination. Dans ce cas, nicetranslator affiche la traduction au fur et à mesure qu’on tape le texte à traduire. L’expérience est amusante, parce que l’outil propose des phrases de destination successives, qui ne correspondent pas à la phrase d’origine, jusqu’à ce qu’on ait terminé la frappe.

Bref, nicetranslator est un outil de dépannage très utile, pour chercher le sens d’une expression étrangère ou pour savoir comment se traduit une locution donnée, voire pour traduire des SMS ou des e-mails. Comme Google Translate (qui a d’ailleurs changé de look, comme on peut le voir ici), nicetranslator propose les langues source et cible suivantes* :

  • Allemand
  • Anglais
  • Arabe
  • Bulgare
  • Catalan
  • Chinois
  • Coréen
  • Croate
  • Danois
  • Espagnol
  • Finois
  • Français
  • Grec
  • Hébreu
  • Hindi
  • Indonésien
  • Italien
  • Japonais
  • Letton
  • Lituanien
  • Néerlandais
  • Norvégien
  • Philippin
  • Polonais
  • Portugais
  • Roumain
  • Russe
  • Serbe
  • Slovaque
  • Slovène
  • Suédois
  • Tchèque
  • Ukrainien
  • Vietnamien

*Anyword dispose de traducteurs professionnels humains dans la plupart de ces langues de traduction.

Le site de traduction de Microsoft comparé à Google et PROMT

Microsoft Live Translator traduit du texte Microsoft

Le blog de l’équipe de développement de Microsoft Live Translator présente une nouvelle fonctionnalité, qui permet de visualiser côte à côte le texte source et le texte cible. Ca donne le résultat que l’on peut apercevoir dans l’illustration ci-dessus. Rien de bien révolutionnaire, puisque la même chose existe dans Word, mais c’est vrai que c’est bien pratique… Sauf qu’il y a de quoi être atterré, à première vue, par la traduction proposée ! Comme le sujet initial du texte concerne des outils Microsoft, on serait pourtant en droit de s’attendre à ce que le dictionnaire interne ait été correctement renseigné, et améliore le rendu.

Voyons un peu ça dans le détail. la première phrase du paragraphe « Understand your code Better » (que je traduirais intuitivement par « Mieux comprendre votre code ») est rédigée de la façon suivante : « Understand what Visual Studio Team System’s Code Metrics is measuring and how, so that you can use it to gain insight into your apps’ overall complexity and spot potential problem areas. » Ce qui signifie : « Comprendre ce que la fonction Code Metrics de Microsoft Visual Studio Team System mesure et comment, pour obtenir un meilleur aperçu de la complexité générale de votre application et cerner les zones de problèmes potentiels. » Voilà comment l’outil de Microsoft le traduit : « Comprendre ce qui est mesure métriques de code de Visual Studio Team System et comment, afin que vous pouvez l’utiliser pour obtenir l’aperçu des vos applications globale de complexité et spot problématiques potentiels. » Autant je trouve les logiciels de traduction automatique utiles pour obtenir un brouillon à remanier, autant, là, je ne saurais pas par où commencer ma révision !

Par curiosité, je copie-colle le texte source dans Google Translate pour voir ce qu’il propose. Et j’obtiens « Comprendre ce que Visual Studio Team System Code de la métrologie est la mesure et de quelle façon, de sorte que vous pouvez l’utiliser pour mieux comprendre vos applications globale de la complexité et place les domaines de problèmes potentiels. » Oubliez la première partie de la phrase, et examinez bien la seconde : c’est presque ça (et c’est à peu près correctement conjugué).

Enfin, je lance PROMT 8. Avant de lancer la traduction, je réserve (c’est-à-dire que je définis comme à ne pas traduire) les expressions Visual Studio Team System et Code Metrics. Et j’obtiens : « Comprenez ce que le Code Metrics DE Visual Studio Team System mesure et comment, pour que vous puissiez l’utiliser pour arriver à mieux connaître la complexité totale de vos app et apercevoir des régions de problème potentielles. » Honnêtement, c’est pas mal, non ?

Pourtant ce n’est pas encore ça. Pourquoi ? Vous êtes vous penché sur le texte américain ? Il utilise une abréviation (« app » pour « application ») en provenance du jargon des développeurs (il y a peu de chance que vous trouviez « app » dans un dictionnaire anglais). Remplaçons-le par « application ». Et introduisons la relative « and spot potential problem areas » par une virgule et un « to » pour obtenir « , and to spot potential problem areas ». Ce cette façon, la phrase américaine à traduire devient « Understand what Visual Studio Team System’s Code Metrics is measuring and how, so that you can use it to gain insight into your application overall complexity, and to spot potential problem areas. »

Google répond : « Comprendre ce que Visual Studio Team System Code de la métrologie est la mesure et de quelle façon, de sorte que vous pouvez l’utiliser pour avoir un aperçu global de votre application complexité, et de repérer les domaines de problèmes potentiels. » La première partie de la phrase est toujours aussi nulle, mais on sait que ça vient du dictionnaire (Code Metrics n’y figure visiblement pas, du coup le moteur ne sait pas comment l’analyser). Quant à la seconde partie, elle est presque parfaite, non ?

PROMT donne: « Comprenez ce que le Code Metrics DE Visual Studio Team System mesure et comment, pour que vous puissiez l’utiliser pour arriver à mieux connaître votre complexité totale d’application et apercevoir des régions de problème potentielles. » Là encore, c’est exploitable: une rapide révision et on y est.

Et Live Translator ? Voilà son résultat : « Comprendre ce qui est mesure métriques de code de Visual Studio Team System et comment, afin que vous pouvez utiliser pour obtenir l’aperçu de votre application globale de complexité et de la tache problématiques potentiels. » Franchement, c’est pas gagné…

J’en tire trois enseignements:

  1. L’outil de traduction automatique repose toujours sur un dictionnaire, qu’il faut être en mesure de mettre à jour, sans quoi on trouble le moteur d’analyse syntaxique, qui devient dès lors incapable de fournir une structure correcte au moteur de traduction, lequel ne peut donc pas fournir un résultat exploitable. Autrement dit: les moteurs en libre service sur le Web ne peuvent pas fournir de résultat intéressant.
  2. La traduction automatique nécessite de comprendre suffisamment bien la langue source pour pouvoir modifier la phrase d’origine avant de la traduire (si c’est mal écrit, ce sera mal traduit) ;
  3. La traduction automatique nécessite que l’utilisateur comprenne suffisamment bien la langue de destination pour pouvoir apprécier la qualité de la phrase renvoyée et décider des corrections à apporter ;

En bref, la traduction automatique est un outil de productivité destiné aux traducteurs professionnels ou aux agences de traduction, ce n’est pas un outil de compréhension pour les non-traducteurs. CQFD.

PS: Voir aussi, sur le même sujet, ou presque.

Google Translate traduit vers onze langues supplémentaires

Google annonce la disponibilité de plusieurs nouvelles langues pour son moteur de traduction Google Translate. L’API est désormais en mesure de traduire dans onze langues supplémentaires :

  • Catalan (ca)
  • Hébreu (iw)
  • Indonésien (id)
  • Letton (lv)
  • Lituanien (lt)
  • Philippin (tl)
  • Serbe (sr)
  • Slovaque (sk)
  • Slovène (sl)
  • Ukrainien (uk)
  • Vietnamien (vi)

Par ailleurs, une nouvelle interface POST permet de demander la traduction de textes plus longs qu’auparavant.

La traduction automatique très attendue par les grandes entreprises

SDL a récemment publié une étude, réalisée en association avec l’IAMT (International Association for Machine Translation) and l’AMTA (Association for Machine Translation Americas), qui analyse les tendances en matière de traduction automatique à partir de 385 entretiens avec des représentants de grandes organisations mondiales.

Les résultats prouvent un intérêt très vif pour la traduction automatisée : ainsi, 25% des personnes interrogées ont déclaré soit utiliser la traduction automatique soit être en train de planifier son utilisation au sein de leur entreprise. Et 40% ont déclaré qu’ils étaient plus susceptibles d’y faire appel aujourd’hui que les années précédentes. Les principales utilisations envisagées concernent la communication instantanée (traduction de messages électroniques, des blogs et de wikis) et la documentation technique, ainsi que la traduction de sites Web et d’alertes virales.

La plupart des participants à l’enquête attendent de la traduction automatique un très haut degré de qualité. Les mêmes la voient comme un outil intégré à un processus de traduction humain de façon à réduire les délais et les coûts sans sacrifier pour autant la qualité.

Une attente qui confirme que ces systèmes sont avant tout des outils de productivité destinés aux traducteurs humains : c’est d’ailleurs de cette façon que SDL les exploite depuis plus de quatre ans au sein du SDL Knowledge-based Translation System™.

Alfabetic crée un service de traduction automatique assistée par des humains

L’excellent TechCrunch français annonce le lancement du service Alfabetic de traduction automatique de blogs.

Alfabetic se propose de diffuser les billets des blogs clients sur des sites étrangers après les avoir traduits dans la langue de destination en exploitant la technologie de traduction automatique à analyse statistique. Pour les clients qui paient plus cher (les « Gold »), Alfabetic prévoit de faire réviser par des traducteurs humains le texte généré par leur moteur automatique. Bien entendu, tout cela permet d’aller beaucoup plus vite, et de publier très rapidement des blogs à l’international. Reste à savoir si les clients « Silver » obtiendront des résultats exploitables à l’aide d’un service de traduction purement automatique. En revanche, je suis persuadé que les « Gold », dont la traduction sera révisée par des traducteurs professionnels, n’ont aucun souci à se faire.

Le robot de Microsoft traduit vos conversations en ligne

Le traducteur automatique de MicrosoftNous avions déjà mentionné ici même les outils de traduction automatique de Microsoft, qui se constitue lui aussi une mémoire de traduction géante à la Google Translation Center. Depuis peu, Microsoft a intégré la traduction automatique simultanée à son service de Chat (Windows Live Messenger ) sous la forme d’un robot appelé Mtbot. Un peu comme MeGlobe, Mtbot traduit vos conversations en ligne à la volée entre l’anglais, le chinois, le néerlandais, le français, l’allemand, l’italien, le japonais, le coréen, le portugais, le russe et l’espagnol. Il suffit d’ajouter mtbot@hotmail.com à la liste de vos amis, et le tour est joué ! Voilà au moins une utilisation pertinente des outils de traduction automatique, sans grand risque pour l’utilisateur, à part, peut-être, quelques gifles virtuelles.