Tuesday 21 November 2017

Traduction automatique

Eh oui!! Le sujet de l'heure est la traduction automatique.

Jusqu'à tout récemment, les traducteurs ne voulaient rien savoir de la traduction automatique. J'étais en partie d'accord avec eux. Le temps de corriger toutes les fautes ou bien de vérifier le sens, voire de comprendre ce charabia, ne faisait que compliquer la tâche de traduction.

Grâce à l'apprentissage profond, la traduction automatique a réussi à faire une percée spectaculaire.

Traduction statistique

La traduction automatique statistique était assez bonne pour que l'on comprenne le sens, mais contenait beaucoup de fautes...

Si l'on compare les traductions de la phrase "The apples fall from the tree in the fall", il est évident que la traduction neuronale est bien meilleure!

Traduction statistiqueLes pommes tombent de l'arbre dans la chute.
Traduction neuronaleLes pommes tombent de l’arbre à l’automne.

Pour voir d'autres différences, vous pouvez consulter une analyse approfondie à cette adresse.

Traduction neuronale

Voici à quoi peut ressembler un réseau neuronal.



Sans expliquer en détail ce qu'est un réseau neuronal (il y a déjà beaucoup de documentation à ce sujet), je veux simplement dire que la couche d'entrée représente votre phrase de départ et que la couche de sortie représente la phrase d'arrivée. Les neurones (cercles) entre les deux définissent des fonctions et les lignes représentent le poids entre eux.

L'utilisateur définit les neurones et les liens entre eux. L'entraînement trouve les meilleurs poids sur les lignes pour arriver à la traduction. Imaginez des millions de phrases traduites et l'apprentissage automatique doit trouver les meilleures valeurs qui vont fonctionner pour toutes les traductions que nous avons.

Évidemment, le but n'est pas de trouver une traduction parfaite, mais plutôt de nous mettre sur la bonne voie.

Remarquez la relation entre un neurone et les mots à la sortie. Combien de chemins possibles y a-t-il? Beaucoup. On peut donc dire que tous les mots à la sortie peuvent avoir été influencés par chacun des mots à l'entrée, et ce, même si la phrase est longue. Ce qui n'était pas vrai pour les modèles statistiques.

Imaginez maintenant qu'il n'y a pas 2 couches au milieu, mais de 6 à 10 couches... et imaginez que chaque couche a des dizaines de neurones. C'est pour cela qu'il faut énormément de calculs pour entraîner un système de traduction neuronal.

TradooIT

TradooIT a développé son propre modèle neuronal entraîné uniquement sur des publications officielles du gouvernement. On parle ici de plusieurs dizaines de millions de phrases. Les documents sur lesquels nous entraînons notre système ont une incidence directe sur les traductions produites. Voici quelques exemples de traduction neuronale effectuée par 3 différents systèmes : TradooIT, DeepL et Google.

Quelle est la meilleure traduction pour chacune des phrases?

A) Simon and his dog ran out of the park. *

1- Simon et son chien sont sortis du parc.
2- Simon et son chien sont sortis du parc en courant.
3- Simon et son chien ont couru hors du parc.

Bonne réponse : 2 - TradooIT
La réponse 1 ne contient pas l'élément d'empressement et la réponse 2 n'indique pas la direction.

B) LSQ is the French sign language version used in Canada. 

1- LSQ est la version française de la langue des signes utilisée au Canada.
2- LSQ est la version en langue des signes française utilisée au Canada.

Bonne réponse : 1 - TradooIT et Google

C) Government of Canada Strengthens Canada Child Benefit.

1- Le gouvernement du Canada renforce l’Allocation canadienne pour enfants.
2- Le gouvernement du Canada renforce la Prestation canadienne pour enfants.

Bonne Réponse : 1 - TradooIT
Évidemment, Google et DeepL (2) se sont entraînés sur des corpus qui ne sont pas strictement canadiens. Mais, quand même, l'expression "Canada Child Benefit" revient très souvent!

D) Quebec company guilty of illegally exporting polar bear skin rugs.

1- Une entreprise québécoise coupable d'avoir exporté illégalement des tapis en peau d'ours polaire.
2- Une entreprise québécoise coupable d’exporter illégalement des tapis de peau d’ours blanc.
3- Une entreprise du Québec se rend coupable d'exportation illégale de tapis en peau d'ours polaire.

Bonne réponse : La plus proche est 1-2 (DeepL, TradooIT)

La traduction neuronale permet de produire une meilleure traduction dans son contexte. Il est rare que la traduction ne soit pas fluide... il faut quand même faire attention aux omissions dans la traduction.

Voici un exemple qui démontre même que 2 phrases ont été fusionnées en une seule en langue d'arrivée...

Texte de départ :
Edmonton inhabitants are benefitting from the Shumka Dance Centre. The Shumka Dance Centre is a facility where Canadian and Ukrainian cultures are celebrated through dance.

Texte d'arrivée :
Les habitants d’Edmonton profitent du Shumka Dance Centre, où les cultures canadienne et ukrainienne sont célébrées par la danse.

Le système a compris que la deuxième phrase est une description et ne va pas répéter inutilement "Centre de danse Shumka". C'est ça qui arrive quand la traduction est meilleure de l'original!

Impressionné? Époustouflé?...

Traducteurs

Les commentaires des traducteurs qui ont bien voulu faire l'essai de notre traducteur automatique à partir de  Gazoo et dans les prétraductions sont très positifs. En gros, le système permet aux traducteurs de concentrer leur effort intellectuel sur le message plutôt que sur la syntaxe ou les fautes d'orthographe ou de grammaire.

Les traducteurs sont également plus productifs. On ne parle pas d'une petite hausse de productivité; on parle d'au moins 30 % à 75 %.

Ce qui est drôle, c'est qu'ils deviennent marabouts lorsque la traduction automatique n'est pas disponible (et je vous parle d'un cas réel :-) ).

Bref, la traduction neuronale produit souvent une réponse assez proche de la traduction humaine... Est-ce que c'est suffisant pour être utile aux traducteurs? Répondre non serait faire l'autruche!

Je vous invite à l'essayer à https://www.tradooit.com/translate/.

Bonne traduction neuronale!

Simon

* Exemple tiré de la publication suivante : http://aclweb.org/anthology/D/D17/D17-1262.pdf.

Tuesday 24 January 2017

Bulletin d'information de janvier 2017


Saviez-vous que TradooIT est beaucoup plus qu'un concordancier? 

L'écosystème TradooIT vous permet d'aligner vos textes traduits, de prétraduire vos documents et de faire des recherches dans vos archives ainsi que dans votre terminologie. Bref, il devient un outil indispensable pour plusieurs langagiers professionnels.

Corpus, corpus, corpus!

Au cours de la dernière année, nous avons procédé à un ajout massif de corpus dans 3 paires de langues (en-fr, es-fr, en-es). Notre mémoire compte maintenant tout près de 1,2 milliards de mots!

La paire de langues anglais-français dépasse maintenant les 450 millions de mots!

Balayage de sites Web

Pour nous aider à créer ces corpus, nous avons mis au point une application interne qui permet de faire ceci :

- Balayage : téléchargement du contenu de sites Web

- Alignement : établissement d'un plan d'alignement afin d'aligner toutes les pages d'un site Web téléchargé

- Filtrage : définition d'options de filtrage de façon à obtenir une très bonne qualité d'alignement

- Importation : une fois qu'on est satisfait du résultat d'alignement et de filtrage, on peut importer tous les nouveaux bitextes dans la mémoire

- Balayage périodique : par la suite, certains sites peuvent continuer d'être mis à jour automatiquement!

Est-ce que cet outil vous serait utile?

Alignement de fichiers amélioré

Afin de vous simplifier la tâche, nous avons amélioré l'alignement des fichiers. Il est maintenant possible de faire ce qui suit :

- Aligner des lots de fichiers à partir d'un fichier ZIP.
  • Mise en correspondance des fichiers (d'après leur nom)
  • Alignement du contenu
  • Importation des fichiers dans la mémoire
- Aligner des fichiers PDF.


Bonne recherche! Et bon alignement!

Simon McDuff

Monday 6 October 2014

TradooIT en France!


Il arrive parfois que votre travail est reconnu par vos pairs et c'est toujours gratifiant.

Softissimo, une entreprise française, trouvait très intéressant notre concordancier bilingue. Pour ceux qui ne la connaissent pas, vous avez sûrement déjà entendu parler ou même utilisé son site très populaire www.reverso.net. Il s'agit d'un portail d'outils linguistiques offrant notamment traduction, dictionnaire, correcteur d'orthographe, conjugaison, grammaire et prononciation.

Bien que Reverso ne vise pas la même clientèle que TradooIT, notre outil créé par des traducteurs avait du potentiel pour servir un portail linguistique comme Reverso.

Après avoir comparé les différents concordanciers bilingues sur le marché, Softissimo a choisi le meilleur! Une clientèle différente signifie des changements à apporter et Softissimo savait exactement ce qu'elle voulait. Ces changements ont été apportés tout en conservant les qualités de TradooIT : simple, rapide et efficace.

Après des mois de travail, votre architecture préférée est maintenant utilisée par Reverso depuis 2013.

Où puis-je voir les résultats de TradooIT dans Reverso? 

TradooIT est utilisé à 3 endroits distincts.
- Site Web indépendant (context2.reverso.net)
- Traduction
- Dictionnaire

Pour les sections Traduction et Dictionnaire, les résultats de TradooIT sont affichés pour ajouter du contexte dans des cas précis. Par exemple, l'outil n'affichera aucun contexte pour la recherche "ordinateur", mais il en affichera pour "rigoureuse".

Voici quelques exemples de recherches et la façon dont Reverso les présente.

Traduction (cliquez sur le mot et entrez manuellement la requête)
festival de cinéma
spécialiste en conservation



Dictionnaire
rigoureuse
tomber malade


Cette intégration a permis à TradooIT non seulement de servir un autre portail linguistique mais aussi de se dépasser!

Bonne recherche!

Simon

Thursday 26 June 2014

Bulletin d'information de juin 2014


Saviez-vous que TradooIT est beaucoup plus qu'un concordancier? 

L'écosystème TradooIT vous permet d'aligner vos textes traduits, de prétraduire vos documents et de faire des recherches dans vos archives ainsi que dans votre terminologie. Bref, il devient un outil indispensable pour plusieurs langagiers professionnels.

Mémoire - Filtrage des données

Vous avez des données plus ou moins bien alignées à importer? TradooIT vous permet de filtrer les segments indésirables pour éviter de polluer votre mémoire. Nos fonctions de filtrage fondées sur les statistiques vous épargneront des heures d'examen attentif!

Le filtrage des données est offert à plusieurs endroits dans TradooIT. Lisez la documentation pour en savoir plus!


Gazoo - Recherche et remplacement bilingue

Nous avons amélioré plusieurs aspects dans Gazoo. Découvrez la nouvelle fenêtre de recherche et remplacement bilingue.

Uniformiser vos traductions deviendra un jeu d'enfant!

Recherche et remplacement de phrases
Recherche et remplacement de sous-segments











Rétroactions

Vos rétroactions ont été très utiles. En effet, nous avons corrigé plus de 650 bitextes manuellement. Merci!

Faits saillants de la mise à jour 2.15 de TradooIT

Nous avons effectué ou résolu 14 tâches ou problèmes. En voici quelques-uns :


Nouveautés

  • [TRADOOIT-864] - [Gazoo] Recherche et remplacement bilingue
  • [TRADOOIT-841] - [Gazoo] Appliquer tout pour la section sous-segment
  • [TRADOOIT-899] - [Gazoo] Raccourci pour sélectionner le texte de la position courante du curseur courant jusqu'à la fin du segment.
  • [TRADOOIT-860] - [Termidoo] Importation de fiches provenant de Termium
  • [TRADOOIT-897] - [Mémoire] Filtrage des importations de TMX et de textes à aligner pour obtenir des données de meilleure qualité

Améliorations

  • [TRADOOIT-23] - [Termidoo] Dupliquer une fiche à partir d'un bouton!
  • [TRADOOIT-848] - [Memoire] Ajouter un filtre d'évaluation pour l'alignement automatique de documents à partir de Transflow
  • [TRADOOIT-858] - [Termidoo] Indiquer la provenance de la fiche
  • [TRADOOIT-859] - [Mémoire] Indiquer la provenance du bitexte
  • [TRADOOIT-862] - [Mémoire] Réduire le temps d'attente pour l'enregistrement d'un bitexte
  • [TRADOOIT-857] - [Termidoo] Notifications - Afficher la différence lors de la notification

    Bogues

    • [TRADOOIT-867] - [Gazoo] Corruption dans les commentaires
    • [TRADOOIT-887] - [Gazoo] Problèmes lors de la sélection de texte en tant que Content Control
    • [TRADOOIT-895] - [Gazoo] Les répétitions internes de petits segments donnent des résultats bizarres dans le volet de traduction
    • [TRADOOIT-898] - [Gazoo] Décalement lors des remplacements pour un document PDF converti
    • [TRADOOIT-893] - [Gazoo] Ouvrir et fermer Word peut causer une exception pour les connexions lentes
    Bonne recherche!

    Simon McDuff

    Wednesday 2 April 2014

    Bulletin d'information d'avril 2014


    Saviez-vous que TradooIT est beaucoup plus qu'un concordancier? 

    L'écosystème TradooIT vous permet d'aligner vos textes traduits, de prétraduire vos documents et de faire des recherches dans vos archives ainsi que dans votre terminologie. Bref, il devient un outil indispensable pour plusieurs langagiers professionnels.

    Termidoo - Notification des changements par courriel

    Lorsque vous travaillez en équipe, il peut être important de savoir qui modifie des fiches dans Termidoo. En vous envoyant des notifications par courriel, Termidoo vous permet d'être toujours informé, dès le moindre changement!

    Vous n'avez qu'à cliquer sur "Commencer à suivre" et le tour est joué!



    Gazoo

    Vous ne connaissez pas Gazoo? Lisez les 2 premiers blogues parus en mars, qui vous introduiront à la traduction avec Gazoo.

    Gazoo : Introduction
    Gazoo : Traduction

    Nouveau corpus

    Nous avons ajouté 2 corpus le mois dernier :
    • OECD (Organisation de Coopération et de Développement Économiques)
    • MWNF (Musée Sans Frontières)

    Rétroactions

    Vos rétroactions ont été très utiles. En effet, nous avons corrigé plus de 1400 bitextes manuellement. Merci!

    Faits saillants de la mise à jour 2.14 de TradooIT

    Nous avons effectué ou résolu 14 tâches ou problèmes. En voici quelques-uns :


    Nouveautés

    • TRADOOIT-852 [Termidoo] Système de suivi pour les fiches Termidoo (notification par courriel lors de changements)
    • TRADOOIT-843 Nouveau corpus : MWNF (Musée Sans Frontières)
    • TRADOOIT-842 Nouveau corpus : OECD (Organisation de Coopération et de Développement Économiques)

    Améliorations

    • TRADOOIT-850 [Mémoire] Prise en charge des symboles spéciaux ® ™
    • TRADOOIT-484 [Mémoire] Amélioration de l'affichage pour importer des fichiers locaux
    • TRADOOIT-849 [Gazoo] Permettre d'agrandir la taille des caractère dans l'explorateur de segments
    • TRADOOIT-845 [Termidoo] Prise en charge des recherches dans les étiquettes avec les mots clés "tag:" ou "etiquette:".
    • TRADOOIT-855 [Prétraduction] Amélioration de la vitesse d'exécution des recherches floues pour les longues phrases

      Bogues

      • TRADOOIT-851 [Gazoo] Le message "All Track changes..." est en anglais dans l'interface en français.
      • TRADOOIT-856 [Gazoo] Fuite de mémoire minime lors de recherches dans la mémoire et le concordancier
      • TRADOOIT-844 [Alignement] Incapable d'enlever un segment invalide avec l'aide du bouton
      • TRADOOIT-853 [Mémoire] Les segments invalides peuvent se retrouver dans les prétraductions (dans certaines conditions)
      • TRADOOIT-846 [Termidoo] Les notes sont souvent décalées
      • TRADOOIT-854 Fichier Excel avec des caractères spéciaux pas supporté pour la prétraduction
      Bonne recherche!

      Simon McDuff

      Tuesday 25 March 2014

      Gazoo : Traduction

      (English version)

      Comment traduire avec Gazoo?

      Dans mon dernier blogue, j'ai expliqué comment installer Gazoo ainsi que son flux de données. Maintenant, voyons comment traduire avec Gazoo dans la vie de tous les jours.

      Étape 1 : Commencer la traduction

      L'option "Commencer la traduction" vous ouvre un dialogue pour configurer votre prétraduction. Pas besoin de faire passer votre fichier dans une machine à saucisses, tout se fait à partir de Word.


      Dans la boîte de dialogue, le champ "Source" est obligatoire, mais vous pouvez inscrire un nouveau code client si vous le désirez. Vous avez l'option de changer la langue du document (1) et de remplacer le texte du document immédiatement après l'analyse (2).

      La prétraduction est très rapide et, une fois quelle est terminée, votre document est officiellement lié à votre écosystème TradooIT. La perspective change et les volets suivants s'ouvrent :

      • Explorateur de segments
      • Traduction




      Cette perspective apparaîtra chaque fois que vous commencerez une traduction ou bien que vous ouvrirez un document lié à TradooIT.


      Explorateur de segments

      L'explorateur de segments affiche le texte de votre document de départ divisé en segments. Il se synchronise avec le contenu de votre document. Lorsque vous changez de paragraphe dans votre document, l'explorateur de segment se déplace vers le segment correspondant. Si vous cliquez sur un segment dans l'explorateur, votre document se déplace à son tour... L'explorateur de segments et votre document sont en parfaite harmonie.

      L'explorateur de segments affiche également des renseignements pratiques comme le degré d'analogie au moment de la prétraduction, le nombre de répétitions, etc.

      Volet de traduction

      Le rôle du volet de traduction est de vous montrer les segments qui sont similaires à votre segment courant dans votre mémoire, et leur équivalent. Il est séparé en 2 parties : les segments trouvés et les sous-segments trouvés. La section des segments trouvés présente les passages assez longs pour valoir la peine d'être remplacés au complet. La section des sous-segments trouvés présente les passages qui sont trop courts pour vouloir remplacer la phrase courante au complet, mais qui sont quand même très importants. Il est maintenant possible de remplacer aussi les sous-segments dans votre document.

      Chaque fois que vous changez de phrase ou de paragraphe, le volet de traduction le détecte et se synchronise avec votre document.

      Étape 2 : Traduire

      Fini le placotage, mettons-nous au travail.

      Il serait trop simple de vous expliquer comment interagir avec Word en tant qu'utilisateur de Gazoo, car celui-ci est transparent. Vous pouvez interagir avec Word normalement. Par contre, il serait trop compliqué de vous expliquer les techniques et les technologies qu'il utilise pour arriver à être aussi transparent. Dans les deux cas, mes explications ne rendraient pas justice à Gazoo. C'est pourquoi il est plus agréable de vous laisser juger par vous-même dans ce vidéo.


      Vous voyez! C'est facile!

      Premièrement, remarquez comme l'interface de travail est transparente. Mis à part les crochets, que vous pouvez d'ailleurs désactiver dans les préférences, le contenu de Word est pur!

      Le curseur se déplace en symbiose avec l'explorateur de segments. Le volet de traduction observe le tout en vous fournissant des renseignements supplémentaires. Ici, pas besoin de gérer des balises, des dialogues, l'état de votre mémoire ou d'autres mauvaise bactéries.

      Le remplacement des segments ou des sous-segments se fait avec légèreté. Même si le contenu de Word change, le texte original est toujours disponible.

      L'aligneur du texte travaille silencieusement en arrière-plan. Il se fait aussi discret que possible pour ne pas interrompre vos pensées.

      Est-ce magique!?! Non. :-) Seulement aussi pur que possible! Pura vida!

      Étape 3 : Terminer la traduction

      Une fois que vous avez achevé votre chef-d'oeuvre, il vous suffit de cliquer sur "Terminer la traduction" et vous avez même l'option de mettre à jour votre mémoire! Vous gagnez un temps fou à analyser, réviser et aligner votre document directement à partir de Word!

      Il y a un sujet que j'ai omis volontairement, ce sont les répétitions. La version actuelle de Gazoo comporte une fonctionnalité de base qui demande à l'utilisateur s'il veut remplacer toutes les des occurrences. Par contre, nous y travaillons pour vous permettre de faire beaucoup PLUS!

      Dans mon prochain blogue, je vais sauter le sujet des répétitions et vous parler de l'aspect "en temps réel" et collaboratif de Gazoo.

      Bonne... traduction!

      Simon

      Gazoo: Translation

      (Version française)

      How do you translate with Gazoo?

      In my last post, I showed you how to install Gazoo and also explained Gazoo’s data flows. Now, let’s see how you can use Gazoo to translate in everyday life.
      Step 1: Start Translation
      When you choose the option Start Translation, a dialogue box opens and allows you to configure the pretranslation. You don’t have to put your document through a meat grinder; the whole process happens in Word. 

      In the dialogue box, you have to fill in the “Source or client” field, but you can type a new client code if you wish. You can also change the language of the document (1) and replace text in the document immediately after analyzing (2).
      The pretranslation process is very quick and, once complete, your document is officially connected to your TradooIT ecosystem. The view changes, and the following panels open:
      •   Segment Explorer
      •   Translation

      This is what you will see each time you begin a translation or open a document connected to TradooIT.
      Segment Explorer Panel
      The Segment Explorer displays the source document text divided into segments. It syncs with the content of your document. When you change a paragraph in your document, the Segment Explorer moves to the corresponding segment. If you click on a segment in the Segment Explorer, the cursor in your document will shift to the corresponding segment. The Segment Explorer and your document are always in perfect harmony.

      In addition, the Segment Explorer diplays useful information that includes the degree of match at pretranslation, the number of repetitions, etc.
      Translation Panel
      The role of the Translation Panel is to display segments similar to your current segment and their equivalent stored in your translation memory. The panel is divided into two sections: one for the segment matches and a second for the sub-segment matches. The first section displays relatively long passages worth replacing in full. The second section is reserved for passages that may be too short to replace the entire segment, but that are still very useful.
      Each time you change a sentence or paragraph, the Translation Panel detects it and syncs with your document.
      Step 2: Translation
      Enough chatting, let’s get to work.
      Since Gazoo is so transparent, it would be too simple to tell you how to use it with Word. Just work with Word as you usually do. On the other hand, it would be too complicated to explain the techniques and technologies that Gazoo uses to be so transparent. In both case, my explanations don’t really do Gazoo justice. It’s so much more pleasant for you to watch this video, then decide for yourself.


      See! It’s a cakewalk.
      First, you can see how transparent the user interface is. Except for the bookmarks, which you can disable in your Word preferences, the Word content is pristine.
      The cursor moves in symbiosis with the Segment Explorer. The Translation Panel keeps an eye on everything and provides additional information. You don’t have to mess around with tags, dialogues, memories or other annoying bugs.  
      Replacing segments or sub-segments is effortless. Even if the content changes, the original text remains intact and available. The alignment tool works quietly in the background so as not to disturb you.
      It's magic!?! No. Just as pure as possible. Pura vida!
      Step 3: Stop Translation
      Once your masterpiece is completed, all you have to do is click on “Stop Translation”. You can even opt to update your memory! You save tons of time when you analyze, revise and align directly in Word!
      I intentionally left out one topic: repetitions. The current version of Gazoo has a basic feature that enables users to replace all instances of a repeated segment. That said, we’re working on a new version that will allow you to do much, much more.
      In my next post, I’ll skip over repetitions and get right down to Gazoo's real-time and collaboration features.
      Happy translating!

      Simon