Préédition et ±è´Ç²õ³Ù-é»å¾±³Ù¾±´Ç²Ô (TA)
Les technologies de ±è°ùéé»å¾±³Ù¾±´Ç²Ô et de ±è´Ç²õ³Ù-é»å¾±³Ù¾±´Ç²Ô pour la traduction automatique (TA) comptent parmi les axes de recherche les plus récents du Département TIM. Ces dix dernières années, la TA a connu des progrès significatifs et elle occupe maintenant une place importante dans l’industrie de la traduction pour gagner du temps et réduire les frais de traduction. Les résultats sont toutefois encore loin d’être parfaits pour la plupart des systèmes de TA. Pour améliorer au maximum l’efficacité de la TA et obtenir une traduction finale de qualité, deux étapes complémentaires sont souvent intégrées dans le processus de traduction : la ±è°ùéé»å¾±³Ù¾±´Ç²Ô et la ±è´Ç²õ³Ù-é»å¾±³Ù¾±´Ç²Ô.
- La ±è°ùéé»å¾±³Ù¾±´Ç²Ô
La ±è°ùéé»å¾±³Ù¾±´Ç²Ô consiste à traiter les textes avant de les traduire automatiquement, notamment à corriger les erreurs potentiellement présentes dans le texte source (principalement les erreurs de grammaire, de ponctuation et d’orthographe), à supprimer les ambiguïtés et à simplifier les structures. Dans le cas de la traduction automatique statistique, elle peut aussi comporter une adaptation du texte de départ pour faire en sorte qu’il se rapproche davantage des textes avec lesquels le système a été entraîné, ce qui peut aider ce système à avoir de meilleurs résultats.
- La ±è´Ç²õ³Ù-é»å¾±³Ù¾±´Ç²Ô
La ±è´Ç²õ³Ù-é»å¾±³Ù¾±´Ç²Ô est l’étape durant laquelle des traducteurs ou linguistes ayant reçu une formation professionnelle relisent le texte produit par la traduction automatique et le corrigent pour supprimer les erreurs sémantiques et linguistiques. Il existe deux grandes catégories de ±è´Ç²õ³Ù-é»å¾±³Ù¾±´Ç²Ô : une ±è´Ç²õ³Ù-é»å¾±³Ù¾±´Ç²Ô légère/rapide et une ±è´Ç²õ³Ù-é»å¾±³Ù¾±´Ç²Ô complète. Le premier type de ±è´Ç²õ³Ù-é»å¾±³Ù¾±´Ç²Ô se concentre sur le transfert correct du sens et ne s’attarde pas sur des problèmes d’ordre stylistique. Dans un scénario de ±è´Ç²õ³Ù-é»å¾±³Ù¾±´Ç²Ô complète, par contre, le texte devrait atteindre une qualité comparable à celle des textes traduits par des humains, tous les problèmes étant pris en considération.
Travaux de Recherche
Entre 2012 et 2015, nous avons coordonné le projet européen . Ce projet visait à améliorer la traduction automatique statistique (TAS) des textes communautaires (forums) grâce au développement de techniques peu intrusives de ±è°ùéé»å¾±³Ù¾±´Ç²Ô et à la ±è´Ç²õ³Ù-é»å¾±³Ù¾±´Ç²Ô.
Début 2015, nous avons intégré ces technologies dans une  plateforme en ligne, dédiée à l’enseignement et à la recherche de la pré-édition et la ±è´Ç²õ³Ù-é»å¾±³Ù¾±´Ç²Ô : le .
Collaborations avec l'industrie
En 2017, le Département a démarré une collaboration avec le Service Linguistique de la Poste Suisse, pour tester l'implémentation de la traduction automatique (DE>FR/IT/EN). Le projet prévoit de comparer plusieurs systèmes de TA statistiques (commerciaux et open source ; basés sur les phrases et neuronaux) et de tester différents types d’intégration avec les traducteurs.
Formation des étudiants
Avec les progrès des technologies de TA, des connaissances en ±è°ùéé»å¾±³Ù¾±´Ç²Ô et en ±è´Ç²õ³Ù-é»å¾±³Ù¾±´Ç²Ô seront nécessaires pour l’industrie de la traduction. C’est pourquoi nous formons nos étudiants pour qu’ils puissent améliorer leurs compétences en TA. Les cours de Traduction Automatique 1 et de Traduction Automatique 2 leur permettent d’avoir un aperçu de l’ensemble du processus de traduction automatique. Les étudiants ont également l’occasion d’approfondir leur connaissance de la TA au cours de leurs études par le biais de stages dans des organisations ou entreprises connues.
Publications principales
- , Bouillon P., Gaspar L., Gerlach J., Porro V., Roturier J., in: Proceedings of the 9th Edition of the Language Resources and Evaluation Conference (LREC), CNL Workshop, Reykjavik, Islande, 2014.
- , Gerlach J., Porro V., Bouillon P., Lehmann S., in: Proceedings of the Machine Translation Summit XIV, Nice, France, 2013.
- , Gerlach J., Porro V., Bouillon P., Lehmann S. , in: 20ème conférence sur le Traitement Automatique des Langues Naturelles(TALN), Sables d'Olonne, France, 2013.
- , Bouillon P., Gerlach J., Germann U., Haddow B., Rayner M., in: Second ACL Workshop on Hybrid Approaches to Translation (HyTra), Sofia, Bulgaria, 2013.
- , Morado Vázquez L., RodrÃguez Vázquez S., Bouillon P., in: Proceedings of the Machine Translation Summit XIV, Nice, France, 2013.
- , Rayner M., Bouillon P., Haddow B., in: Proceedings of AMTA, San Diego, CA, US, 2012.