You are on page 1of 8

Analyse des systèmes de mémoires de traduction

Abstrait

Dès du milieu des années 1980, les outils de traduction ont monopolisé de plus
en plus les vies quotidiennes des traducteurs et des gestionnaires de projets de
traduction. Mais à présent beaucoup du temps doit être consacré à l’analyse, à la
formation et aux tâches administratives.
Les outils de traduction ont été conçus pour faciliter le travail du traducteur,
pour le rendre plus rapide et plus efficace. La gamme de ceux-ci comprend aussi bien
des utilités de conversion, gestion de la terminologie, mémoires de traduction,
traduction automatique ainsi que flux de travaux et systèmes de gestion de projet.
Les outils de traduction ont été développés dans le dessein de réduire le
travail de traduction répétitif, mais d’un autre côté ceux-ci ajoutent des diverses
tâches à la charge de travail, comme la gestion des bases de données et ainsi de suite.
Cet exposé fournira un aperçu d’une section des outils de traduction - les
systèmes divers de mémoires de traduction présents aujourd’hui sur le marché et les
technologies qu’ils emploient. L’exposé intègre une comparaison des caractéristiques
fondamentales communes telles que le compte des mots, la fonction
d’analyse/statistique et la pré-traduction, les spécialités des quelques outils ainsi que
la description des possibilités d’échange des données entre les systèmes, à l’aide du
format TMX.
Comme « le meilleur outil » pour tout n’existe pas, le but de cet atelier n’est
pas de recommander un seul outil, mais de fournir quelques directives pour l’analyse
des systèmes de mémoires de traduction conformément aux exigences
individuelles.

1. Outils de mémoires de traduction - Synthèse

Les systèmes de mémoires de traduction, comme le nom l’indique,


« mémorisent » les traductions effectuées par un traducteur humain. La plupart des
systèmes de mémoires de traduction (souvent également appelés « systèmes-TM »)
sont constituées d’une base de données qui mémorise le texte original ainsi que sa
traduction – une base de données des paires de segments.
Ici « segment » indique que le module qui est traduit et mémorisé dans la base
de données peut varier d’un seul mot (par exemple un en-tête ou un élément dans
une liste à puces) à des phrases, des propositions complètes ou même des
paragraphes complets. Les outils identifient un segment par un ensemble de règles
internes qui établit, par exemple, qu’un segment se termine par un point ou une
marque de paragraphe.
De verificat
During translation itself, the tool will automatically look up every new source
language segment to be translated in that bilingual translation memory.
Pendant la traduction proprement dite, l’outil va rechercher automatiquement
chaque segment linguistique appartenant à la nouvelle source à traduire dans celle
mémoire de traduction bilingue. Si le même segment est trouvé dans la base de
données, le système offrira au traducteur à titre de suggestion la traduction qui a été
sauvée avec ce segment, pour être réemployée. Si le système ne trouve pas le même
segment, il commencera à rechercher des segments similaires. Celles-ci sont lesdites
correspondances « floues », étant donné que les segments de la langue source (dans
le document et dans la base de données) correspondent seulement à un certain
pourcentage. Quand le traducteur acquiert une telle correspondance floue de la base
de données, celui-ci peut déterminer si l’on peut réutiliser pour la traduction
courante et dans quelle proportion. Habituellement, le traducteur est capable même
d’établir le niveau de « flou », c’est-à-dire le pourcentage de similitude, de sorte que
le système fournisse seulement des traductions qui peuvent être réutilisées sans qu’il
soit nécessaire d’apporter trop d’amendements à la traduction suggérée.
Ainsi l’emploi d’un système de mémoires de traduction permet
l’augmentation de la cohérence et la diminution du temps nécessaire pour rédiger
une traduction. Ceci vaut notamment pour la traduction des documents itératifs,
comme des documentations techniques, des manuels, modes d’emploi et mises à jour
des matériels déjà traduits.
Les outils de mémoire de traduction sont usuellement le constituant principal
d’un ensemble d’outils. Ces ensembles offrent des outils de recyclage, ce que l’on
appelle des systèmes d’alignement. Ceux-ci sont utilisés pour rédiger des traductions
effectuées sans l’aide des systèmes de mémoires de traduction afin que celles-ci
puissent être réutilisées par pareils outils de mémoire de traduction. Ces outils
consultent/lisent la source et les dossiers de langue cible, les affichent parallèlement
et proposent des liaisons des segments de la langue source avec les segments
correspondants de la langue cible. Ensuite un traducteur va analyser ces liaisons.
Puis ensuite, les paires de segments peuvent être importées dans la mémoire de
traduction. Dorénavant, elles peuvent être utilisées comme si elles avaient été
traduites interactivement avec le système lui-même. Un autre élément de pareil
ensemble d’outils est le système de gestion terminologique – une autre base de
données qui mémorise des termes individuels (ou phrases) conjointement avec leur
traduction(s) dans la/les langue(s) cible. La base de données de la mémoire de
traduction et la base de données terminologique travaillent ensemble pendant la
traduction. Cela permettra au traducteur non seulement d’obtenir des suggestions
pour la traduction des segments entiers mais aussi une liste de tous les termes à
l’intérieur de ce segment qui ont été trouvés dans la base de données terminologique.
D’autres éléments d’un tel ensemble d’outils pourraient être le flux de travail ou les
systèmes de gestion des projets, ainsi que des filtres et des utilitaires pour la
conversion de format de fichiers.
Les systèmes de mémoires de traduction commencent aussi d’être
personnalisables pour l’emploi avec des systèmes de gestion de document ou de
contenu et certains sont même programmable via une API (interface de
programmation applicative – des commandes de programmation qui rendent
possible pour l’utilisateur d’appeler le système de mémoires de traduction d’autres
applications).

2. Le principe fondamental des outils de mémoire de traductions

Essentiellement, tous les outils de mémoires de traductions ont été développés


dans le même but : on ne devrait pas avoir à traduire quelque chose qui a été déjà
traduit. Il devrait ressortir de la base de données ou le matériel de référence afin que
le traducteur doive seulement décider si la traduction précédente peut être
réemployée ou celle-ci nécessite d’être modifiée.
Les technologies employées pour atteindre cet objectif sont différentes.
Quelques outils utilisent un modèle faisant référence aux dossiers d’un projet
antérieur. Le modèle de référencement exploite ces dossiers déjà traduits (fichiers
originaux de langue source et fichiers traduits) en tant que source pour suggestions
de nouvelles traductions. Ce modèle est notamment efficace pour des projets avec
beaucoup de mises à jour, contenant bien des petits changements.
De l’autre côté, le modèle de base de données mémorise toutes les traductions
jamais faites dans une base de données, indépendamment du contexte, ce qui est
utile si les mêmes ou des segments similaires apparaissent dans des projets et types
de documents distincts. La plupart des systèmes de mémoires de traduction utilisés
couramment sont capables d’ouvrer avec toute langue installée sur l’ordinateur de
l’utilisateur et usuellement ils permettent également à l’utilisateur d’ajouter à chaque
traduction des renseignements spécifiques concernant le projet ou l’utilisateur.
3. Traduire avec d’outils de mémoires de traduction

Le texte à traduire est constitué par des unités plus petites, comme les en-têtes,
les propositions, les articles de liste, les entrées d’index et ainsi de suite. Ces
composants textuels s’appellent « segments ». Les systèmes de mémoires de
traduction sont munis d’une série de règles, qui leur permet d’identifier où se trouve
le début d’un segment et où le segment s’arrête. Lorsqu’on traduit en utilisant un
système de mémoires de traduction, celui-ci parcourt le texte segment par segment,
offrant chacun d’eux au traducteur accompagné par toute traduction retrouvée pour
ceux-ci ou un segment similaire qui a été mémorisé dans la base de données ou qu’on
peut trouver dans le matériel de référence. Le traducteur décide s’il va réemployer la
traduction proposée, s’il va l’adapter ou s’il va créer une nouvelle traduction et
ensuite il la sauve dans le système. C’est ainsi que le traducteur construit une
mémoire de paires de segments qui peut être référencée pour des traductions futures.

This store of segment pairs can also be used for analyzing new files to
determine the rate of recycling that can be achieved. Or it can be used to run a pre-
translation, which creates files that contain segments with more or less matching
translations already in them. This is very useful when working on a large batch of
files or preparing files for other translators who are not working with a translation
memory tool.
Cette mémoire de paires de segments peut également
Pour être capable d’utiliser d’outils de mémoire de traduction sur des divers
formats de fichiers, de fichiers ordinaires Word à fichiers PAO (publication assistée
par ordinateur), pour exemple FrameMaker ou Interleaf ou des fichiers pour le web
en HTML, XML ou SGML, quelques-uns de ces formats doivent être convertis dans
un format avec lequel l’outil de mémoire de traduction peut travailler.
Par conséquent, choisir un système de mémoires de traductions dépend aussi
des types de dossiers qu’on doit traiter et combien de temps et d’effort doivent être
consacrés pour les préparer et les convertir dans un format utilisable pour la
traduction et puis de retour au format originel.

Also, when it comes to software localization for example, different tools


have to be used for different parts of the project. The project might consist of text
within the software, from the user interface (GUI) to dialogs and messages as well
as online-help files, documentation, packaging and marketing material and so on.
And here different types of text require the use of different tools. GUI, software
dialogs and messages are best translated with a software localization tool, that is a
translation memory tool that can read those special software file formats. They
usually also contain testing features to check for consistent use of hot keys for
example, or length related problems that might arise, if the translated text does not
fit the button space it is supposed to appear on. But those systems are mostly
specialized on the software itself.
Aussi, en ce qui concerne la localisation de logiciel, par exemple, on doit
utiliser des outils différents pour les parties différentes du projet. Le projet pourrait
consister en texte dans le logiciel, des directives concernant l’interface utilisateur
jusqu’aux dialogues et messages, ainsi que des dossiers aide en ligne, documentation,
matériel d’emballage ou publicitaire et ainsi de suite. Et ici des catégories distinctes
de texte exigent l’utilisation d’outils distincts. Les directives concernant l’interface
utilisateur

For translation of the documentation, another translation memory tool is


needed. And here the question arises how those tools for translating software and
documentation interact, because what has been translated for one part might also
be reusable in the other (this will be covered in the section about data exchange
further down).
Online-Help files, for example, could be translated with either a software
localization tool or with a translation memory system for documentation, as both
system types support this format.

4. Comparaison des caractéristiques

Tous les outils de mémoires de traduction offrent des fonctionnalités de base,


comme le compte de mots ou une analyse du potentiel de recyclage (combien de
segments du dossier à traduire sont présents dans la base de données ou le matériel
de référence comme des correspondances 100% ou, aussi semblable, des
correspondances floues).
Les outils de mémoires de traduction fournissent également des
caractéristiques pour la pre-traduction automatisée, fonctionnalités de recherche
dans la base de données comprenant les segments, ainsi que de l’accessibilité aux
éléments de gestion terminologique pendant la traduction. Néanmoins tout outil
comporte également ses spécialités. Celles-ci sont les caractéristiques qui peuvent
influencer le choix des outils.
La majorité de systèmes de mémoires de traduction lisent les dossiers à
traduire dans le système lui-même, tout en les convertissant dans un tableau à
l’intérieur duquel une colonne contient les segments de langue source et une autre
colonne sera remplie avec la traduction respective.
D’autres se connectent à Microsoft Word, afin que n’importe quel dossier qui
peut être ouvert en Word ne doive pas être converti avant la traduction et puisse être
traité dans un mode « tu as ce que vois ».
Les traducteurs peuvent travailler dans un environnement habituel. D’autres
formats de dossiers, par exemple les formats PAO ou ce que l’on appelle formats
balisés (XML, le HTML ou SGML) sont soit convertis soit affichés dans un éditeur
distinct. On utilise les couleurs pour marquer le texte à traduire de même que les
balises qui constituent la structure et la mise en forme du dossier.
Un nombre croissant de développeurs améliorent les fonctionnalités des outils
de mémoires de traduction en ajoutant des nouvelles caractéristiques, comme pre-
traduction sensible au contexte ou des constituants semblables à la traduction
automatique (pour des segments qui n’ont pas de correspondance dans la mémoire
de traduction), ainsi que des constituants de gestion de projet.
5. Échange des données entre les systèmes de mémoires de traduction

Depuis quelque temps, les traducteurs n’ont pas eu la possibilité de transférer


les données d’un système de mémoires de translation dans un autre système, pour
être réutilisées. Une situation qui a été atténuée à certains égards par les
manufacturiers d’outils en ajoutant des fonctionnalités d’exportation, pour certains
formats brevetés d’autres manufacturiers. Mais il n’était pas faisable pour chaque
outil de supporter tous les formats d’exportation/importation de tous les autres outils
– notamment avec de nouveaux outils étant tout le temps développés et
commercialisés.
À présent, les manufacturiers d’outils ont convenu d’utiliser un format
standard pour représenter les données dans leurs systèmes ou au moins d’offrir ce
format comme l'un des formats d’exportation. Cela permet un transfert plus facile
des données de mémoires de translation d’un système à l’autre – même si les
résultats ne sont pas toujours entièrement satisfaisants. Ce standard est appelé TMX
– le format Translation Memory Exchange. C’est une représentation à base XML des
données mémorisées dans un système de mémoires de traduction.

5.1. Exemple de représentation des données au format TMX



Chaque paire de segments est représentée par une étiquette <ut> et </ut>, qui
indique le début et la fin de la paire de segments. (« ut » signifie « unité de
traduction », comme on appelle souvent ces paires de segments.) Les langages
individuels des segments et les contextes textuels suivent ensuite. Ce format pourrait
être produit et lu par tout système de mémoires de traduction en employant TMX.
Aujourd’hui il y a trois niveaux de conformité TMX. Le premier niveau représente
seulement le texte lui-même. Le deuxième niveau est également capable de
représenter l’information de mise en forme. Et le troisième niveau serait utilisé pour
représenter des données complémentaires spécifiques à l’outil, comme
l’identification de l’utilisateur, nom des projets et toute chose spécifiée par celui-ci.
Aujourd’hui, la plupart d’outils se conforment au moins à TMX niveau 1 ou même
au niveau 2.

6. Conclusion
Avant d’investir dans tout outil de traduction, il faut qu’on recense les
exigences individuelles de l’utilisateur. Cela comprend les types de fichier qui
doivent être traduits. Comme la plupart d’outils de mémoire de traduction
s’appuient sur l’information structurelle et de mise en forme dans le fichier, pour
segmenter et afficher le texte, on devrait tester si la manière de construction des
fichiers à traduire marche bien avec tel ou tel système de mémoires de traduction.
Cela pourrait même signifier qu’on doit adapter dès le début la manière de
rédiger les documents afin qu’au stade de la traduction les outils employés puissent
gérer plus facilement les fichiers.
D’autres aspects sont la capacité de mise en réseau et la liste de langues
supportées ainsi que les divers types de fichier supportés.
On doit aussi prendre en considération les prix des licences, la formation et
l’assistance.
Ensuite, pour être capable d’évaluer quel outil répond le mieux aux exigences
de l’utilisateur, on devrait tester les outils pour quelque temps avec des exemples
concrets. La plupart des manufacturiers d’outils offrent une période d’essai
d’environ 30 jours ou une version démo limitée du logiciel ou, dans le cas où une
période plus longue d’évaluation est exigée, un essai prolongé avec la version
intégrale du logiciel.
Cela comprend habituellement le besoin d’acheter aussi une session de
formation, pour préparer de manière optimale les gens qui vont évaluer le logiciel.