Apertium : du neuf pour le projet de traduction automatique libre
Apertium est un programme de traduction automatique libre et actif dans 18 paires de langues, reprises sur la page d’accueil du wiki. Aujourd’hui deux paires comprennant le français existent en version stable : français-catalan et français-espagnol.
Depuis la publication de la dernière nouvelle sur Apertium en mars 2008, beaucoup de choses ont changé.
Tout d’abord, Apertium gagne en popularité. Ainsi, l’université de Reykyavik participe au développement d’Apertium. Le quotidien espagnol El Pais vient d’ailleurs d’y consacrer un long article. libre. Ensuite, Apertium a été sélectionné pour le Google Summer of Code (GSOC). Neuf étudiants dont deux de Grenoble y participent à l’évenement.
Finalement, les développeurs ont publié en version stable de nombreuses nouvelles paires dont l’espagnol-occitan, catalan-occitan, espagnol-basque, anglais-esperanto, anglais-galicien, anglais-gallois, portugais-galicien, portugais-catalan.
Notons, que des dévelloppeurs pour de nouvelles paires comme le français-esperanto sont le bienvenue. Vous pourriez ainsi vous baser sur les paire espagnol-français et, d’autre part, espagnol-esperanto, catalan-esperanto, anglais-esperanto. De plus la version français-espagnol est passée en version 0.9.
Apertium se base sur un moteur écrit en C++, et cinq fichiers XML par paire de langues. Si vous désirez créer une nouvelle paire de langue, vous ne devez pas connaître le C++, mais simplement pouvoir utiliser un éditeur de texte pour manipuler les fichier XML.
Un fichier monolingue pour chaque langue : celui-ci contient des modèles qui indiquent comment les mots varient (la conjugaison pour les verbes, la formation du pluriel pour les noms, etc) et une liste de mots avec le modèle associé.
Un fichier bilingue qui contient une liste de mots dans une langue et sa traduction dans l’autre. Deux fichiers de transfert qui indiquent les règles pour passer d’une langue à l’autre et un autre fichier en inversant le rôle de langue cible et source.
Les personnes intéressées par le développement sont invitées à nous rendre visite sur le canala irc #apertium hébérgé sur irc.freenode.org.
Lien : Le Wiki
Vous souhaitez reproduire cet article ?




