TOOLinux

Le journal du Libre

Apertium : du neuf pour le projet de traduction automatique libre

lundi 27 avril 2009

Depuis la publication
de la dernière nouvelle sur Apertium en mars 2008, beaucoup de choses
ont changé.

Tout d’abord, Apertium gagne en popularité. Ainsi, l’université
de Reykyavik participe au développement d’Apertium. Le
quotidien espagnol El Pais vient d’ailleurs d’y consacrer un long article.
libre. Ensuite, Apertium a été sélectionné pour le Google Summer of Code
(GSOC). Neuf étudiants dont deux de Grenoble y participent à
l’évenement.

Finalement, les développeurs ont publié en version stable de
nombreuses nouvelles paires dont l’espagnol-occitan, catalan-occitan,
espagnol-basque, anglais-esperanto, anglais-galicien, anglais-gallois,
portugais-galicien, portugais-catalan.

Notons, que des dévelloppeurs pour de nouvelles paires comme le français-esperanto sont le bienvenue. Vous pourriez ainsi
vous baser sur les paire espagnol-français et, d’autre part,
espagnol-esperanto, catalan-esperanto, anglais-esperanto. De plus la
version français-espagnol est passée en version 0.9.

Apertium se base sur un moteur écrit en C++, et cinq fichiers XML par
paire de langues. Si vous désirez créer une nouvelle paire de langue,
vous ne devez pas connaître le C++, mais simplement pouvoir utiliser
un éditeur de texte pour manipuler les fichier XML.

Un fichier monolingue pour chaque langue : celui-ci contient des
modèles qui indiquent comment les mots varient (la conjugaison pour
les verbes, la formation du pluriel pour les noms, etc) et une liste
de mots avec le modèle associé.

Un fichier bilingue qui contient une
liste de mots dans une langue et sa traduction dans l’autre. Deux
fichiers de transfert qui indiquent les règles pour passer d’une
langue à l’autre et un autre fichier en inversant le rôle de langue
cible et source.

Les personnes intéressées par le développement sont invitées à nous
rendre visite sur le canala irc #apertium hébérgé sur
irc.freenode.org.

Lien : Le Wiki