TOOLinux

Toute l’actu Linux & Open Source

Meta fait passer "No Language Left Behind" en open source

lundi 11 juillet 2022

Créé par Meta, No Language Left Behind (NLLB) est un projet visant à développer des capacités de traduction automatique de haute qualité pour la plupart des langues du monde. Le programme vient de passer en open source.

La maison-mère de Facebook vient d’annoncer une avancée importante dans son projet NLLB : un modèle d’IA appelé NLLB-200, qui traduit 200 langues différentes avec des résultats au-delà des espérances.

Meta met ainsi en libre accès (licence open source MIT) via Github les modèles NLLB-200, FLORES-200, le code d’entraînement des modèles et le code permettant de recréer l’ensemble de données d’entraînement afin d’aider d’autres chercheurs à améliorer leurs outils de traduction et à s’appuyer sur les travaux déjà effectués.

Nombre des langues concernées, comme le kamba et le lao, n’étaient pas ou peu prises en charge par les meilleurs outils de traduction actuels, en dehors des efforts de Mozilla en matière de synthèse vocale Common Voice, dont nous vous parlions dans cet article.

L’open source devrait aider à peaufiner ce travail. "Nous sommes en train de mettre en libre accès le modèle NLLB-200 et de publier une série d’outils de recherche pour permettre à d’autres chercheurs d’étendre ce travail à d’autres langues et de construire des technologies plus inclusives", explique Meta sur son blog.

"Les outils de traduction de haute qualité peuvent être transformateurs. La réalité actuelle est qu’une poignée de langues - dont l’anglais, le mandarin, l’espagnol et l’arabe - dominent le web. Les locuteurs natifs de ces langues très répandues peuvent perdre de vue l’importance de lire quelque chose dans leur propre langue maternelle. Nous pensons que la NLLB contribuera à préserver la langue telle qu’elle était censée être partagée, au lieu de toujours nécessiter une langue intermédiaire qui se trompe souvent de sentiment/contenu." - Meta

Les avancées de la recherche de NLLB vont également venir enrichir les 25 milliards de traductions comptabilisées chaque jour sur le fil d’actualité de Facebook, Instagram et, à l’avenir, des autres plateformes de Meta (on peut penser à WhatsApp ou encore au métavers).