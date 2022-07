Meta a annoncé l’open-sourcing de sa toute dernière création, un outil unique alimenté par l’intelligence artificielle (IA) qui peut traduire plus de 200 langues. Meta va ainsi plus loin dans sa mission d’interconnecter le monde en utilisant certaines des technologies les plus avancées du monde moderne.

Au début de cette année, Meta a annoncé un projet de recherche en IA sur la traduction vocale universelle. Quelques langues comme l’anglais, l’espagnol, le mandarin, l’italien et l’allemand sont déjà prises en charge par plusieurs outils Web de traduction automatique. Cependant, Meta est à la fois ambitieux et très engagé à offrir une expérience plus équitable aux locuteurs natifs de langues moins couramment utilisées, même celles qui n’ont pas de système d’écriture standard. À ce jour, le modèle d’IA fonctionne avec 200 langues différentes, avec un potentiel de croissance supplémentaire, Meta ayant décidé d’ouvrir le système.

Dans son article de blog, Meta a identifié trois grands défis pour la recherche sur la traduction automatique : la rareté des données, les défis de la modélisation, et l’évaluation et l’amélioration des résultats. L’entreprise pense que grâce à ses deux projets, No Language Left Behind et le Universal Speech Translator, elle va résoudre ces problématiques. Ces projets rendent l’Internet beaucoup plus ouvert aux locuteurs natifs du monde entier. Collectivement, des initiatives comme celles-ci devraient permettre de produire des traductions fiables et en temps réel dans des centaines de langues, de l’asturien au luganda en passant par l’urdu.

Selon Angela Fan, chercheuse chez Meta, l’objectif du projet est de mettre au point une technologie de traduction inclusive. Actuellement, l’IA est testée pour aider les rédacteurs de Wikipedia à traduire leurs articles dans d’autres langues. Très bientôt, le modèle sera déployé sur l’écosystème de Meta.

Les experts en TA affirment que les traductions du modèle IA ne sont pas censées être parfaites. Ce qui le distingue des autres outils de traduction, c’est son intérêt pour les langues dont les autres outils ne s’occupent généralement pas. C’est ainsi qu’il relève les défis mentionnés en matière de pénurie de données. Une centaine de nouvelles langues sont concernées, y compris les langues à faibles ressources ou celles dont le nombre de traductions disponibles est inférieur à un million.

Gagnant-gagnant

Afin d’améliorer et d’évaluer les résultats de la traduction, Meta a testé des paires de phrases pour chaque langue incluse dans le modèle d’IA. Les phrases ont été traduites de l’anglais vers les langues respectives par des locuteurs natifs qui sont également des traducteurs professionnels. Les phrases traduites par la machine et celles traduites par l’homme ont été comparées, et des scores numériques ont été attribués pour mesurer les chevauchements. L’objectif est que le modèle apprenne et finisse par produire des traductions de qualité humaine.

Pour garantir une traduction responsable et respectueuse des cultures, Meta affirme réaliser des études de cas avec des locuteurs de plus de 20 langues. L’entreprise n’étudie pas seulement les aspects techniques de la traduction de langue à langue, mais aussi ce que les gens considèrent comme important dans la traduction de leur langue maternelle. Les nuances culturelles, les préjugés et le langage potentiellement dangereux ne sont pas facilement pris en compte dans la simple translittération, et les informations peuvent ne pas être transmises avec succès sans ces considérations. Meta le sait bien, et affirme que ses objectifs à long terme en matière de traduction universelle ne nécessitent pas une simple expertise en IA, mais la coopération de nombreux experts, chercheurs et individus du monde entier.

Bien entendu, une grande partie des avantages revient à l’entreprise elle-même. Un outil de traduction multilingue universel réussi sert les futures innovations de Meta, qu’il s’agisse d’une expérience de réalité virtuelle plus inclusive, de vastes fonctionnalités de réalité augmentée ou simplement de comprendre de mieux en mieux ses utilisateurs sur Facebook, Instagram et WhatsApp.