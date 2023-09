by

Lorsque l’on pense à des outils dotés d’une intelligence artificielle (IA), on pense naturellement à ChatGPT et à Bing Chat. Mais Meta, propriétaire de Facebook, veut changer cela avec SeamlessM4T, un « traducteur linguistique universel » alimenté par l’IA qui pourrait convertir instantanément n’importe quelle langue du monde en n’importe quel résultat.

Meta décrit SeamlessM4T comme « le premier modèle de traduction et de transcription multilingue et multimodale par l’IA ». Ce n’est pas peu dire, mais en termes simples, cela signifie qu’il peut convertir des langues de différentes manières, par exemple en prenant des données audio et en les convertissant en texte dans une autre langue.

Selon Meta, les fonctions de reconnaissance vocale et de traduction de l’outil peuvent fonctionner de différentes manières :

Reconnaissance vocale pour près de 100 langues

Traduction de la parole vers le texte pour près de 100 langues d’entrée et de sortie

Traduction de la parole vers la parole pour près de 100 langues d’entrée et 36 langues de sortie

Traduction texte à texte pour près de 100 langues

Traduction texte-parole pour près de 100 langues d’entrée et 35 langues de sortie

Meta affirme que cela « permettra aux gens de communiquer sans effort par la parole et le texte dans différentes langues ».

Bientôt sur Facebook ?

SeamlessM4T est publié sous une licence de recherche, et Meta déclare qu’il le fait pour « permettre aux chercheurs et aux développeurs de s’appuyer sur ce travail ». En outre, les métadonnées de l’ensemble de données utilisé pour entraîner le modèle de traduction, appelé SeamlessAlign, sont également rendues publiques. Il s’agit de « 270 000 heures d’alignements de discours et de textes », affirme Meta.

Cependant, Meta n’a pas précisé d’où provenaient ces 270 000 heures de « discours exploité ». Des inquiétudes ont été soulevées quant aux conséquences sur la vie privée des travaux de Meta sur les chatbots, alors que d’autres outils d’IA ont déjà été pris en flagrant délit de vol de travaux protégés. Il ne fait aucun doute que l’on craint que Meta ait pu faire quelque chose d’analogue lorsqu’elle a formé SeamlessM4T.

Il existe déjà d’autres outils de traduction, comme Google Traduction, qui peuvent convertir du texte en texte et de la parole en texte, mais Meta affirme que ses propres efforts sont supérieurs. Selon Meta, SeamlessM4T « réduit les erreurs et les retards, augmentant ainsi l’efficacité et la qualité du processus de traduction ».

Meta n’a pas précisé si le nouvel outil serait intégré à ses applications telles que Facebook et Instagram, mais l’entreprise a révélé qu’elle souhaitait « explorer comment ce modèle fondamental peut permettre de nouvelles capacités de communication » à l’avenir. Nous verrons bien ce que cela implique.