Lors de Connect 2023, Meta a présenté une multitude d’outils et de fonctionnalités d’édition IA, introduisant des autocollants IA et des capacités d’édition d’images telles que le Restyle et Backdrop. Cependant, le clou du spectacle a été l’annonce du nouvel assistant IA de Meta, qui devrait rejoindre WhatsApp, Messenger et Instagram dans les prochains jours. Mais la méthode utilisée pour former cet assistant pourrait ne pas plaire à tout le monde.

Selon Reuters, Meta a utilisé des publications publiques de Facebook et d’Instagram pour former certaines parties de son nouvel assistant virtuel Meta AI. Dans une interview, le principal responsable de la politique de l’entreprise a assuré à Reuters que les messages privés partagés exclusivement avec la famille et les amis avaient été exclus afin de respecter la vie privée des consommateurs.

Nick Clegg, président des affaires internationales de Meta, a précisé que les discussions privées sur les services de messagerie n’étaient pas non plus prises en compte dans les données d’entraînement. Meta a pris des mesures pour filtrer les détails privés des ensembles de données publiques utilisés pour la formation. Clegg a souligné que Meta « a essayé d’exclure les ensembles de données qui ont une forte prépondérance d’informations personnelles ». Clegg a également déclaré que la « grande majorité » des données utilisées par Meta pour la formation étaient accessibles au public. Par exemple, LinkedIn a été délibérément omis pour des raisons de protection de la vie privée.

Les remarques de Clegg s’inscrivent dans un contexte de critiques adressées aux entreprises technologiques, notamment Meta, OpenAI et Google, qui utilisent des informations récupérées sur l’Internet sans autorisation appropriée pour entraîner leurs modèles d’intelligence artificielle. Ces modèles ingèrent des quantités massives de données pour résumer des informations et générer des images.

Meta a développé l’assistant en utilisant un modèle personnalisé basé sur le modèle de langage étendu Llama 2, rendu public en juillet, et un nouveau modèle appelé Emu, conçu pour générer des images en réponse à des invites textuelles. Le produit est conçu pour produire du texte, du son et des images, et accéder à des informations en temps réel grâce à un partenariat avec le moteur de recherche Bing de Microsoft.

De potentiels litiges ?

Les publications publiques sur Facebook et Instagram, contenant à la fois du texte et des photos, ont joué un rôle dans l’entraînement de Meta AI. Emu s’est concentré sur la génération d’images, tandis que les fonctions de chat étaient basées sur Llama 2, améliorées avec des ensembles de données annotées et disponibles publiquement. Clegg a indiqué que des restrictions de sécurité avaient été mises en œuvre pour empêcher la création d’images photoréalistes de personnalités publiques.

En ce qui concerne les droits d’auteur, Clegg s’attend à de potentiels litiges, notamment sur la question de savoir si le contenu créatif relève de la doctrine de l’utilisation équitable. Bien que Meta estime que c’est le cas, Clegg reconnaît que cela pourrait donner lieu à des batailles juridiques.