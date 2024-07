Le directeur général de Microsoft AI, Mustafa Suleyman, a déclaré que tout le contenu de l’internet était gratuit pour l’entraînement des modèles d’IA, ce qui a suscité une levée de boucliers. Dans une interview accordée à CNBC, Suleyman a minimisé les inquiétudes concernant l’utilisation de la propriété intellectuelle par les entreprises spécialisées dans l’IA, affirmant que la pratique consistant à utiliser librement des contenus en ligne accessibles au public est établie depuis des années.

« Je pense qu’en ce qui concerne le contenu qui se trouve déjà sur le web ouvert, le contrat social de ce contenu depuis les années 90 est qu’il s’agit d’une utilisation équitable. Tout le monde peut le copier, le recréer, le reproduire », a-t-il déclaré. C’est ce que l’on appelle le « freeware », si l’on veut, et c’est ce que l’on a compris.

Le leader de la technologie a ajouté qu’à moins qu’un éditeur ou un organe de presse ne demande explicitement de ne pas « crawler ou scraper » son contenu autrement que pour l’indexer, les entreprises d’IA peuvent l’utiliser pour former des modèles d’IA.

Il a ajouté : « Il existe une catégorie distincte dans laquelle un site Web, un éditeur ou un organe de presse a explicitement demandé à ce que son contenu ne soit pas “scrapé” ou “crawlé” pour une raison autre que l’indexation, afin que d’autres personnes puissent trouver ce contenu. Il s’agit d’une zone grise, et je pense qu’elle sera examinée par les tribunaux ».

Le commentaire de Suleyman sur les limites juridiques floues de l’apprentissage des modèles d’IA se reflète dans les récentes actions en justice. À la suite de ses remarques, le Center for Investigative Reporting a intenté une action en justice contre OpenAI et son principal investisseur, Microsoft, alléguant l’utilisation non autorisée du contenu de l’organisation à but non lucratif sans permission ni compensation.

Les utilisateurs réagissent aux commentaires du PDG de Microsoft AI sur l’IA

Selon le registre, le vérificateur d’IA Copyleaks a constaté que près de 60 % des réponses fournies par ChatGPT-3.5 contenaient une forme ou une autre de contenu plagié, et que plus de 45 % contenaient un texte identique à un contenu préexistant.

Cette action en justice s’inscrit dans la lignée d’actions en justice analogues menées par le New York Times et environ 8 autres organisations médiatiques.

Plusieurs utilisateurs ont publié leurs réactions sur X, en désaccord avec le point de vue du PDG de Microsoft selon lequel le contenu disponible fait partie d’un « contrat social », libre d’être utilisé pour former des modèles d’intelligence artificielle.

L’un d’entre eux a déclaré : « Cela DEVRAIT être un logiciel gratuit, mais votre entreprise vole effrontément toute l’expression humaine en la réduisant à un “contenu” », tandis qu’un autre a déclaré que c’était l’équivalent d’une « machine à plagier ».