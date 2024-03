La recherche sur le Web n’a cessé de se dégrader au cours des dernières années et, plus récemment, les articles de spam générés par l’intelligence artificielle ont contribué à ce problème. Google tente aujourd’hui de remédier à ce problème, avec une mise à jour de Google Recherche qui vise à réduire les résultats de « faible qualité ».

La capacité généralisée des outils d’IA générative a permis aux sites de produire des centaines ou des milliers d’articles par jour, inondant les résultats de recherche sur le Web pour des sujets populaires.

Il est désormais assez courant de trouver dans les résultats de recherche des articles rédigés (au moins en partie) par l’IA, dont beaucoup comportent des erreurs factuelles et une supervision minimale de la part d’un rédacteur humain. Google a déjà déclaré qu’elle autorisait le contenu généré par l’IA dans les résultats de recherche, mais que tous les articles étaient soumis aux mêmes normes de qualité et que le contenu indésirable serait rejeté. Cependant, la recherche Google est toujours truffée de spam généré par l’IA.

Les algorithmes de Google Recherche ont été mis à jour afin de réduire les résultats de mauvaise qualité et non originaux. L’entreprise a déclaré dans un article de blog :

Aujourd’hui, les méthodes de création de contenu à grande échelle sont plus sophistiquées, et il n’est pas toujours évident de savoir si le contenu est créé uniquement par l’automatisation. Pour mieux lutter contre ces techniques, nous renforçons notre politique afin de nous concentrer sur ce comportement abusif — la production de contenu à grande échelle pour améliorer le classement dans les moteurs de recherche — qu’il s’agisse d’automatisation, d’humains ou d’une combinaison des deux. Cela nous permettra d’agir sur un plus grand nombre de types de contenus à faible valeur ajoutée créés à grande échelle, comme les pages qui prétendent apporter des réponses à des recherches populaires, mais qui ne fournissent pas de contenu utile.

Il reste à voir si ces changements auront un effet suffisant. Les sites de spam pourraient simplement réduire leur production pour éviter d’être détectés, ou ils pourraient essayer d’autres solutions de contournement. Cette mesure ne concerne pas non plus directement les contenus générés par l’IA qui contiennent des erreurs factuelles ou des informations généralement inutiles : il est plus difficile de les détecter automatiquement et Google ne semble pas prendre des mesures manuelles suffisamment souvent. Les tests effectués par l’entreprise elle-même font état d’une réduction de 40 % des contenus de mauvaise qualité.

Une mise à jour prévue ce mois-ci

Google tente également de prendre des mesures contre les « abus de réputation de sites », c’est-à-dire les sites qui publient du contenu tiers très différent de leur contenu habituel, afin que le tiers puisse bénéficier de la réputation existante du site et de son classement dans les recherches sur le Web. Google a déclaré : « Par exemple, un tiers peut publier des avis sur des prêts sur salaire sur un site éducatif fiable afin d’en tirer des avantages en termes de classement. Ce type de contenu bien classé dans le moteur de recherche peut semer la confusion ou induire en erreur les visiteurs qui peuvent avoir des attentes très différentes quant au contenu d’un site Web donné ». Par ailleurs, l’entreprise considère désormais comme du spam les domaines expirés et réaffectés qui affichent un contenu de faible qualité.

L’amélioration de la détection du spam fait partie de la mise à jour principale de Google pour la recherche, prévue pour le mois de mars 2024. La modification de l’abus de réputation des sites entrera en vigueur le 5 mai 2024.

Google accorde 60 jours aux sites abusant de leur réputation pour rectifier leur contenu avant d’appliquer les changements de classement. Les autres changements sont effectifs immédiatement.