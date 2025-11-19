Accueil » Cloudflare : une panne majeure liée au Bot Management fait tomber une partie du Web

Cloudflare : une panne majeure liée au Bot Management fait tomber une partie du Web

Cloudflare : une panne majeure liée au Bot Management fait tomber une partie du Web

Le Web a vacillé plusieurs heures. Ce mardi, Cloudflare a connu sa plus grave panne depuis 2019, paralysant une large partie d’Internet, de X à ChatGPT en passant par Downdetector.

Le responsable ? Un dysfonctionnement situé au cœur du système de Bot Management, censé identifier et réguler les crawlers automatiques.

Une panne systémique dans l’un des piliers de l’infrastructure du Web

Cloudflare annonce depuis des années qu’environ 20 % du trafic Internet transite par son réseau. Sa mission : absorber les pics de charge, bloquer les attaques DDoS massives et garantir la disponibilité des sites face aux variations brutales de trafic.

Mais mardi, c’est la structure elle-même qui a flanché.

Le crash a rendu inaccessibles une multitude de services majeurs, rappelant les précédentes pannes globales liées à Microsoft Azure ou Amazon Web Services. Une réalité qui, une fois encore, souligne la fragilité d’un Internet centralisé où des acteurs clés deviennent des points de défaillance critiques.

Le problème ne venait ni de l’IA générative, ni du DNS, ni d’une attaque

Matthew Prince, cofondateur et CEO de Cloudflare, a publié un article détaillé pour retracer l’origine du problème. Contrairement aux premières hypothèses — dont une potentielle attaque de type DDoS — l’incident provient d’un dysfonctionnement interne, lié au système de permissions d’une base de données.

Plus précisément, au composant chargé de générer les bot scores, essentiels pour distinguer les requêtes humaines des bots légitimes… ou malveillants.

Un changement dans ClickHouse à l’origine de l’emballement

Le machine learning pilotant Bot Management s’appuie sur un fichier de configuration fréquemment mis à jour. Mais, une évolution dans le comportement des requêtes ClickHouse responsables de ce fichier a introduit une multiplication de « feature rows » dupliquées.

Résultat : le fichier de configuration a explosé en taille, dépassant les limites mémoire prévues, ce qui a fini par faire chuter le proxy central traitant le trafic dépendant du module bots.

Les clients utilisant des règles basées sur les scores générés ont alors vu leur trafic légitime bloqué — une gigantesque série de faux positifs.

À l’inverse, les clients n’utilisant pas ces scores… n’ont pas été affectés.

Les bots IA ne sont pas en cause, mais la question reste sensible

Cloudflare a récemment intensifié ses efforts contre les crawlers utilisés pour entraîner les IA génératives. On se souvient notamment de l’annonce du système AI Labyrinth, conçu pour piéger les bots ignorants les directives « no crawl ».

Mais, Prince insiste : cette panne n’avait aucun lien avec les nouveaux outils basés sur l’IA. C’est un défaut de processus, pas une défaillance de la technologie expérimentale.

Cloudflare promet des changements structurels

Pour éviter qu’un tel incident ne se reproduise, l’entreprise annonce quatre mesures clés :

Durcir la gestion des fichiers de configuration générés par Cloudflare, comme s’ils provenaient d’utilisateurs externes. Activer davantage de switchs globaux, permettant de couper rapidement des fonctionnalités en cas d’emballement. Limiter la capacité des core dumps et erreurs systèmes à épuiser les ressources. Revoir l’ensemble des modes de défaillance des modules critiques du proxy.

Une réponse technique complète, mais qui ne résout pas la question fondamentale : le Web dépend de plus en plus d’infrastructures centralisées, et chaque faille devient un risque systémique.

Une panne qui pose une question plus large

Cet incident Cloudflare rejoint une série noire touchant Microsoft, AWS et d’autres géants. À mesure que le Web s’appuie sur quelques acteurs centraux, les pannes deviennent moins fréquentes, mais beaucoup plus impactantes.

L’Internet moderne n’est pas seulement un réseau distribué : c’est un écosystème où certains nœuds sont devenus vitaux. Et quand l’un d’eux tombe, c’est une partie du monde connecté qui vacille.