TechFlow, 19 novembre — Cloudflare a publié officiellement le 18 novembre 2025 un rapport détaillé post-incident concernant l'interruption mondiale de son réseau. Selon ce rapport, l'incident a commencé à 11h20 UTC et n'était pas dû à une attaque réseau, mais à une réaction en chaîne provoquée par un changement de permissions dans le système de base de données. Plus précisément, une modification du comportement des requêtes dans la base de données ClickHouse a entraîné une augmentation anormale des profils de caractéristiques du système de gestion des robots (Bot Management), dépassant la limite prédéfinie d'allocation mémoire et provoquant ainsi l'effondrement du système.
Le rapport documente en détail les services affectés pendant l'incident, notamment le CDN principal, Turnstile et Workers KV, ainsi que la chronologie complète des opérations de résolution entre 11h28 et 17h06. L'équipe Cloudflare a résolu le problème en arrêtant la propagation de la configuration erronée et en effectuant un retour arrière (rollback) vers une version stable.
Dans le rapport, le PDG de Cloudflare, Matthew Prince, reconnaît qu'il s'agit de la panne la plus grave subie par l'entreprise depuis 2019, et s'engage à renforcer la validation des profils de configuration, à ajouter des interrupteurs fonctionnels globaux et à optimiser les mécanismes de gestion des erreurs afin d'empêcher la récurrence de tels événements.




