Cloudflare, le vere cause dietro al blackout globale d’internet
No, non c'entrano complessi attacchi informatici. L'incidente di Cloudflare ci racconta per l'ennesima volta come internet sia molto più fragile di quel che pensiamo.

Cloudflare ha fatto luce sul blackout globale che il 18 novembre ha messo offline numerosi siti internet in tutto il mondo. In un lungo post pubblicato dopo l’incidente, il CEO Matthew Prince ha ammesso che, nelle prime fasi, l’azienda aveva sospettato un massiccio attacco DDoS. Una teoria plausibile considerando la natura dei servizi offerti, ma rivelatasi errata poche ore dopo.
Non c’entrano gli hacker
“Non è stato un attacco informatico né un’azione malevola,” ha spiegato Prince, chiarendo che il problema è nato da un cambiamento interno nel sistema di permessi del database. Una modifica che ha innescato un errore imprevisto in uno dei componenti cruciali del sistema: il file utilizzato dal modulo di Bot Management, responsabile di classificare e gestire le richieste automatizzate sui siti dei clienti Cloudflare.
Quel file, aggiornato automaticamente ogni pochi minuti, contiene le caratteristiche utilizzate dal modello di machine learning per stabilire se un bot debba essere considerato legittimo oppure bloccato. A causa della modifica al sistema che genera quel file, la sua dimensione è cambiata improvvisamente, portando il sistema a restituire errori HTTP 5xx, bloccando o degradando gran parte del traffico globale gestito dalla piattaforma.
Un sistema fragile
Il ruolo del sistema di gestione dei bot è oggi particolarmente delicato. Sempre più aziende lo utilizzano per impedire ai crawler automatizzati di prelevare contenuti web per addestrare modelli linguistici senza permesso. Non a caso, Cloudflare aveva avviato un progetto chiamato “pay per crawl”, con l’obiettivo di consentire alle piattaforme di AI l’accesso ai contenuti solo dietro compenso.
L’incidente è stato definito dallo stesso CEO “il peggiore dal 2019”, anno dell’ultimo blackout che ha interessato l’azienda. Cloudflare, che gestisce una parte significativa del traffico globale, ha confermato che i servizi sono tornati operativi dopo aver identificato e risolto la causa del malfunzionamento. Nel frattempo, Prince ha promesso che l’azienda farà ulteriore verifiche interne per assicurarsi che un evento simile non si ripeta più.