
Quest’autunno, abbiamo avuto un bel po’ di grattacapi con il cloud, non so se ci avete fatto caso. Cioè, AWS, Azure, e dopo Cloudflare. Tutti giù, uno dopo l’altro.
Una sfilza di interruzioni che ci hanno dimostrato una cosa molto seria: oggi, un errore stupido di configurazione interna o un pasticcio coi metadati è l’equivalente moderno di un massiccio blackout.
Sì, proprio così.
Avvio delle iscrizioni al corso Cyber Offensive Fundamentals Vuoi smettere di guardare tutorial e iniziare a capire davvero come funziona la sicurezza informatica? La base della sicurezza informatica, al di là di norme e tecnologie, ha sempre un unico obiettivo: fermare gli attacchi dei criminali informatici. Pertanto "Pensa come un attaccante, agisci come un difensore". Ti porteremo nel mondo dell'ethical hacking e del penetration test come nessuno ha mai fatto prima. Per informazioni potete accedere alla pagina del corso oppure contattarci tramite WhatsApp al numero 379 163 8765 oppure scrivendoci alla casella di posta [email protected].
Se ti piacciono le novità e gli articoli riportati su di Red Hot Cyber, iscriviti immediatamente alla newsletter settimanale per non perdere nessun articolo. La newsletter generalmente viene inviata ai nostri lettori ad inizio settimana, indicativamente di lunedì. |
Nel giro di quattro settimane, si sono bloccati tutti e tre i giganti, e ogni volta il problema veniva da dentro, dall’infrastruttura stessa dei provider. Non è che c’era troppa gente, o il picco stagionale, o chissà quale attacco alla rete, no.
La cosa assurda, e un po’ inquietante, è che evidenzia quanto sono fragili questi sistemi, giganteschi ma delicati come cristallo, dove una piccola, piccolissima modifica a un componente può scatenare un inferno di conseguenze.
I tecnici AWS sono stati i primi a far partire la catena di eventi, il 20 ottobre. Era un problema del servizio DNS nella regione US-EAST-1 – sempre lei, tra l’altro, chissà perché capita sempre lì, ma vabbè. E da lì, amici, reazione a catena.
Il problema DNS ha scavallato il singolo cluster e si è diffuso. Messaggistica, giochi, piattaforme di streaming… tutto bloccato. L’errore in un componente core ti sbatte in faccia quanto migliaia di aziende, e noi tutti, dipendiamo da come funziona la meccanica interna del cloud. Non è rassicurante, nemmeno un pò.
Nove giorni dopo, eccoci di nuovo. Tocca ad Azure. Era il 29 ottobre se non ricordo bene. Lì tutto è partito da una modifica sbagliata al sistema di distribuzione dei contenuti. Cloud Microsoft globale in tilt.
Anche i loro servizi, inclusi quelli proprietari tipo lo strumento di automazione 365 Copilot, sono andati a farsi benedire, e ovviamente anche tutte le app di terzi che usano Azure per i calcoli e l’autorizzazione. Una cosa banale nella configurazione ha mandato in avaria l’intera rete distribuita che fa girare un sacco di flussi di lavoro.
Ma l’incidente più, non so, forse più eclatante è stato il blackout di Cloudflare. Sempre in autunno, eh. Lì la causa era un file di configurazione. Quello che dovrebbe filtrare il traffico strano, quello sospetto. Questo file, per qualche ragione è divenuto enorme, una cosa fuori scala.
Il modulo interno che gestisce la rete è andato in crash, di fatto. Cloudflare instrada il traffico per un numero immenso di risorse, capite? E se crolla anche solo una sezione, beh… X, ChatGPT, IKEA e Canva. Tutta roba grossa che si è interrotta per ‘sto file. Un errore interno che si è portato dietro mezzo internet.
Il succo di tutta questa storia, il denominatore comune, è che il problema non è venuto fuori da solo. Niente di esterno. Solo cambiamenti interni, che succedono in processi automatizzati, roba di routine.
Internet, oggi, si è trasformato, dicono gli esperti – e hanno ragione, secondo me – in un sistema di sistemi interdipendenti: DNS, piani di controllo cloud, servizi di autenticazione... Tutto opera sulla stessa infrastruttura dei provider.
Se ne salta uno, l’altro ne risente subito. L’effetto cascata lo vedi senza neanche dover aspettare: è istantaneo.
L’automazione spinta, poi, e l’altissima densità di potenza di calcolo che è tutta concentrata in mano a questi giganti (sono pochi, sono pochi!) fa sì che un piccolo intervento, che magari a livello singolo sembra giusto, diventi la miccia per un’interruzione a catena. Tutto va velocissimo, non hai il tempo di intervenire manualmente.
Ecco perché, dicono gli esperti del settore – e questa è una bella immagine – questi errori di configurazione stanno diventando, di fatto, le interruzioni di corrente nell’era del calcolo distribuito: un passo falso, uno solo, e salta tutto, su servizi diversi.
Insomma, questi incidenti hanno palesato una cosa semplice ma allo stesso tempo altamente preoccupante: la resilienza dei sistemi cloud non riesce a tenere il passo con quanto sono diventati scalabili. L’infrastruttura assomiglia sempre più a una rete elettrica ad alta tensione, che se superi una soglia, parte la reazione a catena.
Le aziende, dovranno per forza cambiare il modo di costruire le loro architetture.
Usare più provider indipendenti, non uno solo, per bilanciare e salvaguardare il loro “running”. Questi approcci aiutano a evitare situazioni in cui un singolo errore porta all’arresto completo dei processi critici.
E non vogliamo questo, vero? No, non lo vogliamo.
Ti è piaciuto questo articolo? Ne stiamo discutendo nella nostra Community su LinkedIn, Facebook e Instagram. Seguici anche su Google News, per ricevere aggiornamenti quotidiani sulla sicurezza informatica o Scrivici se desideri segnalarci notizie, approfondimenti o contributi da pubblicare.

Cyber NewsLa vulnerabilità critica recentemente aggiunta al catalogo delle vulnerabilità note sfruttate (KEV) dalla Cybersecurity and Infrastructure Security Agency (CISA) interessa il Broadcom VMware vCenter Server e viene attivamente sfruttata dagli hacker criminali per violare le…
Cyber NewsLa storia di Ilya Lichtenstein, l’hacker responsabile di uno degli attacchi informatici più grandi mai compiuti contro le criptovalute, appare come un episodio di una serie TV, eppure è assolutamente reale. Dopo essere stato rilasciato,…
Cyber NewsSe c’erano ancora dubbi sul fatto che le principali aziende mondiali di intelligenza artificiale fossero d’accordo sulla direzione dell’IA, o sulla velocità con cui dovrebbe arrivarci, questi dubbi sono stati dissipati al World Economic Forum…
Cyber NewsUna settimana fa, il CEO di Cursor, Michael Truell, ha annunciato un risultato presumibilmente straordinario. Ha affermato che, utilizzando GPT-5.2, Cursor ha creato un browser in grado di funzionare ininterrottamente per un’intera settimana. Questo browser…
Cyber NewsL’Italia si conferma uno degli obiettivi principali della campagna di attacchi DDoS portata avanti dal gruppo hacktivista NoName057(16). Secondo quanto dichiarato direttamente dal collettivo, il nostro Paese ha subito 487 attacchi informatici tra ottobre 2024…