In sintesiIl modello Mythos di Anthropic, secondo una testimonianza del comitato di intelligence, sarebbe riuscito a penetrare i sistemi classificati della NSA e del Comando cibernetico statunitense in poche ore. L'azienda ha quindi creato un sistema di protezione che sarebbe dovuto essere in gradi di proteggere l'AI da jailbreak, ma questo non ha avuto successo.
Secondo una testimonianza resa al Comitato di intelligence del Senato e riportata da The Economist, il modello Mythos di Anthropic è riuscito a penetrare in quasi tutti i sistemi classificati gestiti dalla NSA e dal Comando cibernetico statunitense nel giro di poche ore.
Il senatore Mark Warner, vicepresidente della commissione, ha dichiarato l’11 giugno che il generale Joshua Rudd, a capo della NSA e del Comando Cibernetico del Pentagono, lo aveva informato della violazione. Le parole di Rudd, come riportato da Warner, sono state: Mythos è riuscito a penetrare “non in settimane, ma in ore”.
Proprio perchè Mythos era così performante che Anthropic ha inventato un nuovo livello di cautela. Il modello è così efficace nell’individuare falle nascoste nel software che l’azienda si è rifiutata di renderlo pubblico, concedendone invece l’accesso a circa 200 partner selezionati nell’ambito di un’iniziativa chiamata Project Glasswing. Tra i partecipanti figurano Amazon, Apple, Google, Microsoft, Nvidia, JPMorgan e la Linux Foundation. Anthropic afferma che Mythos Preview ha già portato alla luce migliaia di vulnerabilità “zero-day”, tra cui una falla vecchia di 27 anni in OpenBSD, uno dei sistemi operativi più sicuri al mondo.
La rivelazione è arrivata nella stessa settimana in cui l’amministrazione Trump ha vietato agli stranieri l’utilizzo di Mythos 5 e Fable 5, i modelli più potenti di Anthropic. Anthropic afferma che il provvedimento è stato emesso dopo che il governo ha scoperto che Fable 5 poteva essere sbloccato (jailbreaking).
Il divieto ha colpito anche gli alleati, compresi i partner dei Five Eyes (Australia, Gran Bretagna, Canada e Nuova Zelanda), e ha impedito all’AI Security Institute britannico, il principale ente mondiale per il test e lo sblocco di modelli di intelligenza artificiale all’avanguardia, di accedere ai sistemi che stava sottoponendo a verifica.
Si tratta di un netto cambio di rotta rispetto alla precedente posizione di Trump sull’intelligenza artificiale.
Per mesi ha smantellato le normative sull’IA introdotte dalla precedente amministrazione, ha autorizzato la vendita di chip avanzati alla Cina e il 2 giugno ha emesso un ordine esecutivo che chiedeva ai laboratori di condividere volontariamente i nuovi modelli con il governo prima della loro pubblicazione.
Ora l’accesso viene revocato da un giorno all’altro e all’ente governativo incaricato di valutare i modelli di frontiera per individuarne le potenziali capacità pericolose è stato ordinato di interrompere la pubblicazione dei suoi rapporti.
Carolina Vivianti è consulente/Advisor autonomo in sicurezza informatica con esperienza nel settore tech e security. Ha lavorato come Security Advisor per Ford EU/Ford Motor Company e Vodafone e ha studi presso la Sapienza Università di Roma.
Aree di competenza: Cybersecurity, IT Risk Management, Security Advisory, Threat Analysis, Data Protection, Cloud Security, Compliance & Governance