In sintesiLa Casa Bianca ha ordinato ad Anthropic di dimostrare che il loro algoritmo Claude Fable 5 è immune da attacchi di jailbreak. Gli esperti ritengono che questa richiesta sia irrealistica, poiché i meccanismi di sicurezza dei modelli linguistiche sono solo temporanei e possono essere aggirati da utenti esperti o sistemi IA avanzati. Nel frattempo, il Dipartimento della Difesa utilizza già l'intelligenza artificiale in operazioni belliche, come dimostrato dall'uso del chatbot Grok durante l'operazione 'Epic Fury'.
La Casa Bianca ha imposto un ultimatum ad Anthropic: il loro modello Claude Fable 5 non tornerà in commercio fino a quando non dimostreranno che è completamente immune da attacchi di jailbreak. Ma purtroppo gli esperti di sicurezza ritengono che questa richiesta sia irrealistica.
L’amministrazione Trump aveva precedentemente ritirato Fable 5 dal mercato, citando le conclusioni dell’Agenzia per la Sicurezza Nazionale (NSA), che avevano rilevato vulnerabilità significative citando un jailbreak che ha permesso di manipolare le richieste in modo da far ignorare al modello i propri limiti di sicurezza.
Anthropic ha contestato queste preoccupazioni, sostenendo che il rischio è esagerato e le conseguenze minime. Tuttavia, le trattative tecniche con il Dipartimento del Commercio e l’Ufficio Nazionale per la Sicurezza Cibernetica non hanno portato a nulla. L’amministrazione ha chiuso il dibattito, dichiarando che non intende più discutere dell’entità del rischio.
Ora, la Casa Bianca sta trasferendo completamente la responsabilità ad Anthropic, e sta richiedendo alla compagnia di testare le proprie tecnologie e segnalare qualsiasi vulnerabilità non appena rilevata. Tuttavia, gli esperti considerano questi requisiti tecnicamente impossibili e inaccettabili da soddisfare dall’azienda. I meccanismi di sicurezza dei modeli linguistici sono solo una misura temporanea in quanto prima o poi, utenti esperti o sistemi IA avanzati troveranno un modo per aggirare queste protezioni, pertanto la richiesta è inapplicabile.
Mentre Anthropic e la Casa Bianca continuano a discutere, il Dipartimento della Difesa sta già utilizzando l’intelligenza artificiale in operazioni belliche. Ad esempio, durante l’operazione “Epic Fury”, il chatbot Grok di xAI di Elon Musk ha facilitato attacchi su oltre 2000 obiettivi in 96 ore. Alcuni senatori hanno già chiesto di vietare legalmente l’uso di modelli linguistici senza controllo umano nelle decisioni sull’impiego della forza.
Questa vicenda evidenzia una grande tensione attorno alle cosiddette “frontier AI”, ovvero quei modelli di intelligenza artificiale avanzati che sono oggi disponibili. Se da un lato i governi e gli apparati militari li considerano asset strategici con potenziali implicazioni all’interno della sicurezza nazionale (tecnologie dual-use o addirittura veri e propri sistemi d’arma digitali), dall’altro, le stesse capacità che li rendono preziosi per la attività di ricerca, l’industria e competitività economica.
Negli Stati Uniti sta quindi crescendo la preoccupazione che tali modelli di frontiera possano essere copiati e quindi distillati o replicati da attori stranieri, con un occhio puntato sulla Cina, riducendo il vantaggio tecnologico dell’occidente o magari rilasciandoli successivamente in modalità opensource per generare influenza.
Il risultato è quindi uno scenario complesso, nel quale le richieste di maggiore sicurezza si scontrano con la realtà e la necessità di innovare con l’impossibilità pratica di garantire sistemi immuni da abusi e jailbreak.
Carolina Vivianti è consulente/Advisor autonomo in sicurezza informatica con esperienza nel settore tech e security. Ha lavorato come Security Advisor per Ford EU/Ford Motor Company e Vodafone e ha studi presso la Sapienza Università di Roma.
Aree di competenza: Cybersecurity, IT Risk Management, Security Advisory, Threat Analysis, Data Protection, Cloud Security, Compliance & Governance