Red Hot Cyber
Sicurezza Informatica, Notizie su Cybercrime e Analisi Vulnerabilità
L’avvelenamento dei dati nelle AI porterà a non riconoscere i malware come tali

L’avvelenamento dei dati nelle AI porterà a non riconoscere i malware come tali

18 Maggio 2022 07:39

Negli ultimi dieci anni, l’intelligenza artificiale è stata utilizzata per il riconoscimento facciale, il rating del credito e le previsioni meteorologiche.

Allo stesso tempo, i casi di hack sofisticati sono diventati più frequenti. La combinazione di intelligenza artificiale e sicurezza informatica era inevitabile poiché entrambi i campi cercavano strumenti migliori e nuovi modi di utilizzare questa tecnologia.

Ma c’è un problema serio che minaccia di minare questi sforzi e potrebbe consentire agli aggressori di aggirare la protezione digitale senza essere scoperti.

Si tratta di una minaccia che a suo tempo avevamo trattato all’interno delle attività di hacking delle AI ovvero dell‘avvelenamento dei dati. 

Molte aziende potrebbero non essere preparate ad affrontare questi rischi sempre più crescenti. Si prevede che il mercato globale della sicurezza informatica dell’IA triplicherà fino a raggiungere i 35 miliardi di dollari entro il 2028. I fornitori di servizi di sicurezza e i loro clienti potrebbero dover combinare più strategie per raggiungere il giusto livello di sicurezza informatica.

Data un’enorme quantità di dati, ai computer può essere insegnato a classificare correttamente le informazioni. Lo stesso approccio viene utilizzato nella sicurezza informatica. Per catturare il malware, le aziende caricano i dati nei loro sistemi e lasciano che l’IA impari da sola. 

Grazie a numerosi esempi di codice buono e cattivo, i computer possono imparare a individuare il malware. 

I sistemi di apprendimento automatico richiedono un numero enorme di campioni correttamente etichettati per identificare con precisione le minacce. 

Il problema è che anche le più grandi società di sicurezza possono confrontare e classificare solo un numero limitato di esempi di malware, quindi non hanno altra scelta che acquistare altri propri dati di addestramento da altre fonti. Alcuni dati potrebbero potrebbero essere opensource o in crowdsourcing.

Ma qualche malintenzionato, potrebbe contrassegnando dei campioni come validi quando di fatto contengono codice dannoso. In questo modo un hacker può indurre la rete neurale a pensare che il codice pericoloso sia innocuo. 

Catturare tali campioni di codice è quasi impossibile. Il codice backdoor può bypassare completamente i meccanismi di difesa, avvelenando meno dello 0,7% dei dati inviati al suo sistema di apprendimento automatico.

Pertanto, un sistema di apprendimento automatico può diventare vulnerabile anche se utilizza solo una piccola quantità di dati open source non verificati.

Un modo per prevenire l’avvelenamento dei dati consiste nel controllare regolarmente l’accuratezza di tutte le etichette nei dati di addestramento da parte degli scienziati che sviluppano modelli di intelligenza artificiale.

Ad esempio, i ricercatori di OpenAI LLP, durante l’analisi dei set di dati per un nuovo strumento di imaging, hanno analizzato regolarmente i dati attraverso filtri speciali per garantire che ogni etichetta fosse accurata.

Ma come starete pensando, la complessità sta aumentando in modo impressionante e generalmente, la complessità non è un fattore che contribuisce ad aumentare la sicurezza.

Ti è piaciuto questo articolo? Ne stiamo discutendo nella nostra Community su LinkedIn, Facebook e Instagram. Seguici anche su Google News, per ricevere aggiornamenti quotidiani sulla sicurezza informatica o Scrivici se desideri segnalarci notizie, approfondimenti o contributi da pubblicare.

Marcello Filacchioni 300x300
ICT CISO e Cyber Security Manager con oltre vent’anni di esperienza tra settore pubblico e privato, ha guidato progetti di sicurezza informatica per realtà di primo piano. Specializzato in risk management, governance e trasformazione digitale, ha collaborato con vendor internazionali e startup innovative, contribuendo all’introduzione di soluzioni di cybersecurity avanzate. Possiede numerose certificazioni (CISM, CRISC, CISA, PMP, ITIL, CEH, Cisco, Microsoft, VMware) e svolge attività di docenza pro bono in ambito Cyber Security, unendo passione per l’innovazione tecnologica e impegno nella diffusione della cultura della sicurezza digitale.
Aree di competenza: Cyber Security Strategy & Governance, Vulnerability Management & Security Operations. 

Articoli in evidenza

Immagine del sitoCyber News
BETTI RHC: il fumetto che educa alla cybersecurity. Esce il 4 e 5 episodio
Andrea Gioia Lomoro - 02/02/2026

BETTI RHC è un progetto editoriale e culturale ideato da Red Hot Cyber, realtà italiana punto di riferimento nel panorama della cybersecurity e della divulgazione tecnologica. Non si tratta di un semplice fumetto, ma di…

Immagine del sitoCyber News
E se domani gli USA spegnessero il cloud?  L’UE non ha un piano e legifera pensando poco
Marcello Filacchioni - 02/02/2026

Mentre il cloud è diventato il cuore dell’economia digitale, l’Unione europea si trova davanti a una scelta storica: trasformare la certificazione cloud in uno strumento di sovranità o limitarsi ad un semplice controllo tecnico. Il…

Immagine del sitoVulnerabilità
Vulnhalla: come scovare bug 0day utilizzando l’Intelligenza Artificiale Generativa
Massimiliano Brolli - 02/02/2026

È il nuovo fuzzing del futuro? Con ogni probabilità sarà un approccio combinato multi agente, dove le AI assieme al bug hunter saranno in grado di ridurre drasticamente i tempi di individuazione dei bug 0-day.…

Immagine del sitoInnovazione
Moltbook, il Reddit dei Robot: Agenti AI discutono della loro civiltà (mentre noi li spiamo)
Silvia Felici - 01/02/2026

Venerdì è emersa online una notizia capace di strappare un sorriso e, subito dopo, generare un certo disagio: il lancio di Moltbook, un social network popolato non da persone ma da agenti di intelligenza artificiale.…

Immagine del sitoCyber News
Addio a NTLM! Microsoft verso una nuova era di autenticazione con kerberos
Silvia Felici - 31/01/2026

Per oltre tre decenni è stato una colonna silenziosa dell’ecosistema Windows. Ora però il tempo di NTLM sembra definitivamente scaduto. Microsoft ha deciso di avviare una transizione profonda che segna la fine di un’era e…