Un’indagine scopre modelli di generazione di immagini AI addestrati sugli abusi sui minori

21 Dicembre 2023 11:43

Un nuovo studio dello Stanford Internet Observatory (SIO) ha identificato la presenza di materiale di abuso sessuale infantile ( CSAM ). Tale ricerca si è concentrata sull’ampio set di dati pubblico LAION-5B, utilizzato per addestrare le reti neurali generative più diffuse, tra cui Stable Diffusion.

L’analisi di oltre 32 milioni di dati ha mostrato che lo strumento PhotoDNA di Microsoft ha confermato la presenza di 1.008 immagini CSAM. I ricercatori hanno sottolineato che questo numero di materiali potrebbe essere molto più elevato.

È importante notare che LAION-5B non contiene le immagini stesse, ma è una raccolta di metadati che include:

hash dell’immagine;
descrizione;
dati linguistici;
informazioni sulla possibilità che l’immagine non sia sicura;
URL dell’immagine.

Alcuni dei collegamenti alle foto CSAM in LAION-5B riguardavano siti come Reddit, X, Blogspot, WordPress, nonché siti per adulti XHamster e XVideos.

Per identificare le immagini sospette nel set di dati, il team SIO si è concentrato su quelle contrassegnate come “non sicure”. Queste immagini sono state testate utilizzando PhotoDNA per verificare la presenza di materiale CSAM. I risultati sono stati quindi inviati al Centro canadese per la protezione dell’infanzia (C3P) per conferma.

Il processo di rimozione del materiale originale identificato è attualmente in corso dopo che gli URL delle immagini sono stati inviati al C3P e al Centro nazionale per i bambini scomparsi e sfruttati (NCMEC) negli Stati Uniti.

Sebbene non esista un collegamento diretto con l’uso dell’intelligenza artificiale per creare immagini pornografiche dei minori, tali tecnologie hanno facilitato la commissione di crimini legati al ricatto deepfake e ad altri tipi di crimini.

Stable Diffusion 1.5 continua ad essere popolare per la creazione di foto esplicite. Questo nonostante la diffusa insoddisfazione della comunità per il rilascio di Stable Diffusion 2.0 con filtri di sicurezza aggiuntivi. Non è chiaro se Stability AI, la società che ha sviluppato Stable Diffusion, fosse a conoscenza della potenziale presenza di CSAM nei suoi modelli.

LAION, un’organizzazione no-profit tedesca che crea set di dati per la formazione sull’intelligenza artificiale generativa, è stata precedentemente criticata per aver incluso contenuti controversi. Google ha utilizzato il predecessore del LAION-5B, il LAION-400M, per addestrare la sua Imagen AI. Tuttavia, l’azienda ha deciso di non rilasciare lo strumento perché un audit del LAION-400M ha rivelato un’ampia gamma di contenuti inappropriati, tra cui immagini pornografiche, insulti razzisti e stereotipi sociali. Sempre nel settembre 2022, nel set di dati LAION-5B sono state trovate fotografie mediche private pubblicate senza autorizzazione .

In risposta alle accuse, la LAION ha annunciato di aver avviato “procedure di manutenzione ordinaria” per rimuovere i collegamenti a contenuti sospetti e potenzialmente illegali. LAION ha affermato che la società ha una politica di tolleranza zero per i contenuti illegali, aggiungendo che i set di dati pubblici sono stati temporaneamente rimossi dalla pubblicazione e verranno restituiti dopo l’aggiornamento del filtraggio. La restituzione dei set di dati all’uso pubblico è prevista per la seconda metà di gennaio.

Ti è piaciuto questo articolo? Ne stiamo discutendo nella nostra Community su LinkedIn, Facebook e Instagram. Seguici anche su Google News, per ricevere aggiornamenti quotidiani sulla sicurezza informatica o Scrivici se desideri segnalarci notizie, approfondimenti o contributi da pubblicare.

Stefano Gazzella

Privacy Officer e Data Protection Officer, è Of Counsel per Area Legale. Si occupa di protezione dei dati personali e, per la gestione della sicurezza delle informazioni nelle organizzazioni, pone attenzione alle tematiche relative all’ingegneria sociale. Responsabile del comitato scientifico di Assoinfluencer, coordina le attività di ricerca, pubblicazione e divulgazione. Giornalista pubblicista, scrive su temi collegati a diritti di quarta generazione, nuove tecnologie e sicurezza delle informazioni.

Aree di competenza: Privacy, GDPR, Data Protection Officer, Legal tech, Diritti, Meme

Visita il sito web dell'autore

Articoli in evidenza

Cybercrime

Campagna di phishing su Signal in Europa: sospetto coinvolgimento di attori statali

Bajram Zeqiri - 07/02/2026

Le autorità tedesche hanno recentemente lanciato un avviso riguardante una sofisticata campagna di phishing che prende di mira gli utenti di Signal in Germania e nel resto d’Europa. L’attacco si concentra su profili specifici, tra…

Innovazione

Robot in cerca di carne: Quando l’AI affitta periferiche. Il tuo corpo!

Silvia Felici - 06/02/2026

L’evoluzione dell’Intelligenza Artificiale ha superato una nuova, inquietante frontiera. Se fino a ieri parlavamo di algoritmi confinati dietro uno schermo, oggi ci troviamo di fronte al concetto di “Meatspace Layer”: un’infrastruttura dove le macchine non…

Cybercrime

DKnife: il framework di spionaggio Cinese che manipola le reti

Pietro Melillo - 06/02/2026

Negli ultimi anni, la sicurezza delle reti ha affrontato minacce sempre più sofisticate, capaci di aggirare le difese tradizionali e di penetrare negli strati più profondi delle infrastrutture. Un’analisi recente ha portato alla luce uno…

Vulnerabilità

Così tante vulnerabilità in n8n tutti in questo momento. Cosa sta succedendo?

Agostino Pellegrino - 06/02/2026

Negli ultimi tempi, la piattaforma di automazione n8n sta affrontando una serie crescente di bug di sicurezza. n8n è una piattaforma di automazione che trasforma task complessi in operazioni semplici e veloci. Con pochi click…

Innovazione

L’IA va in orbita: Qwen 3, Starcloud e l’ascesa del calcolo spaziale

Sergio Corpettini - 06/02/2026

Articolo scritto con la collaborazione di Giovanni Pollola. Per anni, “IA a bordo dei satelliti” serviva soprattutto a “ripulire” i dati: meno rumore nelle immagini e nei dati acquisiti attraverso i vari payload multisensoriali, meno…