In sintesiGli archivi musicali sono diventati un obiettivo facile per gli algoritmi di IA che li utilizzano per l'addestramento senza rispettare le regole d'uso. Questo problema è stato evidenziato da The Atlantic, che ha scoperto dataset contenenti milioni di brani scaricati illegalmente da YouTube e Spotify. Tra gli artisti coinvolti ci sono Lady Gaga, Radiohead e molti altri.
Gli archivi musicali sono diventati un obiettivo facile per gli algoritmi di intelligenza artificiale, che spesso li utilizzano per l’addestramento dei loro modelli commerciali senza rispettare le regole d’uso. The Atlantic ha recentemente evidenziato questo problema attraverso una nuova base dati di tracce musicali utilizzate per l’addestramento delle IA.
Il giornalista Alex Ryner ha scoperto quattro dataset contenenti musica, due dei quali particolarmente estesi: uno con 12 milioni di brani e un altro con 9 milioni. Gli altri due dataset sono più piccoli ma comunque significativi, con oltre 100 mila canzoni ciascuno. Questi dataset sono stati scaricati migliaia di volte, anche se non è possibile identificare tutti gli utenti coinvolti. Google e Stability AI hanno confermato l’uso di questi dati in pubblicazioni scientifiche.
La questione principale riguarda non solo la presenza delle tracce online, ma anche il modo in cui vengono ottenute. Tre dei dataset scoperti distribuiscono le canzoni non come archivi musicali pronti all’uso, ma come elenchi di link a brani su YouTube e Spotify. Gli sviluppatori di IA utilizzano poi strumenti automatici per scaricare l’audio, spesso aggirando i meccanismi di accesso che permettono agli autori di guadagnare o ottenere visibilità. Questo approccio viola le regole delle piattaforme coinvolte.
Tra gli artisti presenti nei dataset ci sono sia nomi famosi come Lady Gaga e Radiohead, sia musicisti di nicchia come Fred Again.., Aphex Twin, Wu-Tang Clan, Bruce Springsteen e Hainbach. Sul sito AI Watchdog di The Atlantic è possibile cercare non solo canzoni, ma anche libri e altri media utilizzati per l’addestramento delle IA.
Dietro a questa pratica si cela un problema più profondo del semplice rispetto delle licenze. Si tratta della trasformazione della creatività umana in una sorta di materia prima per l’economia dell’intelligenza artificiale, che non viene vista o valutata. Ogni brano musicale è il frutto di anni di studio, sperimentazione ed esperienza personale. Tuttavia, quando viene incluso in grandi raccolte di dati, finisce per essere considerato solo come una sequenza di informazioni da processare.
Il dibattito non si concentra solo sul diritto d’autore, ma anche sul riconoscimento del valore culturale e umano che ogni opera possiede. È importante capire come questo valore venga redistribuito nell’era delle macchine intelligenti.
La corsa all’addestramento di modelli sempre più avanzati sta mettendo a rischio l’equilibrio tra innovazione e sostenibilità nel settore creativo. Se artisti, autori ed etichette non ricevono un consenso o una compensazione per l’uso delle loro opere, le basi economiche che sostengono la produzione culturale potrebbero essere erose.
La sfida futura sarà quella di stabilire regole chiare che permettano lo sviluppo dell’intelligenza artificiale senza trasformare gli archivi digitali in risorse da sfruttare senza controllo. Queste regole dovranno garantire trasparenza, consenso e una giusta ricompensa per i creatori.
Carolina Vivianti è consulente/Advisor autonomo in sicurezza informatica con esperienza nel settore tech e security. Ha lavorato come Security Advisor per Ford EU/Ford Motor Company e Vodafone e ha studi presso la Sapienza Università di Roma.
Aree di competenza: Cybersecurity, IT Risk Management, Security Advisory, Threat Analysis, Data Protection, Cloud Security, Compliance & Governance