Recentemente, la questione dell’uso dei diritti d’autore nella formazione sull’intelligenza artificiale è venuta alla ribalta. OpenAI, un laboratorio sostenuto da Microsoft, ha affermato che non è possibile creare reti neurali all’avanguardia che soddisfino i requisiti moderni senza utilizzare il lavoro originale umano. A loro avviso, l’utilizzo di materiali di pubblico dominio non protetti dal diritto d’autore porterà alla creazione di un’intelligenza artificiale di bassa qualità.
La dichiarazione è arrivata sullo sfondo dello sviluppo attivo dell’apprendimento automatico e dei problemi legati al diritto d’autore. Un recente rapporto dell’IEEE ha rilevato che servizi di intelligenza artificiale come Midjourney e DALL-E 3 di OpenAI sono in grado di ricreare scene protette da copyright da film e videogiochi in base ai dati di addestramento.
Lo studio condotto dall’esperto di intelligenza artificiale Gary Marcus e dall’illustratore digitale Reed Southen, documenta numerosi casi di “plagio” in cui OpenAI e DALL-E 3 rendono versioni quasi identiche di scene di film, immagini di attori famosi e contenuti di videogiochi.
La legalità di tale utilizzo di materiali proprietari e i rischi di responsabilità per i fornitori di intelligenza artificiale e i loro clienti rimangono controversi. Tuttavia, i risultati dello studio potrebbero rafforzare la posizione di coloro che hanno citato in giudizio Midjourney e i creatori di DALL-E di OpenAI per violazione del copyright.
Il rapporto evidenzia che OpenAI e Midjourney sono in grado di creare materiale che potrebbe violare diritti d’autore e marchi senza che i sistemi ne informino gli utenti. Cioè, gli utenti potrebbero anche non sapere che stanno violando il copyright creando un’immagine.

Le aziende non divulgano i dati utilizzati per addestrare i propri modelli di intelligenza artificiale. Non sono solo gli artisti digitali a metterli sotto pressione. Ad esempio, il New York Times ha recentemente citato in giudizio OpenAI perché il suo modello di testo ChatGPT produce copie quasi letterali di articoli dal servizio di abbonamento a pagamento del giornale.
In risposta a una richiesta del Comitato per le comunicazioni e il digitale della Camera dei Lord del Regno Unito, OpenAI ha presentato un rapporto in cui avvertiva che i suoi modelli non avrebbero funzionato senza formazione sui contenuti proprietari. Credono che imparare dai materiali protetti da copyright sia legittimo, anche se riconoscono che “c’è ancora del lavoro da fare per sostenere e dare potere ai creatori”.
OpenAI offriva protezione dalle rivendicazioni sul copyright per i client ChatGPT e API a meno che il cliente o gli utenti finali “sapessero o avrebbero dovuto sapere che il risultato viola o potrebbe violare” i diritti d’autore o se il client ignorava le funzionalità di sicurezza. Midjourney, al contrario, promette di perseguire e citare in giudizio i clienti coinvolti nella violazione per recuperare le spese legali associate a tali affermazioni.
Pertanto, l’uso del diritto d’autore nella formazione sull’IA rimane una questione complessa e controversa che richiede ulteriori considerazioni e possibilmente modifiche legislative.