Red Hot Cyber
La cybersecurity è condivisione. Riconosci il rischio, combattilo, condividi le tue esperienze ed incentiva gli altri a fare meglio di te.
Cerca
970x120
TM RedHotCyber 320x100 042514
AI Senza Dati: Entro il 2026 potremmo esaurire i dati di addestramento. Cosa succederà dopo?

AI Senza Dati: Entro il 2026 potremmo esaurire i dati di addestramento. Cosa succederà dopo?

Redazione RHC : 12 Novembre 2023 09:30

Recentemente avevamo parlato del fatto che l’intelligenza artificiale, una volta che utilizzerà i propri dati per alimentarsi, avrebbe potuto perdere di qualità e precisione. Una nuova ricerca inizia a prendere in considerazione il fatto che tra qualche anno, i dati prodotti dagli umani inizieranno a scarseggiare.

Questo determinerà meno informazioni per le IA ma anche un problema da risolvere da parte degli scienziati.

L’esaurimento dei dati di addestramento

L’intelligenza artificiale (AI), che ha raggiunto l’apice della popolarità, deve far fronte alla mancanza di dati di addestramento necessari per il suo funzionamento. Ciò potrebbe rallentare lo sviluppo di modelli di intelligenza artificiale. In particolare di modelli linguistici di grandi dimensioni, e persino cambiare il corso della rivoluzione dell’intelligenza artificiale.


Nuovo Fumetto Betti

CALL FOR SPONSOR - Sponsorizza l'ottavo episodio della serie Betti-RHC

Sei un'azienda innovativa, che crede nella diffusione di concetti attraverso metodi "non convenzionali"? 
Conosci il nostro corso sul cybersecurity awareness a fumetti? 
Red Hot Cyber sta ricercando un nuovo sponsor per una nuova puntata del fumetto Betti-RHC mentre il team è impegnato a realizzare 3 nuovi episodi che ci sono stati commissionati. 
Contattaci tramite WhatsApp al numero 375 593 1011 per richiedere ulteriori informazioni oppure alla casella di posta [email protected]


Supporta Red Hot Cyber attraverso: 

  1. L'acquisto del fumetto sul Cybersecurity Awareness
  2. Ascoltando i nostri Podcast
  3. Seguendo RHC su WhatsApp
  4. Seguendo RHC su Telegram
  5. Scarica gratuitamente “Byte The Silence”, il fumetto sul Cyberbullismo di Red Hot Cyber

Se ti piacciono le novità e gli articoli riportati su di Red Hot Cyber, iscriviti immediatamente alla newsletter settimanale per non perdere nessun articolo. La newsletter generalmente viene inviata ai nostri lettori ad inizio settimana, indicativamente di lunedì.

L’addestramento di algoritmi IA potenti e accurati richiede grandi quantità di dati. Ad esempio, ChatGPT è stato addestrato su 300 miliardi di parole. Allo stesso modo, DALL-E, Lensa e Midjourney sono stati addestrati su set di dati LIAON-5B contenente 5,8 miliardi di coppie immagine-testo. Se un algoritmo viene addestrato su dati insufficienti, potrebbe produrre risultati imprecisi o di bassa qualità.

La ricerca mostra che il patrimonio di dati di Internet sta crescendo molto più lentamente rispetto ai set di dati utilizzati per addestrare l’intelligenza artificiale. 

il 2026 potrebbe essere la data limite

L’anno scorso, un gruppo di ricercatori ha previsto che i dati testuali di qualità si esauriranno entro il 2026. Questa previsione è state definita sulla base delle attuali tendenze di formazione dell’IA continueranno. Si stima inoltre che i dati linguistici di bassa qualità si esauriranno tra il 2030 e il 2050. Inoltre le immagini di bassa qualità si esauriranno tra il 2030 e il 2060. La mancanza di dati utilizzabili potrebbe rallentare lo sviluppo dell’intelligenza artificiale. Questo mentre si prevede che l’economia AI contribuirà fino a 15,7 trilioni di dollari all’economia globale entro il 2030.

Tuttavia, ci sono modi per risolvere il problema della carenza di dati. 

Soluzioni per poter generare nuovi dati

Una possibilità è migliorare gli algoritmi di intelligenza artificiale per utilizzare meglio i dati esistenti. Nei prossimi anni, gli sviluppatori saranno probabilmente in grado di addestrare sistemi di IA utilizzando meno dati e forse meno potenza di calcolo. Ciò contribuirà anche a ridurre l’impronta di carbonio dell’intelligenza artificiale. 

Un’altra opzione è utilizzare l’intelligenza artificiale per creare dati sintetici per addestrare i sistemi. Gli sviluppatori possono semplicemente generare i dati necessari adatti al loro modello di intelligenza artificiale specifico. Diversi progetti utilizzano già contenuti sintetici, spesso ottenuti da servizi di generazione dati. Questo diventerà più comune in futuro

Immagine del sitoRedazione
La redazione di Red Hot Cyber è composta da un insieme di persone fisiche e fonti anonime che collaborano attivamente fornendo informazioni in anteprima e news sulla sicurezza informatica e sull'informatica in generale.

Lista degli articoli

Articoli in evidenza

Immagine del sito
100 anni di Intelligence italiana! Mattarella celebra il centenario del SIM al Quirinale
Di Redazione RHC - 16/10/2025

Il 15 ottobre 2025 segna un anniversario di eccezionale rilievo nella storia della sicurezza nazionale italiana: cento anni dalla nascita del Servizio Informazioni Militare (SIM), primo servizio di in...

Immagine del sito
Allarme: migliaia di siti italiani a rischio! 526.000 siti e 6.500 db in vendita nel Darkweb
Di Luca Stivali - 16/10/2025

Un nuovo post sul dark web offre l’accesso completo a migliaia di server e database MySQL appartenenti a provider italiani di hosting condiviso. Nelle ultime ore è apparso su un forum underground u...

Immagine del sito
F5 subisce una violazione di sicurezza: codice sorgente e dati sensibili rubati
Di Redazione RHC - 16/10/2025

Un grave incidente di sicurezza è stato segnalato da F5, principale fornitore di soluzioni per la sicurezza e la distribuzione delle applicazioni. Era stato ottenuto l’accesso a lungo termine ai si...

Immagine del sito
Il “Double Bind” porta al Jailbreak di GPT-5: L’AI che è stata convinta di essere schizofrenica
Di Luca Vinciguerra - 15/10/2025

Un nuovo e insolito metodo di jailbreaking, ovvero l’arte di aggirare i limiti imposti alle intelligenze artificiali, è arrivato in redazione. A idearlo è stato Alin Grigoras, ricercatore di sicur...

Immagine del sito
Microsoft Patch Tuesday col botto! 175 bug corretti e due zero-day sfruttati
Di Redazione RHC - 14/10/2025

Nel suo ultimo aggiornamento, il colosso della tecnologia ha risolto 175 vulnerabilità che interessano i suoi prodotti principali e i sistemi sottostanti, tra cui due vulnerabilità zero-day attivame...