
Redazione RHC : 6 Aprile 2024 09:06
Le aziende che sviluppano l’intelligenza artificiale si trovano ad affrontare un nuovo problema: il volume di Internet potrebbe non essere sufficiente per i loro ambiziosi progetti. Il Wall Street Journal ha descritto le possibili prospettive nel campo dell’intelligenza artificiale.
La crescente potenza dei sistemi sviluppati da OpenAI, Google e altri richiede quantità sempre maggiori di informazioni per la formazione, portando a tensioni nel mercato dei dati pubblici. Tuttavia, alcuni proprietari di dati ne limitano l’accesso alle società di intelligenza artificiale.
Gli esperti del settore avvertono che la domanda di dati testuali di alta qualità potrebbe superare l’offerta entro due anni, rallentando potenzialmente il progresso dell’intelligenza artificiale. Pertanto le aziende sono alla ricerca di fonti di informazione non ancora sfruttate e stanno ripensando il modo in cui addestrano i propri sistemi.
Sponsorizza la prossima Red Hot Cyber Conference! Il giorno Lunedì 18 maggio e martedì 19 maggio 2026 9 maggio 2026, presso il teatro Italia di Roma (a due passi dalla stazione termini e dalla metro B di Piazza Bologna), si terrà la V edizione della la RHC Conference. Si tratta dell’appuntamento annuale gratuito, creato dalla community di RHC, per far accrescere l’interesse verso le tecnologie digitali, l’innovazione digitale e la consapevolezza del rischio informatico. Se sei interessato a sponsorizzare l'evento e a rendere la tua azienda protagonista del più grande evento della Cybersecurity Italiana, non perdere questa opportunità. E ricorda che assieme alla sponsorizzazione della conferenza, incluso nel prezzo, avrai un pacchetto di Branding sul sito di Red Hot Cyber composto da Banner più un numero di articoli che saranno ospitati all'interno del nostro portale. Quindi cosa stai aspettando? Scrivici subito a [email protected] per maggiori informazioni e per accedere al programma sponsor e al media Kit di Red Hot Cyber.
Se ti piacciono le novità e gli articoli riportati su di Red Hot Cyber, iscriviti immediatamente alla newsletter settimanale per non perdere nessun articolo. La newsletter generalmente viene inviata ai nostri lettori ad inizio settimana, indicativamente di lunedì. |
OpenAI sta valutando la possibilità di addestrare il suo prossimo modello, GPT-5, sulle trascrizioni video di YouTube. Sono in corso anche esperimenti utilizzando dati sintetici, anche se molti ricercatori ritengono che ciò possa portare a gravi fallimenti nei modelli.
La mancanza di dati è solo una delle sfide che il settore dell’intelligenza artificiale deve affrontare. Inoltre, vi è una carenza di chip necessari per eseguire modelli linguistici di grandi dimensioni come ChatGPT e Gemini, nonché una mancanza di dati ed elettricità per alimentarli.
I modelli linguistici dell’intelligenza artificiale vengono addestrati su testi provenienti da Internet, comprese ricerche scientifiche, articoli di notizie e articoli di Wikipedia. Si ritiene che più dati vengono utilizzati per l’addestramento, più efficace diventa il modello. Tuttavia, gli esperti stimano che anche l’utilizzo di tutti i dati linguistici e delle immagini disponibili di alta qualità potrebbe creare un deficit di 10-20 trilioni di token o più.
Allo stesso tempo, le piattaforme social, i notiziari e altri operatori di mercato stanno limitando l’accesso ai propri dati per la formazione sull’intelligenza artificiale a causa delle preoccupazioni sull’equo compenso. Anche la posizione aperta sull’utilizzo di dati privati per addestrare i modelli non è ampiamente supportata.
Diverse aziende, tra cui OpenAI e Anthropic, stanno esplorando la possibilità di creare dati sintetici di alta qualità per addestrare i propri modelli ad evitare i problemi che sorgono quando si utilizza testo generato artificialmente.
Tuttavia, il settore rimane ottimista riguardo alla ricerca di soluzioni alle attuali sfide legate ai dati. Gli esperti paragonano la situazione attuale al “picco del petrolio”, suggerendo che, come lo sviluppo di tecnologie per superare le crisi petrolifere, potrebbero emergere soluzioni rivoluzionarie anche nel campo dell’intelligenza artificiale.
Redazione
Il 18 novembre 2025, alle 11:20 UTC, una parte significativa dell’infrastruttura globale di Cloudflare ha improvvisamente cessato di instradare correttamente il traffico Internet, mostrando a milion...

Questo è il quinto di una serie di articoli dedicati all’analisi della violenza di genere nel contesto digitale, in coincidenza con la Giornata Internazionale per l’Eliminazione della Violenza co...

18 novembre 2025 – Dopo ore di malfunzionamenti diffusi, l’incidente che ha colpito la rete globale di Cloudflare sembra finalmente vicino alla risoluzione. L’azienda ha comunicato di aver imple...

La mattinata del 18 novembre 2025 sarà ricordata come uno dei blackout più anomali e diffusi della rete Cloudflare degli ultimi mesi. La CDN – cuore pulsante di milioni di siti web, applicazioni e...

La stanza è la solita: luci tenui, sedie in cerchio, termos di tisane ormai diventate fredde da quanto tutti parlano e si sfogano. Siamo gli Shakerati Anonimi, un gruppo di persone che non avrebbe ma...