
Redazione RHC : 6 Aprile 2024 09:06
Le aziende che sviluppano l’intelligenza artificiale si trovano ad affrontare un nuovo problema: il volume di Internet potrebbe non essere sufficiente per i loro ambiziosi progetti. Il Wall Street Journal ha descritto le possibili prospettive nel campo dell’intelligenza artificiale.
La crescente potenza dei sistemi sviluppati da OpenAI, Google e altri richiede quantità sempre maggiori di informazioni per la formazione, portando a tensioni nel mercato dei dati pubblici. Tuttavia, alcuni proprietari di dati ne limitano l’accesso alle società di intelligenza artificiale.
Gli esperti del settore avvertono che la domanda di dati testuali di alta qualità potrebbe superare l’offerta entro due anni, rallentando potenzialmente il progresso dell’intelligenza artificiale. Pertanto le aziende sono alla ricerca di fonti di informazione non ancora sfruttate e stanno ripensando il modo in cui addestrano i propri sistemi.
Christmas Sale -40% 𝗖𝗵𝗿𝗶𝘀𝘁𝗺𝗮𝘀 𝗦𝗮𝗹𝗲! Sconto del 𝟰𝟬% 𝘀𝘂𝗹 𝗽𝗿𝗲𝘇𝘇𝗼 𝗱𝗶 𝗰𝗼𝗽𝗲𝗿𝘁𝗶𝗻𝗮 del Corso "Dark Web & Cyber Threat Intelligence" in modalità E-Learning sulla nostra Academy!🚀
Fino al 𝟯𝟭 𝗱𝗶 𝗗𝗶𝗰𝗲𝗺𝗯𝗿𝗲, prezzi pazzi alla Red Hot Cyber Academy. 𝗧𝘂𝘁𝘁𝗶 𝗶 𝗰𝗼𝗿𝘀𝗶 𝘀𝗰𝗼𝗻𝘁𝗮𝘁𝗶 𝗱𝗲𝗹 𝟰𝟬% 𝘀𝘂𝗹 𝗽𝗿𝗲𝘇𝘇𝗼 𝗱𝗶 𝗰𝗼𝗽𝗲𝗿𝘁𝗶𝗻𝗮.
Per beneficiare della promo sconto Christmas Sale, scrivici ad [email protected] o contattaci su Whatsapp al numero di telefono: 379 163 8765.
Se ti piacciono le novità e gli articoli riportati su di Red Hot Cyber, iscriviti immediatamente alla newsletter settimanale per non perdere nessun articolo. La newsletter generalmente viene inviata ai nostri lettori ad inizio settimana, indicativamente di lunedì. |
OpenAI sta valutando la possibilità di addestrare il suo prossimo modello, GPT-5, sulle trascrizioni video di YouTube. Sono in corso anche esperimenti utilizzando dati sintetici, anche se molti ricercatori ritengono che ciò possa portare a gravi fallimenti nei modelli.
La mancanza di dati è solo una delle sfide che il settore dell’intelligenza artificiale deve affrontare. Inoltre, vi è una carenza di chip necessari per eseguire modelli linguistici di grandi dimensioni come ChatGPT e Gemini, nonché una mancanza di dati ed elettricità per alimentarli.
I modelli linguistici dell’intelligenza artificiale vengono addestrati su testi provenienti da Internet, comprese ricerche scientifiche, articoli di notizie e articoli di Wikipedia. Si ritiene che più dati vengono utilizzati per l’addestramento, più efficace diventa il modello. Tuttavia, gli esperti stimano che anche l’utilizzo di tutti i dati linguistici e delle immagini disponibili di alta qualità potrebbe creare un deficit di 10-20 trilioni di token o più.
Allo stesso tempo, le piattaforme social, i notiziari e altri operatori di mercato stanno limitando l’accesso ai propri dati per la formazione sull’intelligenza artificiale a causa delle preoccupazioni sull’equo compenso. Anche la posizione aperta sull’utilizzo di dati privati per addestrare i modelli non è ampiamente supportata.
Diverse aziende, tra cui OpenAI e Anthropic, stanno esplorando la possibilità di creare dati sintetici di alta qualità per addestrare i propri modelli ad evitare i problemi che sorgono quando si utilizza testo generato artificialmente.
Tuttavia, il settore rimane ottimista riguardo alla ricerca di soluzioni alle attuali sfide legate ai dati. Gli esperti paragonano la situazione attuale al “picco del petrolio”, suggerendo che, come lo sviluppo di tecnologie per superare le crisi petrolifere, potrebbero emergere soluzioni rivoluzionarie anche nel campo dell’intelligenza artificiale.
Redazione
Secondo Eurostat nel 2023 solo il 55% dei cittadini dell’Unione Europea tra i 16 e i 74 anni possedeva competenze digitali almeno di base, con forti differenze tra paesi: si va da valori intorno all...

Cloudflare ha registrato un’interruzione significativa nella mattina del 5 dicembre 2025, quando alle 08:47 UTC una parte della propria infrastruttura ha iniziato a generare errori interni. L’inci...

Una campagna sempre più aggressiva, che punta direttamente alle infrastrutture di accesso remoto, ha spinto gli autori delle minacce a tentare di sfruttare attivamente le vulnerabilità dei portali V...

Dietro molte delle applicazioni e servizi digitali che diamo per scontati ogni giorno si cela un gigante silenzioso: FreeBSD. Conosciuto soprattutto dagli addetti ai lavori, questo sistema operativo U...

Molto spesso parliamo su questo sito del fatto che la finestra tra la pubblicazione di un exploit e l’avvio di attacchi attivi si sta riducendo drasticamente. Per questo motivo diventa sempre più f...