La scorsa settimana, la società cinese DeepSeek ha rilasciato R1, il suo nuovo modello linguistico, scatenando un’ondata di reazioni nel settore dell’intelligenza artificiale. Non solo R1 è paragonabile ai migliori modelli occidentali, ma è stato sviluppato a una frazione del costo.
Anche se ancora oggi molti mettono in dubbio queste informazioni, va da se che DeepSeek è stato uno tsunami nel mondo dell’Intelligenza generativa e il suo modello Open Source ha sconvolto decisamente gli equilibri e le regole del gioco.
DeepSeek ha scelto di renderlo completamente gratuito e open-source, provocando un terremoto nel panorama tecnologico globale.
Il crollo del mercato e le reazioni negli Stati Uniti
La risposta non si è fatta attendere. Il mercato azionario statunitense ha bruciato 1 trilione di dollari, gli investitori si sono lanciati in previsioni catastrofiche e persino Donald Trump ha definito l’evento un campanello d’allarme per gli Stati Uniti.
Marc Andreessen, uno dei più influenti venture capitalist della Silicon Valley, ha dichiarato: “R1 è una delle innovazioni più sorprendenti e impressionanti, un vero dono per il mondo.”
Ma il vero impatto di DeepSeek non risiede solo nel modello. Rilasciando pubblicamente i dettagli del suo processo di sviluppo, l’azienda ha sfatato il mito che la creazione di IA avanzate richieda investimenti miliardari. Questo ha costretto i competitor a una reazione immediata:
- Alibaba ha annunciato una nuova versione del suo modello Qwen.
- AI2, laboratorio di ricerca americano, ha aggiornato Tulu, sostenendo che ora superi R1.
- OpenAI ha lanciato in tutta fretta ChatGPT Gov, una versione del chatbot per le agenzie governative statunitensi, segnale chiaro della crescente preoccupazione per le tecnologie cinesi.
Come Apprendono normalmente i modelli linguistici
Per capire la portata della svolta, bisogna comprendere il processo di sviluppo delle IA che generalmente avviene in due fasei:
- Pre-formazione : La rete neurale viene alimentata con enormi quantità di dati (libri, codice, pagine web) per creare un modello base.
- Post-formazione : Il modello viene ottimizzato con due metodi principali:
- Ottimizzazione supervisionata: esseri umani valutano e migliorano le risposte.
- Apprendimento per rinforzo con feedback umano (RLHF): il modello impara attraverso giudizi umani.
OpenAI è stata la prima a implementare RLHF, rendendo i suoi modelli più intuitivi. Oggi, quasi tutte le aziende lo adottano.
Il segreto di DeepSeek: meno esseri umani, più automazione
DeepSeek ha tagliato i costi in modo drastico eliminando gran parte del lavoro umano. Invece di affidarsi a valutatori umani costosi, ha sviluppato un sistema automatizzato in cui il computer stesso giudica e migliora le risposte.
- Vantaggio: Risparmio di milioni di dollari.
- Limite: Le macchine eccellono in materie esatte (matematica, programmazione) ma faticano con domande creative o filosofiche.
Per la messa a punto finale, DeepSeek ha comunque coinvolto specialisti umani, ma grazie ai bassi costi della manodopera in Cina e all’abbondanza di esperti in matematica e ingegneria, ha mantenuto un vantaggio competitivo enorme.
I trucchi ingegneristici che hanno reso R1 così potente
DeepSeek non si è limitata a ottimizzare i costi: ha introdotto innovazioni tecniche chiave che hanno migliorato le prestazioni di R1.
- GRPO: un nuovo approccio al rinforzo
- I modelli IA standard usano un’intelligenza artificiale separata per valutare le risposte.
- DeepSeek ha eliminato questa dipendenza, facendo in modo che lo stesso modello stimasse la correttezza delle risposte → riduzione dei costi senza perdita di qualità.
- Previsione multi-token
- I modelli tradizionali prevedono il testo parola per parola.
- DeepSeek ha sviluppato un metodo per analizzare più parole contemporaneamente, migliorando velocità e precisione.
- Ottimizzazione delle GPU Nvidia
- DeepSeek ha riscritto il codice a basso livello per sfruttare al massimo le schede video esistenti, superando i limiti hardware senza acquistare nuovi chip.
- Data mining economico
- Invece di raccogliere manualmente dati matematici per il modello DeepSeekMath, l’azienda ha semplicemente filtrato i dati dal vasto archivio gratuito Common Crawl.
Il futuro dell’IA: cosa succederà ora?
DeepSeek ha innescato una reazione a catena. Microsoft, poco prima del rilascio di R1, ha annunciato rStar-Math, un modello sviluppato con una metodologia simile. Hugging Face sta già lavorando a OpenR1, un clone open-source del modello cinese.
Ma la vera rivoluzione è un’altra: non servono più miliardi di dollari per creare un’IA avanzata. Ora che il metodo di DeepSeek è pubblico, possiamo aspettarci una nuova ondata di intelligenze artificiali di alta qualità, più accessibili e a basso costo.
“Sembrava che l’IA fosse un lusso per pochi colossi tecnologici. DeepSeek ha dimostrato il contrario. Se è davvero così semplice, ci aspetta un vero boom dell’intelligenza artificiale.” ha detto Lewis Tunstall, ricercatore di Hugging Face
L’Occidente è preoccupato: perché?
La rapidità con cui la Cina sta sviluppando l’IA ha messo in allarme governi ed esperti di sicurezza. Se le aziende cinesi riescono a creare modelli avanzati a costi ridotti, ciò potrebbe ribaltare la supremazia tecnologica degli Stati Uniti in settori chiave come economia e difesa.
- Sanzioni inefficaci → Gli USA hanno vietato l’export di chip Nvidia H100 in Cina, ma DeepSeek ha aggirato il blocco ottimizzando i chip più vecchi.
- Preoccupazioni per la sicurezza → OpenAI ha lanciato ChatGPT Gov subito dopo R1, segno che Washington teme fughe di dati attraverso i modelli cinesi.
- IA militare → La Cina investe attivamente in IA per intelligence, guerra informatica e armi autonome.
Conclusione: Una AI Democratica è alle porte?
Nei prossimi mesi vedremo:
- Nuovi modelli open-source basati su R1, con Hugging Face in prima linea.
- Risposte aggressive da OpenAI, Google e Anthropic, che potrebbero accelerare il rilascio di GPT-5 e Gemini 3.
- Regolamentazioni più severe negli USA e UE per arginare l’adozione di IA cinesi.
Ma il punto cruciale è chiaro: DeepSeek ha infranto il monopolio dello sviluppo IA avanzato.
Non è più una tecnologia esclusiva delle élite di Silicon Valley. L’intelligenza artificiale è ora più accessibile che mai, e il mondo della tecnologia non sarà più lo stesso.
La Redazione di Red Hot Cyber fornisce aggiornamenti quotidiani su
bug,
data breach e
minacce globali. Ogni contenuto è validato dalla nostra community di esperti come
Pietro Melillo,
Massimiliano Brolli,
Sandro Sana,
Olivia Terragni e
Stefano Gazzella.
Grazie alla sinergia con i nostri
Partner leader nel settore (tra cui
Accenture,
CrowdStrike,
Trend Micro e
Fortinet), trasformiamo la complessità tecnica in consapevolezza collettiva, garantendo un'informazione accurata basata sull'analisi di fonti primarie e su una rigorosa
peer-review tecnica.