DeepSeek lancia la versione 3.1 del suo modello di intelligenza artificiale con supporto a chip cinesi

24 Agosto 2025 09:59

C’è stato un giorno in cui DeepSeek ha sorpreso mezzo mondo dimostrando che si poteva fare molto con meno. Oggi torna con la versione 3.1 e un messaggio che non passa inosservato: il modello è stato preparato per il prossimo lotto di chip cinesi.

Non stiamo parlando di un’inversione automatica del mercato, ma piuttosto di una scommessa concreta che punta in una direzione scomoda per NVIDIA e compagnia. Se questa armonia tecnica con l’hardware cinese si traduce in prestazioni, il dibattito su chi alimenta l’intelligenza artificiale in Cina suonerà molto diversamente.

Secondo la dichiarazione dell’azienda stessa , la versione V3.1 introduce l’inferenza ibrida nel più puro stile GPT-5 : un unico sistema con due percorsi, Think (ragionamento approfondito) e Non-Think (risposta rapida), commutabili dal sito web e dall’app. La formulazione è chiara: “Inferenza ibrida: Think e Non-Think, un modello, due modelli”. L’azienda sottolinea inoltre che la versione Think “ottiene risposte in meno tempo” rispetto alla sua predecessora. In altre parole, non cambiano solo i pesi, ma anche le modalità di inferenza già in uso.

La frase che riassume tutto: un FP8 “progettato per chip domestici”

In un commento appuntato sul suo ultimo post su WeChat, DeepSeek scrive: “UE8M0 FP8 è per la prossima generazione di chip nazionali”. Questo è il punto spinoso: suggerisce che l’azienda abbia adattato il formato dei dati, apparentemente un FP8 etichettato UE8M0, alla prossima ondata di processori cinesi.

Bloomberg e Reuters riprendono il messaggio e lo riassumono: la V3.1 è “personalizzata per funzionare con i chip di intelligenza artificiale cinesi di prossima generazione “. In altre parole, un’ottimizzazione orientata all’ecosistema locale.

FP8 è un formato a 8 bit che occupa la metà delle dimensioni di FP16/BF16. Grazie al supporto nativo, consente maggiori prestazioni per ciclo e meno memoria, a condizione che il ridimensionamento sia calibrato correttamente.

La scheda modello ufficiale Hugging Face afferma che DeepSeek-V3.1 “è stato addestrato utilizzando il formato di ridimensionamento UE8M0 FP8“, il che indica che non si tratta semplicemente di un processo di weight packing, ma che l’addestramento e l’esecuzione sono stati specificamente adattati a tale precisione. La parte difficile, e vale la pena essere cauti, è che tutto fa presagire che in futuro verranno implementati diversi chip, in grado di sfruttare questo schema in modo nativo.

Quindi, si tratta di una cattiva notizia per NVIDIA?

I dati dell’anno fiscale conclusosi il 26 gennaio indicano che la Cina ha rappresentato circa il 13% del fatturato dell’azienda guidata da Jensen Huang. Se parte dell’intelligenza artificiale in Cina dovesse passare dal classico ecosistema GPU + CUDA di NVIDIA a soluzioni nazionali basate sul fattore di forma UE8M0 FP8 e in grado di fornire buoni risultati (presumibilmente i chip Ascend di Huawei), la domanda di soluzioni occidentali potrebbe erodersi nel tempo.

La Cina ha rappresentato circa il 13% del fatturato di Nvidia nell’ultimo anno fiscale

Tutto questo avviene sullo sfondo dei controlli sulle esportazioni statunitensi: restrizioni volte a limitare l’accesso della Cina a chip all’avanguardia e che hanno anche accelerato la sua corsa all’autosufficienza.

Quest’anno, l’amministrazione Trump ha ripristinato condizionatamente le esportazioni di H2O, un chip progettato per la Cina. Da allora, lo status di H2O ha subito oscillazioni: tra permessi, pressioni normative cinesi e i piani di NVIDIA di introdurre alternative basate su Blackwell.

Il messaggio di fondo è che il quadro è politico e in evoluzione, e qualsiasi percorso che consenta alla Cina di diventare meno dipendente da queste finestre acquisisce valore strategico.

Ti è piaciuto questo articolo? Ne stiamo discutendo nella nostra Community su LinkedIn, Facebook e Instagram. Seguici anche su Google News, per ricevere aggiornamenti quotidiani sulla sicurezza informatica o Scrivici se desideri segnalarci notizie, approfondimenti o contributi da pubblicare.

Luca Vinciguerra

Machine Learning Engineer specializzato nel Natural Language Processing. Appassionato di Intelligenza Artificiale, Coding e tecnologia in generale. Aspetta l'avvento di Skynet.

Aree di competenza: Artificial Intelligence Engineer, Machine Learning & Deep Learning Specialist, Python Developer

Articoli in evidenza

Cybercrime

Campagna di phishing su Signal in Europa: sospetto coinvolgimento di attori statali

Bajram Zeqiri - 07/02/2026

Le autorità tedesche hanno recentemente lanciato un avviso riguardante una sofisticata campagna di phishing che prende di mira gli utenti di Signal in Germania e nel resto d’Europa. L’attacco si concentra su profili specifici, tra…

Innovazione

Robot in cerca di carne: Quando l’AI affitta periferiche. Il tuo corpo!

Silvia Felici - 06/02/2026

L’evoluzione dell’Intelligenza Artificiale ha superato una nuova, inquietante frontiera. Se fino a ieri parlavamo di algoritmi confinati dietro uno schermo, oggi ci troviamo di fronte al concetto di “Meatspace Layer”: un’infrastruttura dove le macchine non…

Cybercrime

DKnife: il framework di spionaggio Cinese che manipola le reti

Pietro Melillo - 06/02/2026

Negli ultimi anni, la sicurezza delle reti ha affrontato minacce sempre più sofisticate, capaci di aggirare le difese tradizionali e di penetrare negli strati più profondi delle infrastrutture. Un’analisi recente ha portato alla luce uno…

Vulnerabilità

Così tante vulnerabilità in n8n tutti in questo momento. Cosa sta succedendo?

Agostino Pellegrino - 06/02/2026

Negli ultimi tempi, la piattaforma di automazione n8n sta affrontando una serie crescente di bug di sicurezza. n8n è una piattaforma di automazione che trasforma task complessi in operazioni semplici e veloci. Con pochi click…

Innovazione

L’IA va in orbita: Qwen 3, Starcloud e l’ascesa del calcolo spaziale

Sergio Corpettini - 06/02/2026

Articolo scritto con la collaborazione di Giovanni Pollola. Per anni, “IA a bordo dei satelliti” serviva soprattutto a “ripulire” i dati: meno rumore nelle immagini e nei dati acquisiti attraverso i vari payload multisensoriali, meno…