
Redazione RHC : 29 Agosto 2025 10:49
Nel 2023, Nvidia ha introdotto un’architettura superchip che collega CPU e GPU tramite un bus NVLink ad alta velocità. Offre una comunicazione significativamente più veloce rispetto a PCIe, ma il suo utilizzo è stato a lungo limitato a data center e piattaforme cloud. Ora l’azienda sta portando la tecnologia sul desktop attraverso il progetto Digits, recentemente ribattezzato DGX Spark . Alla conferenza Hot Chips, Andi Scande, responsabile dell’architettura di GB10, ha fornito dettagli sul nuovo chip.
Il GB10 è prodotto da TSMC con un processo produttivo a 3 nm ed è composto da due die: una CPU progettata da MediaTek e una GPU creata da Nvidia. Sono collegati tramite un packaging 2.5D e l’interfaccia NVLink Chip-to-Chip dell’azienda, che fornisce fino a 600 GB/s di larghezza di banda bidirezionale.
La parte CPU (S-die) contiene 20 core Arm v9.2, divisi in due cluster: X925 e Cortex A725, con 32 MB di cache L3 e ulteriori 16 MB di L4 per velocizzare le interazioni tra i blocchi. Secondo Nvidia, il die della GPU è in grado di fornire fino a 1 petaFLOPS di calcoli FP4, o circa 31 teraFLOPS in FP32. In termini di prestazioni AI, questo è paragonabile alla RTX 5070 (il cui prezzo consigliato è di circa $ 550), ma la GB10 è notevolmente più efficiente: il suo consumo energetico è di 140 W contro i 250 W della 5070.
Prova la Demo di Business Log! Adaptive SOC italiano Log management non solo per la grande Azienda, ma una suite di Audit file, controllo USB, asset, sicurezza e un Security Operation Center PERSONALE, che ti riporta tutte le operazioni necessarie al tuo PC per tutelare i tuoi dati e informati in caso di problemi nel tuo ambiente privato o di lavoro.
Scarica ora la Demo di Business Log per 30gg
Se ti piacciono le novità e gli articoli riportati su di Red Hot Cyber, iscriviti immediatamente alla newsletter settimanale per non perdere nessun articolo. La newsletter generalmente viene inviata ai nostri lettori ad inizio settimana, indicativamente di lunedì. |
Il vantaggio principale è la capacità di memoria: 128 GB di LPDDR5x contro i 12 GB della RTX 5070. Nonostante l’assenza di HBM, la memoria opera a 9400 MT/s e fornisce 273-301 GB/s di larghezza di banda. Questo è sufficiente per addestrare e riaddestrare modelli in cui la capacità è più importante della velocità di picco.
Secondo Nvidia, DGX Spark consente di riaddestrare modelli con un massimo di 70 miliardi di parametri ed eseguire inferenze su modelli con un massimo di 200 miliardi di parametri. Se necessario, è possibile combinare due dispositivi tramite la scheda di rete ConnectX-7 con due porte 200GbE, raddoppiando le capacità di elaborazione.
Il prezzo del nuovo prodotto parte da 2.999 dollari, rendendolo accessibile solo agli sviluppatori professionisti. Ma la cosa più importante è che l’architettura GB10 è compatibile con soluzioni di livello data center e i modelli testati su Spark non richiedono modifiche per l’implementazione industriale.
Redazione
La Duma di Stato della Federazione Russa ha adottato all’unanimità un appello a tutti gli sviluppatori di reti neurali nazionali e stranieri, chiedendo che all’intelligenza artificiale venga impe...

OpenAI ha presentato Aardvark, un assistente autonomo basato sul modello GPT-5 , progettato per individuare e correggere automaticamente le vulnerabilità nel codice software. Questo strumento di inte...

Analisi RHC sulla rete “BHS Links” e sulle infrastrutture globali di Black Hat SEO automatizzato Un’analisi interna di Red Hot Cyber sul proprio dominio ha portato alla luce una rete globale di ...

Abbiamo recentemente pubblicato un approfondimento sul “furto del secolo” al Louvre, nel quale sottolineavamo come la sicurezza fisica – accessi, controllo ambientale, vigilanza – sia oggi str...

Una nuova e insidiosa campagna di phishing sta colpendo i cittadini lombardi. I truffatori inviano e-mail che sembrano provenire da una presunta agenzia di recupero crediti, chiedendo il pagamento di ...