
Nel 2023, Nvidia ha introdotto un’architettura superchip che collega CPU e GPU tramite un bus NVLink ad alta velocità. Offre una comunicazione significativamente più veloce rispetto a PCIe, ma il suo utilizzo è stato a lungo limitato a data center e piattaforme cloud. Ora l’azienda sta portando la tecnologia sul desktop attraverso il progetto Digits, recentemente ribattezzato DGX Spark . Alla conferenza Hot Chips, Andi Scande, responsabile dell’architettura di GB10, ha fornito dettagli sul nuovo chip.
Il GB10 è prodotto da TSMC con un processo produttivo a 3 nm ed è composto da due die: una CPU progettata da MediaTek e una GPU creata da Nvidia. Sono collegati tramite un packaging 2.5D e l’interfaccia NVLink Chip-to-Chip dell’azienda, che fornisce fino a 600 GB/s di larghezza di banda bidirezionale.
La parte CPU (S-die) contiene 20 core Arm v9.2, divisi in due cluster: X925 e Cortex A725, con 32 MB di cache L3 e ulteriori 16 MB di L4 per velocizzare le interazioni tra i blocchi. Secondo Nvidia, il die della GPU è in grado di fornire fino a 1 petaFLOPS di calcoli FP4, o circa 31 teraFLOPS in FP32. In termini di prestazioni AI, questo è paragonabile alla RTX 5070 (il cui prezzo consigliato è di circa $ 550), ma la GB10 è notevolmente più efficiente: il suo consumo energetico è di 140 W contro i 250 W della 5070.
Avvio delle iscrizioni al corso Cyber Offensive Fundamentals Vuoi smettere di guardare tutorial e iniziare a capire davvero come funziona la sicurezza informatica? La base della sicurezza informatica, al di là di norme e tecnologie, ha sempre un unico obiettivo: fermare gli attacchi dei criminali informatici. Pertanto "Pensa come un attaccante, agisci come un difensore". Ti porteremo nel mondo dell'ethical hacking e del penetration test come nessuno ha mai fatto prima. Per informazioni potete accedere alla pagina del corso oppure contattarci tramite WhatsApp al numero 379 163 8765 oppure scrivendoci alla casella di posta [email protected].
Se ti piacciono le novità e gli articoli riportati su di Red Hot Cyber, iscriviti immediatamente alla newsletter settimanale per non perdere nessun articolo. La newsletter generalmente viene inviata ai nostri lettori ad inizio settimana, indicativamente di lunedì. |
Il vantaggio principale è la capacità di memoria: 128 GB di LPDDR5x contro i 12 GB della RTX 5070. Nonostante l’assenza di HBM, la memoria opera a 9400 MT/s e fornisce 273-301 GB/s di larghezza di banda. Questo è sufficiente per addestrare e riaddestrare modelli in cui la capacità è più importante della velocità di picco.
Secondo Nvidia, DGX Spark consente di riaddestrare modelli con un massimo di 70 miliardi di parametri ed eseguire inferenze su modelli con un massimo di 200 miliardi di parametri. Se necessario, è possibile combinare due dispositivi tramite la scheda di rete ConnectX-7 con due porte 200GbE, raddoppiando le capacità di elaborazione.
Il prezzo del nuovo prodotto parte da 2.999 dollari, rendendolo accessibile solo agli sviluppatori professionisti. Ma la cosa più importante è che l’architettura GB10 è compatibile con soluzioni di livello data center e i modelli testati su Spark non richiedono modifiche per l’implementazione industriale.
Ti è piaciuto questo articolo? Ne stiamo discutendo nella nostra Community su LinkedIn, Facebook e Instagram. Seguici anche su Google News, per ricevere aggiornamenti quotidiani sulla sicurezza informatica o Scrivici se desideri segnalarci notizie, approfondimenti o contributi da pubblicare.

InnovazioneQuesta settimana ha segnato la fine di un’era: Microsoft ha finalmente terminato il supporto per Windows Server 2008, il sistema operativo basato su Windows Vista. Il sistema operativo server, nome in codice Longhorn Server, è…
CyberpoliticaL’articolo pubblicato ieri su Red Hot Cyber ha raccontato i fatti: la multa, le dichiarazioni durissime di Matthew Prince, le minacce di disimpegno di Cloudflare dall’Italia, il possibile effetto domino su Olimpiadi, investimenti e servizi…
CulturaDopo aver analizzato nei due articoli precedenti l’inquadramento normativo e il conflitto tra algoritmi e diritti fondamentali è necessario volgere lo sguardo alle ripercussioni che la proposta CSAR avrà sulla competitività digitale dell’Europa e sulla…
VulnerabilitàUna vulnerabilità recentemente risolta permetteva agli aggressori di sfruttare Microsoft Copilot Personal con un semplice clic, al fine di rubare di nascosto dati sensibili degli utenti. Mediante un link di phishing, i malintenzionati erano in…
CulturaWikipedia nacque il 15 gennaio 2001, in un freddo pomeriggio di metà gennaio che nessuno ricorda più davvero più. Jimmy Wales e Larry Sanger decisero di fare un esperimento, uno di quelli che sembrano folli…