
Nel 2023, Nvidia ha introdotto un’architettura superchip che collega CPU e GPU tramite un bus NVLink ad alta velocità. Offre una comunicazione significativamente più veloce rispetto a PCIe, ma il suo utilizzo è stato a lungo limitato a data center e piattaforme cloud. Ora l’azienda sta portando la tecnologia sul desktop attraverso il progetto Digits, recentemente ribattezzato DGX Spark . Alla conferenza Hot Chips, Andi Scande, responsabile dell’architettura di GB10, ha fornito dettagli sul nuovo chip.
Il GB10 è prodotto da TSMC con un processo produttivo a 3 nm ed è composto da due die: una CPU progettata da MediaTek e una GPU creata da Nvidia. Sono collegati tramite un packaging 2.5D e l’interfaccia NVLink Chip-to-Chip dell’azienda, che fornisce fino a 600 GB/s di larghezza di banda bidirezionale.
La parte CPU (S-die) contiene 20 core Arm v9.2, divisi in due cluster: X925 e Cortex A725, con 32 MB di cache L3 e ulteriori 16 MB di L4 per velocizzare le interazioni tra i blocchi. Secondo Nvidia, il die della GPU è in grado di fornire fino a 1 petaFLOPS di calcoli FP4, o circa 31 teraFLOPS in FP32. In termini di prestazioni AI, questo è paragonabile alla RTX 5070 (il cui prezzo consigliato è di circa $ 550), ma la GB10 è notevolmente più efficiente: il suo consumo energetico è di 140 W contro i 250 W della 5070.
Il vantaggio principale è la capacità di memoria: 128 GB di LPDDR5x contro i 12 GB della RTX 5070. Nonostante l’assenza di HBM, la memoria opera a 9400 MT/s e fornisce 273-301 GB/s di larghezza di banda. Questo è sufficiente per addestrare e riaddestrare modelli in cui la capacità è più importante della velocità di picco.
Secondo Nvidia, DGX Spark consente di riaddestrare modelli con un massimo di 70 miliardi di parametri ed eseguire inferenze su modelli con un massimo di 200 miliardi di parametri. Se necessario, è possibile combinare due dispositivi tramite la scheda di rete ConnectX-7 con due porte 200GbE, raddoppiando le capacità di elaborazione.
Il prezzo del nuovo prodotto parte da 2.999 dollari, rendendolo accessibile solo agli sviluppatori professionisti. Ma la cosa più importante è che l’architettura GB10 è compatibile con soluzioni di livello data center e i modelli testati su Spark non richiedono modifiche per l’implementazione industriale.
Ti è piaciuto questo articolo? Ne stiamo discutendo nella nostra Community su LinkedIn, Facebook e Instagram. Seguici anche su Google News, per ricevere aggiornamenti quotidiani sulla sicurezza informatica o Scrivici se desideri segnalarci notizie, approfondimenti o contributi da pubblicare.

InnovazioneL’evoluzione dell’Intelligenza Artificiale ha superato una nuova, inquietante frontiera. Se fino a ieri parlavamo di algoritmi confinati dietro uno schermo, oggi ci troviamo di fronte al concetto di “Meatspace Layer”: un’infrastruttura dove le macchine non…
CybercrimeNegli ultimi anni, la sicurezza delle reti ha affrontato minacce sempre più sofisticate, capaci di aggirare le difese tradizionali e di penetrare negli strati più profondi delle infrastrutture. Un’analisi recente ha portato alla luce uno…
VulnerabilitàNegli ultimi tempi, la piattaforma di automazione n8n sta affrontando una serie crescente di bug di sicurezza. n8n è una piattaforma di automazione che trasforma task complessi in operazioni semplici e veloci. Con pochi click…
InnovazioneArticolo scritto con la collaborazione di Giovanni Pollola. Per anni, “IA a bordo dei satelliti” serviva soprattutto a “ripulire” i dati: meno rumore nelle immagini e nei dati acquisiti attraverso i vari payload multisensoriali, meno…
Cyber ItaliaNegli ultimi giorni è stato segnalato un preoccupante aumento di truffe diffuse tramite WhatsApp dal CERT-AGID. I messaggi arrivano apparentemente da contatti conosciuti e richiedono urgentemente denaro, spesso per emergenze come spese mediche improvvise. La…