
Nel 2023, Nvidia ha introdotto un’architettura superchip che collega CPU e GPU tramite un bus NVLink ad alta velocità. Offre una comunicazione significativamente più veloce rispetto a PCIe, ma il suo utilizzo è stato a lungo limitato a data center e piattaforme cloud. Ora l’azienda sta portando la tecnologia sul desktop attraverso il progetto Digits, recentemente ribattezzato DGX Spark . Alla conferenza Hot Chips, Andi Scande, responsabile dell’architettura di GB10, ha fornito dettagli sul nuovo chip.
Il GB10 è prodotto da TSMC con un processo produttivo a 3 nm ed è composto da due die: una CPU progettata da MediaTek e una GPU creata da Nvidia. Sono collegati tramite un packaging 2.5D e l’interfaccia NVLink Chip-to-Chip dell’azienda, che fornisce fino a 600 GB/s di larghezza di banda bidirezionale.
La parte CPU (S-die) contiene 20 core Arm v9.2, divisi in due cluster: X925 e Cortex A725, con 32 MB di cache L3 e ulteriori 16 MB di L4 per velocizzare le interazioni tra i blocchi. Secondo Nvidia, il die della GPU è in grado di fornire fino a 1 petaFLOPS di calcoli FP4, o circa 31 teraFLOPS in FP32. In termini di prestazioni AI, questo è paragonabile alla RTX 5070 (il cui prezzo consigliato è di circa $ 550), ma la GB10 è notevolmente più efficiente: il suo consumo energetico è di 140 W contro i 250 W della 5070.
Avvio delle iscrizioni al corso Cyber Offensive Fundamentals Vuoi smettere di guardare tutorial e iniziare a capire davvero come funziona la sicurezza informatica? La base della sicurezza informatica, al di là di norme e tecnologie, ha sempre un unico obiettivo: fermare gli attacchi dei criminali informatici. Pertanto "Pensa come un attaccante, agisci come un difensore". Ti porteremo nel mondo dell'ethical hacking e del penetration test come nessuno ha mai fatto prima. Per informazioni potete accedere alla pagina del corso oppure contattarci tramite WhatsApp al numero 379 163 8765 oppure scrivendoci alla casella di posta [email protected].
Se ti piacciono le novità e gli articoli riportati su di Red Hot Cyber, iscriviti immediatamente alla newsletter settimanale per non perdere nessun articolo. La newsletter generalmente viene inviata ai nostri lettori ad inizio settimana, indicativamente di lunedì. |
Il vantaggio principale è la capacità di memoria: 128 GB di LPDDR5x contro i 12 GB della RTX 5070. Nonostante l’assenza di HBM, la memoria opera a 9400 MT/s e fornisce 273-301 GB/s di larghezza di banda. Questo è sufficiente per addestrare e riaddestrare modelli in cui la capacità è più importante della velocità di picco.
Secondo Nvidia, DGX Spark consente di riaddestrare modelli con un massimo di 70 miliardi di parametri ed eseguire inferenze su modelli con un massimo di 200 miliardi di parametri. Se necessario, è possibile combinare due dispositivi tramite la scheda di rete ConnectX-7 con due porte 200GbE, raddoppiando le capacità di elaborazione.
Il prezzo del nuovo prodotto parte da 2.999 dollari, rendendolo accessibile solo agli sviluppatori professionisti. Ma la cosa più importante è che l’architettura GB10 è compatibile con soluzioni di livello data center e i modelli testati su Spark non richiedono modifiche per l’implementazione industriale.
Ti è piaciuto questo articolo? Ne stiamo discutendo nella nostra Community su LinkedIn, Facebook e Instagram. Seguici anche su Google News, per ricevere aggiornamenti quotidiani sulla sicurezza informatica o Scrivici se desideri segnalarci notizie, approfondimenti o contributi da pubblicare.

CybercrimeNelle prime ore del mattino del 13 gennaio, uno dei principali ospedali del Belgio si è trovato improvvisamente quasi paralizzato. L’AZ Monica, con sedi ad Anversa e Deurne, è stato colpito da un attacco informatico…
CyberpoliticaIl CEO di Cloudflare, Matthew Prince, ha minacciato di chiudere le attività dell’azienda in Italia dopo che l’autorità di regolamentazione delle telecomunicazioni del Paese le ha imposto una multa pari al doppio del suo fatturato…
CybercrimeUn’analisi approfondita sulle connessioni infrastrutturali del gruppo emergente Orion Leaks e il suo possibile legame con l’ex gigante LockBit RaaS. Negli ultimi mesi, a seguito dell’Operazione Cronos, condotta da agenzie internazionali per smantellare l’infrastruttura e…
CybercrimeNegli ultimi mesi si sta parlando sempre più spesso di un cambio di paradigma nel cybercrime. Quello che per anni è stato percepito come un ecosistema prevalentemente digitale — fatto di frodi, furti di identità,…
CybercrimeA volte, per disattivare la protezione di Windows non è necessario attaccare direttamente l’antivirus. È sufficiente impedirne il corretto avvio. Un ricercatore che si fa chiamare Two Seven One Three (TwoSevenOneT) ha pubblicato su GitHub…