Meta ha stretto recentemente un accordo con Amazon per implementare decine di milioni di core di processore AWS Graviton. I chip alimenteranno l’infrastruttura di calcolo su cui l’azienda sta costruendo la prossima generazione di servizi di intelligenza artificiale : dalla ricerca e generazione di codice ad agenti multi-step in grado di pianificare azioni ed eseguire attività in tempo quasi reale.
Amazon inizierà con decine di milioni di core Graviton e potrà aumentare questa capacità se le esigenze di calcolo di Meta continueranno a crescere. I processori serviranno a gestire diversi carichi di lavoro relativi ai servizi di intelligenza artificiale dell’azienda. Meta gestisce piattaforme con una base di utenti di un miliardo di persone, quindi anche un piccolo miglioramento in termini di velocità o consumo energetico a un livello dell’infrastruttura ha un impatto significativo sull’intero sistema.
Graviton è la linea proprietaria di processori per server di Amazon basata sull’architettura Arm. AWS promuove questi chip come un’opzione più veloce, economica ed efficiente dal punto di vista energetico per i carichi di lavoro cloud rispetto a molti processori per server tradizionali. Per le infrastrutture di intelligenza artificiale, il risparmio energetico non è più un aspetto secondario, ma una componente strategica: i data center richiedono più potenza, più rack e prestazioni più prevedibili.
L’accordo amplia la partnership di lunga data di Meta con Amazon Web Services e rappresenta un cambiamento significativo nell’infrastruttura di intelligenza artificiale. Negli ultimi anni, l’attenzione si è concentrata sulle unità di elaborazione grafica (GPU), necessarie per addestrare modelli di grandi dimensioni.
Una volta lanciati i prodotti di intelligenza artificiale, il carico di lavoro viene distribuito in modo diverso. I sistemi devono elaborare rapidamente le query, eseguire catene di ragionamento, accedere ai dati, coordinare le operazioni e fornire risultati a miliardi di utenti. Questo lavoro richiede non solo GPU, ma anche potenti unità di elaborazione centrale (CPU).
Il nuovo Graviton5 è prodotto con un processo a 3 nanometri e include 192 core. Amazon dichiara un aumento delle prestazioni fino al 25% rispetto alla generazione precedente. Il nuovo chip dispone inoltre di una cache cinque volte più grande rispetto al suo predecessore. La cache consente al processore di accedere ai dati più velocemente e una minore latenza tra i core è importante per i sistemi in cui vengono eseguite in parallelo più attività correlate.
Amazon segnala inoltre una riduzione della latenza tra i core fino al 33%. Per i servizi di intelligenza artificiale, questo parametro ha un impatto diretto sulla velocità di risposta. Un agente che cerca informazioni, scrive codice, verifica i passaggi e richiama strumenti esterni passa costantemente da un’operazione all’altra. Più velocemente l’infrastruttura connette questi processi, minore sarà il ritardo tra la richiesta e il risultato.
Graviton funziona con AWS Nitro System, la piattaforma hardware e software di Amazon per la sicurezza, il networking e le prestazioni cloud. I processori supportano anche Elastic Fabric Adapter, una tecnologia per la connettività server a bassa latenza in cluster di grandi dimensioni. I cluster sono necessari quando una singola attività è distribuita su più macchine e lo scambio di dati non deve rallentare l’intero processo.
L’accordo dimostra che la corsa all’intelligenza artificiale non si limita più all’acquisto di GPU per l’addestramento dei modelli. I nuovi sistemi basati su agenti devono pianificare, ragionare, scrivere codice ed eseguire sequenze di azioni. Dopo l’addestramento del modello, il carico di lavoro principale si sposta sull’inferenza, ovvero sull’esecuzione del modello finale in risposta a query reali degli utenti. In questa fase, CPU, memoria, rete ed efficienza energetica iniziano a svolgere un ruolo sempre più significativo.
Per Meta, l’espansione delle proprie fonti di potenza di calcolo è diventata una priorità strategica. L’azienda non vuole dipendere da una singola classe di chip o da un singolo fornitore, soprattutto in un momento in cui la domanda di risorse per l’IA cresce più rapidamente della capacità del mercato di costruire nuovi data center. Graviton offre a Meta un’ulteriore opportunità per scalare i carichi di lavoro della CPU alla base dell’IA basata su agenti.
Per Amazon, l’accordo con Meta rappresenta una forte conferma pubblica del suo impegno verso i propri processori. Graviton è da tempo utilizzato internamente da AWS, ma l’impiego di decine di milioni di core per uno dei maggiori consumatori di infrastrutture per l’IA porta la questione a un livello superiore. Amazon dimostra che la competizione nel campo dell’IA non si basa solo su acceleratori costosi, ma sull’intera infrastruttura di calcolo: CPU, rete, cache, consumo energetico e costo di elaborazione di ogni singola richiesta.
Carolina Vivianti è consulente/Advisor autonomo in sicurezza informatica con esperienza nel settore tech e security. Ha lavorato come Security Advisor per Ford EU/Ford Motor Company e Vodafone e ha studi presso la Sapienza Università di Roma.
Aree di competenza: Cybersecurity, IT Risk Management, Security Advisory, Threat Analysis, Data Protection, Cloud Security, Compliance & Governance