A tutto Open Source! Esce Mistral 3, e le AI entrano nel mondo OnPrem

3 Dicembre 2025 08:58

L’azienda francese Mistral AI ha presentato la sua linea di modelli Mistral 3, rendendoli completamente open source con licenza Apache 2.0. La serie include diversi modelli compatti e densi con 3, 8 e 14 miliardi di parametri, oltre al modello di punta Mistral Large 3. Si tratta di un modello “Misture-of-Experts” con 41 miliardi di parametri attivi e 675 miliardi di parametri condivisi, che l’azienda definisce la sua soluzione più potente fino ad oggi.

Mistral Large 3 è stato addestrato da zero su circa 3.000 GPU NVIDIA H200. Dopo un ulteriore addestramento, il modello ha raggiunto il livello dei migliori modelli didattici open source nell’elaborazione di query comuni, ha supportato la comprensione delle immagini e ha dimostrato ottimi risultati in modalità multilingue, soprattutto per lingue diverse da inglese e cinese.

Nella classifica LMArena dei modelli open source non specificamente progettati per il ragionamento complesso, Mistral Large 3 ha debuttato al secondo posto ed è entrato nella top ten tra tutti i modelli OSS.

Gli sviluppatori hanno immediatamente rilasciato sia la versione base che quella didattica di Mistral Large 3. È stata promessa una versione separata incentrata sul ragionamento, che verrà rilasciata in seguito. Queste versioni aperte sono pensate per fungere da punto di partenza per la personalizzazione in base alle esigenze aziendali, anche lato client.

Per semplificare l’implementazione, Mistral collabora con NVIDIA, vLLM e Red Hat. Un benchmark per Mistral Large 3 è pubblicato in formato NVFP4, preparato utilizzando il progetto llm-compressor Questa versione può essere eseguita in modo efficiente su sistemi Blackwell NVL72, nonché su nodi con 8 GPU A100 o H100 tramite vLLM . NVIDIA ha aggiunto kernel attention e MoE ottimizzati per la nuova architettura, il supporto per split prefill e decoding e, in collaborazione con Mistral, ha implementato la decodifica speculativa. L’intera gamma Mistral 3 è supportata in TensorRT-LLM e SGLang consentendo le massime prestazioni con bassa profondità di bit e contesto lungo.

Per scenari edge e locali, Mistral produce la famiglia Ministral 3. Questi tre modelli supportano 3, 8 e 14 miliardi di parametri, ciascuno disponibile nelle versioni base, instructional e reasoning, tutti in grado di gestire immagini. Grazie al supporto multilingue e multiformato, vengono offerti come suite universale per una varietà di esigenze aziendali e di sviluppo: dai servizi online alle applicazioni eseguite localmente o su dispositivi embedded.

Particolare enfasi è posta sull’efficienza. Secondo Mistral, Ministral 3 dimostra il miglior rapporto costo-qualità tra i modelli open source della sua categoria. Le versioni didattiche eguagliano e superano le loro controparti in termini di accuratezza, mentre in scenari reali generano spesso un ordine di grandezza inferiore di token, riducendo latenza e costi.

Quando l’accuratezza è l’unico fattore importante, le varianti di ragionamento possono richiedere più tempo per calcolare e produrre una risposta più accurata. A titolo di esempio, citano Ministral 3 14B, che ha ottenuto un punteggio di circa l’85% nella sua categoria nel benchmark AIME 2025 Olympiad.

Tutti questi modelli sono progettati non solo per grandi data center, ma anche per sistemi edge. NVIDIA offre distribuzioni Ministral ottimizzate su workstation DGX Spark , PC e laptop dotati di RTX e piattaforme Jetson Orin . Ciò significa che lo stesso stack di modelli può essere utilizzato per applicazioni che vanno dalla robotica e dai dispositivi intelligenti ai servizi cloud.

La famiglia Mistral 3 è già disponibile in Mistral AI Studio , integrata con Amazon Bedrock, Azure Foundry, IBM WatsonX, OpenRouter, Fireworks e Together AI, ed è disponibile anche come scala aperta nelle collezioni Mistral Large 3 e Ministral 3 su Hugging Face.

Partner selezionati, come Modal e Unsloth AI , offrono soluzioni pronte all’uso per l’inferenza e il riaddestramento. NVIDIA NIM e AWS SageMaker promettono di aggiungere presto il supporto.

Per le aziende che cercano una soluzione più adatta alle sfide del loro settore e ai dati, Mistral offre servizi di formazione su modelli personalizzati. Inoltre, sul sito web è disponibile la documentazione tecnica dettagliata per diverse configurazioni, tra cui Ministral 3 3B-25-12 , Ministral 3 8B-25-12 , Ministral 3 14B-25-12 e Mistral Large 3 , oltre a materiali sulla governance e il rischio dell’IA nella sezione AI Governance Hub.

Detto questo, l’intelligenza artificiale sta andando anche verso modelli aperti e Open source altamente performanti. A vo orai la scelta se poter creare Cluster interni ed interoperabili dai vostri professionisti oppure fornire informazioni ad openai e Google.

Ti è piaciuto questo articolo? Ne stiamo discutendo nella nostra Community su LinkedIn, Facebook e Instagram. Seguici anche su Google News, per ricevere aggiornamenti quotidiani sulla sicurezza informatica o Scrivici se desideri segnalarci notizie, approfondimenti o contributi da pubblicare.

Cropped RHC 3d Transp2 1766828557 300x300

Redazione

La Redazione di Red Hot Cyber fornisce aggiornamenti quotidiani su bug, data breach e minacce globali. Ogni contenuto è validato dalla nostra community di esperti come Pietro Melillo, Massimiliano Brolli, Sandro Sana, Olivia Terragni e Stefano Gazzella. Grazie alla sinergia con i nostri Partner leader nel settore (tra cui Accenture, CrowdStrike, Trend Micro e Fortinet), trasformiamo la complessità tecnica in consapevolezza collettiva, garantendo un'informazione accurata basata sull'analisi di fonti primarie e su una rigorosa peer-review tecnica.

Articoli in evidenza

Cybercrime

Campagna di phishing su Signal in Europa: sospetto coinvolgimento di attori statali

Bajram Zeqiri - 07/02/2026

Le autorità tedesche hanno recentemente lanciato un avviso riguardante una sofisticata campagna di phishing che prende di mira gli utenti di Signal in Germania e nel resto d’Europa. L’attacco si concentra su profili specifici, tra…

Innovazione

Robot in cerca di carne: Quando l’AI affitta periferiche. Il tuo corpo!

Silvia Felici - 06/02/2026

L’evoluzione dell’Intelligenza Artificiale ha superato una nuova, inquietante frontiera. Se fino a ieri parlavamo di algoritmi confinati dietro uno schermo, oggi ci troviamo di fronte al concetto di “Meatspace Layer”: un’infrastruttura dove le macchine non…

Cybercrime

DKnife: il framework di spionaggio Cinese che manipola le reti

Pietro Melillo - 06/02/2026

Negli ultimi anni, la sicurezza delle reti ha affrontato minacce sempre più sofisticate, capaci di aggirare le difese tradizionali e di penetrare negli strati più profondi delle infrastrutture. Un’analisi recente ha portato alla luce uno…

Vulnerabilità

Così tante vulnerabilità in n8n tutti in questo momento. Cosa sta succedendo?

Agostino Pellegrino - 06/02/2026

Negli ultimi tempi, la piattaforma di automazione n8n sta affrontando una serie crescente di bug di sicurezza. n8n è una piattaforma di automazione che trasforma task complessi in operazioni semplici e veloci. Con pochi click…

Innovazione

L’IA va in orbita: Qwen 3, Starcloud e l’ascesa del calcolo spaziale

Sergio Corpettini - 06/02/2026

Articolo scritto con la collaborazione di Giovanni Pollola. Per anni, “IA a bordo dei satelliti” serviva soprattutto a “ripulire” i dati: meno rumore nelle immagini e nei dati acquisiti attraverso i vari payload multisensoriali, meno…