Nel 128° giorno dal lancio, DeepSeek R1 ha rivoluzionato l’intero mercato dei modelli di grandi dimensioni. Il suo impatto si è fatto sentire prima di tutto sul fronte dei costi: il solo annuncio di R1 ha contribuito ad abbassare i prezzi delle inferenze. OpenAI, ad esempio, ha aggiornato a giugno il costo del suo modello o3, riducendolo del 20% rispetto alla versione precedente o1. Questo cambiamento è avvenuto in un contesto competitivo sempre più serrato, dove l’efficienza economica è diventata una leva strategica fondamentale.
L’utilizzo dei modelli DeepSeek su piattaforme di terze parti è esploso, ma non senza contraddizioni. La domanda è aumentata di quasi 20 volte rispetto al primo rilascio, trainando l’espansione di molte aziende cloud. Tuttavia, la piattaforma ufficiale di DeepSeek – sia a livello web che via API – ha registrato un costante calo di traffico. Secondo i dati di SemiAnalysis, a maggio solo il 16% dei token generati dal modello proveniva da DeepSeek stesso. Questo segnale evidenzia una crescente preferenza degli utenti verso soluzioni alternative più performanti e meno frustranti in termini di latenza.
Dietro l’apparente successo si cela una strategia estrema di riduzione dei costi. DeepSeek ha deliberatamente sacrificato l’esperienza utente per limitare il consumo di risorse computazionali. Le sue API ufficiali soffrono di alti tempi di latenza, con ritardi significativi nell’erogazione del primo token. In confronto, piattaforme come Parasail o Friendli offrono latenze minime a costi contenuti. Altre, come Azure, pur essendo più care, garantiscono prestazioni decisamente superiori. Anche la finestra di contesto fornita da DeepSeek – limitata a 64k – è considerata insufficiente per task complessi come la programmazione, dove piattaforme concorrenti offrono fino a 2,5 volte più contesto allo stesso prezzo.
Advertising
La scelta di DeepSeek è chiara: potenziare l’intelligenza, non il servizio. Tutte le ottimizzazioni introdotte puntano a un unico obiettivo: ridurre il carico delle inferenze pubbliche per concentrare la potenza di calcolo sullo sviluppo interno. Questo approccio spiega anche l’assenza di reali investimenti su chatbot proprietari o offerte API competitive. In parallelo, DeepSeek adotta una strategia open source per alimentare l’adozione dei suoi modelli tramite provider esterni, consolidando la propria influenza sull’ecosistema AI senza dover sostenere i costi di scala.
La seconda metà del gioco nei modelli LLM è tutta sulla qualità del token. Mentre DeepSeek punta alla costruzione dell’AGI, Claude, ad esempio, cerca un compromesso tra performance e redditività. Ha rallentato leggermente per contenere il consumo computazionale, ma mantiene una buona esperienza utente. Il modello Claude Sonnet 4 ha visto un calo del 40% nella velocità, ma resta più reattivo di DeepSeek. Inoltre, modelli come Claude ottimizzano le risposte in modo da consumare meno token, mentre DeepSeek e Gemini, per la stessa risposta, possono richiedere il triplo dei token. In questa fase della competizione, efficienza e intelligenza non sono più solo una questione di prezzo o velocità, ma di visione a lungo termine.
📢 Resta aggiornatoTi è piaciuto questo articolo? Rimani sempre informato seguendoci su Google Discover (scorri in basso e clicca segui) e su 🔔 Google News. Ne stiamo anche discutendo sui nostri social: 💼 LinkedIn, 📘 Facebook e 📸 Instagram. Hai una notizia o un approfondimento da segnalarci? ✉️ Scrivici
La Redazione di Red Hot Cyber fornisce aggiornamenti quotidiani su bug, data breach e minacce globali. Ogni contenuto è validato dalla nostra community di esperti come Pietro Melillo, Massimiliano Brolli, Sandro Sana, Olivia Terragni e Stefano Gazzella.
Grazie alla sinergia con i nostri Partner leader nel settore (tra cui Accenture, CrowdStrike, Trend Micro e Fortinet), trasformiamo la complessità tecnica in consapevolezza collettiva, garantendo un'informazione accurata basata sull'analisi di fonti primarie e su una rigorosa peer-review tecnica.
Dopo il successo delle scorse edizioni, Red Hot Cyber è lieta di annunciare una nuova live-class del corso "Dark Web & Cyber Threat Intelligence". A differenza dei corsi e-learning pre-registrati, queste lezioni online in tempo reale, condotte dal professor Pietro Melillo, offrono un’esperienza formativa interattiva e coinvolgente, ideale per approfondire i contenuti e affrontare casi pratici.
Le Live Class sono progettate per garantire un apprendimento mirato e personalizzato, con un massimo di 14 partecipanti per sessione. Questo consente di adattare il percorso formativo alle esigenze specifiche, ma anche di mantenere alta la qualità: i posti sono limitati e nelle scorse edizioni sono andati in sold-out due settimane prima dell’inizio. Prenota subito per assicurarti il tuo posto!
Docente: Pietro Melillo, PhD presso l’Università del Sannio e docente presso IUSI University
Livello: Intermedio
Durata: 15 ore in Live Class con docente dal vivo
Prerequisiti: Navigazione Internet e conoscenze base di sicurezza informatica
Certificazione : Cyber Threat Intelligence Professional (CTIP) previo superamento dell’esame finale
Opportunità post-corso: Accesso al laboratorio operativo DarkLab per attività pratiche di intelligence
Al termine del corso, potrai accedere all’esclusivo Laboratorio di Intelligence DarkLab, un ambiente operativo dove mettere in pratica le competenze acquisite. Sarà l’occasione per sperimentare attività di investigazione nel Dark Web, analisi delle minacce e redazione di report di intelligence e ricerche approfondite.