Red Hot Cyber
La cybersecurity è condivisione. Riconosci il rischio, combattilo, condividi le tue esperienze ed incentiva gli altri a fare meglio di te.
Cerca

Lo Tsunami DeepSeek ha Colpito nel Segno: Una AI Più Democratica Bussa Alle Porte

Redazione RHC : 1 Febbraio 2025 09:28

La scorsa settimana, la società cinese DeepSeek ha rilasciato R1, il suo nuovo modello linguistico, scatenando un’ondata di reazioni nel settore dell’intelligenza artificiale. Non solo R1 è paragonabile ai migliori modelli occidentali, ma è stato sviluppato a una frazione del costo.

Anche se ancora oggi molti mettono in dubbio queste informazioni, va da se che DeepSeek è stato uno tsunami nel mondo dell’Intelligenza generativa e il suo modello Open Source ha sconvolto decisamente gli equilibri e le regole del gioco.

DeepSeek ha scelto di renderlo completamente gratuito e open-source, provocando un terremoto nel panorama tecnologico globale.

Il crollo del mercato e le reazioni negli Stati Uniti

CORSO NIS2 : Network and Information system 2
La direttiva NIS2 rappresenta una delle novità più importanti per la sicurezza informatica in Europa, imponendo nuovi obblighi alle aziende e alle infrastrutture critiche per migliorare la resilienza contro le cyber minacce. Con scadenze stringenti e penalità elevate per chi non si adegua, comprendere i requisiti della NIS2 è essenziale per garantire la compliance e proteggere la tua organizzazione.

Accedi All'Anteprima del Corso condotto dall'Avv. Andrea Capelli sulla nostra Academy e segui l'anteprima gratuita.
Per ulteriori informazioni, scrivici ad [email protected] oppure scrivici su Whatsapp al 379 163 8765 

Supporta RHC attraverso:


Ti piacciono gli articoli di Red Hot Cyber? Non aspettare oltre, iscriviti alla newsletter settimanale per non perdere nessun articolo.

La risposta non si è fatta attendere. Il mercato azionario statunitense ha bruciato 1 trilione di dollari, gli investitori si sono lanciati in previsioni catastrofiche e persino Donald Trump ha definito l’evento un campanello d’allarme per gli Stati Uniti.

Marc Andreessen, uno dei più influenti venture capitalist della Silicon Valley, ha dichiarato: “R1 è una delle innovazioni più sorprendenti e impressionanti, un vero dono per il mondo.”

Ma il vero impatto di DeepSeek non risiede solo nel modello. Rilasciando pubblicamente i dettagli del suo processo di sviluppo, l’azienda ha sfatato il mito che la creazione di IA avanzate richieda investimenti miliardari. Questo ha costretto i competitor a una reazione immediata:

  • Alibaba ha annunciato una nuova versione del suo modello Qwen.
  • AI2, laboratorio di ricerca americano, ha aggiornato Tulu, sostenendo che ora superi R1.
  • OpenAI ha lanciato in tutta fretta ChatGPT Gov, una versione del chatbot per le agenzie governative statunitensi, segnale chiaro della crescente preoccupazione per le tecnologie cinesi.

Come Apprendono normalmente i modelli linguistici

Per capire la portata della svolta, bisogna comprendere il processo di sviluppo delle IA che generalmente avviene in due fasei:

  1. Pre-formazione : La rete neurale viene alimentata con enormi quantità di dati (libri, codice, pagine web) per creare un modello base.
  2. Post-formazione : Il modello viene ottimizzato con due metodi principali:
    • Ottimizzazione supervisionata: esseri umani valutano e migliorano le risposte.
    • Apprendimento per rinforzo con feedback umano (RLHF): il modello impara attraverso giudizi umani.

OpenAI è stata la prima a implementare RLHF, rendendo i suoi modelli più intuitivi. Oggi, quasi tutte le aziende lo adottano.

Il segreto di DeepSeek: meno esseri umani, più automazione

DeepSeek ha tagliato i costi in modo drastico eliminando gran parte del lavoro umano. Invece di affidarsi a valutatori umani costosi, ha sviluppato un sistema automatizzato in cui il computer stesso giudica e migliora le risposte.

  • Vantaggio: Risparmio di milioni di dollari.
  • Limite: Le macchine eccellono in materie esatte (matematica, programmazione) ma faticano con domande creative o filosofiche.

Per la messa a punto finale, DeepSeek ha comunque coinvolto specialisti umani, ma grazie ai bassi costi della manodopera in Cina e all’abbondanza di esperti in matematica e ingegneria, ha mantenuto un vantaggio competitivo enorme.

I trucchi ingegneristici che hanno reso R1 così potente

DeepSeek non si è limitata a ottimizzare i costi: ha introdotto innovazioni tecniche chiave che hanno migliorato le prestazioni di R1.

  1. GRPO: un nuovo approccio al rinforzo
    • I modelli IA standard usano un’intelligenza artificiale separata per valutare le risposte.
    • DeepSeek ha eliminato questa dipendenza, facendo in modo che lo stesso modello stimasse la correttezza delle risposte → riduzione dei costi senza perdita di qualità.
  2. Previsione multi-token
    • I modelli tradizionali prevedono il testo parola per parola.
    • DeepSeek ha sviluppato un metodo per analizzare più parole contemporaneamente, migliorando velocità e precisione.
  3. Ottimizzazione delle GPU Nvidia
    • DeepSeek ha riscritto il codice a basso livello per sfruttare al massimo le schede video esistenti, superando i limiti hardware senza acquistare nuovi chip.
  4. Data mining economico
    • Invece di raccogliere manualmente dati matematici per il modello DeepSeekMath, l’azienda ha semplicemente filtrato i dati dal vasto archivio gratuito Common Crawl.

Il futuro dell’IA: cosa succederà ora?

DeepSeek ha innescato una reazione a catena. Microsoft, poco prima del rilascio di R1, ha annunciato rStar-Math, un modello sviluppato con una metodologia simile. Hugging Face sta già lavorando a OpenR1, un clone open-source del modello cinese.

Ma la vera rivoluzione è un’altra: non servono più miliardi di dollari per creare un’IA avanzata. Ora che il metodo di DeepSeek è pubblico, possiamo aspettarci una nuova ondata di intelligenze artificiali di alta qualità, più accessibili e a basso costo.

“Sembrava che l’IA fosse un lusso per pochi colossi tecnologici. DeepSeek ha dimostrato il contrario. Se è davvero così semplice, ci aspetta un vero boom dell’intelligenza artificiale.” ha detto Lewis Tunstall, ricercatore di Hugging Face

L’Occidente è preoccupato: perché?

La rapidità con cui la Cina sta sviluppando l’IA ha messo in allarme governi ed esperti di sicurezza. Se le aziende cinesi riescono a creare modelli avanzati a costi ridotti, ciò potrebbe ribaltare la supremazia tecnologica degli Stati Uniti in settori chiave come economia e difesa.

  • Sanzioni inefficaci → Gli USA hanno vietato l’export di chip Nvidia H100 in Cina, ma DeepSeek ha aggirato il blocco ottimizzando i chip più vecchi.
  • Preoccupazioni per la sicurezza → OpenAI ha lanciato ChatGPT Gov subito dopo R1, segno che Washington teme fughe di dati attraverso i modelli cinesi.
  • IA militare → La Cina investe attivamente in IA per intelligence, guerra informatica e armi autonome.

Conclusione: Una AI Democratica è alle porte?

Nei prossimi mesi vedremo:

  • Nuovi modelli open-source basati su R1, con Hugging Face in prima linea.
  • Risposte aggressive da OpenAI, Google e Anthropic, che potrebbero accelerare il rilascio di GPT-5 e Gemini 3.
  • Regolamentazioni più severe negli USA e UE per arginare l’adozione di IA cinesi.

Ma il punto cruciale è chiaro: DeepSeek ha infranto il monopolio dello sviluppo IA avanzato.

Non è più una tecnologia esclusiva delle élite di Silicon Valley. L’intelligenza artificiale è ora più accessibile che mai, e il mondo della tecnologia non sarà più lo stesso.

Redazione
La redazione di Red Hot Cyber è composta da un insieme di persone fisiche e fonti anonime che collaborano attivamente fornendo informazioni in anteprima e news sulla sicurezza informatica e sull'informatica in generale.

Lista degli articoli

Articoli in evidenza

Dentro la mente di LockBit: profilazione criminologica di un gruppo ransomware “aziendale”

Nel mondo del cybercrime moderno, dove le frontiere tra criminalità e imprenditoria si fanno sempre più sfumate, il gruppo ransomware LockBit rappresenta un caso di studio affascinante. Atti...

Più le AI diventano come noi, più soffriranno di Social Engineering? Il caso di Copilot che preoccupa

Microsoft 365 Copilot è uno strumento di intelligenza artificiale integrato in applicazioni Office come Word, Excel, Outlook, PowerPoint e Teams. I ricercatori hanno recentemente scoperto che lo ...

CVE-2025-32710: La falla zero-click nei servizi RDP che può causare la totale compromissione del tuo server

Una vulnerabilità di sicurezza critica nei Servizi Desktop remoto di Windows, monitorata con il codice CVE-2025-32710, consente ad aggressori non autorizzati di eseguire codice arbitrario in...

RHC Intervista GhostSec: l’hacktivismo tra le ombre del terrorismo e del conflitto cibernetico

Ghost Security, noto anche come GhostSec, è un gruppo hacktivista emerso nel contesto della guerra cibernetica contro l’estremismo islamico. Le sue prime azioni risalgono alla fase success...

Arriva PathWiper! Il nuovo malware che devasta le infrastrutture critiche in Ucraina

Gli analisti di Cisco Talos hanno segnalato che le infrastrutture critiche in Ucraina sono state attaccate da un nuovo malware che distrugge i dati chiamato PathWiper. I ricercatori scrivono...