CrowdStrike e Meta lanciano CyberSOCEval per valutare l’IA nella sicurezza informatica

15 Settembre 2025 19:51

CrowdStrike ha presentato oggi, in collaborazione con Meta, una nuova suite di benchmark – CyberSOCEval – per valutare le prestazioni dei sistemi di intelligenza artificiale nelle operazioni di sicurezza reali. Basata sul framework CyberSecEval di Meta e sulla competenza leader di CrowdStrike in materia di threat intelligence e dati di intelligenza artificiale per la sicurezza informatica, questa suite di benchmark open source contribuisce a stabilire un nuovo framework per testare, selezionare e sfruttare i modelli linguistici di grandi dimensioni (LLM) nel Security Operations Center (SOC).

I difensori informatici si trovano ad affrontare una sfida enorme a causa dell’afflusso di avvisi di sicurezza e delle minacce in continua evoluzione. Per superare gli avversari, le organizzazioni devono adottare le più recenti tecnologie di intelligenza artificiale. Molti team di sicurezza sono ancora agli inizi del loro percorso verso l’intelligenza artificiale, in particolare per quanto riguarda l’utilizzo di LLM per automatizzare le attività e aumentare l’efficienza nelle operazioni di sicurezza. Senza benchmark chiari, è difficile sapere quali sistemi, casi d’uso e standard prestazionali offrano un vero vantaggio in termini di intelligenza artificiale contro gli attacchi del mondo reale.

Meta e CrowdStrike affrontano questa sfida introducendo CyberSOCEval, una suite di benchmark che aiutano a definire l’efficacia dell’IA per la difesa informatica. Basato sul framework open source CyberSecEval di Meta e sull’intelligence sulle minacce di prima linea di CrowdStrike, CyberSOCEval valuta gli LLM in flussi di lavoro di sicurezza critici come la risposta agli incidenti, l’analisi del malware e la comprensione dell’analisi delle minacce.

Testando la capacità dei sistemi di IA rispetto a una combinazione di tecniche di attacco reali e scenari di ragionamento di sicurezza progettati da esperti basati su tattiche avversarie osservate, le organizzazioni possono convalidare le prestazioni sotto pressione e dimostrare la prontezza operativa. Con questi benchmark, i team di sicurezza possono individuare dove l’IA offre il massimo valore, mentre gli sviluppatori di modelli ottengono una Stella Polare per migliorare le capacità che incrementano il ROI e l’efficacia del SOC.

“In Meta, ci impegniamo a promuovere e massimizzare i vantaggi dell’intelligenza artificiale open source, soprattutto perché i modelli linguistici di grandi dimensioni diventano strumenti potenti per le organizzazioni di tutte le dimensioni”, ha affermato Vincent Gonguet, Direttore del prodotto, GenAI presso Laboratori di super intelligenza in Meta. “La nostra collaborazione con CrowdStrike introduce una nuova suite di benchmark open source per valutare le capacità degli LLM in scenari di sicurezza reali. Con questi benchmark in atto e aperti al miglioramento continuo da parte della comunità della sicurezza e dell’IA, possiamo lavorare più rapidamente come settore per sbloccare il potenziale dell’IA nella protezione dagli attacchi avanzati, comprese le minacce basate sull’IA.”

La suite di benchmark open source CyberSOCEval è ora disponibile per la comunità di intelligenza artificiale e sicurezza, che può utilizzarla per valutare le capacità dei modelli. Per accedere ai benchmark, visita il framework CyberSecEval di Meta . Per ulteriori informazioni sui benchmark, visita qui .

Ti è piaciuto questo articolo? Ne stiamo discutendo nella nostra Community su LinkedIn, Facebook e Instagram. Seguici anche su Google News, per ricevere aggiornamenti quotidiani sulla sicurezza informatica o Scrivici se desideri segnalarci notizie, approfondimenti o contributi da pubblicare.

Agostino Pellegrino

E’ un libero professionista, insegnante e perito di informatica Forense, Cyber Security ed Ethical Hacking e Network Management. Ha collaborato con importanti istituti di formazione a livello internazionale e ha esercitato teaching e tutorship in tecniche avanzate di Offensive Security per la NATO ottenendo importanti riconoscimenti dal Governo degli Stati Uniti. Il suo motto è “Studio. Sempre”.

Aree di competenza: Cybersecurity architecture, Threat intelligence, Digital forensics, Offensive security, Incident response & SOAR, Malware analysis, Compliance & frameworks

Articoli in evidenza

Cybercrime

Campagna di phishing su Signal in Europa: sospetto coinvolgimento di attori statali

Bajram Zeqiri - 07/02/2026

Le autorità tedesche hanno recentemente lanciato un avviso riguardante una sofisticata campagna di phishing che prende di mira gli utenti di Signal in Germania e nel resto d’Europa. L’attacco si concentra su profili specifici, tra…

Innovazione

Robot in cerca di carne: Quando l’AI affitta periferiche. Il tuo corpo!

Silvia Felici - 06/02/2026

L’evoluzione dell’Intelligenza Artificiale ha superato una nuova, inquietante frontiera. Se fino a ieri parlavamo di algoritmi confinati dietro uno schermo, oggi ci troviamo di fronte al concetto di “Meatspace Layer”: un’infrastruttura dove le macchine non…

Cybercrime

DKnife: il framework di spionaggio Cinese che manipola le reti

Pietro Melillo - 06/02/2026

Negli ultimi anni, la sicurezza delle reti ha affrontato minacce sempre più sofisticate, capaci di aggirare le difese tradizionali e di penetrare negli strati più profondi delle infrastrutture. Un’analisi recente ha portato alla luce uno…

Vulnerabilità

Così tante vulnerabilità in n8n tutti in questo momento. Cosa sta succedendo?

Agostino Pellegrino - 06/02/2026

Negli ultimi tempi, la piattaforma di automazione n8n sta affrontando una serie crescente di bug di sicurezza. n8n è una piattaforma di automazione che trasforma task complessi in operazioni semplici e veloci. Con pochi click…

Innovazione

L’IA va in orbita: Qwen 3, Starcloud e l’ascesa del calcolo spaziale

Sergio Corpettini - 06/02/2026

Articolo scritto con la collaborazione di Giovanni Pollola. Per anni, “IA a bordo dei satelliti” serviva soprattutto a “ripulire” i dati: meno rumore nelle immagini e nei dati acquisiti attraverso i vari payload multisensoriali, meno…