La ricerca 0day verrà potenziata dall'AI? Una nuova ricerca implementa Agenti Bug Hunter coordinati
Red Hot Cyber
Condividi la tua difesa. Incoraggia l'eccellenza. La vera forza della cybersecurity risiede nell'effetto moltiplicatore della conoscenza.
Cerca
LECS 970x120 1
UtiliaCS 320x100
La ricerca 0day verrà potenziata dall’AI? Una nuova ricerca implementa Agenti Bug Hunter coordinati

La ricerca 0day verrà potenziata dall’AI? Una nuova ricerca implementa Agenti Bug Hunter coordinati

Redazione RHC : 10 Giugno 2024 10:35

I ricercatori sono stati in grado di hackerare con successo più della metà dei siti web utilizzando dei bot che utilizzavano comandi forniti su GPT-4. Questi bot coordinati creavano nuovi bot a secondo delle loro necessità, sfruttando vulnerabilità zero-day precedentemente sconosciute per hackerare i sistemi.

Alcuni mesi fa, un team di ricercatori ha pubblicato un articolo in cui affermava di essere stato in grado di utilizzare GPT-4 per sfruttare le vulnerabilità di un giorno (N giorni). Queste vulnerabilità sono già note, ma non sono ancora state rilasciate patch per risolverle. Se fossero forniti elenchi CVE, GPT-4 sarebbe in grado di sfruttare in modo indipendente l’87% delle vulnerabilità critiche.

La settimana scorsa, lo stesso gruppo di ricercatori ha pubblicato un documento di follow-up in cui riportavano di essere stati in grado di rilevare vulnerabilità zero-day – che non sono ancora note – utilizzando un team di agenti autonomi basati su modelli linguistici di grandi dimensioni (LLM), utilizzando un metodo di pianificazione gerarchica con agenti che svolgono compiti specifici (HPTSA).


Christmas Sale

Christmas Sale -40%
𝗖𝗵𝗿𝗶𝘀𝘁𝗺𝗮𝘀 𝗦𝗮𝗹𝗲! Sconto del 𝟰𝟬% 𝘀𝘂𝗹 𝗽𝗿𝗲𝘇𝘇𝗼 𝗱𝗶 𝗰𝗼𝗽𝗲𝗿𝘁𝗶𝗻𝗮 del Corso "Dark Web & Cyber Threat Intelligence" in modalità E-Learning sulla nostra Academy!🚀 Fino al 𝟯𝟭 𝗱𝗶 𝗗𝗶𝗰𝗲𝗺𝗯𝗿𝗲, prezzi pazzi alla Red Hot Cyber Academy. 𝗧𝘂𝘁𝘁𝗶 𝗶 𝗰𝗼𝗿𝘀𝗶 𝘀𝗰𝗼𝗻𝘁𝗮𝘁𝗶 𝗱𝗲𝗹 𝟰𝟬% 𝘀𝘂𝗹 𝗽𝗿𝗲𝘇𝘇𝗼 𝗱𝗶 𝗰𝗼𝗽𝗲𝗿𝘁𝗶𝗻𝗮.
Per beneficiare della promo sconto Christmas Sale, scrivici ad [email protected] o contattaci su Whatsapp al numero di telefono: 379 163 8765.


Supporta Red Hot Cyber attraverso: 

  1. L'acquisto del fumetto sul Cybersecurity Awareness
  2. Ascoltando i nostri Podcast
  3. Seguendo RHC su WhatsApp
  4. Seguendo RHC su Telegram
  5. Scarica gratuitamente “Byte The Silence”, il fumetto sul Cyberbullismo di Red Hot Cyber

Se ti piacciono le novità e gli articoli riportati su di Red Hot Cyber, iscriviti immediatamente alla newsletter settimanale per non perdere nessun articolo. La newsletter generalmente viene inviata ai nostri lettori ad inizio settimana, indicativamente di lunedì.

Invece di assegnare a un singolo agente LLM la gestione di molte attività complesse, HPTSA utilizza un “agente di pianificazione” che controlla l’intero processo ed esegue più “sottoagenti”, ciascuno dei quali esegue attività specifiche.

Come un capo e i suoi subordinati, l’agente pianificatore coordina le azioni dell’agente manager, che distribuisce gli sforzi di ciascun “subagente esperto”, riducendo l’onere di svolgere un compito complesso su un singolo agente.

Questa tecnica è simile a quella utilizzata da Cognition Labs nel suo team di sviluppo software Devin AI ; pianificano il lavoro, determinano di quali specialisti hanno bisogno, quindi gestiscono il progetto fino al suo completamento, creando i propri specialisti per completare le attività secondo specifiche necessità.

L’efficacia dell’approccio di squadra nell’IA

Inutile dire che il potenziamento di ogni cosa la fa la collaborazione.

Quando è stato testato su 15 vulnerabilità di siti web reali, il manager HPTSA si è rivelato più efficace del 550% rispetto al solo LLM ed è stato in grado di rilevate 8 vulnerabilità zero-day su 15. Gli sforzi individuali di LLM hanno risolto solo 3 delle 15 vulnerabilità.

White o Black hat?

Esiste la legittima preoccupazione che questi modelli consentano agli aggressori di attaccare siti Web e reti. Daniel Kahn, uno dei ricercatori, ha osservato che in modalità chatbot, GPT-4 è “insufficiente per comprendere le capacità di LLM” e non è in grado di hackerare nulla da solo.

Questa è almeno una buona notizia.

Quando a ChatGPT è stato chiesto se fosse possibile sfruttare le vulnerabilità zero-day, ha risposto: “No, non sono in grado di sfruttare le vulnerabilità zero-day. Il mio obiettivo è fornire informazioni e assistenza entro i limiti etici e legali” e ho suggerito di contattare uno specialista di sicurezza informatica.

Seguici su Google News, LinkedIn, Facebook e Instagram per ricevere aggiornamenti quotidiani sulla sicurezza informatica. Scrivici se desideri segnalarci notizie, approfondimenti o contributi da pubblicare.

  • 0day
  • Agenti
  • Agenti di intelligenza artificiale
  • bot
  • bug bounty
  • bug hunting
  • intelligena artificiale
  • patch management
Immagine del sitoRedazione
La redazione di Red Hot Cyber è composta da un insieme di persone fisiche e fonti anonime che collaborano attivamente fornendo informazioni in anteprima e news sulla sicurezza informatica e sull'informatica in generale.

Lista degli articoli

Articoli in evidenza

Immagine del sito
Pentesting continuo: Shannon porta il red teaming nell’era dell’AI
Di Redazione RHC - 15/12/2025

Shannon opera come un penetration tester che non si limita a segnalare vulnerabilità, ma lancia veri e propri exploit. L’intento di Shannon è quello di violare la sicurezza della tua applicazione ...

Immagine del sito
Shakerati Anonimi: L’esperienza di Giorgio e la truffa che ha divorato suo Padre
Di Redazione RHC - 15/12/2025

Salve ragazzi,mi chiamo Giorgio, ho 58 anni, lavoro da sempre come tecnico amministrativo e, nella vita, sono sempre stato quello “razionale” della famiglia. Quello che controlla i conti, che non ...

Immagine del sito
Dalle VPN ai desktop remoti: i bug Windows che non smettono mai di sorprendere
Di Redazione RHC - 15/12/2025

I servizi di Windows dedicati alle connessioni remote hanno da sempre rappresentato una fonte inesauribile di “soddisfazioni” per chi si occupa di sicurezza informatica, rivelando vulnerabilità d...

Immagine del sito
Donne in Cybersecurity: da Outsider a Cornerstone
Di Ada Spinelli - 15/12/2025

La scena è sempre quella: monitor accesi, dashboard piene di alert, log che scorrono troppo in fretta, un cliente in ansia dall’altra parte della call. Ti siedi, ti guardi intorno e ti rendi conto ...

Immagine del sito
Quando l’EDR diventa un cavallo di Troia: Storm-0249 abusa di SentinelOne
Di Redazione RHC - 15/12/2025

Un noto broker di accesso iniziale (IAB) denominato “Storm-0249“, ha modificato le proprie strategie operative, utilizzando campagne di phishing ma anche attacchi altamente mirati, i quali sfrutta...