
OpenAI ha presentato Aardvark, un assistente autonomo basato sul modello GPT-5 , progettato per individuare e correggere automaticamente le vulnerabilità nel codice software. Questo strumento di intelligenza artificiale, definito “agente di ricerca sulla sicurezza”, è già in fase di beta testing w consentirà una rapida identificazione e risoluzione di potenziali problemi nei repository.
Secondo la descrizione, Aardvark monitora le modifiche al codice sorgente in tempo reale, analizza i commit e determina quali di essi potrebbero rappresentare una minaccia. Sulla base di questa analisi, il sistema crea un proprio modello di minaccia, allineato all’architettura e agli obiettivi del progetto.
Quindi analizza la cronologia delle modifiche e testa nuovi frammenti, tentando di riprodurre potenziali vulnerabilità in un ambiente isolato. Se un problema viene confermato, viene generata una patch utilizzando l’OpenAI Codex e quindi inviata per la revisione umana.
Avvio delle iscrizioni al corso Cyber Offensive Fundamentals Vuoi smettere di guardare tutorial e iniziare a capire davvero come funziona la sicurezza informatica? La base della sicurezza informatica, al di là di norme e tecnologie, ha sempre un unico obiettivo: fermare gli attacchi dei criminali informatici. Pertanto "Pensa come un attaccante, agisci come un difensore". Ti porteremo nel mondo dell'ethical hacking e del penetration test come nessuno ha mai fatto prima. Per informazioni potete accedere alla pagina del corso oppure contattarci tramite WhatsApp al numero 379 163 8765 oppure scrivendoci alla casella di posta [email protected].
Se ti piacciono le novità e gli articoli riportati su di Red Hot Cyber, iscriviti immediatamente alla newsletter settimanale per non perdere nessun articolo. La newsletter generalmente viene inviata ai nostri lettori ad inizio settimana, indicativamente di lunedì. |
Aardvark si basa su GPT-5, introdotto nell’agosto 2025, un modello con logica migliorata e routing modulare che gli consente di selezionare dinamicamente la modalità operativa appropriata in base all’attività. Ciò consente all’agente non solo di identificare le vulnerabilità, ma anche di valutarne la gravità, assegnarne la priorità e suggerire soluzioni mirate.
Secondo OpenAI, i test interni sui propri repository e su quelli di diversi partner hanno già prodotto risultati: almeno dieci CVE sono state identificate in progetti open source. Ciò dimostra il potenziale dello strumento come guardiano costante durante lo sviluppo, prevenendo il rallentamento nel rilascio di nuove funzionalità.
Lo sviluppo di Aardvark procede parallelamente a iniziative simili di altre aziende. Ad esempio, Google ha recentemente annunciato CodeMender , un sistema di intelligenza artificiale in grado di individuare, riscrivere e correggere il codice vulnerabile al fine di prevenire ulteriori attacchi. Questa tecnologia sarà integrata in importanti progetti open source con la partecipazione dei loro responsabili.
Nel contesto della competizione tra soluzioni come Aardvark, CodeMender e XBOW , sta emergendo una nuova classe di strumenti per la revisione continua del codice, i test di exploitability e la generazione di patch. Il rilascio di Aardvark ha coinciso anche con il recente lancio dei modelli gpt-oss-safeguard, specificamente addestrati per attività di classificazione basate sulla sicurezza.
Ti è piaciuto questo articolo? Ne stiamo discutendo nella nostra Community su LinkedIn, Facebook e Instagram. Seguici anche su Google News, per ricevere aggiornamenti quotidiani sulla sicurezza informatica o Scrivici se desideri segnalarci notizie, approfondimenti o contributi da pubblicare.

Cyber NewsLa storia di Ilya Lichtenstein, l’hacker responsabile di uno degli attacchi informatici più grandi mai compiuti contro le criptovalute, appare come un episodio di una serie TV, eppure è assolutamente reale. Dopo essere stato rilasciato,…
Cyber NewsSe c’erano ancora dubbi sul fatto che le principali aziende mondiali di intelligenza artificiale fossero d’accordo sulla direzione dell’IA, o sulla velocità con cui dovrebbe arrivarci, questi dubbi sono stati dissipati al World Economic Forum…
Cyber NewsUna settimana fa, il CEO di Cursor, Michael Truell, ha annunciato un risultato presumibilmente straordinario. Ha affermato che, utilizzando GPT-5.2, Cursor ha creato un browser in grado di funzionare ininterrottamente per un’intera settimana. Questo browser…
Cyber NewsL’Italia si conferma uno degli obiettivi principali della campagna di attacchi DDoS portata avanti dal gruppo hacktivista NoName057(16). Secondo quanto dichiarato direttamente dal collettivo, il nostro Paese ha subito 487 attacchi informatici tra ottobre 2024…
Cyber NewsLa domanda ritorna ciclicamente da oltre dieci anni: uno smartphone può davvero sostituire un computer? Nel tempo, l’industria ha provato più volte a dare una risposta concreta, senza mai arrivare a una soluzione definitiva. Dai…