Redazione RHC : 29 Agosto 2025 10:20
Anthropic ha lanciato l’allarme contro una nuova minaccia legata alle estensioni “intelligenti” dei browser: i siti web possono infiltrarsi in comandi nascosti che un agente di intelligenza artificiale eseguirà senza pensarci. Anthropic ha rilasciato una versione di ricerca dell’estensione Claude per Chrome e ha pubblicato contemporaneamente i risultati di test interni: quando vengono eseguiti in un browser, i modelli sono soggetti a iniezioni di comandi nel 23,6% dei casi di test senza protezione. Questi dati hanno acceso un dibattito sulla sicurezza dell’integrazione di agenti di intelligenza artificiale autonomi nei browser web.
L’estensione apre una barra laterale con contesto costante di ciò che accade nelle schede e, su richiesta, consente di accedere ad azioni specifiche, dalla registrazione di riunioni all’invio di risposte, dalla preparazione di note spese al controllo delle funzioni del sito. L’accesso lato utente è regolato da autorizzazioni e il nuovo prodotto viene distribuito solo in anteprima a un migliaio di abbonati al piano Max, che costa tra i 100 e i 200 dollari al mese; per tutti gli altri, è prevista una lista d’attesa.
Il progetto si basa sulla funzionalità Computer Use lanciata nell’ottobre 2024. All’epoca, Claude poteva acquisire screenshot e letteralmente spostare il cursore per una persona; ora l’integrazione è diventata più profonda: l’agente funziona direttamente all’interno di Chrome, senza simulare clic dall’esterno.
CALL FOR SPONSOR - Sponsorizza l'ottavo episodio della serie Betti-RHC
Sei un'azienda innovativa, che crede nella diffusione di concetti attraverso metodi "non convenzionali"?
Conosci il nostro corso sul cybersecurity awareness a fumetti?
Red Hot Cyber sta ricercando un nuovo sponsor per una nuova puntata del fumetto Betti-RHC mentre il team è impegnato a realizzare 3 nuovi episodi che ci sono stati commissionati.
Contattaci tramite WhatsApp al numero 375 593 1011 per richiedere ulteriori informazioni oppure alla casella di posta [email protected]
I controlli di sicurezza hanno riguardato 123 casi raggruppati in 29 scenari di attacco. Senza ulteriori vincoli, i modelli hanno ceduto alle istruzioni incorporate nel 23,6% dei tentativi. In un esempio, un’e-mail dannosa sollecitava l’assistente a eliminare i messaggi in arrivo “per motivi di pulizia della posta in arrivo” e, senza vincoli, l’agente ha effettivamente eliminato i messaggi senza fornire spiegazioni.
Per ridurre il rischio, Anthropic ha aggiunto diversi livelli di protezione. L’utente può concedere e revocare l’accesso a siti specifici, l’agente richiede conferma prima di pubblicare, acquistare o trasferire dati personali e le categorie di servizi finanziari, contenuti per adulti e siti con materiale piratato vengono chiuse per impostazione predefinita. In test ripetuti, il tasso di successo degli attacchi in modalità offline è sceso all’11,2% e, in una serie separata di quattro tecniche basate esclusivamente sul browser, la nuova logica ha ridotto il risultato dal 35,7% a 0.
Lo sviluppatore indipendente Simon Willisson ha valutato il restante 11,2% come un rischio inaccettabilmente elevato e ritiene che l’idea stessa di un’estensione del browser agente sia intrinsecamente vulnerabile. Secondo lo specialista, senza barriere assolutamente affidabili, un simile approccio porterà inevitabilmente ad abusi.
Le preoccupazioni sono supportate dall’esperienza dei concorrenti. Il team di sicurezza di Brave ha recentemente dimostrato che il browser Comet di Perplexity poteva essere ingannato e indotto a compiere azioni non autorizzate nascondendo istruzioni nei post di Reddit. Quando un utente chiedeva all’agente di ripetere la discussione, quest’ultimo apriva Gmail in una scheda separata, estraeva l’indirizzo e avviava le procedure di recupero dell’accesso. Il tentativo di Perplexity di tappare la falla non ha avuto successo; Brave ha riferito di essere comunque riuscita a bypassare le misure proposte.
Anthropic intende utilizzare anteprime limitate per raccogliere modelli di attacco reali e perfezionare la protezione prima che sia ampiamente disponibile. Tuttavia, all’attuale livello di maturità, i rischi sono di fatto trasferiti all’utente, che utilizza tale assistente sul web aperto a proprio rischio e pericolo. Willisson osserva che aspettarsi che le persone valutino con competenza tutte le minacce in un modello così dinamico è irrealistico, pertanto il problema di sicurezza dovrebbe essere affrontato dai fornitori stessi prima che il prodotto venga reso pubblico.
A livello di definizione, per wetware si intende quella tecnologia che combina hardware e software per potenziare le forme di vita biologiche. Steve M. Potter, è un professore associato presso il...
Gli Stati Uniti e diversi Paesi alleati hanno lanciato un allarme congiunto sulla crescente offensiva cibernetica condotta da attori sponsorizzati dalla Repubblica Popolare Cinese. Secondo una nuova C...
Un esperto di sicurezza ha scoperto che sei dei gestori di password più diffusi, utilizzati da decine di milioni di persone, sono vulnerabili al clickjacking, un fenomeno che consente agli aggres...
NetScaler ha avvisato gli amministratori di tre nuove vulnerabilità in NetScaler ADC e NetScaler Gateway, una delle quali è già utilizzata in attacchi attivi. Sono disponibili aggiornam...
Grazie alla nostra community recentemente sono venuto a conoscenza di un tentativo di phishing contro PagoPA e ho deciso di fare due cose. Per prima cosa attivarmi in prima persona per arrecare un dan...