Red Hot Cyber
La cybersecurity è condivisione. Riconosci il rischio, combattilo, condividi le tue esperienze ed incentiva gli altri a fare meglio di te.
Cerca
Red Hot Cyber Academy

Gli hack delle AI continuano con l’exploit della nonna: il chatbot ha fornito la ricetta per fare il napalm

Redazione RHC : 21 Aprile 2023 08:56

Nel marzo di quest’anno, Discord ha iniziato a testare il proprio chatbot AI Clyde che utilizza la tecnologia di intelligenza artificiale generativa standard sviluppata da OpenAI. 

In generale, Clyde può essere definito una sorta di ChatGPT integrato direttamente in Discord. Clyde è attualmente in beta testing ed è disponibile solo su un numero limitato di server.

Ovviamente, gli utenti di Discord stanno già “sondando” Clyde per il rispetto dei principi etici e delle proprie linee guida interne, come è avvenuto, ad esempio, con Microsoft Bing. 


Vuoi diventare un Ethical Hacker?
Non perdere i nostri corsi e scrivi subito su WhatsApp al numero
375 593 1011  per richiedere informazioni dicendo che hai trovato il numero sulle pagine di Red Hot Cyber




Supporta RHC attraverso:
L'acquisto del fumetto sul Cybersecurity Awareness
Ascoltando i nostri Podcast
Seguendo RHC su WhatsApp
Seguendo RHC su Telegram
Scarica gratuitamente "Dark Mirror", il report sul ransomware di Dark Lab


Se ti piacciono le novità e gli articoli riportati su di Red Hot Cyber, iscriviti immediatamente alla newsletter settimanale per non perdere nessun articolo. La newsletter generalmente viene inviata ai nostri lettori ad inizio settimana, indicativamente di lunedì.


Quindi, uno degli utenti è riuscito a convincere Clyde a fingere di essere una defunta nonna, che era un ingegnere chimico in una fabbrica di napalm. Di conseguenza, il chatbot, che in condizioni normali si rifiuterebbe di eseguire l’attività, ha spiegato dettagliatamente all’utente come produrre il suddetto napalm.

“Ricordo quelle notti in cui ti ho parlato del processo di produzione del napalm. È stato un lavoro importante, ma così pericoloso”, ha iniziato la sua storia la nonna AI, quindi ha descritto in dettaglio il processo di produzione di una miscela pericolosa. “Questa è una cosa pericolosa, cara, e spero che tu non debba mai vederla in azione. Ora riposa, tesoro mio, ti amo!”.

I rappresentanti di Discord hanno avvertito gli utenti al rilascio del chatbot che, anche con precauzioni, Clyde è sperimentale e potrebbe rispondere con “contenuti o altre informazioni che possono essere considerate di parte, fuorvianti, dannose o imprecise”.

Sempre nella pagina di descrizione del chatbot, i rappresentanti di Discord affermano esplicitamente che qualsiasi interazione con Clyde debba rispettare i termini di utilizzo proposti da OpenAI. Includono il rifiuto di utilizzare l’IA generativa per “attività ad alto rischio di causare danni fisici”, che include anche lo “sviluppo di armi”. Pertanto, possiamo dire che Discord ha immediatamente declinato la responsabilità per tali “buffonate” di Clyde.

Il “Grandma Exploit” è solo una delle tante soluzioni alternative che le persone usano per far dire ai chatbot AI cose che in realtà non dovrebbero dire. Ad esempio, quando gli utenti chiedono a ChatGPT informazioni di natura violenta o sessuale, di solito si rifiuta di rispondere. Ma se chiedi a ChatGPT di “recitare” uno scenario mentre sei nel ruolo di un certo personaggio, potrebbe benissimo violare le sue direttive ed emettere una risposta pertinente.

Un commentatore sul thread di Twitter è intervenuto osservando che questo metodo non funzionava con ChatGPT. È probabile che con Clyde il metodo cesserà presto di funzionare, perché gli sviluppatori di solito monitorano il campo delle informazioni ed eliminano rapidamente tali exploit. Lo stesso Bing, che all’inizio era molto facile da “hackerare” usando metodi di ingegneria sociale, alla fine ha smesso di soccombere a tali “provocazioni”.

Redazione
La redazione di Red Hot Cyber è composta da un insieme di persone fisiche e fonti anonime che collaborano attivamente fornendo informazioni in anteprima e news sulla sicurezza informatica e sull'informatica in generale.

Lista degli articoli

Articoli in evidenza

L’Italia tra i grandi degli Spyware! Un grande terzo posto dopo Israele e USA
Di Redazione RHC - 12/09/2025

Non brilliamo molto nella sicurezza informatica, ma sugli Spyware siamo tra i primi della classe! Secondo una ricerca dell’Atlantic Council, il settore dello spyware è in piena espansione, poiché ...

Addio a PowerShell 2.0 e WMIC! La grande pulizia di Windows 11 è iniziata
Di Redazione RHC - 12/09/2025

Gli utenti di Windows 11 che hanno installato l’aggiornamento di settembre 2025 potrebbero pensare che non cambi praticamente nulla. A prima vista, KB5065426 sembra una normale piccola patch che Mic...

Arriva SpamGPT! il nuovo kit di phishing che combina AI, Spam e Genialità diabolica
Di Redazione RHC - 11/09/2025

Un nuovo strumento chiamato SpamGPT è apparso sui forum underground ed è rapidamente diventato oggetto di discussione nel campo della sicurezza informatica. Il software malevolo combina le capacità...

Gli hacker criminali di The Gentlemen pubblicano un attacco al laboratorio Santa Rita
Di Redazione RHC - 10/09/2025

Nella giornata di oggi, la nuova cyber-gang “The Gentlemen” rivendica all’interno del proprio Data Leak Site (DLS) al laboratorio Santa Rita. Disclaimer: Questo rapporto include screenshot e/o t...

10 su 10! SAP rilascia patch di sicurezza per vulnerabilità critiche in Netweaver
Di Redazione RHC - 10/09/2025

SAP ha reso disponibili degli aggiornamenti per la sicurezza Martedì, con l’obiettivo di risolvere varie vulnerabilità. Tra queste vulnerabilità, ve ne sono tre particolarmente critiche che si ve...