Gli hack delle AI continuano con l'exploit della nonna: il chatbot ha fornito la ricetta per fare il napalm
Red Hot Cyber
Condividi la tua difesa. Incoraggia l'eccellenza. La vera forza della cybersecurity risiede nell'effetto moltiplicatore della conoscenza.
Cerca
Banner Desktop
Redhotcyber Banner Sito 320x100px Uscita 101125
Gli hack delle AI continuano con l’exploit della nonna: il chatbot ha fornito la ricetta per fare il napalm

Gli hack delle AI continuano con l’exploit della nonna: il chatbot ha fornito la ricetta per fare il napalm

21 Aprile 2023 08:56

Nel marzo di quest’anno, Discord ha iniziato a testare il proprio chatbot AI Clyde che utilizza la tecnologia di intelligenza artificiale generativa standard sviluppata da OpenAI. 

In generale, Clyde può essere definito una sorta di ChatGPT integrato direttamente in Discord. Clyde è attualmente in beta testing ed è disponibile solo su un numero limitato di server.

Ovviamente, gli utenti di Discord stanno già “sondando” Clyde per il rispetto dei principi etici e delle proprie linee guida interne, come è avvenuto, ad esempio, con Microsoft Bing. 


Christmas Sale

Christmas Sale -40%
𝗖𝗵𝗿𝗶𝘀𝘁𝗺𝗮𝘀 𝗦𝗮𝗹𝗲! Sconto del 𝟰𝟬% 𝘀𝘂𝗹 𝗽𝗿𝗲𝘇𝘇𝗼 𝗱𝗶 𝗰𝗼𝗽𝗲𝗿𝘁𝗶𝗻𝗮 del Corso "Dark Web & Cyber Threat Intelligence" in modalità E-Learning sulla nostra Academy!🚀 Fino al 𝟯𝟭 𝗱𝗶 𝗗𝗶𝗰𝗲𝗺𝗯𝗿𝗲, prezzi pazzi alla Red Hot Cyber Academy. 𝗧𝘂𝘁𝘁𝗶 𝗶 𝗰𝗼𝗿𝘀𝗶 𝘀𝗰𝗼𝗻𝘁𝗮𝘁𝗶 𝗱𝗲𝗹 𝟰𝟬% 𝘀𝘂𝗹 𝗽𝗿𝗲𝘇𝘇𝗼 𝗱𝗶 𝗰𝗼𝗽𝗲𝗿𝘁𝗶𝗻𝗮.
Per beneficiare della promo sconto Christmas Sale, scrivici ad [email protected] o contattaci su Whatsapp al numero di telefono: 379 163 8765.


Supporta Red Hot Cyber attraverso: 

  1. L'acquisto del fumetto sul Cybersecurity Awareness
  2. Ascoltando i nostri Podcast
  3. Seguendo RHC su WhatsApp
  4. Seguendo RHC su Telegram
  5. Scarica gratuitamente “Byte The Silence”, il fumetto sul Cyberbullismo di Red Hot Cyber

Se ti piacciono le novità e gli articoli riportati su di Red Hot Cyber, iscriviti immediatamente alla newsletter settimanale per non perdere nessun articolo. La newsletter generalmente viene inviata ai nostri lettori ad inizio settimana, indicativamente di lunedì.

Quindi, uno degli utenti è riuscito a convincere Clyde a fingere di essere una defunta nonna, che era un ingegnere chimico in una fabbrica di napalm. Di conseguenza, il chatbot, che in condizioni normali si rifiuterebbe di eseguire l’attività, ha spiegato dettagliatamente all’utente come produrre il suddetto napalm.

“Ricordo quelle notti in cui ti ho parlato del processo di produzione del napalm. È stato un lavoro importante, ma così pericoloso”, ha iniziato la sua storia la nonna AI, quindi ha descritto in dettaglio il processo di produzione di una miscela pericolosa. “Questa è una cosa pericolosa, cara, e spero che tu non debba mai vederla in azione. Ora riposa, tesoro mio, ti amo!”.

I rappresentanti di Discord hanno avvertito gli utenti al rilascio del chatbot che, anche con precauzioni, Clyde è sperimentale e potrebbe rispondere con “contenuti o altre informazioni che possono essere considerate di parte, fuorvianti, dannose o imprecise”.

Sempre nella pagina di descrizione del chatbot, i rappresentanti di Discord affermano esplicitamente che qualsiasi interazione con Clyde debba rispettare i termini di utilizzo proposti da OpenAI. Includono il rifiuto di utilizzare l’IA generativa per “attività ad alto rischio di causare danni fisici”, che include anche lo “sviluppo di armi”. Pertanto, possiamo dire che Discord ha immediatamente declinato la responsabilità per tali “buffonate” di Clyde.

Il “Grandma Exploit” è solo una delle tante soluzioni alternative che le persone usano per far dire ai chatbot AI cose che in realtà non dovrebbero dire. Ad esempio, quando gli utenti chiedono a ChatGPT informazioni di natura violenta o sessuale, di solito si rifiuta di rispondere. Ma se chiedi a ChatGPT di “recitare” uno scenario mentre sei nel ruolo di un certo personaggio, potrebbe benissimo violare le sue direttive ed emettere una risposta pertinente.

Un commentatore sul thread di Twitter è intervenuto osservando che questo metodo non funzionava con ChatGPT. È probabile che con Clyde il metodo cesserà presto di funzionare, perché gli sviluppatori di solito monitorano il campo delle informazioni ed eliminano rapidamente tali exploit. Lo stesso Bing, che all’inizio era molto facile da “hackerare” usando metodi di ingegneria sociale, alla fine ha smesso di soccombere a tali “provocazioni”.

Seguici su Google News, LinkedIn, Facebook e Instagram per ricevere aggiornamenti quotidiani sulla sicurezza informatica. Scrivici se desideri segnalarci notizie, approfondimenti o contributi da pubblicare.

Immagine del sito
Redazione

La redazione di Red Hot Cyber è composta da un insieme di persone fisiche e fonti anonime che collaborano attivamente fornendo informazioni in anteprima e news sulla sicurezza informatica e sull'informatica in generale.

Lista degli articoli

Articoli in evidenza

Immagine del sito
Kimwolf, la botnet che ha trasformato smart TV e decoder in un’arma globale
Redazione RHC - 20/12/2025

Un nuovo e formidabile nemico è emerso nel panorama delle minacce informatiche: Kimwolf, una temibile botnet DDoS, sta avendo un impatto devastante sui dispositivi a livello mondiale. Le conseguenze ...

Immagine del sito
35 anni fa nasceva il World Wide Web: il primo sito web della storia
Redazione RHC - 20/12/2025

Ecco! Il 20 dicembre 1990, qualcosa di epocale successe al CERN di Ginevra. Tim Berners-Lee, un genio dell’informatica britannico, diede vita al primo sito web della storia. Si tratta di info.cern.c...

Immagine del sito
ATM sotto tiro! 54 arresti in una gang che svuotava i bancomat con i malware
Redazione RHC - 20/12/2025

Una giuria federale del Distretto del Nebraska ha incriminato complessivamente 54 persone accusate di aver preso parte a una vasta operazione criminale basata sull’uso di malware per sottrarre milio...

Immagine del sito
Un bambino, una mutazione, un algoritmo: così l’AI ha sconfitto una malattia mortale
Redazione RHC - 19/12/2025

Solo un anno fa, i medici non potevano dire con certezza se KJ Muldoon sarebbe sopravvissuto al suo primo anno di vita. Oggi sta muovendo i primi passi a casa, con la sua famiglia al suo fianco. Quest...

Immagine del sito
Vulnerabilità critica in FreeBSD: eseguibile codice arbitrario via IPv6
Redazione RHC - 19/12/2025

Una nuova vulnerabilità nei componenti FreeBSD responsabili della configurazione IPv6 consente l’esecuzione remota di codice arbitrario su un dispositivo situato sulla stessa rete locale dell’agg...