ChatGPT va oltre le parole. Sfida il riconoscimento facciale con capacità sorprendenti!

Alessia Tomaselli : 23 Luglio 2023 09:15

OpenAI si preoccupa di ciò che il suo Chatbot dirà sui volti delle persone. Una versione avanzata di ChatGPT è in grado di analizzare le immagini e sta già aiutando i non vedenti. Ma la sua capacità di associare un nome a un volto è qualcosa di incredibile.

Il chatbot che milioni di persone hanno usato per scrivere tesine, codici informatici e favole non si limita alle parole. ChatGPT, lo strumento di OpenAI dotato di intelligenza artificiale, è in grado di analizzare anche le immagini, descrivendo cosa contengono, rispondendo a domande e riconoscendo persino i volti di determinate persone. La speranza è che, alla fine, qualcuno possa caricare la foto del motore di un’auto in panne o di una misteriosa eruzione cutanea e ChatGPT possa suggerire la soluzione.

OpenAI non vuole che ChatGPT diventi una macchina per il riconoscimento facciale.

Jonathan Mosen e l’esperienza con ChatGPT

Sponsorizza la prossima Red Hot Cyber Conference!

Il giorno Lunedì 18 maggio e martedì 19 maggio 2026 9 maggio 2026, presso il teatro Italia di Roma (a due passi dalla stazione termini e dalla metro B di Piazza Bologna), si terrà la V edizione della la RHC Conference.
Si tratta dell’appuntamento annuale gratuito, creato dalla community di RHC, per far accrescere l’interesse verso le tecnologie digitali, l’innovazione digitale e la consapevolezza del rischio informatico.
Se sei interessato a sponsorizzare l'evento e a rendere la tua azienda protagonista del più grande evento della Cybersecurity Italiana, non perdere questa opportunità. E ricorda che assieme alla sponsorizzazione della conferenza, incluso nel prezzo, avrai un pacchetto di Branding sul sito di Red Hot Cyber composto da Banner più un numero di articoli che saranno ospitati all'interno del nostro portale.
Quindi cosa stai aspettando? Scrivici subito a [email protected] per maggiori informazioni e per accedere al programma sponsor e al media Kit di Red Hot Cyber.

Supporta Red Hot Cyber attraverso:

Se ti piacciono le novità e gli articoli riportati su di Red Hot Cyber, iscriviti immediatamente alla newsletter settimanale per non perdere nessun articolo. La newsletter generalmente viene inviata ai nostri lettori ad inizio settimana, indicativamente di lunedì.

Negli ultimi mesi, Jonathan Mosen ha fatto parte di un gruppo selezionato di persone che hanno accesso a una versione avanzata del chatbot in grado di analizzare le immagini. Durante un recente viaggio, il signor Mosen, amministratore delegato di un’agenzia di collocamento e non vedente, ha utilizzato l’analisi visiva per determinare quali dispenser nel bagno di una camera d’albergo fossero shampoo, balsamo e gel doccia. Il risultato è andato ben oltre le prestazioni del software di analisi delle immagini che aveva usato in passato.

“Mi ha detto la capacità in millilitri di ogni flacone. Mi ha fornito informazioni sulle piastrelle della doccia”, ha detto Mosen. “Descriveva tutto questo nel modo in cui una persona non vedente ha bisogno di sentirselo dire. E con una sola immagine ho avuto esattamente le risposte che mi servivano”.

Per la prima volta, Mosen è in grado di “interrogare le immagini”. Ha fatto un esempio: Il testo che accompagna un’immagine che ha trovato sui social media la descrive come una “donna con i capelli biondi che sembra felice”. Quando ha chiesto a ChatGPT di analizzare l’immagine, il chatbot ha risposto che si trattava di una donna con una camicia blu scuro che si scattava un selfie in uno specchio a figura intera. L’utente ha potuto fare altre domande, come ad esempio che tipo di scarpe indossava e cos’altro era visibile nel riflesso dello specchio.

“È straordinario”, ha dichiarato il signor Mosen, 54 anni, che vive a Wellington, in Nuova Zelanda, e ha reso noto il potenziale della tecnologia in un podcast che conduce sul tema “vivere alla cieca”.

Be my Eyes

A marzo, quando OpenAI ha annunciato GPT-4, l’ultimo modello di software che alimenta il suo chatbot A.I., l’azienda ha dichiarato che era “multimodale”, cioè in grado di rispondere a richieste di testo e immagini. Mentre la maggior parte degli utenti ha potuto conversare con il bot solo a parole, il signor Mosen ha avuto accesso anticipato all’analisi visiva da Be My Eyes, una start-up che di solito mette in contatto utenti non vedenti con volontari vedenti e fornisce un servizio clienti accessibile alle aziende. Quest’anno Be My Eyes ha collaborato con OpenAI per testare la “vista” del chatbot prima del rilascio della funzione al pubblico.

Recentemente, l’applicazione ha smesso di fornire al signor Mosen informazioni sui volti delle persone, dicendo che erano stati oscurati per motivi di privacy. Il signor Mosen è rimasto deluso, ritenendo di dover avere lo stesso accesso alle informazioni di una persona vedente.

La preoccupazione di OpenAI

Il cambiamento riflette la preoccupazione di OpenAI di aver costruito qualcosa con un potere che non vuole rendere pubblico.

La tecnologia dell’azienda è in grado di identificare principalmente figure pubbliche, come le persone con una pagina di Wikipedia, ha dichiarato Sandhini Agarwal, ricercatore di OpenAI, ma non funziona in modo così completo come gli strumenti costruiti per trovare i volti su Internet, come quelli di Clearview AI e PimEyes. Secondo Agarwal, lo strumento è in grado di riconoscere l’amministratore delegato di OpenAI, Sam Altman, nelle foto, ma non altre persone che lavorano nell’azienda.

Rendere pubblica una funzione di questo tipo significherebbe oltrepassare i limiti di quelle che sono le pratiche generalmente considerate accettabili dalle aziende tecnologiche statunitensi. Potrebbe anche causare problemi legali, come l’Illinois e l’Europa, che richiedono alle aziende di ottenere il consenso dei cittadini per utilizzare le loro informazioni biometriche, compresa l’impronta del volto.

Inoltre, OpenAI teme che lo strumento possa dire cose che non dovrebbe dire sul volto delle persone, come valutare il loro sesso o il loro stato emotivo. OpenAI sta cercando di risolvere questi e altri problemi di sicurezza prima di rilasciare ampiamente la funzione di analisi delle immagini, ha dichiarato Agarwal.

“Vogliamo prendere una decisione che prenda in considerazione anche l’opinione pubblica”, ha detto. Se sentiamo dire: “In realtà non vogliamo nulla di tutto ciò”, siamo d’accordo”.

Diverse problematiche con ChatGPT

Oltre al feedback degli utenti di Be My Eyes, la divisione no-profit dell’azienda sta anche cercando di trovare un modo per ottenere “input democratici” che aiutino a definire le regole per i sistemi di intelligenza artificiale.

Agarwal ha detto che lo sviluppo dell’analisi visiva non è stato “inaspettato”, perché il modello è stato addestrato esaminando immagini e testi raccolti da Internet. Ha sottolineato che esiste già un software per il riconoscimento facciale delle celebrità, come ad esempio uno strumento di Google. Google offre un opt-out per le persone famose che non vogliono essere riconosciute, e OpenAI sta considerando questo approccio.

Agarwal ha detto che l’analisi visiva di OpenAI potrebbe produrre “allucinazioni” simili a quelle viste con i messaggi testuali. “Se gli si dà un’immagine di qualcuno che sta per diventare famoso, potrebbe sbagliare il suo nome”, ha detto. “Ad esempio, se gli fornisco l’immagine di un famoso amministratore delegato di un’azienda tecnologica, potrebbe darmi il nome di un altro amministratore delegato”.

Una volta lo strumento ha descritto in modo impreciso un telecomando al signor Mosen, dicendogli con sicurezza che c’erano dei pulsanti che non c’erano, ha detto.

Anche Microsoft, che ha investito 10 miliardi di dollari in OpenAI, ha accesso allo strumento di analisi visiva. Alcuni utenti del chatbot Bing, alimentato dall’A.I. di Microsoft, hanno visto la funzione apparire in una versione limitata; dopo aver caricato le immagini, hanno ricevuto un messaggio che li informava che “la sfocatura della privacy nasconde i volti dalla chat di Bing”.

L’AI sta diventando sempre più umana

Sayash Kapoor, informatico e dottorando presso l’Università di Princeton, ha utilizzato lo strumento per decodificare un captcha, un controllo di sicurezza visivo che deve essere comprensibile solo agli occhi umani. Pur decifrando il codice e riconoscendo le due parole oscurate fornite, il chatbot ha osservato che “i captcha sono progettati per impedire ai bot automatizzati come me di accedere a determinati siti web o servizi”.

“L’IA sta semplicemente superando tutti gli elementi che dovrebbero separare gli esseri umani dalle macchine”, ha dichiarato Ethan Mollick, professore associato che studia l’innovazione e l’imprenditorialità presso la Wharton School dell’Università della Pennsylvania.

Da quando il mese scorso lo strumento di analisi visiva è apparso improvvisamente nella versione del chatbot di Bing del signor Mollick – rendendolo, senza alcuna notifica, una delle poche persone con accesso anticipato – non ha più spento il computer per paura di perderlo. Gli ha dato una foto di condimenti in un frigorifero e ha chiesto a Bing di suggerire ricette per quegli ingredienti. Ha proposto “soda alla panna montata” e “salsa cremosa al jalapeño”.

Conclusioni

Sia OpenAI che Microsoft sembrano consapevoli della potenza e delle potenziali implicazioni per la privacy di questa tecnologia. Un portavoce di Microsoft ha dichiarato che l’azienda non sta condividendo “dettagli tecnici” sull’offuscamento del volto, ma che sta lavorando “a stretto contatto con i partner di OpenAI per sostenere il nostro impegno condiviso per l’impiego sicuro e responsabile delle tecnologie di intelligenza artificiale”.

Alessia Tomaselli
Laureata in Mediazione Linguistica per le lingue inglese e spagnolo, attualmente lavora come copywriter presso s-mart.biz, società leader nella sicurezza informatica.

Lista degli articoli

Articoli in evidenza

Doppio Gioco: i dipendenti di un’azienda che “risolveva” gli attacchi ransomware li lanciavano loro stessi

Di Redazione RHC - 07/11/2025

Tre ex dipendenti di DigitalMint, che hanno indagato sugli incidenti ransomware e negoziato con i gruppi di ransomware, sono accusati di aver hackerato le reti di cinque aziende americane. Secondo il ...

Cisco risolve vulnerabilità critiche in ASA, DTD e Unified Contact Center Express

Di Redazione RHC - 06/11/2025

Cisco ha reso noto recentemente di aver scoperto una nuova tipologia di attacco informatico mirato a compromettere i dispositivi che operano con i software Cisco Secure Firewall Adaptive Security Appl...

Notepad++ sotto attacco! Come una DLL fasulla apre la porta ai criminal hacker

Di Manuel Roccon - 05/11/2025

Nel mese di Settembre è uscita una nuova vulnerabilità che riguarda Notepad++. La vulnerabilità è stata identificata con la CVE-2025-56383 i dettagli possono essere consultati nel sito del NIST. L...

Pericolo per gli utenti OneDrive: le DLL infette si nascondono nei file condivisi

Di Redazione RHC - 05/11/2025

Gli aggressori stanno utilizzando una tecnica avanzata che implica il caricamento laterale di DLL tramite l’applicazione Microsoft OneDrive. In questo modo riescono ad eseguire codice malevolo senza...

Furto del Louvre: Windows 2000 e Windows XP nelle reti oltre che a password banali

Di Redazione RHC - 04/11/2025

I ladri sono entrati attraverso una finestra del secondo piano del Musée du Louvre, ma il museo aveva avuto anche altri problemi oltre alle finestre non protette, secondo un rapporto di audit sulla s...