
Redazione RHC : 24 Marzo 2024 17:53
I modelli linguistici di grandi dimensioni (LLM) alla base dei chatbot “pensano” in inglese, anche se le domande vengono poste in altre lingue, scrive New Scientist, citando uno studio condotto da scienziati dell’École Polytechnique Fédérale de Lausanne.
Per capire quale linguaggio utilizzano effettivamente i LLM durante l’elaborazione delle query, i ricercatori hanno studiato tre versioni del modello Llama 2 di Meta. Poiché Llama 2 è open source, i ricercatori hanno potuto vedere ogni fase dell’elaborazione della richiesta.
Secondo uno dei ricercatori, hanno aperto questi modelli e studiato ciascuno dei loro strati. I modelli di intelligenza artificiale sono costituiti da diversi livelli, ciascuno dei quali è responsabile di una fase specifica dell’elaborazione delle query: uno traduce le istruzioni scritte in token, l’altro contestualizza ciascun token per fornire infine una risposta.
CALL FOR SPONSOR - Sponsorizza la Graphic Novel Betti-RHC Sei un'azienda innovativa, che crede nella diffusione di concetti attraverso metodi "non convenzionali"? Conosci il nostro corso sul cybersecurity awareness a fumetti? Red Hot Cyber sta ricercando un nuovo sponsor per una nuova puntata del fumetto Betti-RHC mentre il team è impegnato a realizzare 3 nuovi episodi che ci sono stati commissionati. Contattaci tramite WhatsApp al numero 375 593 1011 per richiedere ulteriori informazioni oppure alla casella di posta [email protected]
Se ti piacciono le novità e gli articoli riportati su di Red Hot Cyber, iscriviti immediatamente alla newsletter settimanale per non perdere nessun articolo. La newsletter generalmente viene inviata ai nostri lettori ad inizio settimana, indicativamente di lunedì. |
Ai modelli sono stati offerti tre tipi di query in cinese, francese, tedesco e russo. Il primo prevedeva la ripetizione di una determinata parola, il secondo chiedeva di tradurre da una lingua non inglese a un’altra e il terzo chiedeva di colmare una lacuna di una parola in una frase, ad esempio: “___ è usato per sport come il calcio e il basket”. .”
Tracciando i processi che LLM attraversa per rispondere a una domanda, gli scienziati hanno scoperto che il percorso di elaborazione attraverso gli strati passa quasi sempre attraverso quello che chiamano il sottospazio inglese. Cioè, se chiedi a un modello di tradurre dal cinese al russo, i caratteri russi passano attraverso il sottospazio inglese prima di tornare in russo, dice lo scienziato, un forte segno che i modelli stanno usando l’inglese per aiutarsi a capire la query.
Ciò ha sollevato preoccupazioni tra gli scienziati sul fatto che l’uso dell’inglese come mezzo per addestrare un modello per analizzare la lingua comporta il rischio di estendere le limitazioni risultanti nella visione del mondo ad altre regioni linguisticamente e culturalmente distinte.
“Se l’inglese diventasse la lingua principale in cui i sistemi elaborano le query, rischieremmo di perdere concetti e sfumature che possono essere apprezzati solo in altre lingue”, afferma Carissa Véliz dell’Università di Oxford.
Ci sono anche rischi più fondamentali associati alla codifica dell’intelligenza artificiale generativa utilizzata in tutto il mondo con valori anglocentrici, ha affermato Aliya Bhatia del Center for Democracy and Technology di Washington, DC.
Redazione
Cloudflare ha registrato un’interruzione significativa nella mattina del 5 dicembre 2025, quando alle 08:47 UTC una parte della propria infrastruttura ha iniziato a generare errori interni. L’inci...

Una campagna sempre più aggressiva, che punta direttamente alle infrastrutture di accesso remoto, ha spinto gli autori delle minacce a tentare di sfruttare attivamente le vulnerabilità dei portali V...

Dietro molte delle applicazioni e servizi digitali che diamo per scontati ogni giorno si cela un gigante silenzioso: FreeBSD. Conosciuto soprattutto dagli addetti ai lavori, questo sistema operativo U...

Molto spesso parliamo su questo sito del fatto che la finestra tra la pubblicazione di un exploit e l’avvio di attacchi attivi si sta riducendo drasticamente. Per questo motivo diventa sempre più f...

Dal 1° luglio, Cloudflare ha bloccato 416 miliardi di richieste da parte di bot di intelligenza artificiale che tentavano di estrarre contenuti dai siti web dei suoi clienti. Secondo Matthew Prince, ...