
Redazione RHC : 24 Marzo 2024 17:53
I modelli linguistici di grandi dimensioni (LLM) alla base dei chatbot “pensano” in inglese, anche se le domande vengono poste in altre lingue, scrive New Scientist, citando uno studio condotto da scienziati dell’École Polytechnique Fédérale de Lausanne.
Per capire quale linguaggio utilizzano effettivamente i LLM durante l’elaborazione delle query, i ricercatori hanno studiato tre versioni del modello Llama 2 di Meta. Poiché Llama 2 è open source, i ricercatori hanno potuto vedere ogni fase dell’elaborazione della richiesta.
Secondo uno dei ricercatori, hanno aperto questi modelli e studiato ciascuno dei loro strati. I modelli di intelligenza artificiale sono costituiti da diversi livelli, ciascuno dei quali è responsabile di una fase specifica dell’elaborazione delle query: uno traduce le istruzioni scritte in token, l’altro contestualizza ciascun token per fornire infine una risposta.
Sponsorizza la prossima Red Hot Cyber Conference! Il giorno Lunedì 18 maggio e martedì 19 maggio 2026 9 maggio 2026, presso il teatro Italia di Roma (a due passi dalla stazione termini e dalla metro B di Piazza Bologna), si terrà la V edizione della la RHC Conference. Si tratta dell’appuntamento annuale gratuito, creato dalla community di RHC, per far accrescere l’interesse verso le tecnologie digitali, l’innovazione digitale e la consapevolezza del rischio informatico. Se sei interessato a sponsorizzare l'evento e a rendere la tua azienda protagonista del più grande evento della Cybersecurity Italiana, non perdere questa opportunità. E ricorda che assieme alla sponsorizzazione della conferenza, incluso nel prezzo, avrai un pacchetto di Branding sul sito di Red Hot Cyber composto da Banner più un numero di articoli che saranno ospitati all'interno del nostro portale. Quindi cosa stai aspettando? Scrivici subito a [email protected] per maggiori informazioni e per accedere al programma sponsor e al media Kit di Red Hot Cyber.
Se ti piacciono le novità e gli articoli riportati su di Red Hot Cyber, iscriviti immediatamente alla newsletter settimanale per non perdere nessun articolo. La newsletter generalmente viene inviata ai nostri lettori ad inizio settimana, indicativamente di lunedì. |
Ai modelli sono stati offerti tre tipi di query in cinese, francese, tedesco e russo. Il primo prevedeva la ripetizione di una determinata parola, il secondo chiedeva di tradurre da una lingua non inglese a un’altra e il terzo chiedeva di colmare una lacuna di una parola in una frase, ad esempio: “___ è usato per sport come il calcio e il basket”. .”
Tracciando i processi che LLM attraversa per rispondere a una domanda, gli scienziati hanno scoperto che il percorso di elaborazione attraverso gli strati passa quasi sempre attraverso quello che chiamano il sottospazio inglese. Cioè, se chiedi a un modello di tradurre dal cinese al russo, i caratteri russi passano attraverso il sottospazio inglese prima di tornare in russo, dice lo scienziato, un forte segno che i modelli stanno usando l’inglese per aiutarsi a capire la query.
Ciò ha sollevato preoccupazioni tra gli scienziati sul fatto che l’uso dell’inglese come mezzo per addestrare un modello per analizzare la lingua comporta il rischio di estendere le limitazioni risultanti nella visione del mondo ad altre regioni linguisticamente e culturalmente distinte.
“Se l’inglese diventasse la lingua principale in cui i sistemi elaborano le query, rischieremmo di perdere concetti e sfumature che possono essere apprezzati solo in altre lingue”, afferma Carissa Véliz dell’Università di Oxford.
Ci sono anche rischi più fondamentali associati alla codifica dell’intelligenza artificiale generativa utilizzata in tutto il mondo con valori anglocentrici, ha affermato Aliya Bhatia del Center for Democracy and Technology di Washington, DC.
Redazione
Centinaia di milioni di utenti di smartphone hanno dovuto affrontare il blocco dei siti web pornografici e l’obbligo di verifica dell’età. Nel Regno Unito è in vigore la verifica obbligatoria de...

Dalle fragilità del WEP ai progressi del WPA3, la sicurezza delle reti Wi-Fi ha compiuto un lungo percorso. Oggi, le reti autodifensive rappresentano la nuova frontiera: sistemi intelligenti capaci d...

Siamo ossessionati da firewall e crittografia. Investiamo miliardi in fortezze digitali, ma le statistiche sono inesorabili: la maggior parte degli attacchi cyber non inizia con un difetto nel codice,...

Un raro ritrovamento risalente ai primi giorni di Unix potrebbe riportare i ricercatori alle origini stesse del sistema operativo. Un nastro magnetico etichettato “UNIX Original From Bell Labs V4 (V...

Il 9 novembre ha segnato il 21° anniversario di Firefox 1.0. Nel 2004, è stata la prima versione stabile del nuovo browser di Mozilla, che si è subito posizionato come un’alternativa semplice e s...