Red Hot Cyber
La cybersecurity è condivisione. Riconosci il rischio, combattilo, condividi le tue esperienze ed incentiva gli altri a fare meglio di te.
Cerca

Meta AI ci porta nella Traduzione Vocale in tempo reale. Scopri i rivoluzionari Modelli di Traduzione Vocale Seamless!

Redazione RHC : 3 Dicembre 2023 08:54

I ricercatori di Meta AI hanno annunciato di aver sviluppato una nuova serie di modelli di intelligenza artificiale chiamati Seamless Communication che mirano a consentire una comunicazione più naturale e autentica tra le lingue. Questo dando vita in modo efficace al concetto di traduttore vocale universale. I modelli sono stati rilasciati questa settimana insieme a documenti di ricerca e dati di accompagnamento.

Il modello principale, Seamless, combina le funzionalità di altri tre modelli: SeamlessExpressive, SeamlessStreaming e SeamlessM4T v2, creando un unico sistema. Secondo il documento di ricerca, Seamless è “il primo sistema disponibile al pubblico che consente una comunicazione espressiva interlinguistica in tempo reale”.

Schema di funzionamento di Seamless (Fonte Meta AI)

Come Seamless funziona come traduttore universale in tempo reale

Translator Seamless rappresenta una nuova fase nell’uso dell’intelligenza artificiale per la comunicazione. Combina tre sofisticati modelli di rete neurale per tradurre in tempo reale oltre 100 lingue parlate e scritte preservando lo stile vocale, l’emozione e la prosodia della voce di chi parla.

Vorresti toccare con mano la Cybersecurity e la tecnologia? Iscriviti GRATIS ai WorkShop Hands-On della RHC Conference 2025 (Giovedì 8 maggio 2025)

Se sei un ragazzo delle scuole medie, superiori o frequenti l'università, oppure banalmente un curioso di qualsiasi età, il giorno giovedì 8 maggio 2025 presso il teatro Italia di Roma (a due passi dalla stazione termini e dalla metro B di Piazza Bologna), si terranno i workshop "hands-on", creati per far avvicinare i ragazzi alla sicurezza informatica e alla tecnologia. Questo anno i workshop saranno:

  • Creare Un Sistema Ai Di Visual Object Tracking (Hands on)
  • Social Engineering 2.0: Alla Scoperta Delle Minacce DeepFake
  • Doxing Con Langflow: Stiamo Costruendo La Fine Della Privacy?
  • Come Hackerare Un Sito WordPress (Hands on)
  • Il Cyberbullismo Tra Virtuale E Reale
  • Come Entrare Nel Dark Web In Sicurezza (Hands on)

  • Potete iscrivervi gratuitamente all'evento, che è stato creato per poter ispirare i ragazzi verso la sicurezza informatica e la tecnologia.
    Per ulteriori informazioni, scrivi a [email protected] oppure su Whatsapp al 379 163 8765


    Supporta RHC attraverso:


    Ti piacciono gli articoli di Red Hot Cyber? Non aspettare oltre, iscriviti alla newsletter settimanale per non perdere nessun articolo.

    SeamlessExpressive si concentra sulla preservazione dello stile vocale e delle sfumature emotive della voce di chi parla durante la traduzione da una lingua all’altra. Come afferma l’articolo, “le traduzioni devono trasmettere le sfumature dell’espressione umana. Sebbene gli strumenti di traduzione esistenti siano efficaci nel trasmettere il contenuto di una conversazione, in genere si basano su sistemi di sintesi vocale monotoni e robotici per l’output.”

    SeamlessStreaming fornisce una traduzione quasi istantanea con un ritardo di soli due secondi circa. I ricercatori affermano che questo è il “primo modello multilingue su larga scala” a raggiungere velocità di traduzione così elevate in quasi 100 lingue parlate e scritte.

    Il terzo modello, SeamlessM4T v2 , funge da base per gli altri due modelli. Questa è una versione aggiornata dell’originale SeamlessM4T rilasciata lo scorso anno. La nuova architettura fornisce “una migliore coerenza tra testo e output vocale”, secondo il documento.

    “Nel complesso, Seamless ci offre uno sguardo chiave sulle basi tecniche necessarie per trasformare l’Universal Speech Translator da un concetto di fantascienza a una tecnologia del mondo reale”, hanno scritto i ricercatori.

    Schema di funzionamento di Seamless (Fonte Meta AI)

    Potenziale per trasformare la comunicazione globale

    I modelli sviluppati aprono la strada a comunicazioni vocali innovative: dalle conversazioni in tempo reale in più lingue utilizzando dispositivi intelligenti, a video e podcast tradotti automaticamente. Tali tecnologie possono rendere la vita degli immigrati e di chiunque si trovi ad affrontare barriere linguistiche molto più semplice, aprendo nuove opportunità per interazioni inclusive.

    “Pubblicando il nostro lavoro, speriamo che ricercatori e sviluppatori possano espandere l’impatto dei nostri contributi creando tecnologie che affrontino il multilinguismo in un mondo sempre più interconnesso e interdipendente”, afferma il documento.

    Tuttavia, i ricercatori riconoscono che la tecnologia può essere utilizzata anche per scopi dannosi, come attacchi di phishing vocale, video falsi e altre applicazioni dannose. Per promuovere la sicurezza e l’uso responsabile dei modelli, hanno implementato diverse misure, tra cui filigrane audio e nuove tecniche per ridurre la produzione tossica allucinatoria.

    I modelli sono disponibili pubblicamente su Hugging Face

    In linea con l’impegno di Meta verso la ricerca aperta e la collaborazione, i modelli di Seamless Communication sono stati pubblicati su Hugging Face e Github. La raccolta include modelli Seamless, SeamlessExpressive, SeamlessStreaming e SeamlessM4T v2 insieme ai relativi metadati.

    Rendendo disponibili i suoi innovativi modelli di elaborazione del linguaggio naturale, Meta mira a ispirare ricercatori e sviluppatori a sviluppare e migliorare ulteriormente queste tecnologie. L’obiettivo è creare un ponte tra lingue e culture diverse, migliorando la comprensione globale. Questa mossa non solo riafferma la posizione di Meta come leader nelle tecnologie di intelligenza artificiale aperta, ma fornisce anche alla comunità di ricerca una risorsa preziosa e rilevante.

    Redazione
    La redazione di Red Hot Cyber è composta da un insieme di persone fisiche e fonti anonime che collaborano attivamente fornendo informazioni in anteprima e news sulla sicurezza informatica e sull'informatica in generale.

    Lista degli articoli

    Articoli in evidenza

    Ma quale Agenda 2030! 9 reattori nucleari per un chatbot è l’altra faccia dell’intelligenza artificiale

    Lo sviluppo di supercomputer per l’intelligenza artificiale sta entrando in una nuova orbita: in termini di scala, costi e consumi energetici e infrastrutture e megaprogetti. Uno studio condott...

    25 Aprile: Dalla Resistenza alla Cyber Resistenza – Difendiamo la Libertà Digitale

    Il 25 Aprile, data simbolo della Liberazione italiana dal fascismo, ci ricorda il valore della libertà, conquistata con il sacrificio di partigiani e combattenti. In un’era dominata dal di...

    Le Action Figure della Cyber Security. Red Hot Cyber lancia la serie “Chiama Ammiocuggino!”

    In un mondo dove ogni giorno si registrano migliaia di attacchi informatici, molte aziende continuano a sottovalutare l’importanza della cybersecurity, affidandosi a “sedicenti esperti&#...

    GPT-4 scrive un exploit prima del PoC pubblico. La corsa alla Patch non è mai stata così essenziale

    AI, AI e ancora AI. E sembra che l’intelligenza artificiale giorno dopo giorno ci porti innovazioni sia come difesa ma soprattutto, come attacco. L’intelligenza artificiale è gi...

    HackerHood di RHC Rivela due nuovi 0day sui prodotti Zyxel

    Il collettivo di ricerca in sicurezza informatica HackerHood, parte dell’universo della community di Red Hot Cyber, ha recentemente scoperto due nuove vulnerabilità ...