Redazione RHC : 3 Settembre 2025 09:53
L’azienda cinese Tencent ha reso pubblico il codice sorgente di una nuova serie di modelli linguistici Hunyuan-MT, appositamente ottimizzati per le attività di traduzione. Gli sviluppatori affermano che gli algoritmi mostrano risultati migliori di Google Translate nel popolare benchmark WMT25.
La serie comprende quattro modelli, tra cui due modelli di punta: Hunyuan-MT-7B e Hunyuan-MT-Chimera-7B, ciascuno contenente 7 miliardi di parametri. Vengono inoltre presentate due versioni compresse, che utilizzano meno memoria, ma operano con una leggera perdita nella qualità della traduzione.
Tencent ha utilizzato quattro set di dati per l’addestramento. Due di questi includevano testi in 33 lingue senza traduzione, mentre gli altri due includevano diversi milioni di coppie di frasi e le relative traduzioni. Questo approccio ha permesso di combinare la conoscenza delle lingue con l’erudizione generale.
PARTE LA PROMO ESTATE -40%
RedHotCyber Academy lancia una promozione esclusiva e a tempo limitato per chi vuole investire nella propria crescita professionale nel mondo della tecnologia e della cybersecurity!
Approfitta del 40% di sconto sull’acquisto congiunto di 3 corsi da te scelti dalla nostra Academy. Ad esempio potresti fare un percorso formativo includendo Cyber Threat intelligence + NIS2 + Criptovalute con lo sconto del 40%. Tutto questo lo potrai fruire, dove e quando vuoi e con la massima flessibilità, grazie a lezioni di massimo 30 minuti ciascuna.
Contattaci tramite WhatsApp al 375 593 1011 per richiedere ulteriori informazioni oppure scriviti alla casella di posta [email protected]
L’efficacia dei modelli è stata testata utilizzando il test MMLU-Pro, progettato per valutare le conoscenze generali. Hunyuan-MT ha mostrato risultati migliori rispetto a Llama-3-8B-Base, nonostante un numero inferiore di parametri.
Dopo l’addestramento iniziale, i modelli sono stati sottoposti a un ulteriore passaggio, utilizzando l’apprendimento per rinforzo. Tencent ha fornito loro compiti e feedback sulla qualità della traduzione, contribuendo a migliorarne l’accuratezza.
La qualità è stata valutata da un sistema di intelligenza artificiale separato, che ha analizzato la corrispondenza semantica della traduzione con l’originale e la correttezza dell’uso della terminologia in diversi campi.
Il primo modello della serie, Hunyuan-MT-7B, si basa sull’architettura classica dei modelli linguistici. La variante Chimera-7B utilizza un metodo di ensemble: diverse reti neurali elaborano una richiesta simultaneamente e le loro risposte vengono poi combinate in una versione finale di qualità superiore.
Nei test WMT25 che confrontano le traduzioni in 31 coppie di lingue, Hunyuan-MT ha superato Google Translate in 30 casi, con alcune coppie che hanno ottenuto risultati superiori del 65%.
Inoltre, la serie di Tencent ha ottenuto risultati migliori rispetto a GPT-4.1 e Claude 4 Sonnet di Anthropic nella maggior parte delle coppie di lingue dello stesso benchmark.
All’inizio di settembre 2025,Palo Alto Networks ha confermato di essere stata vittima di una violazione dei dati. La compromissione non ha interessato i suoi prodotti o servizi core, bensì alcune i...
Il 31 agosto 2025 il volo AAB53G, operato con un Dassault Falcon 900LX immatricolato OO-GPE e con a bordo la presidente della Commissione Europea Ursula von der Leyen, è decollato da Varsavia ed è a...
La recente conferma da parte di Zscaler riguardo a una violazione dati derivante da un attacco alla supply chain fornisce un caso studio sull’evoluzione delle minacce contro ecosistemi SaaS compless...
Proofpoint pubblica il report “Voice of the CISO 2025”: cresce il rischio legato all’AI e rimane il problema umano, mentre i CISO sono a rischio burnout. L’84% dei CISO italiani prevede un att...
La società QNAP Systems ha provveduto al rilascio di aggiornamenti di sicurezza al fine di eliminare varie vulnerabilità presenti nel firmware QVR dei sistemi VioStor Network Video Recorder (NVR). I...