¡Tencent desafía a los gigantes! El nuevo Hunyuan-MT supera a Google Translate y GPT-4.1

Redazione RHC : 3 septiembre 2025 09:55

La empresa china Tencent ha publicado el código fuente de un nuevo conjunto de modelos de lenguaje Hunyuan-MT, especialmente optimizados para tareas de traducción. Los desarrolladores afirman que los algoritmos tienen un rendimiento superior al de Google Translate en la popular prueba de rendimiento WMT25.

El conjunto comprende cuatro modelos, incluyendo dos modelos insignia: Hunyuan-MT-7B y Hunyuan-MT-Chimera-7B, cada uno con 7 mil millones de parámetros. También se presentan dos versiones comprimidas que consumen menos memoria, pero funcionan con una ligera pérdida de calidad de traducción.

Tencent utilizó cuatro conjuntos de datos para el entrenamiento. Dos de ellos incluían textos en 33 idiomas sin traducción, mientras que los otros dos incluían varios millones de pares de oraciones y sus traducciones. Este enfoque les permitió combinar el conocimiento del idioma con el conocimiento general.

La eficacia de los modelos se evaluó mediante la prueba MMLU-Pro, diseñada para evaluar el conocimiento general. Hunyuan-MT tuvo un mejor rendimiento que Llama-3-8B-Base, a pesar de tener menos parámetros.

Tras el entrenamiento inicial, los modelos se sometieron a una etapa adicional de entrenamiento mediante aprendizaje por refuerzo. Tencent les proporcionó tareas y retroalimentación sobre la calidad de la traducción, lo que contribuyó a mejorar su precisión.

La calidad se evaluó mediante un sistema de IA independiente, que analizó la correspondencia semántica de la traducción con el original y el uso correcto de la terminología en diferentes campos.

El primer modelo de la serie, Hunyuan-MT-7B, se basa en la arquitectura clásica de los modelos de lenguaje. La variante Chimera-7B utiliza un método de conjunto: varias redes neuronales procesan una consulta simultáneamente y sus respuestas se combinan para obtener una versión final de mayor calidad.

En las pruebas WMT25 que compararon traducciones en 31 pares de idiomas, Hunyuan-MT superó a Google Translate en 30 casos, y algunos pares obtuvieron resultados hasta un 65 % superiores.

Además, la serie de Tencent obtuvo un mejor rendimiento que GPT-4.1 y Claude 4 Sonnet de Anthropic en la mayoría de los pares de idiomas en el mismo punto de referencia.

Redazione
Red Hot Cyber's editorial team consists of a collection of individuals and anonymous sources who actively collaborate by providing advance information and news on cyber security and IT in general.

Lista degli articoli

Artículos destacados

China promueve la gobernanza global de la IA en el marco de las Naciones Unidas

Di Redazione RHC - 27/10/2025

El 27 de octubre se celebró en el Ministerio de Asuntos Exteriores en Beijing el Foro del Salón Azul sobre el tema «Mejorar la gobernanza global y construir una comunidad con un futuro compartido p...

Hackers atacan instalaciones de producción de armas nucleares de EE. UU

Di Redazione RHC - 27/10/2025

Hackers del gobierno vulneraron una planta de fabricación de componentes para armas nucleares en Estados Unidos explotando vulnerabilidades de Microsoft SharePoint. El incidente afectó al Campus de ...

Gemini 3.0 Pro: Google se prepara para el salto generacional y pretende superar a GPT-5 y Claude 4.5

Di Redazione RHC - 25/10/2025

En los últimos días, algunos usuarios han recibido una notificación diciendo que sus dispositivos Gemini Advanced han sido «actualizados del modelo de la generación anterior al 3.0 Pro, el modelo...

Explosión crítica de RCE en Microsoft WSUS explotada activamente. CISA advierte: riesgo inminente.

Di Redazione RHC - 25/10/2025

La Agencia de Seguridad de Infraestructura y Ciberseguridad de Estados Unidos (CISA) ha emitido una alerta global con respecto a la explotación activa de una falla crítica de ejecución remota de c�...

¡Sin carne ni huesos, solo código! Llega el primer presentador de IA de Channel 4.

Di Redazione RHC - 24/10/2025

El lunes 20 de octubre, el Canal 4 transmitió un documental completo presentado por un presentador de televisión creativo impulsado completamente por inteligencia artificial. » No soy real. Por pri...