Red Hot Cyber

La ciberseguridad se comparte. Reconozca el riesgo, combátalo, comparta sus experiencias y anime a otros a hacerlo mejor que usted.
Buscar

DeepSeek lanza la versión 3.1 de su modelo de IA con soporte para chips chinos

Redazione RHC : 24 agosto 2025 10:03

Hubo un día en que DeepSeek sorprendió a medio mundo al demostrar que se podía hacer mucho con menos. Hoy regresa con la versión 3.1 y un mensaje que no pasa desapercibido: el modelo está preparado para la próxima tanda de chips chinos.

No hablamos de un cambio de rumbo automático del mercado, sino de una apuesta concreta que apunta en una dirección incómoda para NVIDIA y la compañía. Si esta armonía técnica con el hardware chino se traduce en rendimiento, el debate sobre quién impulsa la IA en China será muy diferente.

Según la propia declaración de la compañía, la versión 3.1 introduce la inferencia híbrida al más puro estilo GPT-5: un sistema único con dos rutas, Think (razonamiento profundo) y Non-Think (respuesta rápida), conmutables desde el sitio web y la aplicación. La redacción es clara: «Inferencia híbrida: Pensar y no pensar, un modelo, dos modelos». La compañía también enfatiza que la versión «Think» «obtiene respuestas más rápido» que su predecesora. En otras palabras, no solo han cambiado los pesos, sino también los modos de inferencia ya en uso.

La frase que lo resume todo: un FP8 «diseñado para chips domésticos»

En un comentario fijado en su última publicación de WeChat, DeepSeek escribe: «El UE8M0 FP8 es para la próxima generación de chips domésticos». Este es el punto delicado: sugiere que la compañía ha adaptado el formato de datos, aparentemente un FP8 denominado UE8M0, a la próxima ola de procesadores chinos.

Bloomberg y Reuters retoman el mensaje y lo resumen: la versión 3.1 está «adaptada para funcionar con los chips de IA de próxima generación de China». En otras palabras, una optimización orientada al ecosistema local.

FP8 es un formato de 8 bits con la mitad del tamaño de FP16/BF16. Gracias a su compatibilidad nativa, permite un mayor rendimiento por ciclo y menos memoria, siempre que el escalado esté correctamente calibrado.

La hoja de modelo oficial de Hugging Face indica que DeepSeek-V3.1 «se entrenó utilizando el formato de escalado UE8M0 FP8», lo que indica que no se trata simplemente de un proceso de ajuste de peso, sino que el entrenamiento y la ejecución se han diseñado específicamente para lograr dicha precisión. Lo complicado, y conviene ser cauteloso, es que todo apunta a que en el futuro se implementarán varios chips que podrán explotar este esquema de forma nativa.

Entonces, ¿son malas noticias para NVIDIA?

Los datos del año fiscal que finalizó el 26 de enero indican que China representó alrededor del 13 % de los ingresos de la compañía, liderados por Jensen Huang. Si parte de la IA china se traslada del ecosistema clásico de GPU + CUDA de NVIDIA a soluciones nacionales basadas en el formato UE8M0 FP8 y capaces de ofrecer buenos resultados (presumiblemente los chips Ascend de Huawei), la demanda de soluciones occidentales podría disminuir con el tiempo.

China representó aproximadamente el 13% de los ingresos de NVIDIA en el último año fiscal

Todo esto ocurre en el contexto de los controles de exportación de EE. UU.: restricciones destinadas a limitar el acceso de China a chips de vanguardia y que también han acelerado su búsqueda de autosuficiencia.

Este año, la administración Trump restableció condicionalmente las exportaciones de H2O, un chip diseñado para China. Desde entonces, el estatus de H2O ha fluctuado en medio de los permisos, la presión regulatoria china y los planes de NVIDIA de introducir alternativas basadas en Blackwell.

El mensaje subyacente es que el marco es político y está en constante evolución, y cualquier camino que permita a China reducir su dependencia de estas oportunidades tiene valor estratégico.

Redazione
Red Hot Cyber's editorial team consists of a collection of individuals and anonymous sources who actively collaborate by providing advance information and news on cyber security and IT in general.

Lista degli articoli

Artículos destacados

¡Llega la Novia Robot! La nueva frontera de la tecnología china.
Di Redazione RHC - 15/08/2025

Mientras que el auge de los robots en China, el mayor mercado y productor mundial de robots, atrae la atención de la industria global de las tecnologías de la información (TI), la apari...

¡Agosto a lo grande! 36 RCE para el martes de parches de Microsoft en agosto.
Di Redazione RHC - 13/08/2025

Martes de parches de agosto: Microsoft publica actualizaciones de seguridad que corrigen 107 vulnerabilidades en los productos de su ecosistema. La actualización incluye correcciones para 90 vuln...

Vulnerabilidad crítica de RCE en Microsoft Teams: se necesita una actualización urgente
Di Redazione RHC - 13/08/2025

Como parte de las actualizaciones de seguridad del martes de parches de agosto de 2025, se ha corregido una vulnerabilidad crítica de ejecución remota de código (RCE) en el software de ...

29.000 servidores Exchange en riesgo. El exploit para CVE-2025-53786 está en explotación.
Di Redazione RHC - 13/08/2025

29 000 servidores Exchange son vulnerables a la vulnerabilidad CVE-2025-53786, que permite a los atacantes acceder a entornos de nube de Microsoft, lo que podría comprometer por completo el ...

James Cameron: La IA puede causar devastación como Skynet y Terminator
Di Redazione RHC - 10/08/2025

«El sistema de defensa militar Skynet entrará en funcionamiento el 4 de agosto de 1997. Comenzará a autoeducarse, aprendiendo a un ritmo exponencial, y adquirirá consciencia de s&#...