Red Hot Cyber

La ciberseguridad se comparte. Reconozca el riesgo, combátalo, comparta sus experiencias y anime a otros a hacerlo mejor que usted.
Buscar

DeepSeek lanza la versión 3.1 de su modelo de IA con soporte para chips chinos

Redazione RHC : 24 agosto 2025 10:03

Hubo un día en que DeepSeek sorprendió a medio mundo al demostrar que se podía hacer mucho con menos. Hoy regresa con la versión 3.1 y un mensaje que no pasa desapercibido: el modelo está preparado para la próxima tanda de chips chinos.

No hablamos de un cambio de rumbo automático del mercado, sino de una apuesta concreta que apunta en una dirección incómoda para NVIDIA y la compañía. Si esta armonía técnica con el hardware chino se traduce en rendimiento, el debate sobre quién impulsa la IA en China será muy diferente.

Según la propia declaración de la compañía, la versión 3.1 introduce la inferencia híbrida al más puro estilo GPT-5: un sistema único con dos rutas, Think (razonamiento profundo) y Non-Think (respuesta rápida), conmutables desde el sitio web y la aplicación. La redacción es clara: «Inferencia híbrida: Pensar y no pensar, un modelo, dos modelos». La compañía también enfatiza que la versión «Think» «obtiene respuestas más rápido» que su predecesora. En otras palabras, no solo han cambiado los pesos, sino también los modos de inferencia ya en uso.

La frase que lo resume todo: un FP8 «diseñado para chips domésticos»

En un comentario fijado en su última publicación de WeChat, DeepSeek escribe: «El UE8M0 FP8 es para la próxima generación de chips domésticos». Este es el punto delicado: sugiere que la compañía ha adaptado el formato de datos, aparentemente un FP8 denominado UE8M0, a la próxima ola de procesadores chinos.

Bloomberg y Reuters retoman el mensaje y lo resumen: la versión 3.1 está «adaptada para funcionar con los chips de IA de próxima generación de China». En otras palabras, una optimización orientada al ecosistema local.

FP8 es un formato de 8 bits con la mitad del tamaño de FP16/BF16. Gracias a su compatibilidad nativa, permite un mayor rendimiento por ciclo y menos memoria, siempre que el escalado esté correctamente calibrado.

La hoja de modelo oficial de Hugging Face indica que DeepSeek-V3.1 «se entrenó utilizando el formato de escalado UE8M0 FP8», lo que indica que no se trata simplemente de un proceso de ajuste de peso, sino que el entrenamiento y la ejecución se han diseñado específicamente para lograr dicha precisión. Lo complicado, y conviene ser cauteloso, es que todo apunta a que en el futuro se implementarán varios chips que podrán explotar este esquema de forma nativa.

Entonces, ¿son malas noticias para NVIDIA?

Los datos del año fiscal que finalizó el 26 de enero indican que China representó alrededor del 13 % de los ingresos de la compañía, liderados por Jensen Huang. Si parte de la IA china se traslada del ecosistema clásico de GPU + CUDA de NVIDIA a soluciones nacionales basadas en el formato UE8M0 FP8 y capaces de ofrecer buenos resultados (presumiblemente los chips Ascend de Huawei), la demanda de soluciones occidentales podría disminuir con el tiempo.

China representó aproximadamente el 13% de los ingresos de NVIDIA en el último año fiscal

Todo esto ocurre en el contexto de los controles de exportación de EE. UU.: restricciones destinadas a limitar el acceso de China a chips de vanguardia y que también han acelerado su búsqueda de autosuficiencia.

Este año, la administración Trump restableció condicionalmente las exportaciones de H2O, un chip diseñado para China. Desde entonces, el estatus de H2O ha fluctuado en medio de los permisos, la presión regulatoria china y los planes de NVIDIA de introducir alternativas basadas en Blackwell.

El mensaje subyacente es que el marco es político y está en constante evolución, y cualquier camino que permita a China reducir su dependencia de estas oportunidades tiene valor estratégico.

Redazione
Red Hot Cyber's editorial team consists of a collection of individuals and anonymous sources who actively collaborate by providing advance information and news on cyber security and IT in general.

Lista degli articoli

Artículos destacados

¡Google Drive se defiende del ransomware! La IA bloquea los ataques.
Di Redazione RHC - 02/10/2025

Google ha presentado una nueva herramienta de IA para Drive para escritorio. Se dice que el modelo se ha entrenado con millones de muestras reales de ransomware y puede suspender la sincronización pa...

Phantom Taurus: el grupo de hackers chinos que espía a gobiernos y embajadas
Di Redazione RHC - 02/10/2025

Expertos de Palo Alto Networks han identificado un nuevo grupo de hackers vinculado al Partido Comunista Chino. Unit 42, la división de inteligencia de amenazas de la compañía con sede en Californi...

Descubriendo la inyección rápida: cuando la IA se deja engañar por las palabras
Di Manuel Roccon - 02/10/2025

Los sistemas de Inteligencia Artificial Generativa (GenAI) están revolucionando la forma en que interactuamos con la tecnología, ofreciendo capacidades extraordinarias en la creación de texto, imá...

¡De usuario a root en un segundo! CISA advierte: millones de sistemas operativos en riesgo. ¡Parche!
Di Redazione RHC - 30/09/2025

La Agencia de Seguridad de Infraestructura y Ciberseguridad de Estados Unidos (CISA) ha añadido una vulnerabilidad crítica en la popular utilidad Sudo, utilizada en sistemas Linux y similares a Unix...

¡EE. UU. quiere hackear Telegram! El caso genera debate sobre privacidad y jurisdicción.
Di Redazione RHC - 29/09/2025

El Departamento de Justicia de EE. UU. recibió autorización judicial para realizar una inspección remota de los servidores de Telegram como parte de una investigación sobre explotación infantil. ...