
Redazione RHC : 24 agosto 2025 10:03
Hubo un día en que DeepSeek sorprendió a medio mundo al demostrar que se podía hacer mucho con menos. Hoy regresa con la versión 3.1 y un mensaje que no pasa desapercibido: el modelo está preparado para la próxima tanda de chips chinos.
No hablamos de un cambio de rumbo automático del mercado, sino de una apuesta concreta que apunta en una dirección incómoda para NVIDIA y la compañía. Si esta armonía técnica con el hardware chino se traduce en rendimiento, el debate sobre quién impulsa la IA en China será muy diferente.
Según la propia declaración de la compañía, la versión 3.1 introduce la inferencia híbrida al más puro estilo GPT-5: un sistema único con dos rutas, Think (razonamiento profundo) y Non-Think (respuesta rápida), conmutables desde el sitio web y la aplicación. La redacción es clara: «Inferencia híbrida: Pensar y no pensar, un modelo, dos modelos». La compañía también enfatiza que la versión «Think» «obtiene respuestas más rápido» que su predecesora. En otras palabras, no solo han cambiado los pesos, sino también los modos de inferencia ya en uso.
En un comentario fijado en su última publicación de WeChat, DeepSeek escribe: «El UE8M0 FP8 es para la próxima generación de chips domésticos». Este es el punto delicado: sugiere que la compañía ha adaptado el formato de datos, aparentemente un FP8 denominado UE8M0, a la próxima ola de procesadores chinos.
Bloomberg y Reuters retoman el mensaje y lo resumen: la versión 3.1 está «adaptada para funcionar con los chips de IA de próxima generación de China». En otras palabras, una optimización orientada al ecosistema local.
FP8 es un formato de 8 bits con la mitad del tamaño de FP16/BF16. Gracias a su compatibilidad nativa, permite un mayor rendimiento por ciclo y menos memoria, siempre que el escalado esté correctamente calibrado.
La hoja de modelo oficial de Hugging Face indica que DeepSeek-V3.1 «se entrenó utilizando el formato de escalado UE8M0 FP8», lo que indica que no se trata simplemente de un proceso de ajuste de peso, sino que el entrenamiento y la ejecución se han diseñado específicamente para lograr dicha precisión. Lo complicado, y conviene ser cauteloso, es que todo apunta a que en el futuro se implementarán varios chips que podrán explotar este esquema de forma nativa.
Entonces, ¿son malas noticias para NVIDIA?
Los datos del año fiscal que finalizó el 26 de enero indican que China representó alrededor del 13 % de los ingresos de la compañía, liderados por Jensen Huang. Si parte de la IA china se traslada del ecosistema clásico de GPU + CUDA de NVIDIA a soluciones nacionales basadas en el formato UE8M0 FP8 y capaces de ofrecer buenos resultados (presumiblemente los chips Ascend de Huawei), la demanda de soluciones occidentales podría disminuir con el tiempo.
Todo esto ocurre en el contexto de los controles de exportación de EE. UU.: restricciones destinadas a limitar el acceso de China a chips de vanguardia y que también han acelerado su búsqueda de autosuficiencia.
Este año, la administración Trump restableció condicionalmente las exportaciones de H2O, un chip diseñado para China. Desde entonces, el estatus de H2O ha fluctuado en medio de los permisos, la presión regulatoria china y los planes de NVIDIA de introducir alternativas basadas en Blackwell.
El mensaje subyacente es que el marco es político y está en constante evolución, y cualquier camino que permita a China reducir su dependencia de estas oportunidades tiene valor estratégico.
Redazione
Conocemos al hombre considerado uno de los científicos más polifacéticos y brillantes del siglo pasado, quizá solo comparable a Einstein. Poseía un amplio abanico de talentos científicos, desarr...

Muchos de nosotros crecimos con Hiroshi Shiba, de Jeeg, el robot de acero que hablaba con su difunto padre, el profesor Senjiro Shiba, científico y arqueólogo, dentro de una gran computadora. En un ...

Los atacantes están explotando activamente una vulnerabilidad crítica en el sistema de protección de aplicaciones web (WAF) FortiWeb de Fortinet, que podría utilizarse como medio para realizar ata...

En uno de los foros más populares de Rusia para la compraventa de vulnerabilidades y herramientas de ataque, el hilo apareció como un anuncio comercial estándar, pero su contenido dista mucho de se...

A menudo hablamos del servicio de ransomware como servicio (RaaS) LockBit, recientemente renovado como LockBit 3.0, que sigue aportando innovaciones significativas al panorama del ransomware. Estas in...