Red Hot Cyber

La ciberseguridad se comparte. Reconozca el riesgo, combátalo, comparta sus experiencias y anime a otros a hacerlo mejor que usted.
Buscar
Red Hot Cyber Academy
Crowdtour Promo Banner For Milan V1 970x120 Desktop
Nanochat: Crea tu propio LLM, entrénalo y ponlo a funcionar en tu PC por $100

Nanochat: Crea tu propio LLM, entrénalo y ponlo a funcionar en tu PC por $100

Redazione RHC : 14 octubre 2025 09:38

El desarrollador Andrej Karpathy ha presentado nanochat , una versión minimalista y completamente de código abierto de ChatGPT que puede entrenarse y ejecutarse en un solo ordenador. Diseñado como plataforma de aprendizaje para el curso LLM101n de Eureka Labs , el proyecto permite a los usuarios crear su propio modelo de lenguaje desde cero hasta la interfaz web, sin dependencias complejas ni infraestructura compleja.

El objetivo de nanochat es demostrar que se puede crear un análogo básico de ChatGPT en pocas horas y por unos 100 $. El script speedrun.sh realiza automáticamente todos los pasos, desde la tokenización y el entrenamiento hasta la inferencia y el lanzamiento de una interfaz web que permite la comunicación, al igual que ChatGPT.

En un nodo con ocho GPU NVIDIA H100 , el proceso completo dura aproximadamente cuatro horas y cuesta $100 (a $24 por hora). Una vez finalizado el entrenamiento, puedes abrir un servidor local y hacerle al modelo cualquier pregunta, desde poesía hasta preguntas de física como «¿Por qué el cielo es azul?».

El proyecto genera un informe detallado (report.md) con parámetros de entrenamiento y resultados comparativos entre benchmarks populares, como ARC, GSM8K, MMLU y HumanEval. Si bien su rendimiento es aún básico en comparación con los LLM industriales, nanochat demuestra el ciclo funcional completo de un modelo moderno, incluyendo interfaz, evaluación y experiencia de usuario.

Karpathy enfatiza que se están desarrollando versiones más grandes, con precios de $300 y $1,000, que acercarán el algoritmo a los niveles de GPT-2. El código está optimizado para la simplicidad y la transparencia: sin configuraciones complejas, fábricas de modelos ni cientos de parámetros. Todo se construye alrededor de una base de código única y cohesiva, fácil de leer, modificar y ejecutar.

NanoChat también puede ejecutarse con una sola tarjeta gráfica, aunque es ocho veces más lento que una 8×H100. Para GPUs limitadas, simplemente reduzca el tamaño del lote para evitar quedarse sin memoria . El proyecto se basa completamente en PyTorch y debería funcionar en la mayoría de las plataformas compatibles.

El investigador enfatiza en el artículo que nanochat no es solo una demostración, sino un punto de referencia básico, accesible y reproducible para estudiar la arquitectura de grandes modelos de lenguaje. Su diseño minimalista y de código abierto lo hace adecuado tanto para estudiantes como para investigadores que desean comprender la estructura del ChatGPT moderno en miniatura.

Immagine del sitoRedazione
Red Hot Cyber's editorial team consists of a collection of individuals and anonymous sources who actively collaborate by providing advance information and news on cyber security and IT in general.

Lista degli articoli

Artículos destacados

Immagine del sito
Se descubrieron 12 errores de seguridad en Ivanti Endpoint Manager (EPM). ¡Actualízalo ahora!
Di Redazione RHC - 14/10/2025

Ivanti ha publicado 13 vulnerabilidades en su software Endpoint Manager (EPM) , incluidas dos fallas de alta gravedad que podrían permitir la ejecución remota de código y la escalada de privilegios...

Immagine del sito
¡WhatsApp Web en la mira! Cómo funciona el gusano que distribuye el troyano bancario.
Di Redazione RHC - 14/10/2025

Los analistas de Sophos descubrieron una compleja operación de malware realizada por expertos en seguridad que utiliza el popular servicio de mensajería WhatsApp para propagar troyanos bancarios, ap...

Immagine del sito
RMPocalypse: Un error crítico en AMD SEV-SNP amenaza la seguridad de la nube.
Di Redazione RHC - 13/10/2025

Se ha identificado una vulnerabilidad crítica en la arquitectura de seguridad de hardware AMD SEV-SNP, que afecta a los principales proveedores de servicios en la nube (AWS, Microsoft Azure y Google ...

Immagine del sito
Spyware sí, spyware no: ¡es solo una posibilidad! NSO Group ahora está bajo control estadounidense.
Di Redazione RHC - 13/10/2025

La empresa israelí NSO Group, desarrolladora del infame software espía Pegasus , quedó recientemente bajo el control de inversores estadounidenses. Un portavoz de la compañía anunció que la nuev...

Immagine del sito
DAS: El oído del mundo oculto en los cables submarinos
Di Redazione RHC - 13/10/2025

Más de 1,2 millones de kilómetros de cables de fibra óptica se extienden por el fondo oceánico, considerados durante mucho tiempo solo como parte de una red global de telecomunicaciones. Sin embar...