
Redazione RHC : 14 octubre 2025 09:38
El desarrollador Andrej Karpathy ha presentado nanochat , una versión minimalista y completamente de código abierto de ChatGPT que puede entrenarse y ejecutarse en un solo ordenador. Diseñado como plataforma de aprendizaje para el curso LLM101n de Eureka Labs , el proyecto permite a los usuarios crear su propio modelo de lenguaje desde cero hasta la interfaz web, sin dependencias complejas ni infraestructura compleja.
El objetivo de nanochat es demostrar que se puede crear un análogo básico de ChatGPT en pocas horas y por unos 100 $. El script speedrun.sh realiza automáticamente todos los pasos, desde la tokenización y el entrenamiento hasta la inferencia y el lanzamiento de una interfaz web que permite la comunicación, al igual que ChatGPT.
En un nodo con ocho GPU NVIDIA H100 , el proceso completo dura aproximadamente cuatro horas y cuesta $100 (a $24 por hora). Una vez finalizado el entrenamiento, puedes abrir un servidor local y hacerle al modelo cualquier pregunta, desde poesía hasta preguntas de física como «¿Por qué el cielo es azul?».
El proyecto genera un informe detallado (report.md) con parámetros de entrenamiento y resultados comparativos entre benchmarks populares, como ARC, GSM8K, MMLU y HumanEval. Si bien su rendimiento es aún básico en comparación con los LLM industriales, nanochat demuestra el ciclo funcional completo de un modelo moderno, incluyendo interfaz, evaluación y experiencia de usuario.

Karpathy enfatiza que se están desarrollando versiones más grandes, con precios de $300 y $1,000, que acercarán el algoritmo a los niveles de GPT-2. El código está optimizado para la simplicidad y la transparencia: sin configuraciones complejas, fábricas de modelos ni cientos de parámetros. Todo se construye alrededor de una base de código única y cohesiva, fácil de leer, modificar y ejecutar.
NanoChat también puede ejecutarse con una sola tarjeta gráfica, aunque es ocho veces más lento que una 8×H100. Para GPUs limitadas, simplemente reduzca el tamaño del lote para evitar quedarse sin memoria . El proyecto se basa completamente en PyTorch y debería funcionar en la mayoría de las plataformas compatibles.
El investigador enfatiza en el artículo que nanochat no es solo una demostración, sino un punto de referencia básico, accesible y reproducible para estudiar la arquitectura de grandes modelos de lenguaje. Su diseño minimalista y de código abierto lo hace adecuado tanto para estudiantes como para investigadores que desean comprender la estructura del ChatGPT moderno en miniatura.
Redazione
En esta apasionante historia, viajaremos a 1959 al Club de Ferrocarriles en Miniatura del MIT Tech y conoceremos a Steve Russell. Steve fue uno de los primeros hackers y escribió uno de los primeros ...

El significado de » hacker » tiene profundas raíces. Proviene del inglés «to hack», que significa picar, cortar, golpear o mutilar. Es una imagen poderosa: la de un campesino rompiendo terrones ...

Desde las vulnerabilidades de WEP hasta los avances de WPA3 , la seguridad de las redes Wi-Fi ha evolucionado enormemente. Hoy en día, las redes autoprotegidas representan la nueva frontera: sistemas...

Un hallazgo excepcional de los primeros tiempos de Unix podría llevar a los investigadores a los mismísimos orígenes del sistema operativo. En la Universidad de Utah se descubrió una cinta magnét...

Imagina una ciudad futurista dividida en dos: por un lado, relucientes torres de innovación; por el otro, el caos y las sombras de la pérdida de control. Esta no es una visión distópica, sino el p...