Redazione RHC : 14 octubre 2025 09:38
El desarrollador Andrej Karpathy ha presentado nanochat , una versión minimalista y completamente de código abierto de ChatGPT que puede entrenarse y ejecutarse en un solo ordenador. Diseñado como plataforma de aprendizaje para el curso LLM101n de Eureka Labs , el proyecto permite a los usuarios crear su propio modelo de lenguaje desde cero hasta la interfaz web, sin dependencias complejas ni infraestructura compleja.
El objetivo de nanochat es demostrar que se puede crear un análogo básico de ChatGPT en pocas horas y por unos 100 $. El script speedrun.sh realiza automáticamente todos los pasos, desde la tokenización y el entrenamiento hasta la inferencia y el lanzamiento de una interfaz web que permite la comunicación, al igual que ChatGPT.
En un nodo con ocho GPU NVIDIA H100 , el proceso completo dura aproximadamente cuatro horas y cuesta $100 (a $24 por hora). Una vez finalizado el entrenamiento, puedes abrir un servidor local y hacerle al modelo cualquier pregunta, desde poesía hasta preguntas de física como «¿Por qué el cielo es azul?».
El proyecto genera un informe detallado (report.md) con parámetros de entrenamiento y resultados comparativos entre benchmarks populares, como ARC, GSM8K, MMLU y HumanEval. Si bien su rendimiento es aún básico en comparación con los LLM industriales, nanochat demuestra el ciclo funcional completo de un modelo moderno, incluyendo interfaz, evaluación y experiencia de usuario.
Karpathy enfatiza que se están desarrollando versiones más grandes, con precios de $300 y $1,000, que acercarán el algoritmo a los niveles de GPT-2. El código está optimizado para la simplicidad y la transparencia: sin configuraciones complejas, fábricas de modelos ni cientos de parámetros. Todo se construye alrededor de una base de código única y cohesiva, fácil de leer, modificar y ejecutar.
NanoChat también puede ejecutarse con una sola tarjeta gráfica, aunque es ocho veces más lento que una 8×H100. Para GPUs limitadas, simplemente reduzca el tamaño del lote para evitar quedarse sin memoria . El proyecto se basa completamente en PyTorch y debería funcionar en la mayoría de las plataformas compatibles.
El investigador enfatiza en el artículo que nanochat no es solo una demostración, sino un punto de referencia básico, accesible y reproducible para estudiar la arquitectura de grandes modelos de lenguaje. Su diseño minimalista y de código abierto lo hace adecuado tanto para estudiantes como para investigadores que desean comprender la estructura del ChatGPT moderno en miniatura.
Ivanti ha publicado 13 vulnerabilidades en su software Endpoint Manager (EPM) , incluidas dos fallas de alta gravedad que podrían permitir la ejecución remota de código y la escalada de privilegios...
Los analistas de Sophos descubrieron una compleja operación de malware realizada por expertos en seguridad que utiliza el popular servicio de mensajería WhatsApp para propagar troyanos bancarios, ap...
Se ha identificado una vulnerabilidad crítica en la arquitectura de seguridad de hardware AMD SEV-SNP, que afecta a los principales proveedores de servicios en la nube (AWS, Microsoft Azure y Google ...
La empresa israelí NSO Group, desarrolladora del infame software espía Pegasus , quedó recientemente bajo el control de inversores estadounidenses. Un portavoz de la compañía anunció que la nuev...
Más de 1,2 millones de kilómetros de cables de fibra óptica se extienden por el fondo oceánico, considerados durante mucho tiempo solo como parte de una red global de telecomunicaciones. Sin embar...