Red Hot Cyber
La ciberseguridad se comparte. Reconozca el riesgo, combátalo, comparta sus experiencias y anime a otros a hacerlo mejor que usted.
Buscar
Enterprise BusinessLog 320x200 1
Fortinet 970x120px
Inteligencia Artificial General (AGI): se ha definido el primer estándar global para medirla

Inteligencia Artificial General (AGI): se ha definido el primer estándar global para medirla

Redazione RHC : 23 octubre 2025 20:59

El 21 de octubre de 2025, un equipo internacional de investigadores de 29 instituciones líderes, incluidas la Universidad de Stanford, el MIT y la Universidad de California en Berkeley, completó un estudio que marca un hito en el desarrollo de la inteligencia artificial: la definición del primer marco cuantitativo para evaluar la Inteligencia Artificial General (AGI).

Basado en la teoría psicológica Cattell-Horn-Carroll (CHC) , el modelo propuesto divide la inteligencia general en diez dominios cognitivos distintos , cada uno con un peso del 10%, para un total de 100 puntos que representan el nivel cognitivo humano.

Según esta escala, el GPT-4 obtuvo un puntaje de 27%, mientras que el GPT-5 alcanzó 58% , lo que evidencia una distribución desigual de habilidades, con excelentes resultados en lenguaje y conocimiento, pero cero puntajes en memoria de largo plazo.

Un enfoque científico para medir la «inteligencia verdadera»

Según los investigadores, determinar si una IA puede considerarse » inteligente » como un humano requiere una evaluación amplia y multidimensional. Al igual que un chequeo médico completo que mide la salud de múltiples órganos, la IAG se analiza en múltiples dominios cognitivos: desde el razonamiento hasta el lenguaje, desde la memoria hasta la percepción sensorial.

El nuevo marco se basa en la teoría CHC , utilizada durante décadas en psicología para medir las capacidades cognitivas humanas. Este enfoque permite descomponer la inteligencia en componentes analíticos, como la cognición, el razonamiento, el procesamiento visual y la memoria.

El objetivo del equipo era transformar estos principios en un sistema de medición objetivo que también pudiera aplicarse a modelos de inteligencia artificial.

La «prueba cognitiva» de IA

Las pruebas evaluaron GPT-4 y GPT-5 en diez áreas : conocimiento general, comprensión y producción de textos, matemáticas, razonamiento inmediato, memoria de trabajo, memoria a largo plazo, recuperación de la memoria, procesamiento visual, procesamiento auditivo y velocidad de reacción.

El GPT-5 mostró mejoras significativas con respecto a su predecesor, alcanzando puntuaciones casi perfectas en lenguaje, conocimiento y matemáticas. Sin embargo, ambas versiones fallaron en las pruebas de memoria a largo plazo y gestión consistente de la información a lo largo del tiempo.

Según los investigadores, esto demuestra que los sistemas de IA actuales compensan sus deficiencias mediante estrategias de «distorsión de capacidad», explotando enormes cantidades de datos o herramientas externas para enmascarar limitaciones estructurales.

La «mente de dientes de sierra» de la IA moderna

El informe describe la distribución de resultados como «dientes de sierra»: excelencia en algunas áreas y graves deficiencias en otras. Por ejemplo, el GPT-5 se comporta como un estudiante brillante en asignaturas teóricas, pero es incapaz de recordar las lecciones aprendidas. Esta fragmentación cognitiva pone de manifiesto que, a pesar de mostrar capacidades avanzadas, las IA aún carecen de una comprensión continua y autónoma del mundo.

Los autores del estudio comparan la IA con un motor sofisticado que carece de algunos componentes esenciales. Incluso con un sistema lingüístico y matemático de vanguardia, la falta de una memoria estable y un verdadero mecanismo de aprendizaje limita la capacidad general. Para la inteligencia artificial, esto se traduce en un alto rendimiento en tareas específicas, pero con poca adaptabilidad y aprendizaje autónomo a largo plazo.

Implicaciones para el futuro de la IA

Además de proporcionar una base científica para la evaluación de la inteligencia artificial, el estudio ayuda a redefinir las expectativas para el desarrollo de la IAG. Demuestra que simplemente aumentar el tamaño de los modelos o los datos no basta para lograr una cognición similar a la humana: se necesitan nuevas arquitecturas capaces de integrar la memoria, el razonamiento y el aprendizaje experiencial.

Los investigadores también enfatizan la importancia de abordar las llamadas «alucinaciones» de la IA (errores de fabricación de información), que siguen siendo un problema crítico en todos los modelos probados. Conocer estas limitaciones puede guiar un uso más informado de la tecnología, evitando tanto el entusiasmo excesivo como los temores infundados.

En definitiva, la principal contribución de esta investigación es la introducción de un verdadero «criterio cognitivo» para medir la inteligencia artificial de forma objetiva y comparable. Solo comprendiendo sus fortalezas y debilidades actuales será posible guiar eficazmente la próxima generación de sistemas inteligentes.

Immagine del sitoRedazione
Red Hot Cyber's editorial team consists of a collection of individuals and anonymous sources who actively collaborate by providing advance information and news on cyber security and IT in general.

Lista degli articoli

Artículos destacados

Immagine del sito
Inteligencia Artificial General (AGI): se ha definido el primer estándar global para medirla
Di Redazione RHC - 23/10/2025

El 21 de octubre de 2025, un equipo internacional de investigadores de 29 instituciones líderes, incluidas la Universidad de Stanford, el MIT y la Universidad de California en Berkeley, completó un ...

Immagine del sito
¡ChatGPT me da dinero! Atlas, el navegador inteligente para macOS, ya está aquí.
Di Redazione RHC - 22/10/2025

OpenAI ha lanzado el navegador ChatGPT Atlas para macOS. Integra inteligencia artificial directamente en la interfaz y permite realizar tareas en páginas web sin tener que cambiar de pestaña. Atlas ...

Immagine del sito
HackerHood de RHC revela dos nuevos días cero en productos Zyxel
Di Redazione RHC - 21/10/2025

El investigador de seguridad Alessandro Sgreccia , miembro del equipo HackerHood de Red Hot Cyber, ha informado de dos nuevas vulnerabilidades en Zyxel que afectan a varios dispositivos de la familia ...

Immagine del sito
Vulnerabilidad F5 BIG-IP: ¡266.000 dispositivos en riesgo en todo el mundo! 2.500 en Italia
Di Redazione RHC - 20/10/2025

La Agencia de Seguridad Cibernética y de Infraestructura (CISA) y el Centro de Análisis e Intercambio de Información Multiestatal (MS-ISAC) están emitiendo este Aviso Conjunto de Ciberseguridad (C...

Immagine del sito
El procesador Intel 386 cumple 40 años: comienza la era de los 32 bits
Di Redazione RHC - 20/10/2025

El 20 de octubre de 2025 marca un aniversario significativo en la historia de la informática: el procesador Intel 80386 , también conocido como i386 , celebra su 40.º aniversario . ¡Y es un cumple...