La Inteligencia Artificial General (AGI) hace referencia a la capacidad de la IA para llevar a cabo cualquier tarea, como un humano entrenado. OpenAI ha presentado hoy GPDval, un test que evalúa lo cerca que está la IA actual de convertirse en AGI, en función de la cantidad de trabajos en los que ya supera a los humanos.
Según este test, la IA más “trabajadora” ya iguala o supera a los humanos en el 49% de 44 profesiones de todos los ámbitos, desde programadores a enfermeras o albañiles.
Curiosamente, ese 49% no lo consigue ChatGPT, sino… la IA Claude de Anthropic. Grok y Gemini quedan bastante atrás.
GDPVal, el test de OpenAI que te dice si la IA te quitará el trabajo
GDPVal propone una serie de tareas relativas a 44 profesiones en nueve sectores diferentes: funcionarios, manufacturación, profesiones técnicas, salud, finanzas, ventas, información, etc.
Entre las profesiones están la de farmacéutico, cajero, periodista, programador, abogado, asistente social, experto financiero, vendedor, etc.
Humanos que trabajan en esas profesiones, y la IA GPT-5-high, una versión “vitaminada” de GPT, han llevado a cabo las tareas, escribiendo un informe con los resultados. También Claude, Gemini, Grok, y otras. Después, expertos independientes ha revisado los informes a ciegas, indicando cuál es mejor. Aquí están los resultados:

OpenAI
Como vemos, la inteligencia artificial Claude ha resultado ganadora, superando a los humanos en el 49% de las 44 profesiones. OpenAI no ha revelado en cuáles.
Gpt-5-high ha quedado en segunda posición, con un 40,6%. OpenAI ha explicado la razón de que Claude la supere, y es bastante peculiar: “Claude obtuvo una puntuación tan alta debido a su tendencia a crear gráficos agradables, más que por su rendimiento puro y duro”.
Vamos, que critica a los evaluadores por elegir los informes con gráficas más coloridas, en vez de por su contenido… Eso desacredita el propio test.
Gemini se queda muy atrás, superando a los humanos en el 24,1% de las profesiones, y Grok llega al 23,4%.
OpenAI asegura que es un gran éxito, porque Gpt-4o solo alcanza una puntuación del 13,7%, y en solo una generación más, Gpt-5-high triplica ese resultado.
Pero estos resultados son bastante sospechosos. Primero, porque OpenAI no detalla las tareas evaluadas, y algo nos dice que ha elegido aquellas en las que a la IA se le da bien.
Y segundo, porque la mayoría de las profesiones no redactan informes, no tiene mucho sentido evaluarlas así. La propia OpenAI ha reconocido esto, y asegura que está trabajando para mejorar esta primera versión de GDPval, con tareas más variadas.
El 49% de las profesiones más populares ya han sido superadas por la IA, según OpenAI. Cuando llegue al 100%, la AGI estará al alcance de la mano.
Conoce cómo trabajamos en ComputerHoy.
Etiquetas: Inteligencia artificial, Industria





