Thursday, December 4, 2025
29.8 C
Santo Domingo

OpenAI lanza un test para saber si la IA te va a quitar el trabajo: “En el 49% de las profesiones, la respuesta es sí”

La Inteligencia Artificial General (AGI) hace referencia a la capacidad de la IA para llevar a cabo cualquier tarea, como un humano entrenado. OpenAI ha presentado hoy GPDval, un test que evalúa lo cerca que está la IA actual de convertirse en AGI, en función de la cantidad de trabajos en los que ya supera a los humanos.

Según este test, la IA más “trabajadora” ya iguala o supera a los humanos en el 49% de 44 profesiones de todos los ámbitos, desde programadores a enfermeras o albañiles.

Curiosamente, ese 49% no lo consigue ChatGPT, sino… la IA Claude de Anthropic. Grok y Gemini quedan bastante atrás.

GDPVal, el test de OpenAI que te dice si la IA te quitará el trabajo

GDPVal propone una serie de tareas relativas a 44 profesiones en nueve sectores diferentes: funcionarios, manufacturación, profesiones técnicas, salud, finanzas, ventas, información, etc.

Entre las profesiones están la de farmacéutico, cajero, periodista, programador, abogado, asistente social, experto financiero, vendedor, etc.

Humanos que trabajan en esas profesiones, y la IA GPT-5-high, una versión “vitaminada” de GPT, han llevado a cabo las tareas, escribiendo un informe con los resultados. También Claude, Gemini, Grok, y otras. Después, expertos independientes ha revisado los informes a ciegas, indicando cuál es mejor. Aquí están los resultados:

OpenAI lanza un test para saber si la IA te va a quitar el trabajo: "En el 49% de las profesiones, la respuesta es sí"

OpenAI

Como vemos, la inteligencia artificial Claude ha resultado ganadora, superando a los humanos en el 49% de las 44 profesiones. OpenAI no ha revelado en cuáles.

Gpt-5-high ha quedado en segunda posición, con un 40,6%. OpenAI ha explicado la razón de que Claude la supere, y es bastante peculiar: “Claude obtuvo una puntuación tan alta debido a su tendencia a crear gráficos agradables, más que por su rendimiento puro y duro”.

Vamos, que critica a los evaluadores por elegir los informes con gráficas más coloridas, en vez de por su contenido… Eso desacredita el propio test.

Gemini se queda muy atrás, superando a los humanos en el 24,1% de las profesiones, y Grok llega al 23,4%.

OpenAI quiere que ChatGPT sea lo primero que mires cuando te despiertes: lanza Pulse, para comerse a Google Discover

OpenAI asegura que es un gran éxito, porque Gpt-4o solo alcanza una puntuación del 13,7%, y en solo una generación más, Gpt-5-high triplica ese resultado.

Pero estos resultados son bastante sospechosos. Primero, porque OpenAI no detalla las tareas evaluadas, y algo nos dice que ha elegido aquellas en las que a la IA se le da bien.

Y segundo, porque la mayoría de las profesiones no redactan informes, no tiene mucho sentido evaluarlas así. La propia OpenAI ha reconocido esto, y asegura que está trabajando para mejorar esta primera versión de GDPval, con tareas más variadas.

El 49% de las profesiones más populares ya han sido superadas por la IA, según OpenAI. Cuando llegue al 100%, la AGI estará al alcance de la mano.

Conoce cómo trabajamos en ComputerHoy.

Etiquetas: Inteligencia artificial, Industria

¿Tú que opinas? Cuéntalo aquí:

Hot this week

Temas

spot_img

Related Articles

Categorias Populares

spot_imgspot_img