Experto en IA desvela todos los secretos de DeepSeek R2, costará un 97% menos que GPT-4o

Date:

La inteligencia artificial de DeepSeek puso patas arriba el mercado de la IA hace unos meses, provocando que Nvidia sufriera la mayor caída en Bolsa de la historia, y descensos brutales en las acciones de Microsoft, Google, etc. Ahora quiere volver a hacer lo mismo con DeepSeek R2. Qué mejor prueba que un único dato: costará un 97,3% menos que GPT-4o.

DeepSeek es una compañía china que desarrolla IA generativa de código abierto, con un rendimiento similar a la competencia, pero que requiere un consumo energético y de chips de IA mucho menor (de ahí la caída en Bolsa de Nvidia). Además cualquiera puede modificarla o personalizarla, al ser de código abierto.

Su modelo de lenguaje DeepSeek R1 ya ha sido superado por los últimos lanzamientos de OpenAI y compañía, pero en breve publicará DeepSeek R2, que promete estar a la altura de GPT-4o, con un coste infinitesimal.

Los secretos de DeepSeek R2

El experto en código abierto, Matt Asay opina sobre DeepSeek: "Es el nuevo Linux, pero más rápido"

El experto en IA Deedy Das, que ha trabajado en el buscador de Google y en Facebook, ha recopilado todas las filtraciones de DeepSeek R2 en un hilo de X. Y los datos revelados, impresionan.

DeepSeekR2 tendrá 1,2 billones de parámetros. Ha sido entrenada con 5,2 Petabytes de datos, el 89% provenientes de C-Eval2.0. Tendrá una mejor visión artificial, alcanzando un 92,4% en COCO.

Lo más impresionante es que es un 97,3% más barata que GTP-4o. Cuesta solo 7 céntimos de dólar por cada millón de tokens de entrada, y 27 céntimos por cada millón de tokens de salida:

Y otro dato importantísimo: el 82% de los chips de IA usados para entrenarla, son chips fabricados en China. En concreto, el modelo Huawei Ascend 910B.

Queda claro pues, que China es capaz de producir modelos de IA a un coste infinitesimal, con respecto a Estados Unidos, y con sus propios chips.

Y como dice el experto en IA Matt Asay, al ser de código abierto, en el momento en el que el código cae en manos de los desarrolladores, deja de ser una IA china, para pasar a ser universal.

Por supuesto, hace falta ver el rendimiento final de DeepSeek R2, y dónde queda con respecto a la competencia. Pero si los datos filtrados se cumplen, va a poner en problemas a GPT-4.5 y Gemini 2.0 Pro.

Conoce cómo trabajamos en ComputerHoy.

Etiquetas: Inteligencia artificial, china

Share post:

Subscribe

spot_imgspot_img

Popular

Relacionados
Relacionados

¡Un niño genio en casa! No es tarea fácil para padres

Ser padres de un niño o niña genio o...

Mejía aboga por mejor conducta ciudadana

Carolina Mejía llevó a estudiantes del Instituto Politécnico Profesor...

Paro médico golpeó a los pacientes vulnerables

El paro médico de 48 horas, iniciado ayer miércoles...

Lamentable caída del ex púgil Jorge –Chino-Leo…

De fuentes confiables nos informan que el expúgil dominicano,...