comscore
Tecnología

La carrera de la IA no para y Chat GPT 5.2 lo demuestra

Un “.2” que no es cosmético: más razonamiento, más agentes y un acelerón que reordena el tablero.

La carrera de la IA no para y Chat GPT 5.2 lo demuestra

ChatGPT-5.2. //Imagen de ilustración generada con inteligencia artificial

Compartir

OpenAI activó el “Código Rojo” y le tocó salir a responder en tiempo récord, y lo hizo con una jugada que desconcierta por la etiqueta: GPT-5.2 suena a parche, a “ajuste menor”, pero se comporta como salto de generación en lo que realmente importa: razonar mejor, sostener tareas largas sin desbaratarse y usar herramientas con más criterio. Pero pensar que este ajuste es lo único que trae este código rojo es ser ingenuo puesto que este modelo no se puede haber desarrollado en este tiempo, así que veremos cosas mayores en el futuro cercano.

Y aquí viene lo que hace dos o tres semanas parecía impensable: esta carrera no solo está viva, está corriendo en modo “sprint”. Gemini 3 llegó el 18 de noviembre con narrativa de “nueva era” y números fuertes; Claude Opus 4.5 apareció el 24 de noviembre y se ganó titulares por su desempeño en programación; y ahora, en la primera quincena de diciembre, GPT-5.2 entra a la pista con una mezcla impresionante: mejor razonamiento + más fiabilidad + mejor “trabajo de oficina” (ese que paga facturas). Dicho en costeño: si uno pestañea, lo dejan viendo un chispero. Le puede interesar: Génesis de la IA: lecciones para Colombia y su mercado laboral

Las tres pruebas de la inteligencia artificial

Lo que más confunde al público es que todo el mundo habla de benchmarks como si fueran jeroglíficos. Pero piense en ellos como tres tipos de pruebas:

Primero, las pruebas de “vida laboral”. OpenAI resalta GDPval, que en cristiano es algo como poner a la IA a competir con profesionales reales en tareas bien definidas: armar una presentación coherente, ordenar una hoja de cálculo, redactar un informe que no sea puro humo. En esa liga, GPT-5.2 (modo “Thinking”) reporta 70,9% de victorias o empates frente a expertos humanos. Eso no significa que “reemplaza a todos”, pero sí que en tareas acotadas y revisables ya juega en primera división. Si en tu oficina hay trabajo repetitivo de análisis, borradores, estructuración y síntesis, el impacto se siente como brisa en Bocagrande: de golpe refresca el día.

Segundo, las pruebas de “arreglar cosas reales”. Aquí aparece SWE-bench Verified, que básicamente mide si un modelo puede corregir un bug en un repositorio real y pasar las pruebas automáticas. No es “programar bonito”; es “que funcione”. GPT-5.2 reporta 80% en esa prueba, un número que, más allá del orgullo, sugiere algo práctico: el modelo no solo escribe código, también entiende contexto, sigue pistas y llega a un arreglo verificable.

Y tercero, las pruebas que apuntan a la palabra más manoseada del momento: AGI.

AGI (inteligencia artificial general) no es “una IA que sabe de todo”, como Wikipedia con esteroides. La forma más simple de entenderlo es esta: una AGI sería una IA capaz de aprender y adaptarse a tareas nuevas, en distintos campos, con la soltura de un humano competente. Hoy tenemos IAs excelentes, pero muchas veces dependen de que el problema esté bien servido en bandeja: instrucciones claras, datos limpios, límites definidos. La AGI, en teoría, sería más “todera”: aterriza en un terreno nuevo, capta las reglas, prueba, corrige y avanza sin que haya que reentrenarla para cada escenario.

¿Y por qué eso importa? Porque cambia el tipo de herramienta que estamos construyendo. Pasamos de “chat que ayuda” a “sistema que ejecuta”: el famoso giro hacia agentes. Un agente es, en esencia, una IA que no solo responde, sino que planifica pasos, usa herramientas (navegación, código, archivos), se autocorrige y persiste hasta completar el objetivo. Esa tendencia —agentes de larga duración— es el hilo conductor de este cierre de 2025.

Ahí entra ARC-AGI, y sobre todo ARC-AGI-2. Si GDPval se parece a una olimpiada de oficina y SWE-bench a un taller mecánico de software, ARC-AGI es un set de rompecabezas de patrones: problemas que los humanos resuelven mirando, infiriendo la regla y aplicándola, pero que a las máquinas les cuestan porque no se trata de “haber leído mucho”, sino de razonamiento fluido. ARC-AGI-2, además, aprieta la tuerca en algo clave: no basta con acertar, también importa la eficiencia. Dicho fácil: no es solo llegar a la respuesta; es llegar sin quemar un estadio de cómputo.

En ese termómetro, OpenAI muestra un salto que explica por qué el “.2” engaña: GPT-5.2 (Thinking) reporta 52,9% en ARC-AGI-2 (Verified), frente a 17,6% del modelo anterior comparado en su tabla, y GPT-5.2 Pro llega a 54,2%. Son números que todavía no significan “AGI lograda”, pero sí significan algo contundente: los modelos están reduciendo la distancia en tareas que antes los dejaban en blanco.

¿Entonces qué nos demuestra, de fondo, este diciembre frenético? Tres cosas.

Una: la competencia dejó de ser solo por “quién escribe más bonito”. Ahora es por quién sostiene mejor procesos completos: investigar, organizar, producir, revisar y entregar, con herramientas. Eso se traduce en productividad real, sobre todo en empresas y profesionales. Lea tambiénGemini 3: el golpe sobre la mesa de Google

Dos: el ritmo se volvió una señal en sí misma. Cuando en menos de un mes ves Gemini 3, Claude 4.5 y ahora GPT-5.2 empujando fronteras, lo sensato no es casarse con una marca; es prepararse para una realidad donde la capacidad se actualiza como el clima.

Y tres: estos avances van a impactar más de lo que parece, porque bajan el costo de tareas cognitivas. En la práctica, veremos más gente “apoyándose” en IA para planear, decidir, documentar, vender, enseñar y programar. Eso abre oportunidades —un emprendedor con menos presupuesto puede jugar más alto—, pero también exige oficio: verificar, supervisar, y entender que un buen resultado no es magia, es proceso + criterio humano.

En Cartagena decimos que “el mar avisa”. La IA también: cada nuevo modelo viene con espuma, ruido y titulares. Pero debajo hay corriente fuerte. Y este cierre de 2025, con GPT-5.2, lo deja clarito: la carrera de la IA no para… y lo que viene, nos va a tocar vivirlo con los ojos bien abiertos.

Únete a nuestro canal de WhatsApp
Reciba noticias de EU en Google News