OpenAI alcanza máximos en benchmarks de programación y tareas profesionales con el nuevo GPT-5.2

11/12/2025

OpenAI ha presentado GPT-5.2, su nuevo modelo que alcanza los mejores resultados en diversos benchmarks de la industria en áreas como programación, análisis de documentos, uso de herramientas y reducción de alucinaciones.

OpenAI alcanza máximos en benchmarks de programación y tareas profesionales con el nuevo GPT-5.2

El nuevo modelo se orienta principalmente al entorno empresarial y profesional, posicionándose como el más avanzado disponible actualmente según diversos benchmarks de la industria. OpenAI destaca que GPT-5.2 establece nuevos récords en áreas como trabajo profesional, ingeniería de software y análisis de contextos extensos.

El modelo incluye tres variantes: Instant, Thinking y Pro. Instant se orienta al uso diario y consultas rápidas, Thinking está pensado para tareas complejas que requieren mayor profundidad de análisis, y Pro ofrece el máximo nivel de calidad para preguntas difíciles donde se prioriza la precisión sobre la velocidad.

En el benchmark GDPval, que evalúa tareas de conocimiento especializado en 44 ocupaciones, GPT-5.2 Thinking iguala o supera a profesionales expertos en el 70,9% de los casos. Las tareas incluyen la creación de presentaciones y hojas de cálculo que el modelo completa a una velocidad once veces mayor y con un coste inferior al 1% respecto al trabajo humano especializado.

Una de las mejoras más significativas se encuentra en la programación. GPT-5.2 Thinking alcanza un 55,6% en SWE-Bench Pro, un benchmark que evalúa la resolución de problemas reales de ingeniería de software en cuatro lenguajes. En tareas de modelado financiero con hojas de cálculo, la precisión aumenta del 59,1% al 68,4%. Usuarios de prueba han destacado mejoras notables en el desarrollo de interfaces complejas con elementos tridimensionales.

El modelo amplía su capacidad para trabajar con documentos extensos, alcanzando casi el 100% de precisión en el análisis de información distribuida a lo largo de hasta 256.000 tokens, equivalente a varios cientos de páginas. Esta característica resulta especialmente útil para analizar contratos, informes técnicos o proyectos con múltiples archivos.

En procesamiento visual, el modelo reduce aproximadamente a la mitad la tasa de errores en la interpretación de gráficos científicos. La precisión en el análisis de capturas de pantalla profesionales aumenta del 64,2% al 86,3%, facilitando el análisis de dashboards y diagramas técnicos.

OpenAI reporta una reducción del 30% en alucinaciones comparado con la versión anterior. En matemáticas de nivel avanzado, GPT-5.2 Thinking resuelve el 40,3% de los problemas en FrontierMath, frente al 31% de GPT-5.1. El modelo también mejora en la coordinación de múltiples herramientas, alcanzando un 98,7% de precisión en tareas de atención al cliente que requieren varios pasos.

GPT-5.2 está disponible desde hoy en ChatGPT para usuarios de planes de pago y en la API para todos los desarrolladores. OpenAI ha fijado un precio en la API superior al de GPT-5.1 por token, aunque se mantiene por debajo de otros modelos de referencia del mercado. La compañía indica que, a pesar del incremento por token, el coste final para alcanzar un nivel de calidad determinado resulta inferior debido a la mayor eficiencia del nuevo modelo.

Puntos clave

  • GPT-5.2 establece nuevos récords en múltiples benchmarks de la industria
  • GPT-5.2 Thinking iguala o supera a profesionales expertos en el 70,9% de tareas de trabajo especializado en 44 ocupaciones diferentes
  • El modelo alcanza un 55,6% en SWE-Bench Pro, estableciendo un nuevo récord en resolución de problemas reales de ingeniería de software
  • Disponible en tres variantes: Instant para uso rápido, Thinking para análisis profundo y Pro para máxima precisión
  • Reduce en un 30% las alucinaciones comparado con GPT-5.1 Thinking
  • Alcanza casi 100% de precisión en análisis de documentos de hasta 256.000 tokens (equivalente a cientos de páginas)
  • Mejora del 64,2% al 86,3% en comprensión de interfaces gráficas y capturas de pantalla profesionales
  • Resuelve el 40,3% de problemas matemáticos de nivel experto, frente al 31% de su predecesor
  • Precio en API superior a GPT-5.1 pero inferior a otros modelos de referencia del mercado

IA relacionada

ChatGPT

El asistente de IA

ChatGPT te ayuda a obtener respuestas, encontrar inspiración y ser más productivo. Es gratuito y fácil de probar. Solo pregunta, y ChatGPT puede ayudarte con escritura, aprendizaje, generación de ...

OpenAI

Investigación y desarrollo en IA responsable

OpenAI desarrolla inteligencia artificial con un enfoque en la seguridad y el beneficio social. La compañía integra investigación avanzada y principios éticos para impulsar tecnologías de IA de ...

Últimas noticias

Trustpilot
Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso.