GPT-5.5: el nuevo modelo de OpenAI que programa y razona de forma autónoma

23/04/2026

OpenAI lanza GPT-5.5, un modelo diseñado para ejecutar tareas complejas de forma autónoma: programar, investigar, analizar datos y operar el ordenador sin supervisión paso a paso.

GPT-5.5: el nuevo modelo de OpenAI que programa y razona de forma autónoma

GPT-5.5 es la nueva apuesta de OpenAI en el segmento de los modelos de inteligencia artificial de alto rendimiento. La compañía lo presenta como su modelo más capaz hasta la fecha y lo orienta especialmente a tareas complejas que requieren planificación y ejecución en varias etapas: programación, trabajo de oficina, análisis de datos e investigación científica.

Una de las características más destacadas es su capacidad para abordar tareas de larga duración de forma autónoma. En lugar de esperar instrucciones paso a paso, el modelo puede recibir un encargo ambiguo, dividirlo en subtareas, usar herramientas, comprobar los resultados intermedios y continuar hasta completarlo. OpenAI denomina a este tipo de funcionamiento "agéntico", en referencia a la capacidad del modelo de actuar como un agente que gestiona su propio trabajo.

En el terreno de la programación, GPT-5.5 alcanza una puntuación del 82,7% en Terminal-Bench 2.0, una prueba de flujos de trabajo complejos en línea de comandos, frente al 75,1% de GPT-5.4, el 69,4% de Claude Opus 4.7 y el 68,5% de Gemini 3.1 Pro. En SWE-Bench Pro, que evalúa la resolución de problemas reales en repositorios de código, obtiene un 58,6%, por debajo del 64,3% de Claude Opus 4.7 pero por encima del 54,2% de Gemini 3.1 Pro. Ingenieros que han accedido al modelo antes de su lanzamiento aseguran que muestra una mayor capacidad para entender la estructura de un sistema de software complejo y anticipar problemas sin necesidad de indicaciones explícitas.

En cuanto al trabajo de oficina, el modelo puede operar interfaces de ordenador de forma autónoma, navegar entre aplicaciones y generar documentos, hojas de cálculo o presentaciones. OpenAI señala que más del 85% de sus empleados ya utiliza Codex cada semana. El equipo financiero de la compañía, por ejemplo, usó el modelo para revisar más de 24.000 formularios fiscales en menos tiempo del habitual.

En investigación científica, GPT-5.5 ha participado en el descubrimiento de una nueva demostración matemática sobre los números de Ramsey, un resultado verificado posteriormente con el asistente de pruebas formales Lean. En análisis de datos biológicos, obtiene un 80,5% en BixBench frente al 74,0% de GPT-5.4, y en FrontierMath —una prueba de matemáticas avanzadas— supera tanto a Claude Opus 4.7 (43,8%) como a Gemini 3.1 Pro (36,9%) con un 51,7% en los niveles 1 a 3.

Desde el punto de vista técnico, el modelo mantiene una latencia similar a la de GPT-5.4 a pesar de ser más capaz, gracias a optimizaciones en la infraestructura de cómputo basada en chips NVIDIA GB200 y GB300. OpenAI también indica que consume menos tokens para completar las mismas tareas, lo que repercute en el coste por uso.

En cuanto a la seguridad, OpenAI ha clasificado las capacidades de GPT-5.5 en ciberseguridad y biología como "altas" dentro de su marco de evaluación de riesgos, sin llegar al nivel "crítico". El modelo incorpora controles adicionales para usos potencialmente peligrosos y ofrece un acceso ampliado a organizaciones que trabajan en defensa de infraestructuras críticas.

GPT-5.5 está disponible desde hoy para los planes Plus, Pro, Business y Enterprise de ChatGPT y Codex. La versión GPT-5.5 Pro, pensada para tareas de mayor precisión, también está activa para los planes Pro, Business y Enterprise. El acceso vía API llegará próximamente, con un precio de 5 dólares por millón de tokens de entrada y 30 por millón de tokens de salida.

Puntos clave

  • Ejecuta tareas largas y complejas de forma autónoma, sin instrucciones paso a paso.
  • Orientado a programación, trabajo de oficina e investigación científica.
  • Supera a Claude Opus 4.7 y Gemini 3.1 Pro en Terminal-Bench 2.0 (82,7%).
  • En programación, queda por debajo de Claude pero por encima de Gemini en SWE-Bench Pro.
  • Más eficiente que GPT-5.4: misma latencia, menos tokens por tarea.
  • Ha contribuido al descubrimiento de una nueva demostración matemática verificada formalmente.
  • OpenAI clasifica sus capacidades en ciberseguridad y biología como "altas".

Vídeos

IA relacionada

ChatGPT

El asistente de IA

ChatGPT te ayuda a obtener respuestas, encontrar inspiración y ser más productivo. Es gratuito y fácil de probar. Solo pregunta, y ChatGPT puede ayudarte con escritura, aprendizaje, generación de ...

OpenAI

Investigación y desarrollo en IA responsable

OpenAI desarrolla inteligencia artificial con un enfoque en la seguridad y el beneficio social. La compañía integra investigación avanzada y principios éticos para impulsar tecnologías de IA de ...

Últimas noticias

Trustpilot
Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso.