GPT-5.5: el nou model d’OpenAI que programa i raona de forma autònoma

23/04/2026

OpenAI llança GPT-5.5, un model dissenyat per executar tasques complexes de forma autònoma: programar, investigar, analitzar dades i operar l'ordinador sense supervisió pas a pas.

GPT-5.5: el nou model d’OpenAI que programa i raona de forma autònoma

GPT-5.5 és la nova proposta d'OpenAI en el segment dels models d'intel·ligència artificial d'alt rendiment. La companyia el posiciona com el seu model més capaç fins ara, orientat a tasques complexes que requereixen planificació i execució en diverses etapes: programació, treball d'oficina, anàlisi de dades i recerca científica.

Una de les característiques més destacades és la seva capacitat per abordar tasques de llarga durada de forma autònoma. En lloc d'esperar instruccions pas a pas, el model pot rebre un encàrrec ambigu, dividir-lo en subtasques, utilitzar eines, comprovar els resultats intermedis i continuar fins a completar-lo. OpenAI anomena aquest funcionament "agèntic", en referència a la capacitat del model d'actuar com un agent que gestiona el seu propi treball.

En programació, GPT-5.5 assoleix una puntuació del 82,7% a Terminal-Bench 2.0, una prova de fluxos de treball complexos en línia d'ordres, davant del 75,1% de GPT-5.4, el 69,4% de Claude Opus 4.7 i el 68,5% de Gemini 3.1 Pro. A SWE-Bench Pro, que avalua la resolució de problemes reals en repositoris de codi, obté un 58,6%, per sota del 64,3% de Claude Opus 4.7 però per sobre del 54,2% de Gemini 3.1 Pro. Enginyers que han accedit al model abans del seu llançament asseguren que mostra una major capacitat per entendre l'estructura de sistemes de programari complexos i anticipar problemes sense instruccions explícites.

Pel que fa al treball d'oficina, el model pot operar interfícies d'ordinador de forma autònoma, navegar entre aplicacions i generar documents, fulls de càlcul o presentacions. OpenAI assenyala que més del 85% dels seus empleats ja utilitza Codex cada setmana. L'equip financer de la companyia, per exemple, va usar el model per revisar més de 24.000 formularis fiscals en menys temps del habitual.

En recerca científica, GPT-5.5 ha participat en el descobriment d'una nova demostració matemàtica sobre els nombres de Ramsey, un resultat verificat posteriorment amb l'assistent de proves formals Lean. En anàlisi de dades biològiques, obté un 80,5% a BixBench davant del 74,0% de GPT-5.4, i a FrontierMath —una prova de matemàtiques avançades— supera tant Claude Opus 4.7 (43,8%) com Gemini 3.1 Pro (36,9%) amb un 51,7% als nivells 1 a 3.

Des del punt de vista tècnic, el model manté una latència similar a la de GPT-5.4 malgrat ser més capaç, gràcies a optimitzacions en la infraestructura de còmput basada en xips NVIDIA GB200 i GB300. OpenAI també indica que consumeix menys tokens per completar les mateixes tasques, cosa que repercuteix en el cost per ús.

Pel que fa a la seguretat, OpenAI ha classificat les capacitats de GPT-5.5 en ciberseguretat i biologia com a "altes" dins del seu marc d'avaluació de riscos, sense arribar al nivell "crític". El model incorpora controls addicionals per a usos potencialment perillosos i ofereix un accés ampliat a organitzacions que treballen en la defensa d'infraestructures crítiques.

GPT-5.5 és disponible des d'avui per als plans Plus, Pro, Business i Enterprise de ChatGPT i Codex. La versió GPT-5.5 Pro, pensada per a tasques de major precisió, també està activa per als plans Pro, Business i Enterprise. L'accés via API arribarà properament, amb un preu de 5 dòlars per milió de tokens d'entrada i 30 per milió de tokens de sortida.

Punts clau

  • Executa tasques llargues i complexes de forma autònoma, sense instruccions pas a pas.
  • Orientat a programació, treball d'oficina i recerca científica.
  • Supera Claude Opus 4.7 i Gemini 3.1 Pro a Terminal-Bench 2.0 (82,7%).
  • En programació, queda per sota de Claude però per sobre de Gemini a SWE-Bench Pro.
  • Més eficient que GPT-5.4: mateixa latència, menys tokens per tasca.
  • Ha contribuït al descobriment d'una demostració matemàtica verificada formalment.
  • OpenAI classifica les seves capacitats en ciberseguretat i biologia com a "altes".

Vídeos

IA relacionada

ChatGPT

L'assistent d'IA

ChatGPT t'ajuda a obtenir respostes, trobar inspiració i ser més productiu. És gratuït i fàcil de provar. Només has de preguntar, i ChatGPT pot ajudar-te amb l'escriptura, l'aprenentatge, la ...

OpenAI

Investigació i desenvolupament en IA responsable

OpenAI desenvolupa intel·ligència artificial amb un enfocament en la seguretat i el benefici social. La companyia integra investigació avançada i principis ètics per impulsar tecnologies d'IA de ...

Últimes noticies

Trustpilot
Aquest lloc web utilitza cookies tècniques, de personalització i anàlisi, pròpies i de tercers, per facilitar la navegació anònima i analitzar estadístiques d’ús del web. Considerem que si continueu navegant, n’accepteu l’ús.