OpenAI presenta ChatGPT Images 2.0, un model de generació d'imatges amb més precisió, suport multilingüe, proporcions flexibles i, per primera vegada, capacitats de raonament.
OpenAI ha llançat ChatGPT Images 2.0, la nova versió del seu model de generació d'imatges, disponible des d'avui per a tots els usuaris de ChatGPT, Codex i l'API. El model representa una millora significativa respecte al seu predecessor en diversos aspectes tècnics i amplia les possibilitats d'ús en contextos professionals.
Una de les millores més destacades és la major precisió en el seguiment d'instruccions. El model pot representar objectes amb més exactitud, renderitzar text dens dins les imatges — incloent-hi icones, elements d'interfície i composicions complexes — i generar resultats en resolucions de fins a 2K a través de l'API. També incorpora suport per a proporcions d'imatge que van de 3:1 a 1:3, la qual cosa permet adaptar-se a formats com ara banners, presentacions, cartells o gràfics per a xarxes socials.
Pel que fa al suport d'idiomes, el model estén la seva capacitat de generació de text en imatges més enllà de l'anglès i els alfabets llatins. OpenAI assenyala avenços concrets en japonès, coreà, xinès, hindi i bengalí, la qual cosa facilita la creació de materials visuals en els idiomes que fan servir els propis usuaris.
ChatGPT Images 2.0 és també el primer model d'imatge d'OpenAI que incorpora capacitats de raonament. Quan s'activa un model de pensament a ChatGPT, el sistema pot cercar informació al web en temps real, generar fins a vuit imatges diferents a partir d'un sol prompt mantenint la coherència visual entre elles, i revisar els seus propis resultats abans de lliurar-los. Aquesta funcionalitat està disponible per als usuaris dels plans Plus, Pro i Business.
El model té una data de tall de coneixement del desembre de 2025, la qual cosa li permet incorporar informació més actualitzada en la generació de continguts informatius com ara infografies o materials educatius.
La integració a Codex permet generar imatges dins del mateix entorn de desenvolupament, sense necessitat de canviar d'eina. A través de l'API, el model està disponible amb el nom gpt-image-2, amb preus variables segons la qualitat i la resolució seleccionades.
OpenAI reconeix limitacions en el model: pot tenir dificultats amb representacions que requereixen un model físic complet del món, com ara guies d'origami o trencaclosques, així com amb detalls molt densos o repetitius i diagrames que depenen d'etiquetes o fletxes precises.
ChatGPT t'ajuda a obtenir respostes, trobar inspiració i ser més productiu. És gratuït i fàcil de provar. Només has de preguntar, i ChatGPT pot ajudar-te amb l'escriptura, l'aprenentatge, la ...
OpenAI desenvolupa intel·ligència artificial amb un enfocament en la seguretat i el benefici social. La companyia integra investigació avançada i principis ètics per impulsar tecnologies d'IA de ...
24/04/2026
DeepSeek llança en versió preliminar la seva família V4, dos models de codi obert capaços de processar fins a un milió de tokens de context i ...
23/04/2026
OpenAI llança GPT-5.5, un model dissenyat per executar tasques complexes de forma autònoma: programar, investigar, analitzar dades i operar ...
17/04/2026
Anthropic ha llançat Claude Design, una eina que permet crear dissenys visuals, prototips interactius i presentacions mitjançant conversa amb el ...
17/04/2026
Anthropic publica Claude Opus 4.7, un model amb guanys notables en desenvolupament de programari, major resolució d'imatge i noves mesures de ...