OpenAI présente ChatGPT Images 2.0, un modèle de génération d'images offrant une meilleure précision, un support multilingue, des proportions flexibles et, pour la première fois, des capacités de raisonnement.
OpenAI a lancé ChatGPT Images 2.0, la nouvelle version de son modèle de génération d'images, disponible dès aujourd'hui pour tous les utilisateurs de ChatGPT, Codex et l'API. Le modèle représente une amélioration significative par rapport à son prédécesseur sur plusieurs aspects techniques et élargit les possibilités d'utilisation dans des contextes professionnels.
L'une des améliorations les plus notables est la plus grande précision dans le suivi des instructions. Le modèle peut représenter les objets avec davantage d'exactitude, rendre du texte dense au sein des images — y compris des icônes, des éléments d'interface et des compositions complexes — et produire des résultats en résolution allant jusqu'à 2K via l'API. Il intègre également un support de proportions d'image allant de 3:1 à 1:3, permettant de s'adapter à des formats tels que les bannières, présentations, affiches ou graphiques pour les réseaux sociaux.
Sur le plan linguistique, le modèle étend sa capacité à générer du texte dans les images au-delà de l'anglais et des langues à écriture latine. OpenAI souligne des progrès concrets en japonais, coréen, chinois, hindi et bengali, facilitant la création de contenus visuels dans les langues que les utilisateurs emploient réellement.
ChatGPT Images 2.0 est également le premier modèle d'image d'OpenAI à intégrer des capacités de raisonnement. Lorsqu'un modèle de réflexion est activé dans ChatGPT, le système peut rechercher des informations en temps réel sur le web, générer jusqu'à huit images distinctes à partir d'un seul prompt en maintenant une cohérence visuelle entre elles, et vérifier ses propres résultats avant de les livrer. Cette fonctionnalité est disponible pour les utilisateurs des abonnements Plus, Pro et Business.
Le modèle dispose d'une date limite de connaissance fixée à décembre 2025, ce qui lui permet d'intégrer des informations plus récentes lors de la génération de contenus informatifs tels que des infographies ou des supports éducatifs.
L'intégration dans Codex permet de générer des images au sein du même environnement de développement, sans changer d'outil. Via l'API, le modèle est disponible sous le nom gpt-image-2, avec une tarification variable selon la qualité et la résolution choisies.
OpenAI reconnaît certaines limites du modèle : il peut avoir des difficultés avec des représentations nécessitant un modèle physique complet du monde, comme des guides d'origami ou des puzzles, ainsi qu'avec des détails très denses ou répétitifs et des diagrammes reposant sur des étiquettes ou des flèches précises.
ChatGPT vous aide à obtenir des réponses, à trouver de l'inspiration et à être plus productif. Il est gratuit et facile à essayer. Posez simplement une question, et ChatGPT peut vous aider à ...
OpenAI développe une intelligence artificielle axée sur la sécurité et le bénéfice social. L'entreprise intègre des recherches avancées et des principes éthiques pour promouvoir des ...
09/06/2026
...
25/05/2026
Le pape Léon XIV publie la première encyclique consacrée à l'intelligence artificielle, fixant la dignité humaine comme critère de tout ...
19/05/2026
Rime présente Coda, un modèle de synthèse vocale pour agents conversationnels en temps réel qui reproduit le rythme, les pauses et l'intonation ...
11/05/2026
Thinking Machines Lab a publié un aperçu de recherche de TML-Interaction-Small, un modèle d'interaction conçu pour collaborer avec l'utilisateur ...