OpenAI a présenté GPT-5.2, son nouveau modèle qui atteint les meilleurs résultats dans divers benchmarks de l'industrie dans des domaines tels que la programmation, l'analyse de documents, l'utilisation d'outils et la réduction des hallucinations.
Le nouveau modèle est principalement orienté vers l'environnement commercial et professionnel, se positionnant comme le plus avancé actuellement disponible selon divers benchmarks de l'industrie. OpenAI souligne que GPT-5.2 établit de nouveaux records dans des domaines tels que le travail professionnel, l'ingénierie logicielle et l'analyse de contextes étendus.
Le modèle comprend trois variantes : Instant, Thinking et Pro. Instant est orienté vers l'utilisation quotidienne et les requêtes rapides, Thinking est conçu pour les tâches complexes nécessitant une plus grande profondeur d'analyse, et Pro offre le plus haut niveau de qualité pour les questions difficiles où la précision prime sur la vitesse.
Dans le benchmark GDPval, qui évalue les tâches de connaissances spécialisées dans 44 professions, GPT-5.2 Thinking égale ou dépasse les professionnels experts dans 70,9% des cas. Les tâches incluent la création de présentations et de feuilles de calcul que le modèle complète à une vitesse onze fois supérieure et à moins de 1% du coût par rapport au travail humain spécialisé.
L'une des améliorations les plus significatives se trouve dans la programmation. GPT-5.2 Thinking atteint 55,6% sur SWE-Bench Pro, un benchmark qui évalue la résolution de problèmes réels d'ingénierie logicielle dans quatre langages. Dans les tâches de modélisation financière avec des feuilles de calcul, la précision augmente de 59,1% à 68,4%. Les utilisateurs testeurs ont souligné des améliorations notables dans le développement d'interfaces complexes avec des éléments tridimensionnels.
Le modèle étend sa capacité à travailler avec des documents étendus, atteignant près de 100% de précision dans l'analyse d'informations réparties sur jusqu'à 256 000 tokens, équivalent à plusieurs centaines de pages. Cette caractéristique est particulièrement utile pour analyser des contrats, des rapports techniques ou des projets avec plusieurs fichiers.
En traitement visuel, le modèle réduit environ de moitié le taux d'erreur dans l'interprétation de graphiques scientifiques. La précision dans l'analyse de captures d'écran professionnelles augmente de 64,2% à 86,3%, facilitant l'analyse de tableaux de bord et de diagrammes techniques.
OpenAI rapporte une réduction de 30% des hallucinations par rapport à la version précédente. En mathématiques de niveau expert, GPT-5.2 Thinking résout 40,3% des problèmes de FrontierMath, contre 31% pour GPT-5.1. Le modèle s'améliore également dans la coordination de plusieurs outils, atteignant 98,7% de précision dans les tâches de service client en plusieurs étapes.
GPT-5.2 est disponible dès aujourd'hui dans ChatGPT pour les utilisateurs d'abonnements payants et dans l'API pour tous les développeurs. OpenAI a fixé un prix API supérieur à GPT-5.1 par token, bien qu'il reste inférieur aux autres modèles de référence du marché. L'entreprise indique que malgré l'augmentation par token, le coût final pour atteindre un niveau de qualité donné est inférieur grâce à la plus grande efficacité du nouveau modèle.
ChatGPT vous aide à obtenir des réponses, à trouver de l'inspiration et à être plus productif. Il est gratuit et facile à essayer. Posez simplement une question, et ChatGPT peut vous aider à ...
OpenAI développe une intelligence artificielle axée sur la sécurité et le bénéfice social. L'entreprise intègre des recherches avancées et des principes éthiques pour promouvoir des ...
09/06/2026
...
25/05/2026
Le pape Léon XIV publie la première encyclique consacrée à l'intelligence artificielle, fixant la dignité humaine comme critère de tout ...
19/05/2026
Rime présente Coda, un modèle de synthèse vocale pour agents conversationnels en temps réel qui reproduit le rythme, les pauses et l'intonation ...
11/05/2026
Thinking Machines Lab a publié un aperçu de recherche de TML-Interaction-Small, un modèle d'interaction conçu pour collaborer avec l'utilisateur ...