OpenAI atteint des sommets dans les benchmarks de programmation et tâches professionnelles avec le nouveau GPT-5.2

11/12/2025

OpenAI a présenté GPT-5.2, son nouveau modèle qui atteint les meilleurs résultats dans divers benchmarks de l'industrie dans des domaines tels que la programmation, l'analyse de documents, l'utilisation d'outils et la réduction des hallucinations.

OpenAI atteint des sommets dans les benchmarks de programmation et tâches professionnelles avec le nouveau GPT-5.2

Le nouveau modèle est principalement orienté vers l'environnement commercial et professionnel, se positionnant comme le plus avancé actuellement disponible selon divers benchmarks de l'industrie. OpenAI souligne que GPT-5.2 établit de nouveaux records dans des domaines tels que le travail professionnel, l'ingénierie logicielle et l'analyse de contextes étendus.

Le modèle comprend trois variantes : Instant, Thinking et Pro. Instant est orienté vers l'utilisation quotidienne et les requêtes rapides, Thinking est conçu pour les tâches complexes nécessitant une plus grande profondeur d'analyse, et Pro offre le plus haut niveau de qualité pour les questions difficiles où la précision prime sur la vitesse.

Dans le benchmark GDPval, qui évalue les tâches de connaissances spécialisées dans 44 professions, GPT-5.2 Thinking égale ou dépasse les professionnels experts dans 70,9% des cas. Les tâches incluent la création de présentations et de feuilles de calcul que le modèle complète à une vitesse onze fois supérieure et à moins de 1% du coût par rapport au travail humain spécialisé.

L'une des améliorations les plus significatives se trouve dans la programmation. GPT-5.2 Thinking atteint 55,6% sur SWE-Bench Pro, un benchmark qui évalue la résolution de problèmes réels d'ingénierie logicielle dans quatre langages. Dans les tâches de modélisation financière avec des feuilles de calcul, la précision augmente de 59,1% à 68,4%. Les utilisateurs testeurs ont souligné des améliorations notables dans le développement d'interfaces complexes avec des éléments tridimensionnels.

Le modèle étend sa capacité à travailler avec des documents étendus, atteignant près de 100% de précision dans l'analyse d'informations réparties sur jusqu'à 256 000 tokens, équivalent à plusieurs centaines de pages. Cette caractéristique est particulièrement utile pour analyser des contrats, des rapports techniques ou des projets avec plusieurs fichiers.

En traitement visuel, le modèle réduit environ de moitié le taux d'erreur dans l'interprétation de graphiques scientifiques. La précision dans l'analyse de captures d'écran professionnelles augmente de 64,2% à 86,3%, facilitant l'analyse de tableaux de bord et de diagrammes techniques.

OpenAI rapporte une réduction de 30% des hallucinations par rapport à la version précédente. En mathématiques de niveau expert, GPT-5.2 Thinking résout 40,3% des problèmes de FrontierMath, contre 31% pour GPT-5.1. Le modèle s'améliore également dans la coordination de plusieurs outils, atteignant 98,7% de précision dans les tâches de service client en plusieurs étapes.

GPT-5.2 est disponible dès aujourd'hui dans ChatGPT pour les utilisateurs d'abonnements payants et dans l'API pour tous les développeurs. OpenAI a fixé un prix API supérieur à GPT-5.1 par token, bien qu'il reste inférieur aux autres modèles de référence du marché. L'entreprise indique que malgré l'augmentation par token, le coût final pour atteindre un niveau de qualité donné est inférieur grâce à la plus grande efficacité du nouveau modèle.

Points clés

  • GPT-5.2 établit de nouveaux records dans plusieurs benchmarks de l'industrie
  • GPT-5.2 Thinking égale ou dépasse les professionnels experts dans 70,9% des tâches de travail spécialisé dans 44 professions différentes
  • Le modèle atteint 55,6% sur SWE-Bench Pro, établissant un nouveau record dans la résolution de problèmes réels d'ingénierie logicielle
  • Disponible en trois variantes : Instant pour une utilisation rapide, Thinking pour une analyse approfondie et Pro pour une précision maximale
  • Réduit les hallucinations de 30% par rapport à GPT-5.1 Thinking
  • Atteint près de 100% de précision dans l'analyse de documents jusqu'à 256 000 tokens (équivalent à des centaines de pages)
  • Améliore de 64,2% à 86,3% la compréhension des interfaces graphiques et des captures d'écran professionnelles
  • Résout 40,3% des problèmes mathématiques de niveau expert, contre 31% pour son prédécesseur
  • Prix API supérieur à GPT-5.1 mais inférieur aux autres modèles de référence du marché

IA connexe

ChatGPT

L'assistant IA

ChatGPT vous aide à obtenir des réponses, à trouver de l'inspiration et à être plus productif. Il est gratuit et facile à essayer. Posez simplement une question, et ChatGPT peut vous aider à ...

OpenAI

Recherche et développement en IA responsable

OpenAI développe une intelligence artificielle axée sur la sécurité et le bénéfice social. L'entreprise intègre des recherches avancées et des principes éthiques pour promouvoir des ...

Dernières nouvelles

Trustpilot
Ce site utilise des cookies techniques, de personnalisation et d’analyse, propres et tiers, pour faciliter la navigation anonyme et analyser les statistiques d’utilisation du site. Nous considérons que si vous continuez à naviguer, vous acceptez leur utilisation.