Anthropic lance Claude Opus 4.6, le modèle le plus avancé de la société

05/02/2026

Anthropic présente Claude Opus 4.6, avec des améliorations en raisonnement, programmation et gestion de longs contextes. Le modèle est en tête de plusieurs benchmarks face à GPT-5.2 et Gemini 3 Pro.

Anthropic lance Claude Opus 4.6, le modèle le plus avancé de la société

Claude Opus 4.6 est la nouvelle version du modèle le plus performant d'Anthropic, disponible sur claude.ai, l'API et les principales plateformes cloud, au même prix que son prédécesseur : 5 et 25 dollars par million de tokens en entrée et en sortie respectivement.

La nouveauté technique la plus significative est une fenêtre de contexte d'un million de tokens en version bêta, disponible pour la première fois dans la gamme Opus, permettant au modèle de traiter des bases de code complètes, de longs contrats ou de grands volumes de documents en une seule requête. Sur le benchmark MRCR v2, qui évalue la récupération d'informations dans de très longs textes, Opus 4.6 atteint 76 % contre 18,5 % pour Sonnet 4.5.

Les comparaisons avec d'autres modèles montrent des résultats solides dans plusieurs catégories. En programmation terminale agentique (Terminal-Bench 2.0), il obtient 65,4 %, devant GPT-5.2 à 64,7 % et Gemini 3 Pro à 56,2 %. En recherche agentique (BrowseComp), il atteint 84 %, contre 77,9 % pour GPT-5.2 et 59,2 % pour Gemini 3 Pro. Sur les tâches de bureau à valeur économique (GDPVal-AA), il obtient 1 606 points Elo contre 1 462 pour GPT-5.2 et 1 195 pour Gemini 3 Pro, ce qui correspond à surpasser le deuxième meilleur modèle du marché dans environ 70 % des cas sur cette évaluation.

En programmation, Opus 4.6 atteint 80,8 % sur SWE-bench Verified, planifie plus soigneusement, maintient les tâches agentiques plus longtemps et détecte ses propres erreurs plus fiablement. Claude Code permet désormais de configurer des équipes d'agents travaillant en parallèle sur différentes parties d'un même projet.

Sur le plan de la sécurité, le modèle maintient un faible taux de comportements indésirables comparable à celui d'Opus 4.5, jusqu'ici le modèle le mieux aligné de la société, et enregistre le taux le plus bas de refus incorrects sur des requêtes légitimes parmi les modèles Claude récents.

Opus 4.6 étend également la capacité de sortie à 128 000 tokens et s'accompagne d'améliorations de Claude dans Excel et du lancement en version de recherche de Claude dans PowerPoint, disponible pour les plans Max, Team et Enterprise.

Pour les développeurs, l'API introduit quatre niveaux de contrôle de l'effort, la pensée adaptative et la compaction de contexte en version bêta.

Points clés

  • Claude Opus 4.6 est le modèle le plus avancé d'Anthropic, au même prix que son prédécesseur.
  • Il introduit pour la première fois dans la gamme Opus une fenêtre de contexte d'un million de tokens en bêta.
  • Sur le benchmark MRCR v2 pour les longs contextes, il passe de 18,5 % (Sonnet 4.5) à 76 %.
  • Il surpasse GPT-5.2 et Gemini 3 Pro sur les principaux benchmarks de programmation, recherche agentique et tâches de bureau.
  • En programmation (SWE-bench Verified), il atteint 80,8 % et permet des équipes d'agents dans Claude Code.
  • Il maintient un profil de sécurité comparable à Opus 4.5, le modèle le mieux aligné de la société à ce jour.
  • La capacité de sortie est étendue à 128 000 tokens.
  • Claude dans PowerPoint est lancé en version de recherche et Claude dans Excel reçoit des améliorations.
  • L'API introduit la pensée adaptative, quatre niveaux de contrôle de l'effort et la compaction de contexte.

Vidéos

IA connexe

Anthropic

Systèmes d'IA dignes de confiance

Anthropic développe des systèmes d'intelligence artificielle fiables et interprétables selon une approche scientifique de la sécurité. L'entreprise intègre recherche avancée et collaboration ...

Claude

Créez avec Claude

Claude est un système d'IA conversationnelle d'Anthropic conçu pour traiter le langage naturel et les images, fournissant analyse, raisonnement logique, génération de code et communication ...

Dernières nouvelles

Trustpilot
Ce site utilise des cookies techniques, de personnalisation et d’analyse, propres et tiers, pour faciliter la navigation anonyme et analyser les statistiques d’utilisation du site. Nous considérons que si vous continuez à naviguer, vous acceptez leur utilisation.