Anthropic présente Claude Opus 4.6, avec des améliorations en raisonnement, programmation et gestion de longs contextes. Le modèle est en tête de plusieurs benchmarks face à GPT-5.2 et Gemini 3 Pro.
Claude Opus 4.6 est la nouvelle version du modèle le plus performant d'Anthropic, disponible sur claude.ai, l'API et les principales plateformes cloud, au même prix que son prédécesseur : 5 et 25 dollars par million de tokens en entrée et en sortie respectivement.
La nouveauté technique la plus significative est une fenêtre de contexte d'un million de tokens en version bêta, disponible pour la première fois dans la gamme Opus, permettant au modèle de traiter des bases de code complètes, de longs contrats ou de grands volumes de documents en une seule requête. Sur le benchmark MRCR v2, qui évalue la récupération d'informations dans de très longs textes, Opus 4.6 atteint 76 % contre 18,5 % pour Sonnet 4.5.
Les comparaisons avec d'autres modèles montrent des résultats solides dans plusieurs catégories. En programmation terminale agentique (Terminal-Bench 2.0), il obtient 65,4 %, devant GPT-5.2 à 64,7 % et Gemini 3 Pro à 56,2 %. En recherche agentique (BrowseComp), il atteint 84 %, contre 77,9 % pour GPT-5.2 et 59,2 % pour Gemini 3 Pro. Sur les tâches de bureau à valeur économique (GDPVal-AA), il obtient 1 606 points Elo contre 1 462 pour GPT-5.2 et 1 195 pour Gemini 3 Pro, ce qui correspond à surpasser le deuxième meilleur modèle du marché dans environ 70 % des cas sur cette évaluation.
En programmation, Opus 4.6 atteint 80,8 % sur SWE-bench Verified, planifie plus soigneusement, maintient les tâches agentiques plus longtemps et détecte ses propres erreurs plus fiablement. Claude Code permet désormais de configurer des équipes d'agents travaillant en parallèle sur différentes parties d'un même projet.
Sur le plan de la sécurité, le modèle maintient un faible taux de comportements indésirables comparable à celui d'Opus 4.5, jusqu'ici le modèle le mieux aligné de la société, et enregistre le taux le plus bas de refus incorrects sur des requêtes légitimes parmi les modèles Claude récents.
Opus 4.6 étend également la capacité de sortie à 128 000 tokens et s'accompagne d'améliorations de Claude dans Excel et du lancement en version de recherche de Claude dans PowerPoint, disponible pour les plans Max, Team et Enterprise.
Pour les développeurs, l'API introduit quatre niveaux de contrôle de l'effort, la pensée adaptative et la compaction de contexte en version bêta.
Anthropic développe des systèmes d'intelligence artificielle fiables et interprétables selon une approche scientifique de la sécurité. L'entreprise intègre recherche avancée et collaboration ...
Claude est un système d'IA conversationnelle d'Anthropic conçu pour traiter le langage naturel et les images, fournissant analyse, raisonnement logique, génération de code et communication ...
24/04/2026
DeepSeek lance en version préliminaire sa famille V4, deux modèles open source capables de traiter jusqu'à un million de tokens de contexte et de ...
23/04/2026
OpenAI lance GPT-5.5, un modèle conçu pour exécuter des tâches complexes de manière autonome : programmer, rechercher, analyser des données et ...
21/04/2026
OpenAI présente ChatGPT Images 2.0, un modèle de génération d'images offrant une meilleure précision, un support multilingue, des proportions ...
17/04/2026
Anthropic a lancé Claude Design, un outil permettant de créer des designs visuels, des prototypes interactifs et des présentations par ...