Anthropic a présenté Claude Opus 4.5, un modèle d'IA qui établit de nouveaux sommets dans les tests de développement logiciel réel. Le système intègre des améliorations en programmation, usage d'agents et contrôle d'ordinateurs, avec des mises à jour de produits comme Claude Code et Excel.
Anthropic a annoncé Claude Opus 4.5, disponible dès aujourd'hui sur son API, ses applications et les trois principales plateformes cloud. Le système atteint 80,9% de précision sur SWE-bench Verified, l'évaluation de référence pour l'ingénierie logicielle en conditions réelles, dépassant des modèles comme Sonnet 4.5 (77,2%) et d'autres concurrents du secteur. En programmation multilingue, il est leader dans 7 des 8 langages évalués.
En plus de dominer en programmation avec agents, le modèle montre des capacités supérieures dans plusieurs domaines techniques. En utilisation d'outils, il obtient 98,2% dans les scénarios de télécommunications et 88,9% dans les environnements de commerce de détail. Dans les tâches d'utilisation d'ordinateurs, il enregistre 66,3%, et en raisonnement visuel 80,7%. Le système atteint également 90,8% en réponses multilingues et 87% en raisonnement de niveau universitaire.
Une caractéristique distinctive est le nouveau paramètre d'effort dans l'API, qui permet aux développeurs d'ajuster l'équilibre entre capacité et consommation de tokens. Avec un niveau d'effort moyen, Opus 4.5 égale la performance de Sonnet 4.5 en utilisant 76% de tokens de sortie en moins. À son niveau maximum, il dépasse Sonnet 4.5 de 4,3 points de pourcentage tout en consommant 48% de tokens en moins.
Anthropic a réalisé des tests internes où Claude Opus 4.5 a complété un examen technique de deux heures pour candidats en ingénierie de performance, obtenant le score le plus élevé enregistré parmi tous les candidats humains évalués. L'entreprise indique que ce résultat soulève des questions sur comment l'intelligence artificielle modifiera le développement logiciel comme profession.
En termes de sécurité, Claude Opus 4.5 présente une plus grande résistance aux attaques par injection de prompts que tout autre modèle sur le marché. Dans des tests avec mille requêtes, le modèle enregistre un taux de succès d'attaque de 4,7%, contre 7,3% pour Sonnet 4.5, 12,5% pour Gemini 3 Pro et 12,6% pour GPT-5.1.
Anthropic a mis à jour plusieurs produits tirant parti des capacités du modèle. Claude Code intègre un mode Plan qui génère des fichiers éditables avant d'exécuter des tâches. Les conversations dans les applications n'ont plus de limite de longueur, car le système résume automatiquement le contexte précédent. Claude for Excel a élargi l'accès bêta à tous les utilisateurs Max, Team et Enterprise.
Claude Opus 4.5 est disponible sur l'API avec l'identifiant claude-opus-4-5-20251101. Le prix est fixé à 5 dollars par million de tokens d'entrée et 25 dollars par million de tokens de sortie.
Anthropic développe des systèmes d'intelligence artificielle fiables et interprétables selon une approche scientifique de la sécurité. L'entreprise intègre recherche avancée et collaboration ...
Claude est un système d'IA conversationnelle d'Anthropic conçu pour traiter le langage naturel et les images, fournissant analyse, raisonnement logique, génération de code et communication ...
15/01/2026
Replit a lancé Mobile Apps on Replit, une fonctionnalité qui permet de décrire une idée, créer l'application et la publier complètement sur ...
14/01/2026
Google a présenté Personal Intelligence, une fonctionnalité qui permet à Gemini d'accéder aux informations d'applications comme Gmail, Google ...
07/01/2026
OpenAI a présenté ChatGPT Health, une expérience dédiée qui permet aux utilisateurs de connecter leurs dossiers médicaux et applications de ...
05/01/2026
Amazon présente Alexa.com, une nouvelle plateforme qui amène son assistant d'intelligence artificielle Alexa+ au navigateur web et complète sa ...