Anthropic a présenté Claude Sonnet 4.5, son nouveau modèle d'intelligence artificielle qui domine les évaluations de programmation et d'utilisation d'ordinateurs. Le lancement inclut des mises à jour de Claude Code, de l'API et des applications, ainsi que le nouveau Claude Agent SDK pour les développeurs.
Claude Sonnet 4.5 domine les évaluations des capacités de programmation et d'utilisation d'ordinateurs dans des conditions réelles. Dans SWE-bench Verified, un test mesurant les compétences de codage dans des situations réelles, le modèle atteint 82,0 %. Dans OSWorld, qui évalue la capacité à effectuer des tâches informatiques réelles, il atteint 61,4 %, contre 42,2 % obtenus par Claude Sonnet 4 il y a quatre mois. Selon Anthropic, le modèle peut maintenir sa concentration pendant plus de 30 heures sur des tâches complexes à plusieurs étapes.
Le lancement comprend des mises à jour importantes des produits de l'entreprise. Claude Code, l'outil en ligne de commande pour les développeurs, intègre des points de contrôle permettant de sauvegarder la progression et de revenir instantanément à des états antérieurs. L'interface du terminal a été entièrement repensée et une extension native pour VS Code a été lancée. L'API Claude ajoute des fonctions d'édition de contexte et de mémoire qui permettent aux agents d'exécuter des tâches de plus longue durée et de plus grande complexité.
Les applications Claude intègrent désormais l'exécution de code et la création de fichiers directement dans les conversations. Les utilisateurs peuvent générer des feuilles de calcul, des présentations et des documents sans quitter le chat. L'extension Claude pour Chrome, disponible pour les abonnés Max ayant rejoint la liste d'attente le mois dernier, permet au modèle de naviguer sur des sites web, de remplir des feuilles de calcul et de compléter des tâches directement dans le navigateur.
Parallèlement au modèle, Anthropic lance le Claude Agent SDK, l'infrastructure qu'elle utilise en interne pour développer Claude Code. Le kit fournit aux développeurs des outils pour construire des agents IA, incluant des systèmes de gestion de mémoire pour les tâches de longue durée, des permissions qui équilibrent autonomie et contrôle utilisateur, et la coordination de sous-agents travaillant vers des objectifs communs. Bien que Claude Code se concentre sur la programmation, le SDK peut s'appliquer à une grande variété de tâches.
Concernant l'alignement et la sécurité, Anthropic décrit ce modèle comme le plus aligné à ce jour. Les évaluations internes montrent des réductions significatives de comportements problématiques tels que la flatterie excessive, la tromperie, la recherche de pouvoir et la tendance à encourager la pensée délirante. Pour les capacités d'agents et d'utilisation d'ordinateurs, des défenses contre les attaques par injection de prompts ont été mises en œuvre.
Le modèle est publié sous les protections AI Safety Level 3, qui incluent des classificateurs pour détecter les contenus potentiellement dangereux liés aux armes chimiques, biologiques, radiologiques et nucléaires. Ces classificateurs peuvent occasionnellement identifier incorrectement du contenu normal, c'est pourquoi Anthropic a facilité la possibilité pour les utilisateurs de continuer les conversations interrompues avec Sonnet 4, un modèle présentant un risque moindre dans ce domaine.
Des experts en finance, droit, médecine et disciplines STEM ont évalué le modèle et ont constaté des améliorations notables en matière de connaissances spécifiques au domaine et de raisonnement par rapport aux modèles précédents, y compris Opus 4.1. Anthropic a publié des évaluations détaillées de sécurité et d'alignement qui, pour la première fois, incluent des tests utilisant des techniques d'interprétabilité mécaniste.
Le modèle est disponible dès aujourd'hui via l'API Claude avec l'identifiant claude-sonnet-4-5, en conservant la même structure tarifaire que son prédécesseur. Anthropic recommande de passer à Claude Sonnet 4.5 pour tous les usages, car il fonctionne comme un remplacement direct avec des performances améliorées.
Anthropic développe des systèmes d'intelligence artificielle fiables et interprétables selon une approche scientifique de la sécurité. L'entreprise intègre recherche avancée et collaboration ...
Claude est un système d'IA conversationnelle d'Anthropic conçu pour traiter le langage naturel et les images, fournissant analyse, raisonnement logique, génération de code et communication ...
Claude Code est un outil de codage agentique pour terminal qui intègre l'IA dans le flux de développement. Il permet l'édition de fichiers, la résolution de problèmes, l'exécution de tests et ...
24/04/2026
DeepSeek lance en version préliminaire sa famille V4, deux modèles open source capables de traiter jusqu'à un million de tokens de contexte et de ...
23/04/2026
OpenAI lance GPT-5.5, un modèle conçu pour exécuter des tâches complexes de manière autonome : programmer, rechercher, analyser des données et ...
21/04/2026
OpenAI présente ChatGPT Images 2.0, un modèle de génération d'images offrant une meilleure précision, un support multilingue, des proportions ...
17/04/2026
Anthropic a lancé Claude Design, un outil permettant de créer des designs visuels, des prototypes interactifs et des présentations par ...