Anthropic lance Claude Sonnet 4.5 avec des améliorations en code et une grande avancée dans l’utilisation d’ordinateurs

29/09/2025

Anthropic a présenté Claude Sonnet 4.5, son nouveau modèle d'intelligence artificielle qui domine les évaluations de programmation et d'utilisation d'ordinateurs. Le lancement inclut des mises à jour de Claude Code, de l'API et des applications, ainsi que le nouveau Claude Agent SDK pour les développeurs.

Anthropic lance Claude Sonnet 4.5 avec des améliorations en code et une grande avancée dans l’utilisation d’ordinateurs

Claude Sonnet 4.5 domine les évaluations des capacités de programmation et d'utilisation d'ordinateurs dans des conditions réelles. Dans SWE-bench Verified, un test mesurant les compétences de codage dans des situations réelles, le modèle atteint 82,0 %. Dans OSWorld, qui évalue la capacité à effectuer des tâches informatiques réelles, il atteint 61,4 %, contre 42,2 % obtenus par Claude Sonnet 4 il y a quatre mois. Selon Anthropic, le modèle peut maintenir sa concentration pendant plus de 30 heures sur des tâches complexes à plusieurs étapes.

Le lancement comprend des mises à jour importantes des produits de l'entreprise. Claude Code, l'outil en ligne de commande pour les développeurs, intègre des points de contrôle permettant de sauvegarder la progression et de revenir instantanément à des états antérieurs. L'interface du terminal a été entièrement repensée et une extension native pour VS Code a été lancée. L'API Claude ajoute des fonctions d'édition de contexte et de mémoire qui permettent aux agents d'exécuter des tâches de plus longue durée et de plus grande complexité.

Les applications Claude intègrent désormais l'exécution de code et la création de fichiers directement dans les conversations. Les utilisateurs peuvent générer des feuilles de calcul, des présentations et des documents sans quitter le chat. L'extension Claude pour Chrome, disponible pour les abonnés Max ayant rejoint la liste d'attente le mois dernier, permet au modèle de naviguer sur des sites web, de remplir des feuilles de calcul et de compléter des tâches directement dans le navigateur.

Parallèlement au modèle, Anthropic lance le Claude Agent SDK, l'infrastructure qu'elle utilise en interne pour développer Claude Code. Le kit fournit aux développeurs des outils pour construire des agents IA, incluant des systèmes de gestion de mémoire pour les tâches de longue durée, des permissions qui équilibrent autonomie et contrôle utilisateur, et la coordination de sous-agents travaillant vers des objectifs communs. Bien que Claude Code se concentre sur la programmation, le SDK peut s'appliquer à une grande variété de tâches.

Concernant l'alignement et la sécurité, Anthropic décrit ce modèle comme le plus aligné à ce jour. Les évaluations internes montrent des réductions significatives de comportements problématiques tels que la flatterie excessive, la tromperie, la recherche de pouvoir et la tendance à encourager la pensée délirante. Pour les capacités d'agents et d'utilisation d'ordinateurs, des défenses contre les attaques par injection de prompts ont été mises en œuvre.

Le modèle est publié sous les protections AI Safety Level 3, qui incluent des classificateurs pour détecter les contenus potentiellement dangereux liés aux armes chimiques, biologiques, radiologiques et nucléaires. Ces classificateurs peuvent occasionnellement identifier incorrectement du contenu normal, c'est pourquoi Anthropic a facilité la possibilité pour les utilisateurs de continuer les conversations interrompues avec Sonnet 4, un modèle présentant un risque moindre dans ce domaine.

Des experts en finance, droit, médecine et disciplines STEM ont évalué le modèle et ont constaté des améliorations notables en matière de connaissances spécifiques au domaine et de raisonnement par rapport aux modèles précédents, y compris Opus 4.1. Anthropic a publié des évaluations détaillées de sécurité et d'alignement qui, pour la première fois, incluent des tests utilisant des techniques d'interprétabilité mécaniste.

Le modèle est disponible dès aujourd'hui via l'API Claude avec l'identifiant claude-sonnet-4-5, en conservant la même structure tarifaire que son prédécesseur. Anthropic recommande de passer à Claude Sonnet 4.5 pour tous les usages, car il fonctionne comme un remplacement direct avec des performances améliorées.

Points clés

  • Claude Sonnet 4.5 atteint 82,0 % dans SWE-bench Verified et 61,4 % dans OSWorld, dominant les évaluations de programmation et d'utilisation d'ordinateurs
  • Le modèle peut maintenir sa concentration pendant plus de 30 heures sur des tâches complexes à plusieurs étapes
  • Anthropic lance le Claude Agent SDK, l'infrastructure qu'elle utilise en interne pour développer ses produits, désormais disponible pour les développeurs
  • Claude Code intègre des points de contrôle pour sauvegarder la progression, une interface repensée et une extension native VS Code
  • Les applications Claude permettent l'exécution de code et la création de fichiers (feuilles de calcul, présentations, documents) directement dans les conversations
  • L'API ajoute des fonctions de mémoire et d'édition de contexte pour que les agents puissent exécuter des tâches de plus longue durée et de plus grande complexité
  • Le modèle montre des réductions significatives de comportements non alignés tels que la flatterie, la tromperie et la recherche de pouvoir selon les évaluations internes
  • Des défenses contre les attaques par injection de prompts et des classificateurs pour détecter les contenus liés aux armes CBRN sont mis en œuvre sous les protections AI Safety Level 3

Vidéos

IA connexe

Anthropic

Systèmes d'IA dignes de confiance

Anthropic développe des systèmes d'intelligence artificielle fiables et interprétables selon une approche scientifique de la sécurité. L'entreprise intègre recherche avancée et collaboration ...

Claude

Créez avec Claude

Claude est un système d'IA conversationnelle d'Anthropic conçu pour traiter le langage naturel et les images, fournissant analyse, raisonnement logique, génération de code et communication ...

Claude Code

Assistant de codage en terminal

Claude Code est un outil de codage agentique pour terminal qui intègre l'IA dans le flux de développement. Il permet l'édition de fichiers, la résolution de problèmes, l'exécution de tests et ...

Dernières nouvelles

Trustpilot
Ce site utilise des cookies techniques, de personnalisation et d’analyse, propres et tiers, pour faciliter la navigation anonyme et analyser les statistiques d’utilisation du site. Nous considérons que si vous continuez à naviguer, vous acceptez leur utilisation.