Qwen3-Max se positionne parmi les modèles de langage les plus avancés du marché

24/09/2025

Le nouveau modèle Qwen3-Max, avec plus d'un billion de paramètres et un entraînement sur 36 billions de tokens, montre des améliorations significatives en raisonnement, programmation et utilisation d'outils, selon des évaluations indépendantes.

Qwen3-Max se positionne parmi les modèles de langage les plus avancés du marché

Alibaba a lancé Qwen3-Max, son plus grand modèle de langage à ce jour. Il compte plus d'un billion de paramètres et a été entraîné sur un ensemble de 36 billions de tokens. Son architecture repose sur un mélange d'experts, une approche qui répartit les tâches entre des sous-composants spécialisés, ce qui contribue à un entraînement stable et efficace. Durant tout le processus, la courbe d'apprentissage est restée uniforme, sans interruptions ni besoin de redémarrer ou d'ajuster les données.

Grâce à des améliorations dans la gestion du calcul distribué, le modèle atteint 30 % d'efficacité en plus dans l'utilisation des ressources par rapport à son prédécesseur. De plus, il est capable de gérer des contextes allant jusqu'à un million de tokens, ce qui lui permet de traiter des documents ou des interactions extrêmement longs sans perte de performance.

La variante instructionnelle, Qwen3-Max-Instruct, occupe la troisième place du classement Text Arena de LMArena. Sur SWE-Bench Verified, un test qui évalue la capacité à résoudre des problèmes réels de programmation extraits de dépôts publics, il atteint 69,6 %, se situant parmi les modèles les plus compétents au niveau mondial. Sur Tau2-Bench, conçu pour mesurer la précision dans l'utilisation d'outils par les agents d'IA, il obtient 74,8 %, dépassant des systèmes comme Claude Opus 4 et DeepSeek V3.1.

Alibaba développe également Qwen3-Max-Thinking, une version spécialisée dans le raisonnement complexe. Bien qu'encore en entraînement, elle a déjà obtenu des résultats parfaits sur des tests mathématiques exigeants tels que AIME 25 et HMMT, en combinant exécution de code et stratégies d'inférence avancées. L'entreprise prévoit de lancer publiquement cette variante dans les prochains mois.

Qwen3-Max-Instruct est désormais disponible sur la plateforme Qwen Chat et via l'API sur Alibaba Cloud. Sa compatibilité avec le format de l'API OpenAI facilite son intégration dans les applications existantes. Pour y accéder, les utilisateurs doivent s'inscrire sur Alibaba Cloud, activer le service Model Studio et générer une clé API. Le lancement renforce l'engagement d'Alibaba à offrir une infrastructure d'intelligence artificielle évolutive et ouverte aux développeurs et chercheurs.

Points clés

  • Alibaba lance Qwen3-Max, son plus grand modèle de langage avec plus d'un billion de paramètres entraîné sur 36 billions de tokens.
  • Qwen3-Max-Instruct occupe la troisième place du classement Text Arena de LMArena.
  • Le modèle atteint 69,6 % sur SWE-Bench Verified et 74,8 % sur Tau2-Bench, dépassant Claude Opus 4 et DeepSeek V3.1.
  • L'architecture de mélange d'experts a permis un entraînement stable sans interruptions ni ajustements.
  • Atteint 30 % d'efficacité en plus dans l'utilisation des ressources par rapport à son prédécesseur.
  • Peut traiter des contextes allant jusqu'à un million de tokens sans perte de performance.
  • Qwen3-Max-Thinking, variante en développement, atteint des résultats parfaits sur AIME 25 et HMMT.
  • Disponible sur Qwen Chat et via API sur Alibaba Cloud, compatible avec le format de l'API OpenAI.

IA connexe

Qwen

Suite de modèles de langage d'Alibaba Cloud

Ensemble de modèles d'IA intégrant le traitement du langage naturel, la vision et l'audio, avec certains modèles disponibles en open source. Fournit l'analyse et la génération de contenu ...

Dernières nouvelles

Trustpilot
Ce site utilise des cookies techniques, de personnalisation et d’analyse, propres et tiers, pour faciliter la navigation anonyme et analyser les statistiques d’utilisation du site. Nous considérons que si vous continuez à naviguer, vous acceptez leur utilisation.