Le nouveau modèle Qwen3-Max, avec plus d'un billion de paramètres et un entraînement sur 36 billions de tokens, montre des améliorations significatives en raisonnement, programmation et utilisation d'outils, selon des évaluations indépendantes.
Alibaba a lancé Qwen3-Max, son plus grand modèle de langage à ce jour. Il compte plus d'un billion de paramètres et a été entraîné sur un ensemble de 36 billions de tokens. Son architecture repose sur un mélange d'experts, une approche qui répartit les tâches entre des sous-composants spécialisés, ce qui contribue à un entraînement stable et efficace. Durant tout le processus, la courbe d'apprentissage est restée uniforme, sans interruptions ni besoin de redémarrer ou d'ajuster les données.
Grâce à des améliorations dans la gestion du calcul distribué, le modèle atteint 30 % d'efficacité en plus dans l'utilisation des ressources par rapport à son prédécesseur. De plus, il est capable de gérer des contextes allant jusqu'à un million de tokens, ce qui lui permet de traiter des documents ou des interactions extrêmement longs sans perte de performance.
La variante instructionnelle, Qwen3-Max-Instruct, occupe la troisième place du classement Text Arena de LMArena. Sur SWE-Bench Verified, un test qui évalue la capacité à résoudre des problèmes réels de programmation extraits de dépôts publics, il atteint 69,6 %, se situant parmi les modèles les plus compétents au niveau mondial. Sur Tau2-Bench, conçu pour mesurer la précision dans l'utilisation d'outils par les agents d'IA, il obtient 74,8 %, dépassant des systèmes comme Claude Opus 4 et DeepSeek V3.1.
Alibaba développe également Qwen3-Max-Thinking, une version spécialisée dans le raisonnement complexe. Bien qu'encore en entraînement, elle a déjà obtenu des résultats parfaits sur des tests mathématiques exigeants tels que AIME 25 et HMMT, en combinant exécution de code et stratégies d'inférence avancées. L'entreprise prévoit de lancer publiquement cette variante dans les prochains mois.
Qwen3-Max-Instruct est désormais disponible sur la plateforme Qwen Chat et via l'API sur Alibaba Cloud. Sa compatibilité avec le format de l'API OpenAI facilite son intégration dans les applications existantes. Pour y accéder, les utilisateurs doivent s'inscrire sur Alibaba Cloud, activer le service Model Studio et générer une clé API. Le lancement renforce l'engagement d'Alibaba à offrir une infrastructure d'intelligence artificielle évolutive et ouverte aux développeurs et chercheurs.
Ensemble de modèles d'IA intégrant le traitement du langage naturel, la vision et l'audio, avec certains modèles disponibles en open source. Fournit l'analyse et la génération de contenu ...
15/01/2026
Replit a lancé Mobile Apps on Replit, une fonctionnalité qui permet de décrire une idée, créer l'application et la publier complètement sur ...
14/01/2026
Google a présenté Personal Intelligence, une fonctionnalité qui permet à Gemini d'accéder aux informations d'applications comme Gmail, Google ...
07/01/2026
OpenAI a présenté ChatGPT Health, une expérience dédiée qui permet aux utilisateurs de connecter leurs dossiers médicaux et applications de ...
05/01/2026
Amazon présente Alexa.com, une nouvelle plateforme qui amène son assistant d'intelligence artificielle Alexa+ au navigateur web et complète sa ...