Kimi K2.5 : vision agentique dans le modèle open-source le plus puissant

27/01/2026

Moonshot AI lance Kimi K2.5, un modèle multimodal open-source qui gère de grands volumes d'informations en une seule conversation et combine des capacités avancées de vision et de programmation, un traitement parallèle via plusieurs agents et une intégration avec des outils de productivité bureautique.

Kimi K2.5 : vision agentique dans le modèle open-source le plus puissant

Moonshot AI a lancé Kimi K2.5, qui selon les benchmarks publiés se présente comme le modèle open-source le plus puissant à ce jour. Le modèle intègre des capacités de vision, de programmation et de traitement par système multi-agents, avec une fenêtre de contexte de 256 000 tokens. Il est disponible via Kimi.com, l'application Kimi, l'API de Moonshot et Kimi Code.

Le développement de K2.5 s'est basé sur un entraînement continu avec environ 15 billions de tokens combinant des données visuelles et textuelles. Cette architecture multimodale permet de générer des interfaces complètes à partir de conversations, en implémentant des designs interactifs et des animations complexes. Le modèle peut reconstruire des sites web complets à partir de vidéos, résoudre des énigmes visuelles en marquant le chemin le plus court par code, et effectuer un débogage visuel autonome, comme il l'a démontré en traduisant l'esthétique de l'œuvre de Matisse en une interface web en itérant sur sa propre sortie.

Le système appelé "agent swarm" (multi-agents) représente un changement dans la stratégie de mise à l'échelle. K2.5 peut auto-diriger jusqu'à 100 sous-agents exécutant des flux de travail parallèles avec un maximum de 1 500 appels d'outils coordonnés. La technologie utilise le Parallel-Agent Reinforcement Learning (PARL) pour décomposer les tâches en sous-tâches parallélisables exécutées de manière concurrente. Cette approche réduit le temps d'exécution jusqu'à 4,5 fois grâce à une métrique appelée Critical Steps qui mesure la latence selon le concept de chemin critique en informatique parallèle. Dans les évaluations internes, le mode Agent Swarm a démontré une réduction de 80% du temps d'exécution pour les tâches complexes.

En productivité bureautique, K2.5 affiche des améliorations de 59,3% dans le benchmark AI Office et de 24,3% dans General Agent par rapport à K2 Thinking. Dans les tâches d'ingénierie logicielle, il atteint 76,8% sur SWE-Bench Verified. Le modèle coordonne plusieurs outils pour générer des documents, des feuilles de calcul, des PDF et des présentations, prenant en charge des tâches telles que l'ajout d'annotations dans Word, la construction de modèles financiers avec des tableaux croisés dynamiques et l'écriture d'équations LaTeX, pouvant aller jusqu'à des documents de 10 000 mots ou 100 pages.

La plateforme propose quatre modes de fonctionnement : K2.5 Instant, K2.5 Thinking, K2.5 Agent et K2.5 Agent Swarm, ce dernier en phase bêta. Pour l'ingénierie logicielle, Moonshot recommande Kimi Code, son outil open-source qui fonctionne depuis le terminal et peut s'intégrer avec des environnements comme VSCode, Cursor ou Zed.

Points clés

  • Moonshot AI présente Kimi K2.5 comme le modèle open-source le plus puissant selon les benchmarks publiés
  • Excelle en programmation avec vision, générant du code à partir d'images et de vidéos, avec 76,8% sur SWE-Bench Verified
  • Intègre un système "agent swarm" (multi-agents) qui coordonne jusqu'à 100 sous-agents en parallèle, réduisant le temps d'exécution jusqu'à 4,5 fois
  • Offre des capacités avancées de productivité bureautique, générant documents, feuilles de calcul et présentations avec des améliorations supérieures à 50% par rapport à K2
  • Disponible en quatre modes différents, dont Agent Swarm en bêta, et complété par Kimi Code pour le développement logiciel

IA connexe

Kimi

Assistant IA pour documents volumineux

Assistant d'intelligence artificielle spécialisé dans le traitement et l'analyse de documents volumineux. Analyse les fichiers PDF, Word et Excel, effectue des recherches en ligne et fonctionne en ...

Moonshot AI

Modèles avancés pour le raisonnement et l'analyse

Entreprise d'IA basée à Pékin, développe des modèles de langage avancés. Sa technologie inclut le raisonnement, la codification et l'analyse multimodale. Kimi, son modèle et chatbot, gère de ...

Dernières nouvelles

★★★★★
Évaluez-nous sur Google
Ce site utilise des cookies techniques, de personnalisation et d’analyse, propres et tiers, pour faciliter la navigation anonyme et analyser les statistiques d’utilisation du site. Nous considérons que si vous continuez à naviguer, vous acceptez leur utilisation.