Moonshot AI lance Kimi K2.5, un modèle multimodal open-source qui gère de grands volumes d'informations en une seule conversation et combine des capacités avancées de vision et de programmation, un traitement parallèle via plusieurs agents et une intégration avec des outils de productivité bureautique.
Moonshot AI a lancé Kimi K2.5, qui selon les benchmarks publiés se présente comme le modèle open-source le plus puissant à ce jour. Le modèle intègre des capacités de vision, de programmation et de traitement par système multi-agents, avec une fenêtre de contexte de 256 000 tokens. Il est disponible via Kimi.com, l'application Kimi, l'API de Moonshot et Kimi Code.
Le développement de K2.5 s'est basé sur un entraînement continu avec environ 15 billions de tokens combinant des données visuelles et textuelles. Cette architecture multimodale permet de générer des interfaces complètes à partir de conversations, en implémentant des designs interactifs et des animations complexes. Le modèle peut reconstruire des sites web complets à partir de vidéos, résoudre des énigmes visuelles en marquant le chemin le plus court par code, et effectuer un débogage visuel autonome, comme il l'a démontré en traduisant l'esthétique de l'œuvre de Matisse en une interface web en itérant sur sa propre sortie.
Le système appelé "agent swarm" (multi-agents) représente un changement dans la stratégie de mise à l'échelle. K2.5 peut auto-diriger jusqu'à 100 sous-agents exécutant des flux de travail parallèles avec un maximum de 1 500 appels d'outils coordonnés. La technologie utilise le Parallel-Agent Reinforcement Learning (PARL) pour décomposer les tâches en sous-tâches parallélisables exécutées de manière concurrente. Cette approche réduit le temps d'exécution jusqu'à 4,5 fois grâce à une métrique appelée Critical Steps qui mesure la latence selon le concept de chemin critique en informatique parallèle. Dans les évaluations internes, le mode Agent Swarm a démontré une réduction de 80% du temps d'exécution pour les tâches complexes.
En productivité bureautique, K2.5 affiche des améliorations de 59,3% dans le benchmark AI Office et de 24,3% dans General Agent par rapport à K2 Thinking. Dans les tâches d'ingénierie logicielle, il atteint 76,8% sur SWE-Bench Verified. Le modèle coordonne plusieurs outils pour générer des documents, des feuilles de calcul, des PDF et des présentations, prenant en charge des tâches telles que l'ajout d'annotations dans Word, la construction de modèles financiers avec des tableaux croisés dynamiques et l'écriture d'équations LaTeX, pouvant aller jusqu'à des documents de 10 000 mots ou 100 pages.
La plateforme propose quatre modes de fonctionnement : K2.5 Instant, K2.5 Thinking, K2.5 Agent et K2.5 Agent Swarm, ce dernier en phase bêta. Pour l'ingénierie logicielle, Moonshot recommande Kimi Code, son outil open-source qui fonctionne depuis le terminal et peut s'intégrer avec des environnements comme VSCode, Cursor ou Zed.
Assistant d'intelligence artificielle spécialisé dans le traitement et l'analyse de documents volumineux. Analyse les fichiers PDF, Word et Excel, effectue des recherches en ligne et fonctionne en ...
Entreprise d'IA basée à Pékin, développe des modèles de langage avancés. Sa technologie inclut le raisonnement, la codification et l'analyse multimodale. Kimi, son modèle et chatbot, gère de ...
09/06/2026
...
25/05/2026
Le pape Léon XIV publie la première encyclique consacrée à l'intelligence artificielle, fixant la dignité humaine comme critère de tout ...
19/05/2026
Rime présente Coda, un modèle de synthèse vocale pour agents conversationnels en temps réel qui reproduit le rythme, les pauses et l'intonation ...
11/05/2026
Thinking Machines Lab a publié un aperçu de recherche de TML-Interaction-Small, un modèle d'interaction conçu pour collaborer avec l'utilisateur ...