Meta Superintelligence Labs lance Muse Spark, un modèle multimodal d'intelligence artificielle capable de traiter texte et images simultanément, avec un mode de raisonnement étendu appelé Contemplating.
Meta a présenté Muse Spark, le premier modèle de la famille Muse développé par Meta Superintelligence Labs (MSL), une division créée par l'entreprise pour centraliser ses efforts en intelligence artificielle avancée. Le modèle combine dans un même système la capacité de comprendre texte et images, d'exécuter des outils externes, de raisonner visuellement étape par étape et de coordonner plusieurs agents IA travaillant en parallèle.
Meta inscrit Muse Spark dans une stratégie de mise à l'échelle à long terme. L'entreprise le présente comme le premier modèle d'une série qui montera en puissance, et annonce des investissements sur toute la chaîne de développement, de la recherche et de l'entraînement des modèles jusqu'à l'infrastructure, dont le nouveau centre de données Hyperion.
Selon les résultats des benchmarks publics fournis par Meta, le modèle présente un profil inégal selon les catégories. Il se distingue particulièrement dans les tâches multimodales, où il domine des tests comme CharXiv Reasoning (86,4) et ERQA de raisonnement incarné (64,7), ainsi qu'en santé, avec un score de 42,8 dans HealthBench Hard contre 14,8 pour Claude Opus 4.6 et 20,6 pour Gemini 3.1 Pro. En revanche, en raisonnement abstrait, il a encore des progrès à faire, avec un 42,5 dans ARC AGI 2 face au 76,5 de Gemini 3.1 Pro. Les résultats dans les tâches agentiques sont compétitifs mais sans leadership marqué.
Pour les tâches plus complexes, Meta a développé le mode Contemplating, qui active plusieurs agents raisonnant simultanément en parallèle. Dans ce mode, le modèle atteint 58 % dans Humanity's Last Exam et 38 % dans FrontierScience Research, des chiffres comparables aux modes de raisonnement les plus avancés de modèles comme Gemini Deep Think ou GPT Pro. Ce mode sera déployé progressivement sur meta.ai.
Dans le domaine de la santé, Meta a collaboré avec plus de 1 000 médecins pour préparer des données d'entraînement spécifiques, afin que le modèle fournisse des réponses plus précises sur des sujets sanitaires, comme la valeur nutritionnelle des aliments ou les muscles sollicités lors d'exercices physiques.
Sur le plan technique, Meta indique que Muse Spark nécessite beaucoup moins de puissance de calcul que son prédécesseur Llama 4 Maverick pour atteindre un niveau de performance équivalent. L'entreprise attribue cette amélioration à des changements dans l'architecture du modèle, les processus d'optimisation et la sélection des données d'entraînement.
En matière de sécurité, Meta a confié des évaluations externes à Apollo Research, qui a constaté que Muse Spark présente une forte capacité à identifier quand il est évalué. L'entreprise affirme que, bien que ce comportement nécessite des recherches supplémentaires, il ne constitue pas un obstacle au lancement du modèle.
Muse Spark est disponible dès aujourd'hui sur meta.ai et dans l'application Meta AI. L'entreprise a également ouvert un accès privé à son API pour des utilisateurs sélectionnés.
Initiative de recherche IA de Meta développant des projets en traitement du langage naturel, IA générative, vision et interaction humain-machine. Créateurs du modèle Llama open ...
Assistant IA développé par Meta qui fonctionne par voix et texte. Offre des réponses personnalisées, édition vidéo, génération d'images et disponible sur applications mobiles, web et lunettes ...
24/04/2026
DeepSeek lance en version préliminaire sa famille V4, deux modèles open source capables de traiter jusqu'à un million de tokens de contexte et de ...
23/04/2026
OpenAI lance GPT-5.5, un modèle conçu pour exécuter des tâches complexes de manière autonome : programmer, rechercher, analyser des données et ...
21/04/2026
OpenAI présente ChatGPT Images 2.0, un modèle de génération d'images offrant une meilleure précision, un support multilingue, des proportions ...
17/04/2026
Anthropic a lancé Claude Design, un outil permettant de créer des designs visuels, des prototypes interactifs et des présentations par ...