Xiaomi MiMo

Xiaomi MiMo

Modèle d'IA de raisonnement précis et conception efficace

MiMo est un modèle d'intelligence artificielle open-source développé par Xiaomi qui se spécialise dans le raisonnement mathématique et la génération de code. Il intègre une architecture avancée avec une optimisation des données pour résoudre efficacement des problèmes complexes avec des performances élevées et une taille compacte.

162

Réseaux sociaux de Xiaomi MiMo

Catégories d’IA de Xiaomi MiMo

Création de Large Language Model (LLM)
¡Producto agotado!

Qu’est-ce que Xiaomi MiMo ?

MiMo-7B est un modèle de langage de 7 milliards de paramètres développé par Xiaomi, axé sur les tâches de raisonnement mathématique et de programmation. Ce modèle combine une architecture avancée avec des techniques spécifiques pour maximiser sa capacité à résoudre des problèmes complexes malgré sa taille relativement compacte.

Le processus de création de MiMo-7B comprend deux étapes principales. Dans la première, il a été entraîné avec une collection de données soigneusement sélectionnées incluant du contenu académique, des textes techniques et des problèmes mathématiques. 70% de ces données étaient centrées sur les mathématiques et la programmation. Le modèle a traité 25 billions de tokens pendant cette phase et a utilisé des techniques de prédiction multiple pour améliorer son efficacité.

La deuxième étape a affiné le modèle via deux méthodes : l'apprentissage supervisé avec 500 000 exemples et l'apprentissage par renforcement avec 130 000 problèmes pratiques vérifiables. Pour ce dernier processus, un système a été développé qui évalue automatiquement l'exactitude des solutions proposées par le modèle et l'entraîne à s'améliorer progressivement. L'infrastructure d'entraînement a été optimisée pour accélérer ce processus de plus du double.

Lors d'évaluations standardisées, MiMo-7B a obtenu des scores remarquables dans les tests de raisonnement (BBH : 75,2), les compétitions mathématiques (AIME : 55,4) et la programmation (LiveCodeBench v5 : 57,8). Ces résultats démontrent sa compétitivité face à des modèles de taille similaire et même certains plus grands.

Le modèle est disponible en quatre versions (Base, SFT, RL-Zero et RL) qui représentent différentes étapes de son développement.

Actualités connexes

Trustpilot
Ce site utilise des cookies techniques, de personnalisation et d’analyse, propres et tiers, pour faciliter la navigation anonyme et analyser les statistiques d’utilisation du site. Nous considérons que si vous continuez à naviguer, vous acceptez leur utilisation.