Granite 4.0 d’IBM, modèles hybrides avec 70% moins de consommation mémoire

02/10/2025

IBM a présenté Granite 4.0, des modèles de langage conçus pour les environnements d'entreprise qui combinent les architectures Transformer et Mamba-2. L'entreprise affirme qu'ils réduisent la consommation de mémoire jusqu'à 70%. Ce sont les premiers modèles open source avec certification ISO 42001.

Granite 4.0 d’IBM, modèles hybrides avec 70% moins de consommation mémoire

IBM a annoncé le lancement de Granite 4.0, une famille de modèles de langage de grande taille incorporant une architecture hybride conçue pour réduire la consommation de ressources informatiques dans les environnements d'entreprise. Les nouveaux modèles combinent des couches d'architecture Transformer avec des couches Mamba-2 dans un rapport de 9:1, une configuration qui selon IBM permet de traiter de longs contextes avec une utilisation moindre de mémoire RAM. Les modèles Tiny et Small incluent également des blocs de mixture of experts (MoE) avec des experts partagés qui améliorent l'efficacité des paramètres.

L'entreprise a présenté trois variantes initiales : Micro, Tiny et Small. Chacune est disponible en versions Base et Instruct, conçues pour différents cas d'usage d'entreprise et déploiements corporatifs. IBM prévoit de lancer des versions supplémentaires, incluant des modèles plus grands (Medium) et plus petits (Nano), avant fin 2025.

L'un des aspects remarquables de cette génération est la certification ISO 42001 obtenue par la famille Granite, devenant les premiers modèles de langage open source à obtenir cette accréditation. La norme ISO 42001 évalue les systèmes de gestion de l'intelligence artificielle sur des aspects tels que la confidentialité des données, l'explicabilité et la responsabilité.

Les modèles Granite 4.0 ont été entraînés avec un corpus de 22 billions de tokens provenant de sources d'entreprise curées. L'architecture hybride permet aux exigences de mémoire de rester constantes indépendamment de la longueur du contexte, tandis que dans les modèles Transformer conventionnels ces exigences croissent de façon quadratique. Cela facilite le traitement de documents étendus ou de conversations longues sans augmenter proportionnellement les ressources nécessaires.

En termes de performance, Granite 4.0-H-Small obtient des résultats compétitifs dans des benchmarks comme IFEval, qui évalue la capacité à suivre des instructions, et dans Berkeley Function Calling Leaderboard v3, qui mesure la précision dans l'exécution d'appels de fonctions. IBM a travaillé avec des entreprises comme EY et Lockheed Martin pour valider la performance de ces modèles dans des cas d'usage réels.

L'entreprise offre également une indemnisation sans limite pour les réclamations de propriété intellectuelle liées au contenu généré par les modèles Granite lorsqu'ils sont utilisés dans watsonx.ai.

Les modèles sont disponibles sur IBM watsonx.ai et sur des plateformes open source comme Hugging Face, Ollama, NVIDIA NIM et Replicate. IBM a établi des collaborations avec des fabricants de matériel comme Qualcomm et AMD pour optimiser la performance sur différents types de dispositifs, des serveurs aux équipements mobiles.

Points clés

  • Granite 4.0 combine les architectures Transformer et Mamba-2 en rapport 9:1 pour réduire la consommation de mémoire jusqu'à 70%
  • Premiers modèles de langage open source à obtenir la certification ISO 42001 pour la gestion de l'IA
  • Conçus spécifiquement pour les environnements d'entreprise avec trois variantes : Micro, Tiny et Small
  • Entraînés avec 22 billions de tokens de sources d'entreprise curées
  • L'architecture hybride maintient des exigences de mémoire constantes indépendamment de la longueur du contexte
  • Validés par des entreprises comme EY et Lockheed Martin dans des cas d'usage réels
  • Indemnisation sans limite pour réclamations de propriété intellectuelle sur watsonx.ai
  • Disponibles sur watsonx.ai, Hugging Face, Ollama, NVIDIA NIM et Replicate
  • Collaborations avec Qualcomm et AMD pour optimisation sur différents dispositifs

IA connexe

Watsonx

Plateforme d'IA entreprise d'IBM

Suite de produits d'intelligence artificielle générative intégrant développement, gestion et automatisation. Permet de gérer des modèles d'IA fondamentaux ou personnalisés, d'automatiser les ...

Dernières nouvelles

Trustpilot
Ce site utilise des cookies techniques, de personnalisation et d’analyse, propres et tiers, pour faciliter la navigation anonyme et analyser les statistiques d’utilisation du site. Nous considérons que si vous continuez à naviguer, vous acceptez leur utilisation.