xAI présente Grok 4 Fast, un modèle d'intelligence artificielle qui améliore l'efficacité des tokens de 40% et réduit les coûts de 98%, combinant grande fenêtre de contexte, architecture unifiée de raisonnement et intégration de recherche web et X.
xAI a annoncé Grok 4 Fast, une nouvelle version de son modèle de langage qui cherche à maintenir les performances de Grok 4 avec une plus grande efficacité dans l'usage des tokens. Selon l'entreprise, Grok 4 Fast utilise 40% de tokens en moins par rapport à son prédécesseur, ce qui se traduit par une réduction des coûts jusqu'à 98% dans leurs benchmarks internes.
Le modèle incorpore une fenêtre de contexte de 2 millions de tokens, permettant de gérer de grands volumes d'informations dans un même flux de travail. Son architecture unifiée combine modes de raisonnement prolongé et réponses rapides en un seul modèle, contrôlés par des instructions système, sans nécessité d'alterner entre différentes configurations.
Grok 4 Fast inclut des capacités d'intégration d'outils natifs, entraînées avec apprentissage par renforcement. Il peut effectuer des recherches sur le web et X (anciennement Twitter), ainsi que traiter du contenu multimédia, incluant images et vidéos, pour synthétiser l'information en temps réel. De plus, le modèle permet l'exécution de code contrôlée selon les instructions système.
Deux variantes sont proposées aux développeurs : grok-4-fast-reasoning et grok-4-fast-non-reasoning, toutes deux avec la fenêtre de contexte de 2 millions de tokens. Le modèle est disponible sur la plateforme grok.com, incluant tous les utilisateurs, et peut aussi être intégré via OpenRouter, Vercel AI Gateway et l'API xAI.
Dans les évaluations indépendantes de LMArena, Grok 4 Fast a atteint la première position dans le Search Arena avec 1163 points Elo et la huitième place dans le Text Arena, montrant efficacité et performance comparables à Grok 4 dans différents scénarios de test.
Avec cette mise à jour, xAI cherche à offrir un modèle de langage qui combine efficacité, unification des modes de raisonnement et capacités de recherche, maintenant des standards de performance similaires à sa version précédente mais avec une moindre consommation de tokens et une plus grande accessibilité pour développeurs et utilisateurs.
Assistant d'intelligence artificielle développé par xAI qui combine traitement de texte et génération d'images. Intégré à la plateforme X pour accès aux données en temps réel et fonction ...
24/04/2026
DeepSeek lance en version préliminaire sa famille V4, deux modèles open source capables de traiter jusqu'à un million de tokens de contexte et de ...
23/04/2026
OpenAI lance GPT-5.5, un modèle conçu pour exécuter des tâches complexes de manière autonome : programmer, rechercher, analyser des données et ...
21/04/2026
OpenAI présente ChatGPT Images 2.0, un modèle de génération d'images offrant une meilleure précision, un support multilingue, des proportions ...
17/04/2026
Anthropic a lancé Claude Design, un outil permettant de créer des designs visuels, des prototypes interactifs et des présentations par ...