DeepSeek lance en version préliminaire sa famille V4, deux modèles open source capables de traiter jusqu'à un million de tokens de contexte et de rivaliser avec les meilleurs modèles propriétaires en mathématiques, sciences et programmation.
DeepSeek a publié le 24 avril 2026 la version preview de DeepSeek-V4, sa nouvelle génération de modèles d'intelligence artificielle. La famille se décline en deux variantes : DeepSeek-V4-Pro, orienté vers les performances maximales, et DeepSeek-V4-Flash, conçu pour des réponses plus rapides à moindre coût. Les deux sont open source et peuvent être téléchargés depuis Hugging Face et ModelScope.
V4-Pro dispose de 1 600 milliards de paramètres au total, mais n'en active que 49 milliards par requête, ce qui permet une utilisation efficace des ressources. V4-Flash compte 284 milliards de paramètres totaux avec 13 milliards actifs par requête. La différence de taille se traduit en vitesse et en coût : Flash répond plus vite et consomme moins de ressources, tandis que Pro offre une plus grande capacité de raisonnement.
La nouveauté la plus visible de la famille est la capacité à traiter jusqu'à un million de tokens de contexte, ce qui permet de travailler avec des documents longs, des conversations étendues ou de grands projets de code sans perdre le fil. Selon l'entreprise, V4-Pro ne nécessite qu'une fraction du calcul requis par son précédent modèle V3.2, grâce à des améliorations dans la façon dont il gère l'attention entre les éléments du texte.
Selon les benchmarks publiés par DeepSeek, V4-Pro surpasse tous les modèles open source en raisonnement mathématique, sciences et programmation compétitive, et s'approche des modèles propriétaires les plus avancés. En connaissance générale du monde, seul Gemini-3.1-Pro le devance. Les deux modèles sont également optimisés pour fonctionner comme agents IA, c'est-à-dire pour exécuter des tâches de manière autonome en enchaînant plusieurs étapes, avec une compatibilité native avec des outils comme Claude Code.
Les modèles sont disponibles sur chat.deepseek.com et dans l'application officielle, avec une API compatible avec les formats OpenAI et Anthropic. Les anciens identifiants deepseek-chat et deepseek-reasoner seront retirés le 24 juillet 2026.
DeepSeek propose un modèle d'intelligence artificielle open source qui inclut des calculs mathématiques, des modèles de langage étendus et visuels, des API et un chatbot avancé. Il optimise le ...
09/06/2026
...
25/05/2026
Le pape Léon XIV publie la première encyclique consacrée à l'intelligence artificielle, fixant la dignité humaine comme critère de tout ...
19/05/2026
Rime présente Coda, un modèle de synthèse vocale pour agents conversationnels en temps réel qui reproduit le rythme, les pauses et l'intonation ...
11/05/2026
Thinking Machines Lab a publié un aperçu de recherche de TML-Interaction-Small, un modèle d'interaction conçu pour collaborer avec l'utilisateur ...