DeepSeek llança en versió preliminar la seva família V4, dos models de codi obert capaços de processar fins a un milió de tokens de context i competir amb els millors models propietaris en matemàtiques, ciència i programació.
DeepSeek ha publicat el 24 d'abril de 2026 la versió preview de DeepSeek-V4, la seva nova generació de models d'intel·ligència artificial. La família es divideix en dues variants: DeepSeek-V4-Pro, orientat al màxim rendiment, i DeepSeek-V4-Flash, pensat per a respostes més ràpides i a menor cost. Tots dos són de codi obert i es poden descarregar des de Hugging Face i ModelScope.
V4-Pro té 1,6 bilions de paràmetres en total, però en cada consulta només n'activa 49.000 milions, la qual cosa permet un ús eficient dels recursos. V4-Flash té 284.000 milions de paràmetres totals amb 13.000 milions d'actius per consulta. La diferència de mida es tradueix en velocitat i cost: Flash respon més ràpid i consumeix menys recursos, mentre que Pro ofereix una major capacitat de raonament.
La novetat més visible de la família és la capacitat de processar fins a un milió de tokens de context, cosa que permet treballar amb documents extensos, converses llargues o projectes de codi de gran mida sense perdre el fil. Segons l'empresa, V4-Pro necessita per a això només una fracció del còmput que requeria el seu model anterior V3.2, gràcies a millores en la manera com gestiona l'atenció entre els elements del text.
Segons els benchmarks publicats per DeepSeek, V4-Pro supera tots els models de codi obert en raonament matemàtic, ciència i programació competitiva, i s'acosta als models propietaris més avançats. En coneixement general del món, només Gemini-3.1-Pro el supera. Tots dos models estan també optimitzats per funcionar com a agents d'IA, és a dir, per executar tasques de forma autònoma encadenant diversos passos, amb compatibilitat nativa amb eines com Claude Code.
Els models estan disponibles a chat.deepseek.com i a l'aplicació oficial, amb una API compatible amb els formats d'OpenAI i Anthropic. Els identificadors anteriors deepseek-chat i deepseek-reasoner es retiraran el 24 de juliol de 2026.
DeepSeek ofereix un model d'intel·ligència artificial de codi obert que inclou càlculs matemàtics, models de llenguatge ampli i visual, APIs i un xatbot avançat. Optimitza el processament de ...
09/06/2026
Anthropic presenta Claude Fable 5 i Claude Mythos 5, dues versions del seu model de major capacitat fins ara. Comparteixen la mateixa base, però un ...
25/05/2026
El papa Lleó XIV publica la primera encíclica dedicada a la intel·ligència artificial, en la qual fixa la dignitat humana com a criteri per a tot ...
19/05/2026
Rime presenta Coda, un model de text a veu per a agents conversacionals en temps real que reprodueix el ritme, les pauses i l'entonació propis d'una ...
11/05/2026
Thinking Machines Lab ha publicat una vista prèvia de recerca de TML-Interaction-Small, un model d'interacció dissenyat per col·laborar amb ...