El nou model Qwen3-Max, amb més d'un bilió de paràmetres i entrenament en 36 bilions de tokens, mostra millores significatives en raonament, programació i ús d'eines, segons avaluacions independents.
Alibaba ha llançat Qwen3-Max, el seu model de llenguatge més gran fins ara. Compta amb més d'un bilió de paràmetres i va ser entrenat amb un conjunt de 36 bilions de tokens. La seva arquitectura es basa en una barreja d'experts, un enfocament que distribueix les tasques entre subcomponents especialitzats, cosa que contribueix a un entrenament estable i eficient. Durant tot el procés, la corba d'aprenentatge es va mantenir uniforme, sense interrupcions ni necessitat de reiniciar o ajustar les dades.
Gràcies a millores en la gestió del còmput distribuït, el model aconsegueix un 30 % més d'eficiència en l'ús de recursos que el seu predecessor. A més, és capaç de gestionar contextos de fins a un milió de tokens, cosa que li permet processar documents o interaccions extremadament llargues sense pèrdua de rendiment.
La variant instruccional, Qwen3-Max-Instruct, ocupa el tercer lloc al leaderboard Text Arena de LMArena. A SWE-Bench Verified, una prova que avalua la capacitat per resoldre problemes reals de programació extrets de repositoris públics, assoleix un 69,6 %, situant-se entre els models més competents a nivell global. A Tau2-Bench, dissenyat per mesurar la precisió en l'ús d'eines per part d'agents d'IA, obté un 74,8 %, superant sistemes com Claude Opus 4 i DeepSeek V3.1.
Alibaba també està desenvolupant Qwen3-Max-Thinking, una versió especialitzada en raonament complex. Tot i que encara està en entrenament, ja ha aconseguit resultats perfectes en proves matemàtiques exigents com AIME 25 i HMMT, en combinar execució de codi i estratègies avançades d'inferència. La companyia planeja llançar aquesta variant de forma pública en els propers mesos.
Qwen3-Max-Instruct ja està disponible a la plataforma Qwen Chat i a través de l'API a Alibaba Cloud. La seva compatibilitat amb el format de l'API d'OpenAI facilita la seva integració en aplicacions existents. Per accedir-hi, els usuaris han de registrar-se a Alibaba Cloud, activar el servei Model Studio i generar una clau d'API. El llançament reforça l'aposta d'Alibaba per oferir infraestructura d'intel·ligència artificial escalable i oberta a desenvolupadors i investigadors.
Conjunt de models d'IA que integra processament del llenguatge natural, visió i àudio, amb alguns models disponibles com a codi obert. Proporciona anàlisi i generació de contingut multimodal, amb ...
12/06/2026
El govern dels Estats Units ha ordenat a Anthropic bloquejar l'accés a Claude Fable 5 i Mythos 5 a ciutadans estrangers, la qual cosa ha obligat la ...
09/06/2026
Anthropic presenta Claude Fable 5 i Claude Mythos 5, dues versions del seu model de major capacitat fins ara. Comparteixen la mateixa base, però un ...
02/06/2026
Microsoft amplia la seva família de models d'intel·ligència artificial amb set desenvolupaments interns que cobreixen generació d'imatges, ...
25/05/2026
El papa Lleó XIV publica la primera encíclica dedicada a la intel·ligència artificial, en la qual fixa la dignitat humana com a criteri per a tot ...