El nou model Qwen3-Max, amb més d'un bilió de paràmetres i entrenament en 36 bilions de tokens, mostra millores significatives en raonament, programació i ús d'eines, segons avaluacions independents.
Alibaba ha llançat Qwen3-Max, el seu model de llenguatge més gran fins ara. Compta amb més d'un bilió de paràmetres i va ser entrenat amb un conjunt de 36 bilions de tokens. La seva arquitectura es basa en una barreja d'experts, un enfocament que distribueix les tasques entre subcomponents especialitzats, cosa que contribueix a un entrenament estable i eficient. Durant tot el procés, la corba d'aprenentatge es va mantenir uniforme, sense interrupcions ni necessitat de reiniciar o ajustar les dades.
Gràcies a millores en la gestió del còmput distribuït, el model aconsegueix un 30 % més d'eficiència en l'ús de recursos que el seu predecessor. A més, és capaç de gestionar contextos de fins a un milió de tokens, cosa que li permet processar documents o interaccions extremadament llargues sense pèrdua de rendiment.
La variant instruccional, Qwen3-Max-Instruct, ocupa el tercer lloc al leaderboard Text Arena de LMArena. A SWE-Bench Verified, una prova que avalua la capacitat per resoldre problemes reals de programació extrets de repositoris públics, assoleix un 69,6 %, situant-se entre els models més competents a nivell global. A Tau2-Bench, dissenyat per mesurar la precisió en l'ús d'eines per part d'agents d'IA, obté un 74,8 %, superant sistemes com Claude Opus 4 i DeepSeek V3.1.
Alibaba també està desenvolupant Qwen3-Max-Thinking, una versió especialitzada en raonament complex. Tot i que encara està en entrenament, ja ha aconseguit resultats perfectes en proves matemàtiques exigents com AIME 25 i HMMT, en combinar execució de codi i estratègies avançades d'inferència. La companyia planeja llançar aquesta variant de forma pública en els propers mesos.
Qwen3-Max-Instruct ja està disponible a la plataforma Qwen Chat i a través de l'API a Alibaba Cloud. La seva compatibilitat amb el format de l'API d'OpenAI facilita la seva integració en aplicacions existents. Per accedir-hi, els usuaris han de registrar-se a Alibaba Cloud, activar el servei Model Studio i generar una clau d'API. El llançament reforça l'aposta d'Alibaba per oferir infraestructura d'intel·ligència artificial escalable i oberta a desenvolupadors i investigadors.
Conjunt de models d'IA que integra processament del llenguatge natural, visió i àudio, amb alguns models disponibles com a codi obert. Proporciona anàlisi i generació de contingut multimodal, amb ...
07/11/2025
Freepik avança en la seva estratègia d'IA presentant Spaces, una eina que integra les seves funcions d'intel·ligència artificial en un entorn de ...
29/10/2025
Google ha actualitzat NotebookLM ampliant significativament la seva capacitat per processar col·leccions extenses de documents i afegint opcions de ...
26/10/2025
Google ha incorporat una nova funcionalitat a AI Studio que permet generar aplicacions amb intel·ligència artificial mitjançant descripcions en ...
24/10/2025
Mistral AI presenta AI Studio, una plataforma que ajuda les empreses a passar de l'experimentació a l'operació fiable de sistemes ...