Qwen3-Max es posiciona entre els models de llenguatge més avançats del mercat

24/09/2025

El nou model Qwen3-Max, amb més d'un bilió de paràmetres i entrenament en 36 bilions de tokens, mostra millores significatives en raonament, programació i ús d'eines, segons avaluacions independents.

Qwen3-Max es posiciona entre els models de llenguatge més avançats del mercat

Alibaba ha llançat Qwen3-Max, el seu model de llenguatge més gran fins ara. Compta amb més d'un bilió de paràmetres i va ser entrenat amb un conjunt de 36 bilions de tokens. La seva arquitectura es basa en una barreja d'experts, un enfocament que distribueix les tasques entre subcomponents especialitzats, cosa que contribueix a un entrenament estable i eficient. Durant tot el procés, la corba d'aprenentatge es va mantenir uniforme, sense interrupcions ni necessitat de reiniciar o ajustar les dades.

Gràcies a millores en la gestió del còmput distribuït, el model aconsegueix un 30 % més d'eficiència en l'ús de recursos que el seu predecessor. A més, és capaç de gestionar contextos de fins a un milió de tokens, cosa que li permet processar documents o interaccions extremadament llargues sense pèrdua de rendiment.

La variant instruccional, Qwen3-Max-Instruct, ocupa el tercer lloc al leaderboard Text Arena de LMArena. A SWE-Bench Verified, una prova que avalua la capacitat per resoldre problemes reals de programació extrets de repositoris públics, assoleix un 69,6 %, situant-se entre els models més competents a nivell global. A Tau2-Bench, dissenyat per mesurar la precisió en l'ús d'eines per part d'agents d'IA, obté un 74,8 %, superant sistemes com Claude Opus 4 i DeepSeek V3.1.

Alibaba també està desenvolupant Qwen3-Max-Thinking, una versió especialitzada en raonament complex. Tot i que encara està en entrenament, ja ha aconseguit resultats perfectes en proves matemàtiques exigents com AIME 25 i HMMT, en combinar execució de codi i estratègies avançades d'inferència. La companyia planeja llançar aquesta variant de forma pública en els propers mesos.

Qwen3-Max-Instruct ja està disponible a la plataforma Qwen Chat i a través de l'API a Alibaba Cloud. La seva compatibilitat amb el format de l'API d'OpenAI facilita la seva integració en aplicacions existents. Per accedir-hi, els usuaris han de registrar-se a Alibaba Cloud, activar el servei Model Studio i generar una clau d'API. El llançament reforça l'aposta d'Alibaba per oferir infraestructura d'intel·ligència artificial escalable i oberta a desenvolupadors i investigadors.

Punts clau

  • Alibaba llança Qwen3-Max, el seu model de llenguatge més gran amb més d'un bilió de paràmetres entrenat amb 36 bilions de tokens.
  • Qwen3-Max-Instruct ocupa el tercer lloc al leaderboard Text Arena de LMArena.
  • El model assoleix un 69,6 % a SWE-Bench Verified i un 74,8 % a Tau2-Bench, superant Claude Opus 4 i DeepSeek V3.1.
  • L'arquitectura de barreja d'experts va permetre un entrenament estable sense interrupcions ni ajustos.
  • Aconsegueix un 30 % més d'eficiència en l'ús de recursos comparat amb el seu predecessor.
  • Pot processar contextos de fins a un milió de tokens sense pèrdua de rendiment.
  • Qwen3-Max-Thinking, variant en desenvolupament, assoleix resultats perfectes a AIME 25 i HMMT.
  • Està disponible a Qwen Chat i a través d'API a Alibaba Cloud, compatible amb el format de l'API d'OpenAI.

IA relacionada

Qwen

Suite de models de llenguatge d'Alibaba Cloud

Conjunt de models d'IA que integra processament del llenguatge natural, visió i àudio, amb alguns models disponibles com a codi obert. Proporciona anàlisi i generació de contingut multimodal, amb ...

Últimes noticies

Trustpilot
Aquest lloc web utilitza cookies tècniques, de personalització i anàlisi, pròpies i de tercers, per facilitar la navegació anònima i analitzar estadístiques d’ús del web. Considerem que si continueu navegant, n’accepteu l’ús.