Qwen3-Max se posiciona entre los modelos de lenguaje más avanzados del mercado

24/09/2025

El nuevo modelo Qwen3-Max, con más de un billón de parámetros y entrenamiento en 36 billones de tokens, muestra mejoras significativas en razonamiento, programación y uso de herramientas, según evaluaciones independientes.

Qwen3-Max se posiciona entre los modelos de lenguaje más avanzados del mercado

Alibaba ha lanzado Qwen3-Max, su modelo de lenguaje más grande hasta la fecha. Cuenta con más de un billón de parámetros y fue entrenado con un conjunto de 36 billones de tokens. Su arquitectura se basa en una mezcla de expertos, un enfoque que distribuye las tareas entre subcomponentes especializados, lo que contribuye a un entrenamiento estable y eficiente. Durante todo el proceso, la curva de aprendizaje se mantuvo uniforme, sin interrupciones ni necesidad de reiniciar o ajustar los datos.

Gracias a mejoras en la gestión del cómputo distribuido, el modelo logra un 30 % más de eficiencia en el uso de recursos que su predecesor. Además, es capaz de manejar contextos de hasta un millón de tokens, lo que le permite procesar documentos o interacciones extremadamente largas sin pérdida de rendimiento.

La variante instruccional, Qwen3-Max-Instruct, ocupa el tercer lugar en el leaderboard Text Arena de LMArena. En SWE-Bench Verified, una prueba que evalúa la capacidad para resolver problemas reales de programación extraídos de repositorios públicos, alcanza un 69,6 %, situándose entre los modelos más competentes a nivel global. En Tau2-Bench, diseñado para medir la precisión en el uso de herramientas por parte de agentes de IA, obtiene un 74,8 %, superando a sistemas como Claude Opus 4 y DeepSeek V3.1.

Alibaba también está desarrollando Qwen3-Max-Thinking, una versión especializada en razonamiento complejo. Aunque aún está en entrenamiento, ya ha logrado resultados perfectos en pruebas matemáticas exigentes como AIME 25 y HMMT, al combinar ejecución de código y estrategias avanzadas de inferencia. La compañía planea lanzar esta variante de forma pública en los próximos meses.

Qwen3-Max-Instruct ya está disponible en la plataforma Qwen Chat y a través de la API en Alibaba Cloud. Su compatibilidad con el formato de la API de OpenAI facilita su integración en aplicaciones existentes. Para acceder, los usuarios deben registrarse en Alibaba Cloud, activar el servicio Model Studio y generar una clave de API. El lanzamiento refuerza la apuesta de Alibaba por ofrecer infraestructura de inteligencia artificial escalable y abierta a desarrolladores e investigadores.

Puntos clave

  • Alibaba lanza Qwen3-Max, su modelo de lenguaje más grande con más de un billón de parámetros entrenado con 36 billones de tokens.
  • Qwen3-Max-Instruct ocupa el tercer lugar en el leaderboard Text Arena de LMArena.
  • El modelo alcanza un 69,6% en SWE-Bench Verified y un 74,8% en Tau2-Bench, superando a Claude Opus 4 y DeepSeek V3.1.
  • La arquitectura de mezcla de expertos permitió un entrenamiento estable sin interrupciones ni ajustes.
  • Logra un 30% más de eficiencia en el uso de recursos comparado con su predecesor.
  • Es capaz de procesar contextos de hasta un millón de tokens sin pérdida de rendimiento.
  • Qwen3-Max-Thinking, variante en desarrollo, alcanza resultados perfectos en AIME 25 y HMMT.
  • Está disponible en Qwen Chat y a través de API en Alibaba Cloud, compatible con el formato de OpenAI API.

IA relacionada

Qwen

Suite de modelos de lenguaje de Alibaba Cloud

Conjunto de modelos de IA que integra procesamiento de lenguaje natural, visión y audio, con algunos modelos disponibles como código abierto. Proporciona análisis y generación de contenido ...

Últimas noticias

Trustpilot
Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso.