El nuevo modelo Qwen3-Max, con más de un billón de parámetros y entrenamiento en 36 billones de tokens, muestra mejoras significativas en razonamiento, programación y uso de herramientas, según evaluaciones independientes.
Alibaba ha lanzado Qwen3-Max, su modelo de lenguaje más grande hasta la fecha. Cuenta con más de un billón de parámetros y fue entrenado con un conjunto de 36 billones de tokens. Su arquitectura se basa en una mezcla de expertos, un enfoque que distribuye las tareas entre subcomponentes especializados, lo que contribuye a un entrenamiento estable y eficiente. Durante todo el proceso, la curva de aprendizaje se mantuvo uniforme, sin interrupciones ni necesidad de reiniciar o ajustar los datos.
Gracias a mejoras en la gestión del cómputo distribuido, el modelo logra un 30 % más de eficiencia en el uso de recursos que su predecesor. Además, es capaz de manejar contextos de hasta un millón de tokens, lo que le permite procesar documentos o interacciones extremadamente largas sin pérdida de rendimiento.
La variante instruccional, Qwen3-Max-Instruct, ocupa el tercer lugar en el leaderboard Text Arena de LMArena. En SWE-Bench Verified, una prueba que evalúa la capacidad para resolver problemas reales de programación extraídos de repositorios públicos, alcanza un 69,6 %, situándose entre los modelos más competentes a nivel global. En Tau2-Bench, diseñado para medir la precisión en el uso de herramientas por parte de agentes de IA, obtiene un 74,8 %, superando a sistemas como Claude Opus 4 y DeepSeek V3.1.
Alibaba también está desarrollando Qwen3-Max-Thinking, una versión especializada en razonamiento complejo. Aunque aún está en entrenamiento, ya ha logrado resultados perfectos en pruebas matemáticas exigentes como AIME 25 y HMMT, al combinar ejecución de código y estrategias avanzadas de inferencia. La compañía planea lanzar esta variante de forma pública en los próximos meses.
Qwen3-Max-Instruct ya está disponible en la plataforma Qwen Chat y a través de la API en Alibaba Cloud. Su compatibilidad con el formato de la API de OpenAI facilita su integración en aplicaciones existentes. Para acceder, los usuarios deben registrarse en Alibaba Cloud, activar el servicio Model Studio y generar una clave de API. El lanzamiento refuerza la apuesta de Alibaba por ofrecer infraestructura de inteligencia artificial escalable y abierta a desarrolladores e investigadores.
Conjunto de modelos de IA que integra procesamiento de lenguaje natural, visión y audio, con algunos modelos disponibles como código abierto. Proporciona análisis y generación de contenido ...
12/06/2026
El gobierno de Estados Unidos ha ordenado a Anthropic bloquear el acceso a Claude Fable 5 y Mythos 5 a ciudadanos extranjeros, lo que ha obligado a ...
09/06/2026
Anthropic presenta Claude Fable 5 y Claude Mythos 5, dos versiones de su modelo de mayor capacidad hasta la fecha. Comparten la misma base, pero uno ...
02/06/2026
Microsoft amplía su familia de modelos de inteligencia artificial con siete nuevos desarrollos internos que cubren generación de imágenes, ...
25/05/2026
El papa León XIV publica la primera encíclica dedicada a la inteligencia artificial, en la que fija la dignidad humana como criterio para todo ...