El nuevo modelo Qwen3-Max, con más de un billón de parámetros y entrenamiento en 36 billones de tokens, muestra mejoras significativas en razonamiento, programación y uso de herramientas, según evaluaciones independientes.
Alibaba ha lanzado Qwen3-Max, su modelo de lenguaje más grande hasta la fecha. Cuenta con más de un billón de parámetros y fue entrenado con un conjunto de 36 billones de tokens. Su arquitectura se basa en una mezcla de expertos, un enfoque que distribuye las tareas entre subcomponentes especializados, lo que contribuye a un entrenamiento estable y eficiente. Durante todo el proceso, la curva de aprendizaje se mantuvo uniforme, sin interrupciones ni necesidad de reiniciar o ajustar los datos.
Gracias a mejoras en la gestión del cómputo distribuido, el modelo logra un 30 % más de eficiencia en el uso de recursos que su predecesor. Además, es capaz de manejar contextos de hasta un millón de tokens, lo que le permite procesar documentos o interacciones extremadamente largas sin pérdida de rendimiento.
La variante instruccional, Qwen3-Max-Instruct, ocupa el tercer lugar en el leaderboard Text Arena de LMArena. En SWE-Bench Verified, una prueba que evalúa la capacidad para resolver problemas reales de programación extraídos de repositorios públicos, alcanza un 69,6 %, situándose entre los modelos más competentes a nivel global. En Tau2-Bench, diseñado para medir la precisión en el uso de herramientas por parte de agentes de IA, obtiene un 74,8 %, superando a sistemas como Claude Opus 4 y DeepSeek V3.1.
Alibaba también está desarrollando Qwen3-Max-Thinking, una versión especializada en razonamiento complejo. Aunque aún está en entrenamiento, ya ha logrado resultados perfectos en pruebas matemáticas exigentes como AIME 25 y HMMT, al combinar ejecución de código y estrategias avanzadas de inferencia. La compañía planea lanzar esta variante de forma pública en los próximos meses.
Qwen3-Max-Instruct ya está disponible en la plataforma Qwen Chat y a través de la API en Alibaba Cloud. Su compatibilidad con el formato de la API de OpenAI facilita su integración en aplicaciones existentes. Para acceder, los usuarios deben registrarse en Alibaba Cloud, activar el servicio Model Studio y generar una clave de API. El lanzamiento refuerza la apuesta de Alibaba por ofrecer infraestructura de inteligencia artificial escalable y abierta a desarrolladores e investigadores.
Conjunto de modelos de IA que integra procesamiento de lenguaje natural, visión y audio, con algunos modelos disponibles como código abierto. Proporciona análisis y generación de contenido ...
17/02/2026
Meta y NVIDIA han anunciado una asociación estratégica de varios años para el despliegue masivo de chips y redes en los centros de datos de Meta, ...
11/02/2026
Zoë Hitzig, que trabajó dos años en OpenAI ayudando a dar forma a modelos de IA y políticas de seguridad, ha dimitido tras el anuncio de la ...
05/02/2026
Kuaishou Technology ha presentado Kling AI 3.0, que incluye cuatro nuevos modelos de generación de vídeo e imagen con mejoras significativas en ...
05/02/2026
OpenAI ha presentado Frontier, una plataforma diseñada para que las empresas puedan construir, desplegar y gestionar agentes de inteligencia ...