El nuevo modelo Qwen3-Max, con más de un billón de parámetros y entrenamiento en 36 billones de tokens, muestra mejoras significativas en razonamiento, programación y uso de herramientas, según evaluaciones independientes.
Alibaba ha lanzado Qwen3-Max, su modelo de lenguaje más grande hasta la fecha. Cuenta con más de un billón de parámetros y fue entrenado con un conjunto de 36 billones de tokens. Su arquitectura se basa en una mezcla de expertos, un enfoque que distribuye las tareas entre subcomponentes especializados, lo que contribuye a un entrenamiento estable y eficiente. Durante todo el proceso, la curva de aprendizaje se mantuvo uniforme, sin interrupciones ni necesidad de reiniciar o ajustar los datos.
Gracias a mejoras en la gestión del cómputo distribuido, el modelo logra un 30 % más de eficiencia en el uso de recursos que su predecesor. Además, es capaz de manejar contextos de hasta un millón de tokens, lo que le permite procesar documentos o interacciones extremadamente largas sin pérdida de rendimiento.
La variante instruccional, Qwen3-Max-Instruct, ocupa el tercer lugar en el leaderboard Text Arena de LMArena. En SWE-Bench Verified, una prueba que evalúa la capacidad para resolver problemas reales de programación extraídos de repositorios públicos, alcanza un 69,6 %, situándose entre los modelos más competentes a nivel global. En Tau2-Bench, diseñado para medir la precisión en el uso de herramientas por parte de agentes de IA, obtiene un 74,8 %, superando a sistemas como Claude Opus 4 y DeepSeek V3.1.
Alibaba también está desarrollando Qwen3-Max-Thinking, una versión especializada en razonamiento complejo. Aunque aún está en entrenamiento, ya ha logrado resultados perfectos en pruebas matemáticas exigentes como AIME 25 y HMMT, al combinar ejecución de código y estrategias avanzadas de inferencia. La compañía planea lanzar esta variante de forma pública en los próximos meses.
Qwen3-Max-Instruct ya está disponible en la plataforma Qwen Chat y a través de la API en Alibaba Cloud. Su compatibilidad con el formato de la API de OpenAI facilita su integración en aplicaciones existentes. Para acceder, los usuarios deben registrarse en Alibaba Cloud, activar el servicio Model Studio y generar una clave de API. El lanzamiento refuerza la apuesta de Alibaba por ofrecer infraestructura de inteligencia artificial escalable y abierta a desarrolladores e investigadores.
Conjunto de modelos de IA que integra procesamiento de lenguaje natural, visión y audio, con algunos modelos disponibles como código abierto. Proporciona análisis y generación de contenido ...
07/11/2025
Freepik avanza en su estrategia de IA presentando Spaces, una herramienta que integra sus funciones de inteligencia artificial en un entorno de ...
29/10/2025
Google ha actualizado NotebookLM ampliando significativamente su capacidad para procesar colecciones extensas de documentos y añadiendo opciones de ...
26/10/2025
Google ha incorporado una nueva funcionalidad en AI Studio que permite generar aplicaciones con inteligencia artificial mediante descripciones en ...
24/10/2025
Mistral AI presenta AI Studio, una plataforma que ayuda a las empresas a pasar de la experimentación a la operación fiable de sistemas de ...