Kuaishou Technology ha presentado Kling AI 3.0, que incluye cuatro nuevos modelos de generación de vídeo e imagen con mejoras significativas en consistencia visual, duración extendida y capacidades de audio nativas en múltiples idiomas y acentos.
La nueva serie incluye cuatro modelos: Video 3.0, Video 3.0 Omni, Image 3.0 e Image 3.0 Omni, que representan un avance significativo en control narrativo y coherencia visual.
Video 3.0 incorpora generación de audio nativa en inglés, chino, japonés, coreano, español y diversos acentos y dialectos. Esto permite crear escenas con diálogos complejos entre múltiples personajes, cada uno hablando un idioma diferente. La duración máxima de los vídeos se amplía hasta 15 segundos, suficiente para secuencias elaboradas con múltiples giros narrativos y transiciones cinematográficas.
Entre las mejoras destacadas está la consistencia de elementos visuales. Los creadores pueden cargar vídeos de referencia e imágenes múltiples para garantizar que personajes, objetos y escenarios mantengan coherencia entre fotogramas. El modelo comprende instrucciones de múltiples escenas y planos, ajustando dinámicamente ángulos de cámara según la dirección creativa.
El sistema también mejora la preservación de texto en imágenes, manteniendo señalización, subtítulos y elementos de marca con alta precisión. Esta capacidad resulta útil en publicidad para comercio electrónico, donde logotipos en ropa permanecen nítidos durante todo el vídeo.
Video 3.0 Omni amplía las capacidades de referencia permitiendo que la IA extraiga rasgos visuales y características de voz de un personaje para replicarlos en nuevas escenas. Incorpora una función de storyboard multipantalla donde los usuarios especifican duración, encuadre, perspectiva y movimientos de cámara para cada plano.
Los modelos de imagen Image 3.0 e Image 3.0 Omni admiten salida en 2K y 4K para casos de uso profesionales, preservando texturas, iluminación y cualidades de materiales con notable precisión.
Desde su lanzamiento en junio de 2024, Kling AI cuenta con más de 60 millones de creadores globalmente y ha producido más de 600 millones de vídeos. Los modelos están disponibles en acceso anticipado para suscriptores Ultra y pronto se abrirán al público general.
Herramienta de inteligencia artificial que genera videos e imágenes a partir de texto y referencias visuales. Incluye audio multiidioma, control de consistencia visual y capacidades de storyboard ...
02/03/2026
El fabricante de Claude rechaza eliminar dos restricciones de uso de su IA para el ejército, en un conflicto que llevó a Trump a ordenar su cese en ...
25/02/2026
Perplexity presenta Computer, un agente de IA capaz de crear y ejecutar flujos de trabajo completos durante horas o meses, coordinando de forma ...
23/02/2026
Anthropic ha identificado campañas a gran escala de DeepSeek, Moonshot y MiniMax para extraer de forma fraudulenta las capacidades de su modelo ...
21/02/2026
El AI Impact Summit 2026 concluye con un acuerdo voluntario suscrito por 88 países que fija las bases para una cooperación internacional en torno ...