Kling AI llança la versió 3.0 amb vídeos de 15 segons i àudio multilingüe

05/02/2026

Kuaishou Technology ha presentat Kling AI 3.0, que inclou quatre nous models de generació de vídeo i imatge amb millores significatives en consistència visual, durada estesa i capacitats d'àudio natives en múltiples idiomes i accents.

Kling AI llança la versió 3.0 amb vídeos de 15 segons i àudio multilingüe

La nova sèrie de models inclou quatre models: Video 3.0, Video 3.0 Omni, Image 3.0 i Image 3.0 Omni, que representen un avenç significatiu en control narratiu i coherència visual.

Video 3.0 incorpora generació d'àudio nativa en anglès, xinès, japonès, coreà, espanyol i diversos accents i dialectes. Això permet crear escenes de diàleg complexes entre múltiples personatges, cadascun parlant un idioma diferent. La durada màxima dels vídeos s'amplia fins a 15 segons, suficient per a seqüències elaborades amb múltiples girs narratius i transicions cinematogràfiques.

Entre les millores destacades hi ha la consistència d'elements visuals. Els creadors poden carregar vídeos de referència i múltiples imatges per garantir que personatges, objectes i escenaris mantinguin coherència entre fotogrames. El model comprèn instruccions de múltiples escenes i plans, ajustant dinàmicament angles de càmera segons la direcció creativa.

El sistema també millora la preservació de text a les imatges, mantenint senyalització, subtítols i elements de marca amb alta precisió. Aquesta capacitat resulta útil en publicitat per a comerç electrònic, on els logotips en roba romanen nítids durant tot el vídeo.

Video 3.0 Omni amplia les capacitats de referència permetent que la IA extregui trets visuals i característiques de veu d'un personatge per replicar-los en noves escenes. Incorpora una funció d'storyboard multipantalla on els usuaris especifiquen durada, enquadrament, perspectiva i moviments de càmera per a cada pla.

Els models d'imatge Image 3.0 i Image 3.0 Omni admeten sortida en 2K i 4K per a casos d'ús professionals, preservant textures, il·luminació i qualitats de materials amb notable precisió.

Des del seu llançament al juny de 2024, Kling AI compta amb més de 60 milions de creadors globalment i ha produït més de 600 milions de vídeos. Els models estan disponibles en accés anticipat per a subscriptors Ultra i aviat s'obriran al públic general.

Punts clau

  • Kling AI llança quatre nous models: Video 3.0, Video 3.0 Omni, Image 3.0 i Image 3.0 Omni
  • Els vídeos arriben fins a 15 segons amb transicions cinematogràfiques
  • Àudio natiu en anglès, xinès, japonès, coreà, espanyol i diversos accents
  • Permet diàlegs entre personatges parlant diferents idiomes
  • Millora la consistència visual amb vídeos i imatges de referència
  • Preserva text a les imatges amb alta precisió per a publicitat
  • Inclou storyboard multipantalla amb control d'enquadrament i moviments
  • Imatges en resolució 2K i 4K per a ús professional
  • Més de 60 milions de creadors i 600 milions de vídeos generats

Vídeos

Últimes noticies

Trustpilot
Aquest lloc web utilitza cookies tècniques, de personalització i anàlisi, pròpies i de tercers, per facilitar la navegació anònima i analitzar estadístiques d’ús del web. Considerem que si continueu navegant, n’accepteu l’ús.