Wan 2.6 incorpora generació de vídeo amb personatges de referència i àudio sincronitzat

16/12/2025

Wan 2.6 és un model multimodal que genera vídeos i imatges a partir de descripcions textuals. La nova versió permet utilitzar personatges de vídeos de referència i crear narratives multipantalla amb sincronització audiovisual.

Wan 2.6 incorpora generació de vídeo amb personatges de referència i àudio sincronitzat

El model Wan 2.6 introdueix capacitats de generació de contingut multimodal que combinen vídeo, imatge i text. Entre les funcionalitats destacades es troba Starring, que permet incorporar personatges de vídeos de referència en noves escenes mantenint la consistència visual i de veu. El sistema analitza fins a 150 fotogrames de referència per preservar l'aparença i el timbre de veu dels personatges, i admet fins a tres referències simultànies per crear interaccions entre múltiples entitats.

La funció de narrativa multipantalla converteix indicacions simples en seqüències de vídeo estructurades, mantenint la coherència de personatges, escenaris i atmosfera al llarg de les diferents preses. Aquesta capacitat permet desenvolupar històries més complexes que les generacions de pla únic.

Pel que fa a la generació de vídeo, Wan 2.6 produeix clips de 15 segons en resolució 1080p amb sincronització nativa entre àudio i vídeo. El sistema genera diàlegs amb múltiples parlants, sincronització labial natural i qualitat d'àudio comparable a estudis professionals. La versió actual millora el seguiment d'instruccions, la física del moviment i el control estètic respecte a versions anteriors.

Per a la síntesi d'imatges, el model ofereix control sobre paràmetres de lent i il·luminació, amb capacitat de referenciar múltiples imatges per mantenir consistència estètica. La funció de generació de text i imatge permet crear narratives visuals estructurades que intercalen ambdós formats, utilitzant capacitats de raonament i coneixement del món real.

El model està dissenyat per a aplicacions que requereixen coherència visual i narrativa en la generació de contingut multimèdia, des de la creació d'escenes amb personatges específics fins a la producció de seqüències amb estructura narrativa completa.

Punts clau

  • Wan 2.6 permet incorporar personatges de vídeos de referència en noves escenes mantenint aparença i veu
  • El sistema analitza fins a 150 fotogrames de referència per preservar la consistència visual
  • Admet fins a tres referències simultànies per crear interaccions entre múltiples personatges
  • Genera vídeos de 15 segons en resolució 1080p amb sincronització entre àudio i vídeo
  • Inclou diàlegs amb múltiples parlants i sincronització labial natural
  • La narrativa multipantalla converteix indicacions simples en seqüències estructurades
  • Ofereix control sobre paràmetres de lent i il·luminació en la síntesi d'imatges
  • Permet crear narratives visuals que intercalen text i imatge de forma coherent

Vídeos

IA relacionada

Wan

Generació multimodal de vídeo i imatge

Plataforma d'IA per a la creació de contingut visual mitjançant models generatius. Ofereix generació de vídeo i imatge des de text, àudio i referències visuals. Inclou eines d'edició i models ...

Últimes noticies

Trustpilot
Aquest lloc web utilitza cookies tècniques, de personalització i anàlisi, pròpies i de tercers, per facilitar la navegació anònima i analitzar estadístiques d’ús del web. Considerem que si continueu navegant, n’accepteu l’ús.