Wan 2.6 és un model multimodal que genera vídeos i imatges a partir de descripcions textuals. La nova versió permet utilitzar personatges de vídeos de referència i crear narratives multipantalla amb sincronització audiovisual.
El model Wan 2.6 introdueix capacitats de generació de contingut multimodal que combinen vídeo, imatge i text. Entre les funcionalitats destacades es troba Starring, que permet incorporar personatges de vídeos de referència en noves escenes mantenint la consistència visual i de veu. El sistema analitza fins a 150 fotogrames de referència per preservar l'aparença i el timbre de veu dels personatges, i admet fins a tres referències simultànies per crear interaccions entre múltiples entitats.
La funció de narrativa multipantalla converteix indicacions simples en seqüències de vídeo estructurades, mantenint la coherència de personatges, escenaris i atmosfera al llarg de les diferents preses. Aquesta capacitat permet desenvolupar històries més complexes que les generacions de pla únic.
Pel que fa a la generació de vídeo, Wan 2.6 produeix clips de 15 segons en resolució 1080p amb sincronització nativa entre àudio i vídeo. El sistema genera diàlegs amb múltiples parlants, sincronització labial natural i qualitat d'àudio comparable a estudis professionals. La versió actual millora el seguiment d'instruccions, la física del moviment i el control estètic respecte a versions anteriors.
Per a la síntesi d'imatges, el model ofereix control sobre paràmetres de lent i il·luminació, amb capacitat de referenciar múltiples imatges per mantenir consistència estètica. La funció de generació de text i imatge permet crear narratives visuals estructurades que intercalen ambdós formats, utilitzant capacitats de raonament i coneixement del món real.
El model està dissenyat per a aplicacions que requereixen coherència visual i narrativa en la generació de contingut multimèdia, des de la creació d'escenes amb personatges específics fins a la producció de seqüències amb estructura narrativa completa.
Plataforma d'IA per a la creació de contingut visual mitjançant models generatius. Ofereix generació de vídeo i imatge des de text, àudio i referències visuals. Inclou eines d'edició i models ...
05/02/2026
Kuaishou Technology ha presentat Kling AI 3.0, que inclou quatre nous models de generació de vídeo i imatge amb millores significatives en ...
05/02/2026
OpenAI ha presentat Frontier, una plataforma dissenyada perquè les empreses puguin construir, desplegar i gestionar agents d'intel·ligència ...
02/02/2026
SpaceX ha adquirit xAI per crear un sistema integrat d'intel·ligència artificial i tecnologia espacial. La companyia ha anunciat centres de dades ...
30/01/2026
Anthropic ha anunciat la disponibilitat de plugins a Cowork, la seva eina d'automatització de tasques que permet a usuaris sense perfil tècnic ...