Google llança Veo i Imagen 3, els seus nous models per a la creació de contingut visual

14/05/2024

Google ha presentat Veo i Imagen 3, dos dels seus models més avançats per a la creació de vídeos d'alta definició i imatges realistes mitjançant intel·ligència artificial. Aquestes eines estan dissenyades per impulsar el procés creatiu dels usuaris, amb noves funcions optimitzades per millorar la qualitat visual.

Google llança Veo i Imagen 3, els seus nous models per a la creació de contingut visual

Google continua avançant en la innovació de mitjans generatius amb el llançament de Veo i Imagen 3, models dissenyats per donar suport als creadors. Veo, el model més avançat per generar vídeos en alta definició, i Imagen 3, el seu model de text a imatge més precís, permeten una nova manera de crear contingut visual d'alta qualitat.

Veo: El model de generació de vídeo més avançat
Veo és capaç de generar vídeos en resolució 1080p, representant fidelment una àmplia gamma d'estils visuals i cinematogràfics. Amb una comprensió avançada del llenguatge natural, Veo pot captar el to exacte d'un prompt i generar vídeos que mantinguin la coherència en preses llargues, on persones, animals i objectes es mouen de manera realista.

Aquest model ofereix un nivell de control creatiu sense precedents, interpretant termes cinematogràfics com "timelapse" o "preses aèries", i creant contingut que flueix de manera natural. Veo es basa en anys de recerca en models generatius de vídeo, incloent treballs previs com Generative Query Network (GQN) i Imagen-Video.

Imagen 3: El model de text a imatge de major qualitat
Imagen 3 és el model més avançat de Google per a la generació d’imatges a partir de text. La seva capacitat per produir imatges fotorealistes amb un alt nivell de detall, i amb menys artefactes visuals, el converteix en l'opció ideal per als creadors. Imagen 3 comprèn millor els prompts llargs i els tradueix en imatges que capturen els petits detalls, aconseguint un nivell de precisió sense precedents.

A més, aquest model és especialment efectiu per a la creació de text dins d’imatges, un desafiament per a altres sistemes de generació. Això obre noves oportunitats per crear contingut personalitzat, des de missatges fins a presentacions.

Google posa a disposició dels creadors Veo i Imagen 3 en versió preliminar, amb la previsió d’integrar aquestes capacitats en plataformes com YouTube Shorts en un futur proper.

Vídeos

IA relacionada

Gemini

Assistant d'IA multimodal de Google

Gemini és l'assistant d'intel·ligència artificial de Google desenvolupat per DeepMind. Treballa amb text, imatges, àudio, vídeo i codi. Genera contingut, respon preguntes i es connecta amb ...

Google AI

Innovació responsable en IA per a tothom

Google AI desenvolupa plataformes avançades que milloren la vida de les persones. El seu ecosistema Gemini integra models, productes i APIs, impulsant la innovació responsable i permetent als ...

Últimes noticies

Trustpilot
Aquest lloc web utilitza cookies tècniques, de personalització i anàlisi, pròpies i de tercers, per facilitar la navegació anònima i analitzar estadístiques d’ús del web. Considerem que si continueu navegant, n’accepteu l’ús.