Google ha presentat Veo i Imagen 3, dos dels seus models més avançats per a la creació de vídeos d'alta definició i imatges realistes mitjançant intel·ligència artificial. Aquestes eines estan dissenyades per impulsar el procés creatiu dels usuaris, amb noves funcions optimitzades per millorar la qualitat visual.
Google continua avançant en la innovació de mitjans generatius amb el llançament de Veo i Imagen 3, models dissenyats per donar suport als creadors. Veo, el model més avançat per generar vídeos en alta definició, i Imagen 3, el seu model de text a imatge més precís, permeten una nova manera de crear contingut visual d'alta qualitat.
Veo: El model de generació de vídeo més avançat
Veo és capaç de generar vídeos en resolució 1080p, representant fidelment una àmplia gamma d'estils visuals i cinematogràfics. Amb una comprensió avançada del llenguatge natural, Veo pot captar el to exacte d'un prompt i generar vídeos que mantinguin la coherència en preses llargues, on persones, animals i objectes es mouen de manera realista.
Aquest model ofereix un nivell de control creatiu sense precedents, interpretant termes cinematogràfics com "timelapse" o "preses aèries", i creant contingut que flueix de manera natural. Veo es basa en anys de recerca en models generatius de vídeo, incloent treballs previs com Generative Query Network (GQN) i Imagen-Video.
Imagen 3: El model de text a imatge de major qualitat
Imagen 3 és el model més avançat de Google per a la generació d’imatges a partir de text. La seva capacitat per produir imatges fotorealistes amb un alt nivell de detall, i amb menys artefactes visuals, el converteix en l'opció ideal per als creadors. Imagen 3 comprèn millor els prompts llargs i els tradueix en imatges que capturen els petits detalls, aconseguint un nivell de precisió sense precedents.
A més, aquest model és especialment efectiu per a la creació de text dins d’imatges, un desafiament per a altres sistemes de generació. Això obre noves oportunitats per crear contingut personalitzat, des de missatges fins a presentacions.
Google posa a disposició dels creadors Veo i Imagen 3 en versió preliminar, amb la previsió d’integrar aquestes capacitats en plataformes com YouTube Shorts en un futur proper.
Gemini és l'assistant d'intel·ligència artificial de Google desenvolupat per DeepMind. Treballa amb text, imatges, àudio, vídeo i codi. Genera contingut, respon preguntes i es connecta amb ...
Google AI desenvolupa plataformes avançades que milloren la vida de les persones. El seu ecosistema Gemini integra models, productes i APIs, impulsant la innovació responsable i permetent als ...
15/01/2026
Replit ha llançat Mobile Apps on Replit, una funcionalitat que permet descriure una idea, crear l'aplicació i publicar-la completament a l'App ...
14/01/2026
Google ha presentat Personal Intelligence, una funció que permet a Gemini accedir a informació d'aplicacions com Gmail, Google Photos i YouTube per ...
07/01/2026
OpenAI ha presentat ChatGPT Health, una experiència dedicada que permet als usuaris connectar els seus historials mèdics i aplicacions de benestar ...
05/01/2026
Amazon presenta Alexa.com, una nova plataforma que porta el seu assistent d'intel·ligència artificial Alexa+ al navegador web i completa la seva ...