Google ha anunciat Veo 3.1, nova versió del seu model de generació de vídeo, juntament amb capacitats avançades d'edició i àudio per a Flow, la seva eina de creació audiovisual que ha generat més de 275 milions de vídeos.
Google ha presentat Veo 3.1, la nova versió del seu model de generació de vídeo que, segons l'empresa, representa l'estat de l'art actual en aquest camp. El model aporta tres millores principals respecte al seu predecessor Veo 3: àudio més ric, major control narratiu i un realisme millorat en la captura de textures. Veo 3.1 també millora l'adherència a les instruccions i la qualitat audiovisual en la conversió d'imatges a vídeo.
Les capacitats de Veo 3.1 s'implementen a Flow, l'eina de creació audiovisual de Google que permet generar vídeos mitjançant intel·ligència artificial. Des del seu llançament fa cinc mesos, la plataforma ha generat més de 275 milions de vídeos. Les actualitzacions responen a les peticions dels usuaris de major control artístic i suport d'àudio en totes les funcionalitats.
Flow incorpora ara les millores en dues direccions. D'una banda, afegeix àudio generat a funcions existents que abans només produïen vídeo sense so. L'opció "Ingredients a vídeo" permet usar múltiples imatges de referència per controlar personatges, objectes i estil visual, generant escenes segons la visió de l'usuari. "Fotogrames a vídeo" crea transicions entre una imatge inicial i una final, produint un vídeo que connecta ambdues de forma fluida. La funció "Estendre" permet crear vídeos més llargs, de fins a un minut o més, que continuen l'acció del clip original basant-se en el seu últim segon. Aquestes tres funcionalitats, que ja existien a Flow, ara inclouen àudio enriquit generat per Veo 3.1.
D'altra banda, Flow afegeix capacitats d'edició completament noves. La funció "Inserir" permet afegir elements a qualsevol escena, des de detalls realistes fins a criatures fantàstiques, gestionant aspectes com ombres i il·luminació per integrar els elements de forma natural. Properament estarà disponible una funció per eliminar objectes o personatges de les escenes, reconstruint automàticament el fons i l'entorn perquè sembli que l'element mai va estar present.
Veo 3.1 està disponible a través de l'API de Gemini per a desenvolupadors, Vertex AI per a clients empresarials i l'aplicació Gemini. Les noves capacitats de Flow estan accessibles tant a l'API de Gemini com a Vertex AI. Google assenyala que aquestes funcions són experimentals i es troben en procés de millora contínua.
Gemini és l'assistant d'intel·ligència artificial de Google desenvolupat per DeepMind. Treballa amb text, imatges, àudio, vídeo i codi. Genera contingut, respon preguntes i es connecta amb ...
Google AI desenvolupa plataformes avançades que milloren la vida de les persones. El seu ecosistema Gemini integra models, productes i APIs, impulsant la innovació responsable i permetent als ...
07/11/2025
Freepik avança en la seva estratègia d'IA presentant Spaces, una eina que integra les seves funcions d'intel·ligència artificial en un entorn de ...
29/10/2025
Google ha actualitzat NotebookLM ampliant significativament la seva capacitat per processar col·leccions extenses de documents i afegint opcions de ...
26/10/2025
Google ha incorporat una nova funcionalitat a AI Studio que permet generar aplicacions amb intel·ligència artificial mitjançant descripcions en ...
24/10/2025
Mistral AI presenta AI Studio, una plataforma que ajuda les empreses a passar de l'experimentació a l'operació fiable de sistemes ...