Google ha anunciat Veo 3.1, nova versió del seu model de generació de vídeo, juntament amb capacitats avançades d'edició i àudio per a Flow, la seva eina de creació audiovisual que ha generat més de 275 milions de vídeos.
Google ha presentat Veo 3.1, la nova versió del seu model de generació de vídeo que, segons l'empresa, representa l'estat de l'art actual en aquest camp. El model aporta tres millores principals respecte al seu predecessor Veo 3: àudio més ric, major control narratiu i un realisme millorat en la captura de textures. Veo 3.1 també millora l'adherència a les instruccions i la qualitat audiovisual en la conversió d'imatges a vídeo.
Les capacitats de Veo 3.1 s'implementen a Flow, l'eina de creació audiovisual de Google que permet generar vídeos mitjançant intel·ligència artificial. Des del seu llançament fa cinc mesos, la plataforma ha generat més de 275 milions de vídeos. Les actualitzacions responen a les peticions dels usuaris de major control artístic i suport d'àudio en totes les funcionalitats.
Flow incorpora ara les millores en dues direccions. D'una banda, afegeix àudio generat a funcions existents que abans només produïen vídeo sense so. L'opció "Ingredients a vídeo" permet usar múltiples imatges de referència per controlar personatges, objectes i estil visual, generant escenes segons la visió de l'usuari. "Fotogrames a vídeo" crea transicions entre una imatge inicial i una final, produint un vídeo que connecta ambdues de forma fluida. La funció "Estendre" permet crear vídeos més llargs, de fins a un minut o més, que continuen l'acció del clip original basant-se en el seu últim segon. Aquestes tres funcionalitats, que ja existien a Flow, ara inclouen àudio enriquit generat per Veo 3.1.
D'altra banda, Flow afegeix capacitats d'edició completament noves. La funció "Inserir" permet afegir elements a qualsevol escena, des de detalls realistes fins a criatures fantàstiques, gestionant aspectes com ombres i il·luminació per integrar els elements de forma natural. Properament estarà disponible una funció per eliminar objectes o personatges de les escenes, reconstruint automàticament el fons i l'entorn perquè sembli que l'element mai va estar present.
Veo 3.1 està disponible a través de l'API de Gemini per a desenvolupadors, Vertex AI per a clients empresarials i l'aplicació Gemini. Les noves capacitats de Flow estan accessibles tant a l'API de Gemini com a Vertex AI. Google assenyala que aquestes funcions són experimentals i es troben en procés de millora contínua.
Gemini és l'assistant d'intel·ligència artificial de Google desenvolupat per DeepMind. Treballa amb text, imatges, àudio, vídeo i codi. Genera contingut, respon preguntes i es connecta amb ...
Google AI desenvolupa plataformes avançades que milloren la vida de les persones. El seu ecosistema Gemini integra models, productes i APIs, impulsant la innovació responsable i permetent als ...
09/06/2026
Anthropic presenta Claude Fable 5 i Claude Mythos 5, dues versions del seu model de major capacitat fins ara. Comparteixen la mateixa base, però un ...
25/05/2026
El papa Lleó XIV publica la primera encíclica dedicada a la intel·ligència artificial, en la qual fixa la dignitat humana com a criteri per a tot ...
19/05/2026
Rime presenta Coda, un model de text a veu per a agents conversacionals en temps real que reprodueix el ritme, les pauses i l'entonació propis d'una ...
11/05/2026
Thinking Machines Lab ha publicat una vista prèvia de recerca de TML-Interaction-Small, un model d'interacció dissenyat per col·laborar amb ...