Project Genie, el nou prototip de Google DeepMind, permet crear, explorar i modificar mons interactius mitjançant IA. Els usuaris poden dissenyar entorns virtuals i recórrer-los com si fossin videojocs.
Project Genie és un prototip de recerca que Google DeepMind ha començat a distribuir entre els subscriptors de Google AI Ultra als Estats Units. L'eina permet crear entorns navegables utilitzant descripcions de text i imatges, que després es poden explorar en temps real.
La tecnologia que impulsa aquest prototip és Genie 3, un model de món que simula la dinàmica d'un entorn i prediu com evolucionen els elements segons les accions de l'usuari. A diferència de les experiències en 3D estàtiques, Genie 3 genera el camí per endavant en temps real mentre l'usuari es mou i interactua. El model simula física i interaccions per crear mons dinàmics i permet la simulació de diversos escenaris, des de robòtica fins a ficció o exploració d'ubicacions històriques.
El funcionament de Project Genie es basa en tres capacitats. La primera és l'esbós de mons, que permet crear un entorn mitjançant text i imatges. Els usuaris defineixen el seu personatge, el món i com explorar-lo, ja sigui caminant, volant o conduint. S'ha integrat Nano Banana Pro per previsualitzar el món i ajustar la imatge abans d'entrar-hi, a més de definir la perspectiva del personatge.
La segona funcionalitat és l'exploració del món. Un cop creat, l'entorn es converteix en un espai navegable on Project Genie genera el camí en temps real segons les accions de l'usuari, amb possibilitat d'ajustar la càmera durant el recorregut.
La tercera capacitat és la remescla de mons. Els usuaris poden modificar mons existents per crear noves versions o explorar mons de la galeria. Un cop acabada l'exploració, és possible descarregar vídeos dels mons creats.
Com a prototip experimental, Project Genie presenta limitacions. Els mons generats poden no semblar completament realistes o no adherir-se a les indicacions o física del món real. Els personatges poden ser menys controlables i les generacions estan limitades a 60 segons.
L'accés ha començat a desplegar-se per a subscriptors de Google AI Ultra als Estats Units majors de 18 anys, amb plans d'expandir-se a més territoris properament.
Gemini és l'assistant d'intel·ligència artificial de Google desenvolupat per DeepMind. Treballa amb text, imatges, àudio, vídeo i codi. Genera contingut, respon preguntes i es connecta amb ...
Google AI desenvolupa plataformes avançades que milloren la vida de les persones. El seu ecosistema Gemini integra models, productes i APIs, impulsant la innovació responsable i permetent als ...
09/06/2026
Anthropic presenta Claude Fable 5 i Claude Mythos 5, dues versions del seu model de major capacitat fins ara. Comparteixen la mateixa base, però un ...
25/05/2026
El papa Lleó XIV publica la primera encíclica dedicada a la intel·ligència artificial, en la qual fixa la dignitat humana com a criteri per a tot ...
19/05/2026
Rime presenta Coda, un model de text a veu per a agents conversacionals en temps real que reprodueix el ritme, les pauses i l'entonació propis d'una ...
11/05/2026
Thinking Machines Lab ha publicat una vista prèvia de recerca de TML-Interaction-Small, un model d'interacció dissenyat per col·laborar amb ...