Microsoft AI ha anunciat MAI-Image-1, el seu primer model de generació d'imatges desenvolupat internament, que se situa entre els deu primers models de text a imatge al rànquing LMArena.
Microsoft AI ha presentat MAI-Image-1, el primer model de generació d'imatges creat completament pels seus equips interns. El model ha assolit una posició entre els deu primers a LMArena, plataforma que classifica models de conversió de text a imatge.
El desenvolupament de MAI-Image-1 forma part de l'estratègia de Microsoft AI de crear models especialitzats per a funcions específiques. La companyia havia anunciat a l'agost els seus dos primers models interns, i aquest nou llançament representa la continuació d'aquesta línia de treball orientada a integrar capacitats de generació visual en els seus productes.
L'entrenament del model s'ha centrat en la selecció de dades i en avaluacions basades en casos d'ús creatius reals, incorporant retroalimentació de professionals del sector creatiu. Microsoft AI ha prioritzat evitar resultats repetitius o amb estils genèrics en les imatges generades.
MAI-Image-1 mostra capacitats destacades en la generació d'imatges fotorealistes, incloent el tractament d'il·luminació amb elements com llum reflectida i reflexos, així com en la representació de paisatges. El model combina velocitat de processament amb qualitat de resultat, la qual cosa permet als usuaris visualitzar les seves idees, iterar sobre elles i transferir el treball a altres eines per continuar el procés creatiu.
Microsoft AI desenvolupa models i productes d'intel·ligència artificial amb èmfasi en responsabilitat, accessibilitat i utilitat pràctica. El seu treball abasta models fundacionals, generació de ...
09/06/2026
Anthropic presenta Claude Fable 5 i Claude Mythos 5, dues versions del seu model de major capacitat fins ara. Comparteixen la mateixa base, però un ...
25/05/2026
El papa Lleó XIV publica la primera encíclica dedicada a la intel·ligència artificial, en la qual fixa la dignitat humana com a criteri per a tot ...
19/05/2026
Rime presenta Coda, un model de text a veu per a agents conversacionals en temps real que reprodueix el ritme, les pauses i l'entonació propis d'una ...
11/05/2026
Thinking Machines Lab ha publicat una vista prèvia de recerca de TML-Interaction-Small, un model d'interacció dissenyat per col·laborar amb ...