ByteDance presenta Seedream 4.0, un model d'intel·ligència artificial que combina generació i edició d'imatges en un sol sistema, amb velocitat millorada i compatibilitat amb diversos estils, disponible a les aplicacions de l'empresa i altres plataformes, i que entra en competència directa amb “Nano Banana” de Google.
ByteDance ha llançat oficialment Seedream 4.0, el seu model d'intel·ligència artificial de nova generació per a la creació d'imatges que integra capacitats de generació i edició en una sola arquitectura. Segons l'empresa, Seedream 4.0 competeix amb models com Gemini 2.5 Flash Image de Google, destacant per la seva major precisió en l'execució d'instruccions i rapidesa en la generació d'imatges.
El model supera significativament el seu predecessor en velocitat, sent capaç de generar imatges en resolució 2K en només 1,8 segons en mode text-a-imatge. L'arquitectura unificada permet realitzar tasques multimodals de manera eficient, combinant generació des de text i edició d'imatges existents sense necessitat de canviar d'eina.
Seedream 4.0 incorpora funcions d'edició mitjançant instruccions senzilles, facilitant la creació o modificació d'imatges amb frases breus. També ofereix versatilitat estilística, permetent transformar imatges en diversos estils artístics, incloent aquarel·la, cyberpunk i estils personalitzats.
Seedream 4.0 admet operacions d'edició complexes com l'afegiment i l'eliminació d'objectes, canvis d'atributs, transformacions d'estil i ajustos estructurals, incloent-hi l'intercanvi de rostres, donant suport a aplicacions professionals.
Està disponible a les aplicacions de ByteDance com Doubao i Jimeng AI, així com en plataformes de tercers com ComfyUI, Krea o Freepik.
Equip de recerca en intel·ligència artificial de ByteDance especialitzat en models fundacionals i AGI. Desenvolupa LLMs, models multimodals, visió per computador i processament de veu. Les seves ...
24/04/2026
DeepSeek llança en versió preliminar la seva família V4, dos models de codi obert capaços de processar fins a un milió de tokens de context i ...
23/04/2026
OpenAI llança GPT-5.5, un model dissenyat per executar tasques complexes de forma autònoma: programar, investigar, analitzar dades i operar ...
21/04/2026
OpenAI presenta ChatGPT Images 2.0, un model de generació d'imatges amb més precisió, suport multilingüe, proporcions flexibles i, per primera ...
17/04/2026
Anthropic ha llançat Claude Design, una eina que permet crear dissenys visuals, prototips interactius i presentacions mitjançant conversa amb el ...