Google presenta su nuevo modelo Gemini 2.5 Flash Image, que permite generar y editar imágenes mediante comandos de texto. La herramienta incluye funciones de fusión de imágenes múltiples y consistencia de personajes.
Google ha confirmado que el misterioso modelo "nano-banana" es en realidad su nuevo sistema Gemini 2.5 Flash Image, diseñado para la generación y edición de imágenes mediante inteligencia artificial. El sistema permite a los usuarios crear y modificar contenido visual utilizando instrucciones en lenguaje natural, una capacidad que amplía las posibilidades del modelo Gemini 2.0 Flash presentado anteriormente.
Entre las características principales del nuevo modelo se encuentra la capacidad de mantener la consistencia visual de personajes u objetos a través de múltiples imágenes. Esta función resulta útil para desarrolladores que necesitan crear contenido coherente, como materiales promocionales de productos o narrativas visuales que requieren personajes reconocibles en diferentes escenarios.
El sistema incorpora también funciones de edición localizada que permiten realizar modificaciones específicas en partes concretas de una imagen. Los usuarios pueden eliminar elementos no deseados, cambiar poses de sujetos, aplicar efectos de desenfoque selectivo o añadir color a fotografías en blanco y negro mediante comandos de texto simples.
Una característica destacable es la capacidad de fusionar múltiples imágenes de entrada en una sola composición. Esta función permite combinar objetos de diferentes fotografías, aplicar esquemas de color específicos a espacios interiores o crear escenas fotorrealistas que integren elementos procedentes de varias fuentes visuales.
El modelo utiliza el conocimiento general de Gemini para interpretar contextos del mundo real, lo que permite generar imágenes con mayor precisión semántica. Esta integración facilita la creación de contenido educativo interactivo y la comprensión de diagramas dibujados a mano.
Gemini 2.5 Flash Image está disponible a través de la API de Gemini, Google AI Studio y Vertex AI para empresas. El precio establecido es de 30 dólares por millón de tokens de salida, con cada imagen equivalente a 1.290 tokens, lo que representa un coste de 0,039 dólares por imagen generada.
Google ha desarrollado varias aplicaciones de demostración que muestran las capacidades del modelo, incluyendo editores de fotos, herramientas de diseño de interiores y sistemas de dibujo colaborativo. Estas aplicaciones están disponibles como plantillas personalizables en Google AI Studio.
Todas las imágenes creadas o editadas con este modelo incluyen una marca de agua digital invisible SynthID, que permite identificar el contenido generado o modificado por inteligencia artificial. La compañía ha establecido colaboraciones con plataformas como OpenRouter.ai y fal.ai para ampliar el acceso de desarrolladores al nuevo modelo.
Puntos clave:
Gemini es el asistente de inteligencia artificial de Google desarrollado por DeepMind. Trabaja con texto, imágenes, audio, video y código. Genera contenido, responde preguntas y se conecta con ...
Google AI desarrolla plataformas avanzadas que mejoran la vida de las personas. Su ecosistema Gemini integra modelos, productos y APIs, impulsando la innovación responsable y permitiendo a ...
05/02/2026
Kuaishou Technology ha presentado Kling AI 3.0, que incluye cuatro nuevos modelos de generación de vídeo e imagen con mejoras significativas en ...
02/02/2026
SpaceX ha adquirido xAI para crear un sistema integrado de inteligencia artificial y tecnología espacial. La compañía ha anunciado centros de ...
29/01/2026
Project Genie, el nuevo prototipo de Google DeepMind, permite crear, explorar y modificar mundos interactivos mediante IA. Los usuarios pueden ...
22/01/2026
Anthropic ha hecho pública la constitución actualizada de Claude, el documento que define los valores y comportamientos de su modelo de ...