Google presenta Gemini 3 con capacidades avanzadas de razonamiento multimodal

18/11/2025

Google DeepMind ha lanzado Gemini 3 Pro, su modelo de inteligencia artificial más avanzado hasta la fecha. El sistema lidera las clasificaciones de rendimiento y obtiene resultados destacados en pruebas de razonamiento científico y comprensión visual.

Google presenta Gemini 3 con capacidades avanzadas de razonamiento multimodal

Google DeepMind ha anunciado el lanzamiento de Gemini 3, presentando inicialmente Gemini 3 Pro en versión preliminar. El modelo está disponible desde hoy en la aplicación Gemini, en el buscador de Google para suscriptores de pago, y en herramientas de desarrollo como AI Studio y Vertex AI. La compañía también ha introducido Gemini 3 Deep Think, un modo que amplía las capacidades de razonamiento del modelo y que se encuentra actualmente en evaluación antes de su lanzamiento público.

Gemini 3 Pro supera a su predecesor, la versión 2.5 Pro, en todas las métricas principales de evaluación. En clasificaciones donde los usuarios comparan modelos sin conocer su identidad, Gemini 3 alcanzó la primera posición con 1.501 puntos. El modelo demostró capacidad para resolver problemas de nivel doctoral en ciencias, alcanzando un 91,9% de acierto en un conjunto de preguntas científicas complejas y estableciendo nuevos récords en resolución de problemas matemáticos avanzados.

Una de las principales mejoras de Gemini 3 reside en su capacidad para procesar simultáneamente diferentes tipos de información. El modelo puede analizar texto, imágenes, vídeos, audio y código de programación dentro de la misma consulta, manteniendo coherencia en sus respuestas. En pruebas que evalúan esta capacidad de comprensión visual y de vídeo, el sistema obtuvo resultados superiores al 80%. Google destaca que Gemini 3 puede trabajar con contextos extensos de hasta un millón de elementos de información, lo que permite analizar documentos largos, vídeos completos o grandes volúmenes de código.

Para desarrolladores, Gemini 3 introduce mejoras significativas en la generación de código y en su capacidad para funcionar como asistente autónomo. El modelo lidera las clasificaciones de desarrollo web y supera ampliamente a la versión anterior en pruebas que miden la capacidad de los sistemas para corregir errores en código existente. Google ha lanzado también Antigravity, una plataforma donde agentes basados en Gemini 3 pueden planificar y ejecutar tareas de programación complejas de forma autónoma, accediendo directamente al editor de código, la terminal y el navegador.

Más allá del desarrollo de software, Google enfatiza que Gemini 3 puede mantener la coherencia en tareas que requieren múltiples pasos a lo largo del tiempo. En simulaciones que evalúan la planificación a largo plazo, el modelo demostró capacidad para tomar decisiones consistentes durante periodos prolongados sin desviarse de los objetivos establecidos. Esta característica se aplicará en la aplicación Gemini para permitir que el sistema ejecute tareas cotidianas como organizar correos electrónicos o reservar servicios, siempre bajo supervisión del usuario.

Según Google DeepMind, Gemini 3 ha completado el proceso de evaluación de seguridad más exhaustivo aplicado a cualquiera de sus modelos. El sistema muestra reducción en tendencias a proporcionar respuestas excesivamente complacientes, mayor resistencia ante intentos de manipulación mediante instrucciones maliciosas, y mejor protección contra usos indebidos. La compañía colaboró con organismos reguladores del Reino Unido y empresas especializadas en seguridad para realizar evaluaciones independientes antes del lanzamiento.

Puntos clave

  • Gemini 3 Pro alcanza la primera posición en clasificaciones de rendimiento con 1.501 puntos
  • Logra un 91,9% de acierto en problemas científicos de nivel doctoral
  • Procesa simultáneamente texto, imágenes, vídeos, audio y código manteniendo coherencia
  • Lidera las clasificaciones de desarrollo web y corrección de errores de código
  • Google lanza Antigravity, plataforma para agentes autónomos de programación
  • El modo Deep Think amplía capacidades de razonamiento y está en fase de evaluación
  • Disponible en la aplicación Gemini, buscador de Google y herramientas de desarrollo
  • Ha completado el proceso de evaluación de seguridad más exhaustivo de Google

Vídeos

IA relacionada

Gemini

Asistente de IA multimodal de Google

Gemini es el asistente de inteligencia artificial de Google desarrollado por DeepMind. Trabaja con texto, imágenes, audio, video y código. Genera contenido, responde preguntas y se conecta con ...

Últimas noticias

Trustpilot
Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso.