Google présente Gemini 3 avec des capacités avancées de raisonnement multimodal

18/11/2025

Google DeepMind a lancé Gemini 3 Pro, son modèle d'intelligence artificielle le plus avancé à ce jour. Le système domine les classements de performance et obtient des résultats remarquables dans les tests de raisonnement scientifique et de compréhension visuelle.

Google présente Gemini 3 avec des capacités avancées de raisonnement multimodal

Google DeepMind a annoncé le lancement de Gemini 3, présentant initialement Gemini 3 Pro en version préliminaire. Le modèle est disponible dès aujourd'hui dans l'application Gemini, dans le moteur de recherche Google pour les abonnés payants, et dans les outils de développement tels que AI Studio et Vertex AI. L'entreprise a également introduit Gemini 3 Deep Think, un mode qui étend les capacités de raisonnement du modèle et qui est actuellement en phase d'évaluation avant son lancement public.

Gemini 3 Pro surpasse son prédécesseur, la version 2.5 Pro, sur toutes les principales métriques d'évaluation. Dans les classements où les utilisateurs comparent les modèles sans connaître leur identité, Gemini 3 a atteint la première place avec 1 501 points. Le modèle a démontré sa capacité à résoudre des problèmes de niveau doctoral en sciences, atteignant 91,9 % de réussite sur un ensemble de questions scientifiques complexes et établissant de nouveaux records dans la résolution de problèmes mathématiques avancés.

L'une des principales améliorations de Gemini 3 réside dans sa capacité à traiter simultanément différents types d'informations. Le modèle peut analyser du texte, des images, des vidéos, de l'audio et du code de programmation dans la même requête, tout en maintenant la cohérence de ses réponses. Dans les tests évaluant cette capacité de compréhension visuelle et vidéo, le système a obtenu des résultats supérieurs à 80 %. Google souligne que Gemini 3 peut travailler avec des contextes étendus allant jusqu'à un million d'éléments d'information, ce qui permet d'analyser de longs documents, des vidéos complètes ou de grands volumes de code.

Pour les développeurs, Gemini 3 introduit des améliorations significatives dans la génération de code et sa capacité à fonctionner comme assistant autonome. Le modèle domine les classements de développement web et surpasse largement la version précédente dans les tests mesurant la capacité des systèmes à corriger les erreurs dans le code existant. Google a également lancé Antigravity, une plateforme où des agents basés sur Gemini 3 peuvent planifier et exécuter de manière autonome des tâches de programmation complexes, en accédant directement à l'éditeur de code, au terminal et au navigateur.

Au-delà du développement logiciel, Google souligne que Gemini 3 peut maintenir la cohérence dans les tâches nécessitant plusieurs étapes dans le temps. Dans des simulations évaluant la planification à long terme, le modèle a démontré sa capacité à prendre des décisions cohérentes sur des périodes prolongées sans s'écarter des objectifs établis. Cette caractéristique sera appliquée dans l'application Gemini pour permettre au système d'exécuter des tâches quotidiennes telles que l'organisation des e-mails ou la réservation de services, toujours sous la supervision de l'utilisateur.

Selon Google DeepMind, Gemini 3 a complété le processus d'évaluation de sécurité le plus complet jamais appliqué à l'un de ses modèles. Le système montre une réduction des tendances à fournir des réponses excessivement complaisantes, une plus grande résistance aux tentatives de manipulation par des instructions malveillantes, et une meilleure protection contre les usages abusifs. L'entreprise a collaboré avec des organismes de régulation britanniques et des sociétés spécialisées en sécurité pour réaliser des évaluations indépendantes avant le lancement.

Points clés

  • Gemini 3 Pro atteint la première place des classements de performance avec 1 501 points
  • Obtient 91,9 % de réussite sur des problèmes scientifiques de niveau doctoral
  • Traite simultanément texte, images, vidéos, audio et code en maintenant la cohérence
  • Domine les classements de développement web et de correction d'erreurs de code
  • Google lance Antigravity, plateforme pour agents autonomes de programmation
  • Le mode Deep Think étend les capacités de raisonnement et est en phase d'évaluation
  • Disponible dans l'application Gemini, la recherche Google et les outils de développement
  • A complété le processus d'évaluation de sécurité le plus complet de Google

Vidéos

IA connexe

Gemini

Assistant IA multimodal de Google

Gemini est l'assistant d'intelligence artificielle de Google développé par DeepMind. Travaille avec texte, images, audio, vidéo et code. Génère du contenu, répond aux questions et se connecte ...

Dernières nouvelles

Trustpilot
Ce site utilise des cookies techniques, de personnalisation et d’analyse, propres et tiers, pour faciliter la navigation anonyme et analyser les statistiques d’utilisation du site. Nous considérons que si vous continuez à naviguer, vous acceptez leur utilisation.