Gemini 3

Google dévoile Gemini 3, son modèle d’intelligence artificielle le plus puissant. Avec un score de 1501 Elo sur LMArena, le géant de Mountain View ravit la première place à OpenAI. Une montée en puissance qui redessine la carte de l’IA générative.

Gemini 3 domine les classements internationaux

Gemini 3 Pro surpasse désormais tous les modèles concurrents sur les principaux benchmarks d’IA. Le système atteint 91,9 % sur GPQA Diamond et 37,5 % au « Humanity’s Last Exam », des résultats qui témoignent d’un raisonnement de niveau doctoral. Par ailleurs, il établit un nouveau record en mathématiques avec 23,4 % sur MathArena Apex. Ces performances marquent un tournant dans la compétition entre Google et OpenAI.

Le multimodal constitue l’autre force de Gemini 3. Le modèle traite simultanément texte, images, vidéos, audio et code grâce à une fenêtre contextuelle d’un million de tokens. En outre, ses capacités de raisonnement visuel impressionnent avec 81 % sur MMMU-Pro et 87,6 % sur Video-MMMU. Google mise ainsi sur une compréhension globale qui dépasse la simple analyse textuelle.

Gemini 3 Deep Think prolonge cette excellence en mode raisonnement approfondi. Ce mode spécifique grimpe à 41 % sur « Humanity’s Last Exam » et atteint même 93,8 % sur GPQA Diamond. Néanmoins, Google le réserve pour l’instant aux testeurs de sécurité avant un déploiement auprès des abonnés Google AI Ultra dans les semaines à venir.

Antigravity transforme l’expérience développeur

Google lance parallèlement Antigravity, sa plateforme de développement agentique propulsée par Gemini 3. Cette solution transforme le rôle des développeurs en architectes de projets. Désormais, les agents IA planifient et exécutent de manière autonome des tâches logicielles complexes, tout en validant leur propre code. Le développeur supervise plusieurs IA travaillant simultanément via un gestionnaire d’agents dédié.

Les résultats techniques sur WebDev Arena confirment cette ambition. Gemini 3 Pro culmine à 1487 Elo et obtient 54,2 % sur Terminal-Bench 2.0, qui évalue la capacité à piloter un ordinateur via terminal. D’ailleurs, sur SWE-bench Verified, il dépasse largement Gemini 2.5 Pro avec 76,2 %. Ces chiffres valident l’approche du « vibe coding », où une simple instruction en langage naturel génère des applications complètes.

L’écosystème s’enrichit rapidement puisque Cursor, GitHub, JetBrains, Manus et Replit intègrent déjà Gemini 3 Pro. Joe Binder, vice-président produit chez GitHub, rapporte une précision supérieure de 35 % dans les tests sur VS Code. Chez JetBrains, Vladislav Tankov constate une amélioration de plus de 50 % dans la résolution de tâches de référence. Cette adoption massive valide la pertinence de la proposition de Google.

Un déploiement immédiat et des capacités agentiques

Google accélère le déploiement de Gemini 3 Pro à travers son écosystème. Le modèle s’intègre dès aujourd’hui dans l’application Gemini, Google AI Studio, Vertex AI et Antigravity. Ensuite, il alimente le mode IA dans Google Search pour offrir des expériences dynamiques et immersives. Les abonnés Google AI Pro et Ultra bénéficient de limites d’utilisation étendues et d’un accès prioritaire aux nouvelles fonctionnalités.

Les capacités agentiques représentent une autre avancée majeure de cette version. Gemini 3 Pro excelle en planification à long terme sur Vending-Bench 2, maintenant des décisions cohérentes sur une année complète d’opération simulée. En conséquence, l’assistant peut gérer des processus complexes comme la réservation de services ou l’organisation d’une boîte de réception Gmail. Les abonnés Google AI Ultra peuvent tester dès maintenant Gemini Agent dans l’application mobile.

Antigravity est disponible gratuitement en prévisualisation publique sur macOS, Windows et Linux. Le service propose également Claude Sonnet 4.5 d’Anthropic et GPT-OSS d’OpenAI pour diversifier les options. Cependant, Google recommande l’usage d’environnements isolés face aux limitations de sécurité connues, notamment les risques d’exfiltration de données. Les développeurs professionnels accèdent à l’API au tarif de 2 dollars par million de tokens en entrée et 12 dollars en sortie.

Le lancement de Gemini 3 intervient huit mois seulement après Gemini 2.5 Pro et une semaine après GPT-5.1 d’OpenAI. Google affirme que Gemini 3 constitue son modèle le plus sécurisé à ce jour, ayant subi la série d’évaluations la plus complète jamais réalisée. Par ailleurs, l’entreprise a collaboré avec des experts mondiaux et obtenu des audits indépendants d’Apollo, Vaultis et Dreadnode. Cette bataille technologique entre les géants de l’IA redéfinit les standards de performance et d’innovation.

Cette montée en puissance soulève une question cruciale : Google parviendra-t-il à convertir cette supériorité technique en adoption massive face aux 800 millions d’utilisateurs hebdomadaires revendiqués par ChatGPT, surtout si Apple choisit Gemini pour la refonte de Siri en 2026 ?

Source : Google


Sur le même sujet

FAUT-IL AVOIR PEUR DE L’INTELLIGENCE ARTIFICIELLE ? – Définitions de l’IA