Gemini 3 débarque en pleine nuit : surpasse GPT-5.1, l'ère des grands modèles de Google est arrivée

2025.11.19

Partager vers

TechFlow SélectionTechFlow Sélection

Gemini 3 débarque en pleine nuit : surpasse GPT-5.1, l'ère des grands modèles de Google est arrivée

Google le définit comme « une étape importante vers l'AGI », soulignant qu'il s'agit actuellement de l'agent intelligent possédant la meilleure capacité mondiale de compréhension multimodale et d'interaction approfondie.

2025.11.19 - 01:34:21

GoogleAI

Dédié à des analyses Web3 approfondies

Alors que Gemini 3 n'est pas encore apparu, Twitter s'effondre en hommage.

Aucune sortie de modèle n'a suscité autant d'attentes que Gemini 3. Compte tenu de la fréquence habituelle de mise à jour trimestrielle de Gemini, la communauté IA attendait impatiemment Gemini 3 depuis septembre.

Aujourd'hui, un simple tweet du responsable des relations développeurs chez Google et du chef de Google AI Studio, ne contenant que le mot « Gemini », a fait exploser des mois d'anticipation accumulée, faisant immédiatement s'embraser les sujets liés sur Twitter.

Fait intéressant, à l'approche de l'annonce, Twitter a « opportunément » planté à plusieurs reprises. Bien que Cloudflare soit officiellement responsable, le timing de ces pannes est si précis qu'on pourrait presque soupçonner une manipulation secrète (chuchotement : après tout, Twitter est la principale tribune de promotion pour tous les modèles).

On ignore ce que pense Elon Musk, qui vient juste de publier Grok 4.1 ce matin, mais en tout cas, les memes inondent déjà Internet.

À l'instant, Gemini 3 vient enfin de faire son entrée officielle. Voyons maintenant quelle puissance il dévoile sous les feux des projecteurs.

Le modèle le plus intelligent

Les faits le prouvent : Google n’a pas déçu ses attentes. La sortie officielle de Gemini 3 redéfinit une fois de plus le SOTA, avec même des félicitations envoyées par Altman et Musk.

Google le qualifie d’« étape clé vers l’AGI » et souligne qu’il s’agit actuellement du système intelligent au monde disposant de la meilleure compréhension multimodale et d’une interaction la plus approfondie.

Gemini 3 ne repousse pas seulement les limites du raisonnement de base, mais cherche également à transformer l’écosystème des développeurs et l’expérience d’assistance IA grâce à la nouvelle plateforme Google Antigravity et au mode Deep Think.

Un monstre de raisonnement dominant partout

Gemini 3 Pro est présenté comme le « modèle de raisonnement le plus avancé ». Il surpasse nettement la génération précédente, Gemini 2.5 Pro, dans presque tous les tests de référence IA majeurs, tout en dominant largement des concurrents clés tels que Claude Sonnet 4.5 et GPT-5.1.

Gemini 3 Pro atteint un score record de 1501 Elo sur le classement LMArena Leaderboard, décrochant les meilleurs résultats sur Humanity’s Last Exam (37,5 % sans utilisation d’outil) et GPQA Diamond (91,9 %), démontrant ainsi une capacité de raisonnement de niveau doctorat. Il établit également une nouvelle norme pour les modèles de pointe en mathématiques, atteignant un nouveau record SOTA de 23,4 % sur MathArena Apex.

Au-delà du texte et de la logique, Gemini 3 Pro redéfinit aussi les limites du raisonnement multimodal. Il obtient respectivement 81 % et 87,6 % sur MMMU-Pro et Video-MMMU, ce qui signifie qu’il peut aisément analyser des schémas scientifiques complexes ou comprendre des flux vidéo dynamiques.

Plus remarquable encore, il atteint 72,1 % sur SimpleQA Verified, montrant d’importants progrès en exactitude factuelle — non seulement il est puissant, mais aussi fiable.

Un partenaire de réflexion qui refuse les flatteries

L’évolution de Gemini 3 Pro ne se limite pas aux performances chiffrées, mais concerne aussi la qualité de l’interaction. Il abandonne les clichés et les flatteuses banalités habituelles des IA, devenant plus intelligent, concis et direct : il vous dit ce que vous devez entendre, pas seulement ce que vous voulez entendre.

Il agit comme un véritable partenaire intellectuel, offrant de nouvelles façons de comprendre l’information et de s’exprimer, allant de la traduction de concepts scientifiques obscurs via des visualisations fidèles générées automatiquement, jusqu’à des séances de remue-méninges créatives.

Gemini 3 Deep Think

Le mode Gemini 3 Deep Think étend davantage les frontières de l’intelligence, marquant une avancée significative dans les capacités de raisonnement et de compréhension multimodale de Gemini 3, aidant à résoudre des problèmes plus complexes.

Dans les tests, Gemini 3 Deep Think surpasse même les très bons résultats de Gemini 3 Pro, obtenant 41,0 % sur Humanity's Last Exam (sans outil) et 93,8 % sur GPQA Diamond. De plus, il atteint un score inédit de 45,1 % sur ARC-AGI-2 (exécution de code, validé par ARC Prize), démontrant sa capacité à relever des défis entièrement nouveaux.

Le mode Gemini 3 Deep Think excelle dans certains des tests de référence IA les plus exigeants.

Apprendre, construire et planifier

Apprendre n’importe quoi

Dès le départ, Gemini vise à intégrer parfaitement des informations multimodales sur n’importe quel sujet, incluant texte, images, vidéos, audio et code. Gemini 3 étend davantage les limites du raisonnement multimodal grâce à ses capacités avancées de raisonnement, de vision et de compréhension spatiale, à ses performances multilingues de pointe et à sa fenêtre contextuelle de l’ordre du million de tokens, vous aidant à apprendre selon votre méthode préférée.

Par exemple, si vous souhaitez apprendre à cuisiner un plat traditionnel familial, Gemini 3 peut interpréter et traduire des recettes manuscrites dans différentes langues, puis générer une version partageable avec vos proches.

Ou encore, si vous souhaitez apprendre un nouveau sujet, il vous suffit de fournir des articles académiques, des conférences vidéo longues ou des tutoriels ; il peut alors générer des fiches mémoire interactives, des visualisations ou du code dans d'autres formats pour vous aider à maîtriser les connaissances.

Il peut même analyser la vidéo de votre match de pickleball, identifier les points à améliorer et élaborer un plan d’entraînement pour vous aider à progresser globalement.

Pour mieux vous aider à comprendre les informations en ligne, le mode IA dans la recherche utilise désormais Gemini 3 afin d’offrir une nouvelle expérience d’interface générative, incluant des mises en page visuelles immersives, des outils interactifs et des simulations, le tout généré instantanément selon votre requête.

Développer n’importe quoi

S’appuyant sur le succès de la version 2.5 Pro, Gemini 3 tient sa promesse de concrétiser toute idée de développeur. Il excelle en génération zero-shot, traitant efficacement des indications et instructions complexes pour produire des interfaces Web plus riches et interactives.

Gemini 3 est le meilleur modèle de codage Vibe et Agent jamais construit par Google. Il rend les produits Google plus autonomes et améliore considérablement l’efficacité des développeurs. Il domine le classement WebDev Arena avec un impressionnant score de 1487 Elo. De plus, il atteint 54,2 % dans le test Terminal-Bench 2.0, conçu pour évaluer la capacité du modèle à utiliser des outils via un terminal. Il surpasse largement la version 2.5 Pro (76,2 %) dans le test SWE-bench Verified, mesurant la performance des agents de codage.

Désormais, les utilisateurs peuvent développer avec Gemini 3 via Google AI Studio, Vertex AI, Gemini CLI et la nouvelle plateforme d’agents intelligents de Google, Google Antigravity. Il est également disponible sur des plateformes tierces telles que Cursor, GitHub, JetBrains, Manus et Replit.

Par exemple, créer un jeu rétro de vaisseau spatial 3D avec des effets visuels plus riches et une interactivité accrue.

Ou encore, développer des interfaces Web et des applications plus riches et interactives.

Planifier n’importe quoi

Depuis l’agent Gemini 2, Gemini a considérablement renforcé sa capacité de planification sur des tâches à long terme.

Cette capacité est confirmée par le test Vending-Bench 2 : Gemini 3 arrive en tête du classement dans un test de gestion simulée de distributeurs automatiques, menant entièrement des opérations commerciales virtuelles grâce à une planification à long terme.

Au cours d'une simulation complète d'une année d'exploitation, Gemini 3 Pro maintient une cohérence stable dans l'appel aux outils et dans la prise de décision, réalisant simultanément un retour sur investissement supérieur tout en restant concentré sur l'objectif.

Gemini 3 Pro démontre une capacité de planification à long terme bien supérieure, générant un retour plus élevé comparé aux autres modèles de pointe.

L’agent Gemini peut aussi aider à trier votre boîte de réception Gmail.

Gemini 3 est désormais entièrement disponible. À compter d’aujourd’hui, les utilisateurs standards et abonnés peuvent accéder au nouveau modèle via l’application Gemini et le mode IA de recherche ; les développeurs et clients entreprises peuvent y accéder via AI Studio, Vertex AI, etc. Quant au très attendu « mode réflexion profonde », il devrait être lancé exclusivement pour les abonnés Google AI Ultra dans les semaines à venir.

Par ailleurs, selon la fiche technique précédemment divulguée, plusieurs autres informations clés sont à noter : Google a formé ce modèle depuis zéro sur des TPU, et en tant que MoE, il dispose de 1M d'entrée et 64k de token de sortie, ce qui signifie que grâce à l'architecture MoE, ils peuvent se permettre de le rendre moins coûteux.

En matière de tarification, Gemini 3.0 Pro introduit un système de tarification hiérarchisé basé sur la longueur du contexte : pour les tâches inférieures à 200k tokens, les prix d’entrée/sortie sont de 2,00 $ / 12,00 $ (par million de tokens) ; au-delà de 200k tokens, ils passent respectivement à 4,00 $ et 18,00 $.

Une nouvelle expérience de développement « agent d’abord »

Google Antigravity est la nouvelle plateforme de développement d’agents intelligents de Google, permettant aux développeurs d’opérer à un niveau plus élevé, orienté vers la réalisation de tâches. En exploitant les capacités avancées de raisonnement, d’utilisation d’outils et de programmation d’agents de Gemini 3, Google Antigravity transforme l’assistance IA d’un simple outil dans la boîte à outils du développeur en un partenaire actif.

Bien que Google Antigravity repose sur une expérience familière d’IDE IA (environnement de développement intégré), ses agents ont été élevés à un niveau d’interface dédiée, dotés d’un accès direct à l’éditeur, au terminal et au navigateur. Désormais, les agents peuvent planifier de manière autonome et exécuter simultanément des tâches logicielles complexes de bout en bout, tout en vérifiant leur propre code.

Outre Gemini 3 Pro, Google Antigravity intègre étroitement le dernier modèle Gemini 2.5 Computer Use de Google pour le contrôle du navigateur, ainsi que son modèle d’édition d’image haut de gamme Nano Banana (Gemini 2.5 Image).

Test utilisateur

Maintenant que la version préliminaire de Gemini 3 Pro est disponible sur la plateforme AI Studio, nous avons décidé de l’essayer.

Prompt : SVG de la skyline de NEW YORK. Utilisez toutes les bibliothèques nécessaires, mais assurez-vous que je puisse coller le tout dans un seul fichier HTML et l'ouvrir dans Chrome. Rendez-le intéressant et très détaillé, montrez des détails inattendus, soyez pleinement créatif et magnifique, le tout dans un seul bloc de code.

Prompt : Créez un jeu Space Invaders visuellement époustouflant.

La scène du pélican à vélo avait auparavant mis en difficulté de nombreux grands modèles. Nous avons donc testé Gemini 3 avec celle-ci. Prompt : Un SVG animé d'un pélican à vélo.

Comparé aux versions précédentes, Gemini 3 a fait de grands progrès, mais présente encore des bogues, comme des pédales de vélo qui tournent dans le vide.

Nous avons ensuite essayé une instruction plus claire : Créez un code SVG animé unique, complet et autonome (sans fichiers externes ni images) représentant un mignon pélican à vélo vu de profil. Cette fois, le vélo généré par Gemini 3 semble ne pas avoir de pédales.

Pour conclure

Dans le sondage lancé par le blogueur X Chubby : « D’ici fin 2026, quelle entreprise possédera le meilleur LLM ? », Google Gemini prend une large avance.

Cette reconquête de la confiance du marché se reflète également dans les chiffres. Dans son blog officiel, Sundar Pichai, PDG d'Alphabet, revient sur les deux dernières années de progrès de Gemini : les Aperçus IA comptent désormais 2 milliards d'utilisateurs mensuels actifs, l'application Gemini dépasse les 650 millions d'utilisateurs mensuels actifs, et plus de 70 % des clients cloud ainsi que 13 millions de développeurs utilisent ses modèles génératifs.

En regardant ces deux dernières années, de la sortie précipitée de Bard (l'ancêtre de Gemini) accompagnée d'une chute boursière, à la refonte stratégique comprenant la fusion avec Google DeepMind, le retour des fondateurs et même un prix Nobel, Google a accompli un retournement de situation digne d’un manuel universitaire.

Le géant qui a autrefois défini le Transformer et qui aujourd’hui adopte une stratégie « Tout sur Gemini » est désormais prêt à contre-attaquer pleinement.

Quant à savoir s’il mettra fin au débat sur « le meilleur LLM » ? Pas si vite. Laissons la balle (et les serveurs) voler encore un peu.

Bienvenue dans la communauté officielle TechFlow

Groupe Telegram :https://t.me/TechFlowDaily

Compte Twitter officiel :https://x.com/TechFlowPost

Compte Twitter anglais :https://x.com/BlockFlow_News

Lien original

Ajouter aux favoris

Partager sur les réseaux sociaux

Auteur

机器之心Synced

@Synced_Global

Gemini 3 débarque en pleine nuit : surpasse GPT-5.1, l'ère des grands modèles de Google est arrivée

TechFlow SélectionTechFlow Sélection

Gemini 3 débarque en pleine nuit : surpasse GPT-5.1, l'ère des grands modèles de Google est arrivée

Le modèle le plus intelligent

Un monstre de raisonnement dominant partout