
奥特曼都点赞,谷歌 Gemini 3 Pro 到底强在哪?
TechFlow SélectionTechFlow Sélection

奥特曼都点赞,谷歌 Gemini 3 Pro 到底强在哪?
Google a fait semblant de dormir pendant 8 mois, puis a sorti d'un coup son atout maître Gemini 3 Pro.
Auteur : Miao Zheng
Google a feint pendant 8 mois, puis sorti d'un coup son atout maître Gemini 3 Pro.
Google a enfin lancé Gemini 3 Pro, de façon soudaine et plutôt « discrète ».
Bien que Google ait récemment publié Nano Banana, un modèle d'édition d'images, attirant ainsi quelque attention, il est resté silencieux trop longtemps concernant ses modèles de base.
Pendant ces derniers mois, tout le monde discutait des nouveaux mouvements d'OpenAI ou admirait la domination de Claude dans le domaine du code, tandis que personne ne mentionnait Gemini, qui n'avait pas vu de mise à jour de version depuis 8 mois.
Même si les activités cloud et les résultats financiers de Google sont excellents, sa présence dans le cercle central des développeurs IA s'est progressivement diluée.
Heureusement, après avoir testé Gemini 3 Pro dès sa sortie, j'ai constaté qu'il ne nous décevait pas.
Mais il est encore trop tôt pour conclure. Le domaine de l'IA a dépassé depuis longtemps l'étape où l'on impressionnait par la taille des paramètres. Désormais, tout le monde se bat sur les applications, le déploiement et la rentabilité.
Savoir si Google pourra s'adapter à cette nouvelle version et ce nouvel environnement reste une inconnue.
01
J'ai demandé à Gemini 3 Pro de me décrire en une phrase. Voici sa réponse :
« Ne plus chercher à prouver au monde à quel point je suis intelligent, mais commencer à réfléchir à la manière d'être plus utile. » —— Gemini 3 Pro
Sur le classement LMArena, Gemini 3 Pro atteint 1501 points Elo, un nouveau record pour l'évaluation globale des capacités des modèles IA. Un résultat remarquable, salué même par Altman via un tweet.
Dans les tests de compétences mathématiques, le modèle atteint une précision de 100 % dans le mode d'exécution de code d'AIME2025 (l'Olympiade américaine de mathématiques). Dans le test GPQADiamond de connaissances scientifiques, Gemini 3 Pro affiche un taux de précision de 91,9 %.
Les résultats du test MathArenaApex montrent que Gemini 3 Pro obtient 23,4 %, alors que les autres modèles principaux stagnent généralement sous les 2 %. De plus, lors du test Humanity'sLastExam, le modèle atteint 37,5 % sans utilisation d'outils.
Lors de cette mise à jour, Google introduit une fonctionnalité nommée « vibecoding », destinée à la génération de code. Cette fonction permet aux utilisateurs de décrire leurs besoins en langage naturel, le système générant ensuite automatiquement le code et l'application correspondante.
Dans un test réalisé dans l'environnement Canvas, après avoir indiqué « crée un ventilateur dont on peut régler la vitesse de rotation », le système a généré en environ 30 secondes un code complet incluant une animation de rotation, un curseur de réglage de vitesse et un bouton marche/arrêt.
Les cas présentés officiellement incluent aussi une simulation visuelle du processus de fusion nucléaire.
En matière d'interaction, Gemini 3 Pro ajoute une fonction appelée « interface générative » (GenerativeUI). Contrairement aux assistants IA traditionnels qui renvoient uniquement du texte, ce système peut générer automatiquement une interface personnalisée selon la requête.
Par exemple, lorsqu'un utilisateur pose une question sur l'informatique quantique, le système peut produire une interface interactive comprenant des explications conceptuelles, des graphiques dynamiques et des liens vers des articles pertinents.
Pour un même sujet, le système adapte l'interface selon le public cible. Par exemple, en expliquant un concept aux enfants et aux adultes, il adopte des approches différentes : plus ludique pour les enfants, plus sobre et claire pour les adultes.
La fonction expérimentale Visual Layout disponible dans Google Labs illustre cette capacité, offrant aux utilisateurs une disposition de type magazine avec images, modules et éléments d'interface ajustables.
Cette sortie inclut également Gemini Agent, un système d'agent intelligent actuellement en phase expérimentale. Ce système peut exécuter des tâches en plusieurs étapes et se connecter à divers services Google comme Gmail, Google Calendar et Reminders.
Dans la gestion de boîte de réception, le système peut filtrer automatiquement les e-mails, définir leurs priorités et rédiger des réponses. La planification de voyage constitue un autre scénario : l'utilisateur indique simplement sa destination et ses dates approximatives, et le système consulte son calendrier, recherche des vols et des hôtels, puis organise l'itinéraire. Cette fonction est actuellement réservée aux abonnés Google AI Ultra aux États-Unis.
En traitement multimodal, Gemini 3 Pro repose sur une architecture mixte creuse d'experts et prend en charge les entrées textuelles, images, audio et vidéo. Sa fenêtre contextuelle atteint 1 million de tokens, lui permettant de traiter des documents ou vidéos longs.
Un test mené par Mark Humphries, professeur d'histoire à l'Université Laurier au Canada, montre que le modèle atteint un taux d'erreur de 0,56 % dans la reconnaissance de manuscrits du XVIIIe siècle, soit une réduction de 50 à 70 % par rapport à la génération précédente.
Google indique que les données d'entraînement incluent des documents publics du web, du code, des images, de l'audio et des vidéos, et que l'apprentissage par renforcement a été utilisé durant la phase post-entraînement.
Google lance également une version optimisée appelée Gemini 3 Deep Think, dédiée aux tâches complexes de raisonnement. Ce mode est actuellement en évaluation de sécurité et devrait être accessible aux abonnés Google AI Ultra dans les prochaines semaines.
Dans le mode IA de Google Search, les utilisateurs peuvent cliquer sur l'onglet « thinking » pour visualiser le processus de raisonnement. Comparé au mode standard, Deep Think effectue davantage d'analyses avant de produire une réponse.
Au-delà des documents officiels, j'ai comparé Gemini 3 Pro avec ChatGPT-5.1.
Première comparaison : la génération d'images.
Prompt : Génère-moi un iPhone17
ChatGPT-5.1
Gemini 3 Pro
Selon mon avis subjectif, ChatGPT-5.1 répond mieux à mes attentes ; cette manche revient donc à ChatGPT-5.1.
Deuxième comparaison : leurs niveaux d'agents intelligents.
Prompt : Va étudier le compte WeChat « Zibang », puis donne-moi ton avis sur ce compte
GPT-5.1
Gemini 3 Pro
Subjectivement, j'apprécie davantage l'analyse de Gemini 3 Pro, mais elle est trop flatteuse. GPT-5.1 identifie les lacunes de Zibang, ce qui paraît plus objectif et réaliste.
Enfin, la capacité de code, domaine crucial pour tous les grands modèles actuels.
J'ai choisi un projet récent très populaire sur GitHub, nommé LightRAG. Ce projet améliore la génération assistée par récupération en intégrant une structure de graphe pour renforcer la perception contextuelle et l'efficacité de la récupération d'informations, offrant ainsi une meilleure précision et des temps de réponse plus rapides. Adresse du projet : https://github.com/HKUDS/LightRAG
Prompt : Explique-moi ce projet
GPT-5.1
Gemini 3 Pro
En outre, Gemini 3 Pro reçoit de hautes appréciations de professionnels du secteur.
02
Bien que la sortie de Gemini 3 Pro ait été très discrète, Google préparait en réalité son lancement depuis longtemps.
Lors de la conférence téléphonique sur les résultats trimestriels, le PDG de Google, Pichai, a déclaré : « Gemini 3 Pro sera publié en 2025. » Pas de date précise, peu de détails, mais cela a marqué le début d'une grande campagne marketing dans le secteur technologique.
Google a continué à envoyer des signaux, maintenant toute la communauté IA en alerte maximale, tout en refusant obstinément de donner un calendrier précis.
À partir d'octobre, des fuites « accidentelles » se sont succédé. À partir du 23 octobre, une capture d'écran d'agenda interne indiquant « Gemini 3 Pro Release » le 12 novembre a circulé massivement.
Des développeurs attentifs ont également découvert l'appellation « gemini-3-pro-preview-11-2025 » dans la documentation API de Vertex AI.
Peu après, des captures d'écran ont commencé à apparaître sur Reddit et X. Certains utilisateurs affirmaient avoir vu le nouveau modèle dans l'outil Gemini Canvas, d'autres découvraient des identifiants anormaux dans certaines versions de l'application mobile.
Ensuite, les données de test suivantes ont commencé à circuler sur les réseaux sociaux.
Ces « fuites », apparemment fortuites, formaient en réalité une campagne de teasing minutieusement orchestrée.
Chaque fuite mettait opportunément en valeur une capacité clé de Gemini 3 Pro, chaque discussion faisant grimper davantage l'anticipation. Quant au compte officiel de Google, son attitude était intrigante : il relayait les discussions communautaires, employait des expressions comme « à venir prochainement » pour attiser la curiosité, voire les cadres supérieurs du laboratoire Google AI répondaient avec deux émojis « réfléchir » sous des tweets spéculant sur la date de sortie, sans jamais révéler la date exacte.
Après près d'un mois de teasing, Google a finalement dévoilé Gemini 3 Pro. Bien que performant, le rythme de mise à jour de Google laisse tout de même certains impatients.
Dès mars, Google avait publié une version préliminaire de Gemini 2.5 Pro, suivie par d'autres versions dérivées comme Gemini 2.5 Flash Preview. Entre-temps, la série Gemini n'a connu aucune mise à jour de numéro de version jusqu'à l'arrivée de Gemini 3 Pro.
Mais les concurrents de Google n'attendent pas Gemini.
OpenAI a lancé GPT-5 le 7 août, puis l'a mis à jour vers GPT-5.1 le 12 novembre. Pendant cette période, OpenAI a aussi lancé son navigateur IA Atlas, visant directement le cœur du marché de Google.
Anthropic a encore accéléré son rythme : sortie de Claude 3.7 Sonnet (premier modèle à raisonnement hybride) le 24 février, puis Claude Opus 4 et Sonnet 4 le 22 mai, Claude Opus 4.1 le 5 août, Claude Sonnet 4.5 le 29 septembre, et enfin Claude Haiku 4.5 le 15 octobre.
Cette série d'offensives a pris Google un peu au dépourvu, mais pour l'instant, Google tient bon.
03
La principale raison pour laquelle Google a mis 8 mois à mettre à jour Gemini 3 Pro pourrait provenir de changements d'équipe.
Vers juillet-août 2025, Microsoft a lancé une offensive massive contre Google, recrutant plus de 20 experts et cadres clés de DeepMind.
Il s'agit notamment de Dave Citron, Directeur Senior Produit chez DeepMind, chargé du déploiement des produits IA phares, et d'Amar Subramanya, Vice-Président Ingénierie de Gemini, l'un des responsables techniques principaux du modèle phare de Google.
D'autre part, l'équipe Nano Banana de Google a indiqué que, longtemps après la sortie de Gemini 2.5 Pro, Google hésitait sur le domaine de la génération d'images par IA, ralentissant ainsi la mise à jour des modèles de base.
Google estimait qu'il fallait d'abord résoudre trois défis majeurs dans la génération d'images : la cohérence des personnages (Character Consistency), l'édition dans le contexte (In-context Editing) et le rendu du texte (Text Rendering), afin d'améliorer les performances des modèles de base.
L'équipe Nano Banana souligne que le modèle doit non seulement « bien dessiner », mais surtout « comprendre le langage humain » et « être contrôlable », pour permettre à la génération d'images par IA d'atteindre véritablement le stade du déploiement commercial.
En regardant aujourd'hui Gemini 3 Pro, c'est une réponse satisfaisante, mais sur un champ de bataille IA où tout va vite, la moyenne ne suffit plus.
En choisissant de livrer ce modèle maintenant, Google doit être prêt à affronter les juges les plus sévères : les utilisateurs et développeurs dont les attentes ont été élevées par les produits concurrents. Les prochains mois ne seront plus une course aux paramètres, mais un combat direct sur l'intégration des écosystèmes. L'éléphant Google doit non seulement apprendre à danser, mais danser plus vite que tous les autres.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News














