
Le dernier modèle d'intelligence artificielle « Banana » de Google fait fureur sur Internet avec le « Vibe Photoshoping »
TechFlow SélectionTechFlow Sélection

Le dernier modèle d'intelligence artificielle « Banana » de Google fait fureur sur Internet avec le « Vibe Photoshoping »
Une cohérence élevée du personnage offre une expérience inédite de « Vibe Photoshoping ».

Vous souvenez-vous du mystérieux modèle d'édition d'images par IA « nano-banana », tant discuté récemment ? À l'époque, il avait fait grand bruit sur LMArena, la compétition des grands modèles linguistiques, grâce à ses performances remarquables. Les experts techniques de Google Gemini s'étaient relayés sur les réseaux sociaux, alimentant toutes les spéculations, au point d'être considéré comme le supposé Gemini 3.0 Pro.
Aujourd'hui, Google a enfin levé le voile sur ce mystère.
Dans la nuit du 27 août, heure de Pékin, Google AI Studio a officiellement lancé Gemini 2.5 Flash Image (nom de code nano banana) 🍌.

Gemini 2.5 Flash Image, tant attendu, fait enfin son apparition | Crédit photo : Geek Park
Il s'agit du modèle de génération et d'édition d'images le plus avancé de Google à ce jour, non seulement extrêmement rapide, offrant une expérience quasi « foudroyante », mais aussi classé SOTA sur plusieurs benchmarks, devançant largement ses concurrents sur LMArena.

Gemini 2.5 Flash Image atteint immédiatement le niveau SOTA dès sa sortie | Crédit image : LMarena.ai
Dans son blog technique, Google indique que Gemini 2.0 Flash avait déjà conquis les développeurs grâce à sa faible latence et son excellent rapport coût-performance, mais les utilisateurs réclamaient davantage : des images de meilleure qualité et un contrôle créatif renforcé. Gemini 2.5 Flash Image répond justement à ces attentes avec des améliorations majeures : la cohérence des personnages est désormais parfaitement préservée, l'édition d'images basée sur les prompts est plus précise, la fusion de plusieurs images devient naturelle et fluide, tandis que la compréhension du monde réel transforme ce modèle non pas simplement en outil, mais en véritable « point zéro » posant les bases des prochaines applications virales.
Geek Park l’a testé dès sa sortie. À notre grande surprise, cette mise à jour ne se contente pas d'améliorer un modèle : elle donne pour la première fois une vision concrète de l’avenir de la retouche photo par IA.

L’expérience est désormais disponible dans Google AI Studio | Crédit photo : Geek Park
Au départ, j'avais abordé cela comme une simple mise à jour, curieux de voir « où se situait la rapidité ». Mais quelques heures d'utilisation ont suffi pour me donner l'impression d'avoir entrevu le visage des futures applications populaires.
Nous étions habitués à des outils comme Meitu Xiuxiu, où quelques clics et filtres permettent de rapidement embellir une photo. Mais l'expérience offerte par Gemini 2.5 Flash Image est radicalement différente. Sa rapidité est incroyable, et son intelligence rappelle celle d’un designer qui comprend vos intentions : il vous suffit d'exprimer votre souhait, et en quelques secondes, l'image apparaît exactement comme vous l'imaginiez.

Outre la qualité, la vitesse constitue une autre différence marquante entre Gemini 2.5 Flash Image et les précédents outils de génération d'images par IA | Crédit photo : Geek Park
01 Génération ultra-rapide, résultats en quelques secondes
La caractéristique la plus frappante de nano banana est sa vitesse. Même avec un ordinateur puissant, l'utilisation de certains modèles open source nécessite souvent plusieurs dizaines de secondes, voire plus, entre la saisie du prompt et la génération d'une image correcte. Pour les utilisateurs mobiles, cette attente est encore plus pénible.
Mais Gemini 2.5 Flash Image réduit ce délai à quelques secondes seulement. Selon Google, c'est le « modèle multimodal natif le plus récent, le plus rapide et le plus efficace » qu'ils aient jamais créé, bénéficiant d'optimisations poussées. Lors de mes tests, après avoir entré un prompt, le résultat apparaissait en environ trois à quatre secondes, avec une résolution et des détails très nets.
Cette expérience ressemble à l'utilisation courante de Meitu Xiuxiu : cliquez sur « embellissement », et le résultat est quasi instantané. La différence ? Tandis que Meitu Xiuxiu applique des filtres prédéfinis par algorithmes, Gemini 2.5 Flash Image construit une image entièrement à partir de rien ou transforme profondément une photo selon vos besoins. Ce sentiment de contrôle total, « là où je pointe, là apparaît le résultat », était impensable avec les processus traditionnels de retouche photo laborieux.

Des demandes comme « supprimer les passants en arrière-plan » peuvent être réglées en un seul prompt | Crédit photo : Geek Park
Si la vitesse améliore l'expérience utilisateur classique, le caractère « multimodal natif » repousse quant à lui les limites des capacités d'image par IA.
Gemini 2.5 Flash Image ne se contente pas de générer des images : il comprend simultanément les entrées textuelles et visuelles. Cela signifie que je peux lui fournir une photo accompagnée d'un texte, et il analysera les deux informations pour comprendre précisément ce que je souhaite.
Par exemple, j'ai téléchargé une photo prise dans la rue, puis lui ai dit : « remplace l'arrière-plan par une nuit à Shinjuku, Tokyo ». Le modèle a non seulement identifié le sujet principal de la photo, mais aussi découpé proprement la personne et remplacé l'arrière-plan par une rue animée de Shinjuku illuminée de néons. Plus impressionnant encore, il a conservé une cohérence lumineuse entre la personne et le nouveau décor, évitant totalement cet effet « collé maladroitement » si fréquent avec les découpes manuelles.
Cette capacité de compréhension me rappelle une fonction souvent vantée par les fabricants de smartphones dans leurs galeries intégrées : le « changement d'arrière-plan en un clic ». Mais contrairement aux anciennes versions, dont les contours étaient flous et l'éclairage incohérent, Gemini 2.5 Flash Image utilise ses connaissances du monde réel et sa compréhension visuelle pour corriger ces détails, produisant des résultats bien plus naturels et conservant des détails beaucoup plus précis que les outils traditionnels de génération texte-image ou image-image.

Image originale & résultat généré par Gemini 2.5 Flash Image | Crédit photo : Geek Park
C’est pourquoi je pense qu’il redéfinit l’expérience de retouche photo : plus besoin de multiples ajustements manuels, les tâches sont désormais accomplies grâce à la compréhension sémantique naturelle du modèle, comme un « coup de baguette magique » particulièrement efficace dans des scénarios exigeants comme la retouche portrait.

Pour ce type de traitement d'images de portraits, Gemini 2.5 Flash Image offre vraiment une expérience inédite de « Vibe Photoshoping ».

Un instant pour sauver la face d’un développeur | Crédit photo : Geek Park
Cette expérience bouleverse l'idée que beaucoup se font de la génération d'images par IA — cette impression de « science occulte » : un bon prompt donne un résultat époustouflant, un mauvais prompt produit quelque chose de complètement hors-sujet.
Mais avec Gemini 2.5 Flash Image, j'ai constaté que cette « dimension ésotérique » est fortement atténuée. Sa compréhension des prompts est plus précise et correspond davantage à l'intuition humaine — voilà pourquoi tant d'utilisateurs trouvent soudainement l'outil bien plus agréable à utiliser.
Par exemple, quand je lui dis « flouter l'arrière-plan pour mettre en valeur la personne au premier plan », l'image générée quelques secondes plus tard correspond exactement à ce que je voulais. Quand je lui demande « de changer l'expression de la personne en sourire », non seulement la bouche s'incurve légèrement vers le haut, mais même le regard est ajusté, avec des détails très fins. J'ai même essayé « coloriser une photo en noir et blanc » : l'image en couleur produite n'était pas arbitraire, mais reflétait autant que possible l'ambiance chromatique historique appropriée.
Cette capacité à « faire exactement ce qui est demandé » contraste avec l'expérience antérieure de Meitu Xiuxiu, où vouloir simplement lisser la peau pouvait transformer tout le visage en une caricature figée avec un « beauté niveau 10 ». Aujourd'hui, les opérations de Gemini 2.5 Flash Image sont précises et mesurées : il comprend réellement ce que vous voulez, puis s'efforce de le restituer fidèlement.
02 Puissance accrue, usage irréversible
Pour mieux visualiser, j'ai fait exprès de le comparer à mes outils mobiles de retouche habituels.
Dans Snapseed, pour flouter l'arrière-plan, je dois généralement passer une ou deux minutes à sélectionner manuellement la zone avant-plan, puis régler l'intensité du flou. Même avec une bonne maîtrise, des ajustements répétés sont inévitables.
Dans Meitu Xiuxiu, bien qu'il existe une fonction de flou d'arrière-plan en un clic, elle finit souvent par flouter aussi les contours de la personne, donnant un résultat peu naturel.
Avec Gemini 2.5 Flash Image, un simple énoncé suffit : il identifie automatiquement la limite entre la personne et l'arrière-plan, applique un flou naturel, sans besoin de retouches supplémentaires.

En modifiant des détails de l’image, il évite soigneusement les effets de « griffonnage aléatoire » fréquents avec d'autres outils d'IA | Crédit image : Twitter
Cette comparaison met en lumière un point essentiel : Gemini 2.5 Flash Image libère l'utilisateur des manipulations complexes, en confiant la majorité du travail au modèle. Pour le grand public, cela abaisse la barrière d'accès à la retouche photo ; pour les professionnels, cela fait gagner un temps précieux.
Après utilisation, mon impression dominante est que Gemini 2.5 Flash Image n’est plus seulement un outil de retouche, mais bien davantage un « assistant intelligent ».
Auparavant, utiliser Meitu Xiuxiu revenait à exploiter un ensemble de fonctions prédéfinies : filtres, embellissement, masquage, chaque bouton correspondant à une action. Il fallait choisir, ajuster progressivement, jusqu’à satisfaction.
Aujourd'hui, la logique de Gemini 2.5 Flash Image est fondamentalement différente. Il ne vous demande plus d’apprendre sa logique, mais comprend directement vos besoins. Vous parlez, et il agit.
Ce changement, subtil en apparence, transforme en réalité toute la dynamique du processus de retouche. Avant, nous nous adaptons à l’outil ; maintenant, c’est l’outil qui s’adapte à nous. Cette nouvelle forme d’interaction est précisément l’ébauche des applications de demain.
À l’heure actuelle, Gemini 2.5 Flash Image en est encore à ses débuts, et certaines limites fonctionnelles persistent. Pourtant, sa vitesse, sa compréhension et sa fidélité suffisent à nourrir l’imagination sur l’avenir.
Et si on combinait cela avec Meitu Xiuxiu ? Peut-être que vous ouvrirez l’application, direz à votre téléphone « retouche cette photo, rends la peau plus naturelle », et en quelques secondes, le résultat sera prêt. En voyage, vous pourriez dire « change la météo en ensoleillé », et l’image deviendrait aussitôt baignée de soleil. Même en montage vidéo, un simple mot pourrait transformer l’ambiance d’un segment entier.

Ce type d’interface pourrait rapidement devenir la fonction principale d’édition d’images intégrée aux systèmes d’exploitation mobiles | Crédit image : Twitter
C’est pourquoi je pense qu’il va révolutionner rapidement les processus existants des outils de retouche photo, définissant la prochaine génération de « Meitu Xiuxiu » : pas seulement retoucher, mais redéfinir l’interaction avec le traitement d’image, faisant de l’IA un partenaire naturel en post-production photographique.
Mais pour l’instant, Gemini 2.5 Flash Image ne peut pas encore devenir une application grand public clé en main : non seulement parce que son objectif principal reste la génération d’images plutôt que les ajustements fins sur des photos existantes, mais aussi parce que toutes les images créées ou modifiées via Gemini 2.5 Flash Image comportent un filigrane numérique SynthID, destiné à aider les plateformes sociales à identifier le contenu généré par IA.
03 Le point de rupture viral
En y repensant, Meitu Xiuxiu est devenu une application universelle car elle résolvait de manière simple un problème que tout le monde voulait régler : rendre les photos plus belles.
Gemini 2.5 Flash Image va plus loin : il affine les capacités complexes de l’IA pour offrir une expérience « génération instantanée » accessible à tous.
Quand j’ai dit pour la première fois « floute légèrement l’arrière-plan », et que quelques secondes plus tard l’image était parfaitement traitée, j’ai compris immédiatement : c’est le point zéro d’une application virale. Ce n’est pas juste un modèle, c’est une capacité fondamentale qui sous-tendra d’innombrables nouveaux produits à venir.

La fonction populaire des dernières années sur mobile : changer le ciel en un clic via IA | Crédit photo : communauté vivo
Dans quelques années, nous aurons peut-être oublié le nom de code « Banana », mais nous verrons apparaître de plus en plus d’outils de retouche photo offrant cette nouvelle expérience : « dites ce que vous voulez, obtenez-le immédiatement ». Comme Meitu Xiuxiu auparavant, ils pourraient devenir le souvenir collectif d’une génération d’utilisateurs.
Seulement cette fois, l’IA poussera l’imagination encore plus loin.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News













