
Entretien avec le responsable produit de Miaoya : Premier jour d'un produit AIGC, si tu ne demandes pas d'argent, tu n'en auras jamais.
TechFlow SélectionTechFlow Sélection

Entretien avec le responsable produit de Miaoya : Premier jour d'un produit AIGC, si tu ne demandes pas d'argent, tu n'en auras jamais.
Lorsque l'effet atteint un point où tous les membres d'une équipe pensent que c'est vraiment excellent, qu'ils ont ce moment « waouh », alors la probabilité de viralité devient très élevée.
Auteurs | Wan Chen, Zheng Yue
Éditeur | Zheng Xuan
Personne n'aurait imaginé que le premier produit phénoménal réellement sorti du cercle en Chine dans le domaine de la génération de contenu par IA (AIGC) naîtrait dans un secteur aussi mature que l'amélioration photo (portrait réaliste).
Lancé discrètement mi-juillet, grâce à une offre alléchante : « 9,9 yuans et 20 photos suffisent pour générer des portraits artistiques personnalisés », Miaoya a attiré en quelques semaines des milliers de jeunes femmes désireuses d’essayer. Les « portraits Miaoya » ont envahi les fils d’actualité des réseaux sociaux comme WeChat Moments.
La vitesse à laquelle Miaoya est sorti du cercle est impressionnante, mais son équipe de développement reste très mystérieuse. Avant son lancement et sa diffusion rapide, aucune fuite n'avait eu lieu lors des dizaines de présentations de grands modèles ces derniers mois. Ce n’était pas non plus un projet lancé par un « grand nom » avec un financement initial de plusieurs dizaines ou centaines de millions. La plupart des professionnels de la tech ignorent encore si Miaoya est porté par une startup indépendante ou un projet interne à un grand groupe.
Récemment, Zhang Yueguang, responsable produit de Miaoya, s’est entretenu avec plusieurs médias technologiques et économiques, dont TechFlow.
Miaoya est un projet incubé au sein d’Alibaba Culture & Entertainment. Après que ChatGPT a déclenché une nouvelle vague d’innovation en IA, Zhang Yueguang a réuni quelques collègues en février dernier pour créer un groupe interne baptisé « Groupe d'action AIGC transversal ». En un mois, ils ont défini le domaine du « portrait réaliste » comme axe principal, puis ont passé trois mois supplémentaires à développer concrètement le produit « Miaoya ».
On pense inévitablement aux célèbres « 20 % de temps libre » de Google, qui avaient donné naissance à des innovations surprenantes comme Google Glass, Cardboard ou la voiture autonome. Ce début romantique, typiquement californien, a suscité encore davantage de curiosité autour de Miaoya.
Au cours d’un entretien d’une heure et demie, Zhang Yueguang a répondu à une série de questions et controverses concernant Miaoya. Bien que des sujets tels que les technologies utilisées, l’échelle des utilisateurs, la composition de l’équipe ou la stratégie commerciale future soient classés comme « secrets commerciaux » et donc non divulgués, ils ont fourni des explications détaillées sur les raisons du choix du portrait réaliste, le processus de création du produit, les controverses liées à la confidentialité des données, ainsi que les facteurs clés de son succès, levant ainsi un coin du voile sur le mystère Miaoya.
Voici le contenu de cet entretien, retranscrit et organisé par TechFlow.
01 Un petit groupe d’intérêt, trois mois pour façonner « Miaoya »
Question : Comment l'équipe a-t-elle construit le projet depuis zéro ?
Réponse : Ce projet a commencé simplement vers janvier-février, sans plan commercial clair comme aujourd’hui. C’était plutôt un groupe d’intérêt. Moi-même et cinq ou six collègues passions notre temps à explorer les avancées technologiques et produits dans le domaine de l’IA et de l’image. Le 9 février, j’ai créé un groupe intitulé « Groupe d'action AIGC transversal ». À partir de là, nous avons commencé à suivre attentivement les nouvelles technologies, outils et plugins émergents dans le domaine de l’image générée par IA. Vers mars, j’ai estimé que certains éléments technologiques clés étaient désormais assez matures, et j’ai décidé de nous orienter vers le portrait réaliste.

Photo de l’équipe Miaoya | Compte officiel Miaoya Camera
Nous avons passé plus de trois mois à peaufiner cette direction, tant sur le plan technique que sur les modèles esthétiques. Fin juin, début juillet, nous avons jugé que le produit était suffisamment abouti pour être présenté aux utilisateurs. Nous avons alors lancé un test interne de deux semaines, en invitant des amis et collègues. Leurs retours étaient très positifs quant à l’efficacité et la satisfaction procurée par le produit. Mi-juillet, nous avons officiellement lancé Miaoya. Le produit a suscité une forte réaction, les utilisateurs l’ayant beaucoup apprécié, dépassant largement nos attentes initiales en termes de croissance.
En matière de ressources, l’usage initial était modeste. Au fur et à mesure de son développement, Miaoya a bénéficié de davantage de soutien. Ce qui compte surtout, c’est que l’entreprise encourage l’innovation, ce qui nous a permis de faire de nombreux essais.
Question : Pourquoi avoir choisi le domaine du portrait réaliste pour concrétiser l’AIGC ?
Réponse : J’ai fait une analyse fondamentale du produit. J’ai auparavant travaillé sur des applications de galerie photo, où nous proposions aux utilisateurs un tri automatique basé sur des algorithmes. Dans toutes les galeries utilisateurs, plus de 70 % des photos sont des portraits réels. Si l’on regroupe toutes les images sans filtre, les portraits réalistes constituent à la fois la catégorie la plus importante, la plus valorisée, et celle qui attire le plus l’attention.
Un autre facteur : des produits comme Midjourney ont connu un grand succès à l’étranger, et certains acteurs chinois ont tenté de reproduire ce modèle. Toutefois, ces produits visent à tout dessiner, ce qui impose des exigences élevées en termes de technologie et d’algorithmes. Une orientation plus verticale est plus facile à concrétiser, d’où le choix du portrait réaliste.
Question : Beaucoup d’utilisateurs disent après avoir essayé Miaoya : « Pour 9,9 yuans, je peux surpasser Tianzhenlan et Haematopoietic ». Qu’en pensez-vous ?
Réponse : Nous n’avions aucune intention de remplacer Tianzhenlan ou Haematopoietic ; c’est une formule lancée par les utilisateurs. Notre format produit peut effectivement rappeler celui des services photographiques actuels, mais selon nous, nous souhaitons collaborer avec les industries de la photographie et de la vidéo, en les aidant à innover plutôt qu’en les concurrençant. Haematopoietic, en tant que service physique, ne pourra jamais être remplacé. Car le processus de prise de vue est lui-même essentiel pour le client. Par exemple, lorsque vous prenez une photo de famille, le fait que toute la famille se rassemble pour ce moment a une grande valeur symbolique. Même avec une IA très avancée, ce processus humain ne peut être remplacé.

Page d’accueil de Miaoya Camera
Nous souhaitons toucher des utilisateurs dans des villes moins développées ou reculées, qui ont rarement accès à ce type de service. Mais partout, le désir de beauté et de photographie existe, car chacun souhaite garder des souvenirs mémorables.
Dans notre lettre de remerciement initiale, nous avons mentionné que des photographes et des designers ont participé à la création des modèles. L’aide apportée par la technologie IA leur paraît également fascinante. Nous pensons que nous complétons cet écosystème, nous n’y sommes pas opposés. Nous voulons fournir des outils à cette industrie, pas supprimer ses concurrents.
Question : Selon votre propre analyse, pourquoi Miaoya a-t-il connu un tel succès ?
Réponse : Le facteur le plus important est la détermination et les efforts de l’équipe. L’ambiance est simple, directe, avec des objectifs clairs et une recherche de l’excellence. Nous avons passé plus de trois mois à perfectionner les résultats pour offrir une meilleure expérience utilisateur. Deuxièmement, l’entreprise encourage, soutient et tolère l’innovation, et renforce son appui dès qu’elle voit des résultats partiels.
Si on cherche directement dans le produit lui-même, je vois plusieurs raisons.
D’abord, nous avons eu de la chance. Ensuite, l’expérience utilisateur est cruciale. Même si un produit a une grande valeur intrinsèque, il sera abandonné s’il n’est pas fluide à utiliser. La valeur commerciale d’un produit n’est pas linéaire : elle ne devient réelle qu’après avoir franchi un seuil critique. C’est pourquoi, lors de la conception, nous devons viser une qualité élevée, au minimum 90/100. Quand le résultat atteint un niveau que tous les membres de l’équipe trouvent vraiment excellent, quand il suscite un moment “waouh”, alors les chances de viralité sont très élevées.
Par ailleurs, la maîtrise du produit est essentielle. Dans sa conception, nous insistons sur trois principes : « vrai », « ressemblant », « beau ». « Vrai » signifie sans effet IA perceptible, « ressemblant » veut dire proche de l’utilisateur, « beau » implique d’être 3 points plus beau que soi. Ces trois critères doivent tous atteindre une note supérieure à 90 avant que nous n’acceptions de lancer le produit sur le marché.
Question : Pourquoi avez-vous fixé à 20 le nombre de photos à télécharger ?
Réponse : Pour obtenir un résultat idéal, 20 photos représentent actuellement la solution optimale. Je ne peux pas entrer dans plus de détails.

Miaoya Camera demande aux utilisateurs de fournir 20 photos ou plus | Capture d’écran Miaoya
Question : Certains analystes estiment que ce genre d’outil populaire court toujours le risque d’être copié. On suppose que votre modèle repose sur un modèle open source affiné, et que vos barrières technologiques ne sont pas très élevées. Quelles sont, selon vous, les barrières techniques ou produit de Miaoya ?
Réponse : Je ne peux pas divulguer précisément comment nous avons mis en œuvre la technologie, mais nous avons bien des barrières. Ce qui importe surtout, c’est la capacité à itérer, étendre et continuer à peaufiner les résultats. Notre équipe technique optimise constamment les performances du produit.
Question : Certains pensent que Miaoya utilise le modèle Stable Diffusion combiné à une méthode d’affinement LoRA. Cette hypothèse correspond-elle à la réalité ?
Réponse : Là encore, je préfère ne pas commenter. Toute question relative à la mise en œuvre technique relève de notre secret commercial, et ne peut donc pas être révélée.
Question : Le modèle de base utilisé pour la génération d’images par Miaoya est-il entraîné en interne ? Utilisez-vous les modèles d’image d’Alibaba Cloud ?
Réponse : Miaoya est un projet interne à l’équipe Alibaba Culture & Entertainment. Nous n’utilisons pas les technologies d’Alibaba Cloud liées à la génération d’images. Quant à savoir exactement comment cela fonctionne, je ne suis pas en mesure de le décrire.
Nous avons un modèle appelé « Tiziano », dont le nom figure dans notre lettre de remerciement publiée le 17 juillet — en référence au père du portrait. Ce nom reflète bien notre volonté initiale : offrir un service de portrait réaliste.
Question : Comment les styles des modèles de Miaoya sont-ils définis ?
Réponse : L’équipe comprend beaucoup de jeunes membres qui discutent efficacement entre eux. Mais nous regardons surtout les utilisateurs, notamment leurs préférences visibles sur les réseaux sociaux ou WeChat Moments.
Nous recueillons aussi beaucoup de retours : quel type de modèle les utilisateurs aiment-ils ? Cela guide notre création continue de nouveaux modèles. La prochaine série de modèles, bientôt disponible, répond presque entièrement aux demandes exprimées par les utilisateurs.
Question : Comment Miaoya Camera équilibre-t-il authenticité et beauté dans les photos produites ?
Réponse : Sept à huit points de ressemblance, deux à trois points de beauté. Dès le départ, nous avons défini trois axes pour le portrait réaliste : « vrai », « ressemblant », « beau ». Pas d’effet IA perceptible, ressemblance maximale, mais légèrement plus beau que soi. Que ce soit pour les applis de beauté ou chaque génération de produits photo, c’est une règle commune.
Nous laissons aussi ce choix à l’utilisateur. Au départ, le portrait est très beau, mais peut-être pas assez ressemblant. Nous disposons d’une fonction spéciale pour le rendre plus proche de vous. En cliquant plusieurs fois, il devient progressivement plus fidèle.
Question : Miaoya ciblera-t-il toujours uniquement les jeunes femmes ?
Réponse : Les utilisateurs principaux de toute application de selfie ou d’image sont majoritairement des femmes. Cela se voit clairement à travers le nombre de nos modèles.
02 Controverses sur la vie privée et la sécurité des données
Question : Fort de vos ressources en contenus audiovisuels chez Alibaba, envisagez-vous un produit de changement de visage dynamique, par exemple permettant de remplacer un visage dans une scène de série ?
Réponse : Ce n’est pas un objectif prioritaire pour nous, même s’il peut exister des opportunités pertinentes. Si une collaboration adéquate se présente, nous pouvons envisager des produits intégrant des séries, des thèmes antiques ou impériaux, afin de mieux comprendre les centres d’intérêt des utilisateurs.
Le changement de visage proprement dit, c’est quelque chose que nous refusons catégoriquement. Dès le départ, j’ai voulu que mon produit soit différent des applications de swap facial, voire que je l’aie délibérément évité.
Question : Quelle est votre opinion sur le développement des produits de changement de visage sur le marché ?
Réponse : Le swap facial est un produit assez mature. Je ne commenterai pas ses cas d’usage. En revanche, il comporte certains risques sécuritaires.
Nos photos générées par IA, comparées aux vrais swaps faciaux, sont moins réalistes. Du moins, elles ne passeraient jamais un test de détection des points clés du visage, un niveau de sécurité élevé. Elles semblent seulement proches. Nos données utilisateur sont donc sûres, la génération aussi, ce qui laisse une perspective durable.
Question : Quelle est votre position face aux controverses sur les clauses de confidentialité ?
Réponse : Après son lancement, Miaoya a suscité certaines controverses à cause de son contrat utilisateur. Nous avons immédiatement apporté des modifications, reconnaissant que c’était notre faute. D’un certain point de vue, nous n’avions pas suffisamment expliqué ce contrat, ni trouvé la manière la plus simple de l’exprimer aux utilisateurs.
Même l’ancienne version du contrat, si on la lit attentivement, était similaire à la nouvelle : tous les droits sur les créations générées appartiennent à l’utilisateur, nous ne pouvons pas les réutiliser. Mais pour assurer normalement le service, nous devons pouvoir afficher les œuvres des utilisateurs et les manipuler, offrant des fonctions de partage ou de téléchargement, ce qui nécessite une autorisation. Le sens original était le même, mais la formulation posait problème, d’où la modification.
Notre intention première est que tout ce qui est créé appartient à l’utilisateur, nous n’en avons aucun droit. Nous ne conservons aucune donnée, nous n’utilisons rien. Nous affichons juste pour vous montrer, c’est tout.
Question : Utiliser Miaoya nécessite de télécharger 20 photos. Vous affirmez que les données du double numérique sont supprimées après génération. Alors pourquoi l’ancienne version du contrat mentionnait-elle l’utilisation comme données d’entraînement ?
Réponse : D’abord, nous n’avons jamais utilisé ces données comme données d’entraînement, ni maintenant ni jamais. Ce passage dans le contrat a effrayé tout le monde.

Ancienne clause controversée du contrat utilisateur de Miaoya Camera
Je le répète : la clause précédente stipulait que tous les droits sur les créations revenaient à l’utilisateur. Justement parce que nous transférons totalement ces droits, nous devons ensuite demander l’autorisation de les afficher.
Si vous observez bien les contrats d’autres produits, ils ne disent souvent pas que les créations appartiennent à l’utilisateur ; ils restent flous, voire attribuent ces droits à la plateforme. Si c’est le cas, bien sûr, aucune autorisation supplémentaire n’est nécessaire.
C’était donc une erreur de formulation de notre part : une bonne intention transformée en expression effrayante. Je dois clarifier ici l’intention de notre équipe : nous n’avons jamais pensé à collecter ou abuser des données privées des utilisateurs. Dès que nous avons vu que cette formulation n’était pas compréhensible, nous l’avons corrigée immédiatement, sans aucune hésitation, car nous n’avions rien fait de mal.
Question : Les caractéristiques faciales des utilisateurs sont-elles extraites ou divulguées ?
Réponse : Nous n’extrayons pas les points clés du visage, cette opération n’existe pas. Lors du téléchargement, une procédure de reconnaissance est effectuée, mais uniquement pour des vérifications de sécurité, afin d’éviter que des photos illégales soient uploadées. Nous ne collectons pas les données biométriques du visage.
Deuxièmement, le processus de création du double numérique n’est pas non plus une extraction des traits du visage. Inversement, nous ne pouvons pas reconstituer vos 20 photos originales. Impossible. Sans entrer dans les détails techniques, cela ne passe pas par l’extraction des données faciales.
C’est pourquoi, comme je le disais, publier votre visage sur les réseaux sociaux ou WeChat Moments comporte probablement un risque de sécurité supérieur à celui de nos produits génératifs.
Question : Si vous n’extradez pas les données clés du visage, comment obtenez-vous de tels résultats ?
Réponse : Cela utilise des technologies IA modernes, mais absolument pas par extraction des points du visage. Je sais que dans l’industrie, on peut spéculer sur diverses approches techniques. Je ne peux pas confirmer quoi que ce soit, mais je peux garantir qu’il n’y a aucun risque de sécurité. Tout en IA est probabiliste ; impossible de reconstituer ou inférer vos photos d’origine. C’est donc très sûr.
Question : Quelles mesures Miaoya prend-il pour protéger la vie privée des utilisateurs ?
Réponse : Nous promettons dans le contrat de ne pas conserver les photos téléchargées. Toutes les photos envoyées, qu’elles soient 20 ou plus, sont supprimées après la création du double numérique. Ainsi, ni les données brutes ni une reconstruction inverse ne sont possibles.
Deuxièmement, nous ne montrons jamais votre double numérique ou autres données à des tiers. Chaque utilisateur ne voit que ses propres images générées, et décide seul s’il souhaite les partager.
Troisièmement, nous avons mis en place de nombreuses protections de cybersécurité. Même si nous respectons la vie privée, nous devons aussi empêcher les pirates. Heureusement, nous bénéficions du soutien technologique global d
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News












