
「妙鸭」製品責任者との対話:AIGCの製品は、初日にお金を請求しなければ、その後ずっとお金は集まらない
TechFlow厳選深潮セレクト

「妙鸭」製品責任者との対話:AIGCの製品は、初日にお金を請求しなければ、その後ずっとお金は集まらない
効果がチーム全員に「これはすごい、わあ!」と思わせる瞬間(ワオ・モーメント)をもたらすとき、その拡散確率は非常に高くなる。
著者 | 宛辰、鄭玥
編集 | 鄭玄
誰もが予想しなかったことに、中国国内でAIGC(AI生成コンテンツ)分野において初めて真に意味で「クロスオーバー」を果たした現象級の製品が、すでに非常に成熟した分野である「写実的ポートレートの写真加工」の領域から生まれた。
7月中旬にこっそりリリースされたこの製品は、「9.9元と20枚の写真があれば芸術的なプロフィール写真を生成できる」というキャッチーな売り文句により、短期間で数え切れないほどの女性ユーザーがダウンロードし体験。その「ミャオヤ撮影写真」は瞬く間に微信(WeChat)の友人関係やその他のSNSを席巻した。
ミャオヤのクロスオーバー速度は驚異的だが、その開発チームは極めて謎めいている。リリース前にも、ここ数ヶ月で開催された数十回の大規模モデル発表会で何らかのヒントが示されたわけでもなく、数千万から数億人民元もの大規模なシード資金を得て起業した「著名人物の起業」でもない。むしろ業界関係者のほとんどが、ミャオヤが独立したスタートアップなのか、それとも大手企業内部のプロジェクトなのかすら把握していない。
最近、ミャオヤの製品責任者である張月光氏は、ギズモード・チャイナを含む複数のテックビジネスメディアの合同インタビューに応じた。
ミャオヤはアリババのエンタメ部門が育成する社内プロジェクトである。ChatGPTが新たなAIブームを引き起こした後、張氏は同僚数名と共に今年2月に「AIGC壁突破グループ」という社内チャットグループを作成。約1カ月かけて「写実的ポートレート」という方向性を議論し、さらに3カ月かけて「ミャオヤ」という具体的な製品を完成させた。
これはかつてグーグルが導入していた有名な「20%フリータイム制度」、そしてその制度から生み出されたグーグル・グラスやCardboard、自動運転車などの革新的な成果を連想させる。まるでシリコンバレー式のロマンチックな始まり方であり、私たちのミャオヤへの好奇心をさらに掻き立てている。
1時間半に及ぶインタビューの中で、張月光氏はミャオヤに関する一連の質問や物議について回答した。製品の技術的詳細、ユーザー規模、チーム構成、将来の収益化戦略などについては「商業機密」として明かせないとされたが、写実的ポートレートを選んだ理由、製品誕生の経緯、データプライバシー問題、流行の要因などについては詳しい説明があり、ミャオヤの神秘のベールの一部が明らかになった。
以下はギズモード・チャイナが整理した対話内容である。
01 数人の趣味のグループから、3カ月で「ミャオヤ」を完成
問:チームはどのようにゼロから製品を立ち上げたのですか?
答:このプロジェクトは1〜2月頃に始まり、当初は現在のような明確なビジネスプランもなく、単なる趣味のグループのようなものでした。私は5、6人の同僚と共に、AIと画像技術の最先端の知識や製品を研究していました。2月9日に「AIGC壁突破行動グループ」というチャットグループを作成しました。そこから徐々に、画像AI技術分野における新技術やエコシステム内の新ツール、プラグインに関心を持つようになりました。3月頃には、いくつかの重要な技術的要素が十分に成熟していると判断し、写実的ポートレートという方向性に絞って開発を進めることに決めました。

ミャオヤチームの集合写真|ミャオヤカメラ公式公众号
その後3カ月以上かけて、技術面と美学面でのテンプレートを磨き続けました。6月末から7月初めにかけて、ようやくユーザーに公開できる状態まで仕上がったと判断し、2週間のインサイダー向けテストを開始。身近な友人や同僚に参加を依頼し、フィードバックを得ました。結果として、ユーザーの反応は製品の効果と満足度に関して概ね好意的でした。7月中旬に正式に一般公開したところ、大きな反響を呼び、ユーザーの支持も高く、成長スピードはチームの当初の予想を上回りました。
リソース面では、当初はあまり多くのリソースを割いていませんでしたが、徐々に発展するにつれて、より多くの支援を得られるようになりました。最も重要だったのは、会社側が革新に対して寛容であり、サポートしてくれたことで、さまざまな試みを行う余地がありました。
問:なぜAIGCの実用化にあたって「写実的ポートレート」の分野を選んだのですか?
答:製品の方向性について、いくつか基本的な分析を行いました。まず、以前にアルバム系の製品を担当していた経験から、ユーザーにアルゴリズムによる自動分類機能を提供していましたが、すべてのユーザーのアルバムを見ると、70%以上が実際の人間の写真です。すべての写真や画像情報をフィルターなしで集計すれば、写実的ポートレートは価値が最も高く、占める割合も最大であり、最も注目される存在です。
もう一つの考慮点は、海外ではMidjourneyのような製品が成功しており、中国でもそれに類似した製品が模倣を試みています。しかし、これらの製品は「何でも描ける画家」のようなものであり、技術やアルゴリズムに対する要求が非常に高くなります。よりニッチな方向性の方が実現しやすいため、それが写実的ポートレートという大枠を選んだ理由です。
問:多くのユーザーが「たった9.9元で天真藍や海馬体を凌駕できる」と体験していますが、それについてどう思いますか?
答:私たちは天真藍や海馬体を倒すつもりはありません。それはあくまでユーザーのスローガンです。私たちの初期の製品形態は現在の写真スタジオサービスに似ているかもしれませんが、私たちの立場としては、写真・映像業界と協力関係を築き、業界に貢献する存在になりたいと考えています。海馬体のような実店舗型の撮影サービスは、決して代替できない存在です。なぜなら、撮影そのものが顧客にとって非常に重要な体験だからです。例えば、家族写真を撮るとき、家族全員が集まって一緒に撮影するプロセス自体に大きな意味があります。AI技術がどれほど進歩しても、そのような体験は代替できません。

ミャオヤカメラのトップページ
私たちは主に地方都市や発展途上地域のユーザーを対象にしており、そういった地域ではこうしたサービスにアクセスしづらいからです。しかし、どこに住んでいようと、美しさや写真に対する需要は存在します。人々は常に、記念に残る写真を残したいと思っているからです。
最初の感謝のメッセージでも述べましたが、私たちは実際にフォトグラファーとデザイナーを招待し、テンプレートの作成に参加してもらいました。彼らにとってもAI技術の助けはとても不思議なものでした。私たちはこのエコシステムと補完関係にあると考えており、対立関係ではありません。この業界にツールを提供したいと思っています。競合を倒すのではなく。
問:ご自身で振り返って、なぜミャオヤはここまで流行したと思いますか?
答:最も重要な要因は、チームメンバーの信念と努力です。チームの雰囲気はシンプルで率直、目標も明確であり、究極の品質を追求するスタイルを持っています。私たちは3カ月以上かけて一つの効果を徹底的に磨き、より良いユーザーエクスペリエンスと結果を目指しました。第二に、会社が革新を奨励し、支援し、寛容であること。また、一定の成果が出た段階で、さらなる支援が得られたことも大きいです。
製品自体に原因を求めると、いくつかのポイントがあると思います。
まず、幸運にも恵まれたと思います。次に、ユーザーエクスペリエンスが非常に重要です。製品が使いづらく、スムーズに使えない場合、どんなに価値が高い製品でもユーザーに捨てられてしまいます。製品の商業的価値は線形的な関係ではなく、ある基準点を超えたときに初めて本格的に発揮されます。そのため、製品設計では高品質な結果を追求しなければなりません。少なくとも90点以上を目指すべきです。チーム全員が「これは本当にすごい!」と感じ、「ワオ!」と思える瞬間(Wow moment)が得られれば、口コミ拡散の可能性は非常に高くなります。
さらに、製品のコントロール性も非常に重要です。私たちは設計時、「真」「像」「美」という三つの原則を守っています。「真」とはAIらしさを感じさせないこと、「像」とはユーザーに似ていること、「美」とはユーザー本人より3点ほど美しくすることです。これらすべての要素が90点以上を達成して初めて、市場に投入します。
問:なぜユーザーがアップロードする写真の枚数は20枚に設定されているのですか?
答:理想的な結果を得るために、20枚というのが現時点での最適解です。具体的な理由は差し控えます。

ミャオヤカメラはユーザーに20枚以上の写真を提供してもらう必要があります|ミャオヤスクリーンショット
問:このような人気ツール型製品は、すぐコピーされる危険に直面すると指摘されています。背景のモデルはオープンソースモデルをファインチューニングしたものではないかとの推測もあり、技術的ハードルが低いように見えます。内部から見た技術的または製品的な障壁はどこにあるのでしょうか?
答:技術的な実装方法については詳しくお話しすることはできませんが、確かに一定の障壁はあります。最も重要なのは、継続的な改善、拡張、および効果の持続的な研磨です。当社の技術チームは製品の効果を不断に最適化しています。
問:ある推測では、Stable Diffusionのモデルを使い、LoRAでファインチューニングしているのではないかと言われています。この推測は現実に合っているでしょうか?
答:これについても評価を控えさせていただきます。技術実装に関する質問はすべて商業機密に該当するため、公表することはできません。
問:ミャオヤの画像生成の基盤モデルは自社で訓練したものでしょうか?それともアリクラウドの画像生成モデルを使用していますか?
答:ミャオヤはアリババエンタメチーム内のプロジェクトであり、アリクラウドの関連技術は使用していません。どのように実現しているかについては、やはり説明できません。
ただし、私たちは「ティツィアーノ(Tiziano)」というモデル名を持っています。おそらく7月17日に公式発表された感謝のメッセージでこの名前をご覧になったでしょう——肖像画の父の名前です。この名前からもわかるように、当初から私たちはユーザーに写実的ポートレートサービスを提供したいと考えていました。
問:現在のミャオヤのテンプレートスタイルはどのように形成されているのですか?
答:チーム内には若いメンバーが多く、効率的に議論しています。もっとも大事なのはユーザーの声です。例えば、SNSや朋友圈で公開共有される中で、ユーザーが好む傾向を見て判断しています。
ユーザーからの意見も多数収集しており、どのようなテンプレートが人気かを把握し、それに基づいて新しいテンプレートを追加しています。今後リリース予定のテンプレート群も、ほとんどがユーザーの要望に基づいています。
問:ミャオヤカメラは、仕上がりの「リアルさ」と「美しさ」をどのようにバランスしているのですか?
答:7〜8割は似ていて、2〜3割は美しく。私たちは写実的ポートレートという方向性を定めたとき、「真」「像」「美」の三つを掲げました。つまり、AI感がなく、可能な限り自分に似ていて、かつ自分より美しいということです。これは美顔カメラや世代ごとの撮影製品にとって常識的なことです。
同時に、選択権はユーザーに委ねています。生成されたポートレートは最初はとても美しいですが、やや似ていないかもしれません。そこで特別な機能を使って「もっと自分に似せる」ことができます。何度かクリックすれば、どんどん自分に近づけられます。
問:ミャオヤは今後も若年層の女性ユーザーに特化し続けるのですか?
答:すべてのセルフィーや画像系製品の主力ユーザーは女性です。私たちのテンプレートの種類の多さを見ても、それがよくわかります。
02 プライバシーとデータセキュリティの議論
問:アリババエンタメの豊富な映像資源を活かし、動的顔合成(フェイススワップ)製品の連携計画はあるのでしょうか?例えば、登録した顔をドラマのキャラクターに変換するようなものです。
答:アリババエンタメとの連携を目的としていませんが、もし適切な機会があれば、ドラマや古風、清宮スタイルなどのテーマと連携して製品を開発し、ユーザーの関心を探ることも検討できます。
フェイススワップ自体は、私たちが断固として行わないことです。私の製品に対する最初の定義からして、過去のフェイススワップ製品とは異なるものであり、むしろ意識的に避けてきた方向性です。
問:市販のフェイススワップ製品の発展についてどう考えますか?
答:フェイススワップはかなり成熟した製品ですが、その用途についてはこれ以上コメントしません。一方で、一定のセキュリティ上の問題もあります。
私たちがAIで生成する写真は、本物のフェイススワップよりもはるかにリアルではありません。少なくとも、顔のキーポイント検出といったセキュリティレベルのテストでは到底通らないはずです。見かけは似ているだけです。この方法であれば、ユーザーのデータは安全であり、生成も比較的安全なので、長期的な発展の余地があります。
問:ユーザー契約条項に関する議論についてどう考えますか?
答:ミャオヤはリリース後にユーザー契約を理由に若干の議論を呼びましたが、すぐに修正しました。これは私たち自身の問題だと認めています。ある意味で、契約内容を十分に説明できなかった、あるいは最もシンプルな言葉でユーザーに伝えられなかったのです。
古い契約であっても、よく読めば新しい契約とほぼ同じ内容です。つまり、製品によって生成されたすべての成果物の権利はユーザーに帰属し、当社は二次利用できません。ただし、ユーザーに正常なサービスを提供するために、作品の表示や操作、共有・ダウンロードサービスを提供する必要があるため、ユーザーの許可を得る必要があります。旧契約もその趣旨は同じでしたが、表現に問題があったため、修正しました。
私たちの本意は、作られたすべてのものはユーザーに属するというもので、当社は所有権を持っていません。ユーザーのデータは一切保存せず、使用もしません。表示が必要な場合は、一時的に表示するだけです。これが私たちの本来の考え方です。
問:ミャオヤを使うには20枚の写真をアップロードする必要がありますが、生成後にデジタルアバターのデータは削除されるとおっしゃっています。それなのに、なぜ旧バージョンの契約では「訓練データとして使用する」という条文があったのですか?
答:まず、このデータを訓練データとして使用したことは一度もなく、これからも使うつもりはありません。以前の契約文は、皆を驚かせてしまいました。

ミャオヤカメラ旧版の議論となったユーザー契約
もう一度説明します。契約の前の条項では、すべての生成物の所有権がユーザーにあると明記しています。まさに所有権を完全にユーザーに譲渡しているため、逆に当社がその情報を表示するにはユーザーの同意が必要になるのです。
実は多くの製品のユーザー契約では、「当社プラットフォーム上で制作した物品の所有権はユーザーにある」とは明言せず、曖昧にしたり、プラットフォーム側に帰属させたりしています。所有権がプラットフォームにあるなら、もちろんユーザーの許可を得る必要はありません。
このやり方は確かに私たちのミスで、善意を逆に皆を非常に恐れさせる表現にしてしまいました。ここで改めてチームの本心を明確にします。ユーザーの個人情報のプライバシーについて、悪用を考えたことは一度もありません。そのため、表現がわかりにくく、ユーザーに誤解を与えたと気づいた時点で、即座に修正しました。心理的抵抗もなく、そもそもそんなことをしていないからです。
問:ユーザーの顔の特徴は抽出され、漏洩する可能性はありますか?
答:ユーザーの顔のキーポイントは抽出していません。そのような操作自体がありません。ユーザーが写真をアップロードする際、識別プロセスはありますが、これは国家の法律に違反する写真を防ぐためのセキュリティ検査であり、ユーザーの顔のデータポイントを取得しているわけではありません。
第二に、デジタルアバターを作成するプロセスも、顔の特徴を抽出するプロセスではありません。逆に言えば、ユーザーがアップロードした20枚の写真を再び復元することは不可能です。技術原理は詳しく説明できませんが、ユーザーの顔のデータ情報の抽出は行われていません。
先ほども言ったように、SNSや朋友圈に自分の顔を投稿するほうが、セキュリティリスクはむしろ高いかもしれません。
問:ユーザーの顔のキーデータを抽出していないなら、今の効果はどうやって実現しているのですか?
答:現在のAI技術を使用していますが、決して顔の特徴点を抽出する方法ではありません。業界ではさまざまな技術的アプローチの推測があると思いますが、ここでは肯定も否定もできません。ただ、セキュリティ上の問題は一切ありません。AIのすべての処理は確率的なものであり、あなたの写真を再現したり、逆算したりすることは不可能です。非常に安全です。
問:ユーザーのプライバシー保護のために、ミャオヤはどのような対策を講じていますか?
答:契約で約束している通り、ユーザーの写真データは保存しません。ユーザーがアップロードしたすべての写真(20枚であろうとそれ以上であろうと)は、デジタルアバターの作成が完了次第、削除されます。そのため、ユーザーのデータを保持することもなければ、デジタルアバターから逆算してデータを復元することもできません。
第二に、ユーザーのデジタルアバターその他のいかなるデータも、第三者に提示することはありません。製品の形式上、各ユーザーは自分が生成した画像しか見ることができず、他人との共有・表示はユーザー自身の選択に委ねられています。
第三に、当社は大量のネットワークセキュリティ対策も講じています。ユーザーのプライバシーを保護し、悪用しないとしても、外部のハッカーによる不正取得を防ぐ必要があります。この点では、アリババグループ全体のプライバシー保護とセキュリティ技術のサポートが大きく貢献しています。
過度に恐れる必要はありません。このツールは本質的に画像作成ツールであり、作成されたコンテンツは自分自身にしか見えず、公開共有の性質もありません。むしろ非常に安全です。AIが私の顔を生成できるなら、悪用されるのでは?という質問もあります。しかし、生成されたものはどれほど似ていても、あくまで「似ている」だけです。一方で、公開SNSに直接自分の写真を投稿すれば、それはまさに「あなた」そのものであり、顔を切り抜かれれば悪用されるリスクがあります。私たちの生成物は、むしろリスクが小さい製品なのです。
総合的に見ると、ユーザーへの影響は極めて低く、ほとんどありません。データは保存せず、逆算も不可能。元のデータや特徴点も取得していません。すべてのコンテンツは自分だけが閲覧可能で、生成物を共有するかどうかは個人の判断です。共有された生成物も、顔認証のセキュリティチェックでは通らないでしょう。なぜなら、自分に似ているだけで、完全に同一ではないからです。
03 AIGCの製品は初日から有料にすべき—無料なら永遠に収益化できない
問:現時点でのミャオヤAPPのダウンロード数や、ユーザーの再利用状況はいかがですか?
答:具体的なデータ指標については、機密事項のためお答えできません。しかし、データの結果は期待通りで、良好だと感じています。2週間のインサイダーテスト期間中に約1万人のユーザーが参加し、その中心となるユーザーは主に同僚たちで、多くはインターネット業界出身です。
将来的なユーザー規模については独自の計画がありますが、こちらも非公開です。より広範なユーザーにこの製品やサービスを提供し、将来のトレンドに対応していきたいと考えています。
問:ミャオヤカメラはユーザーのアクティブ維持についてどのように考えていますか?市中では、このようなアプリは一過性のブームに終わるのではないかという声もありますが、この懸念についてどう思いますか?
答:まず、効果系製品のSNS爆発的拡散は、この業界ではほぼ日常茶飯事です。数年に一度、あるいはインターネットのピーク期には毎年のように似たような製品が登場します。確かに一時的に注目を集める製品もあれば、やがて静かになるものもありますが、一部は定着します。例えば「脸萌(リアンメン)」は、一時的に流行した後消え去ったと思われがちですが、その需要は最終的に抖音(ドウイン)のエフェクトやフィルターによって吸収されました。これは非常に安定した需要であり、今日でも多くのユーザーが毎日利用しています。
ミャオヤカメラに関しては、決して「一発屋」ではなく、安定したサービス需要になると期待しています。もちろん、そのためには製品の効果とサービス品質の継続的な向上、さらなるサービスの追加が必要です。具体的な実現方法は非公開ですが、目標はユーザーに低コストかつ高品質な画像サービスを提供することです。
問:ミャオヤのBtoB向けワークステーションは8月4日(本日)にリリースされ、AIおよび関連技術分野で優れた実績を持つデザイナーに内観テストを依頼しています。このワークステーションにはコンテンツコミュニティの要素はありますか?フォトグラファーとの連携方法は?どのようなデザイナーを対象としていますか?BtoBの課題と、ミャオヤが解決できることは?
答:BtoB向けワークステーションにはコンテンツコミュニティの要素はありません。現在のBtoB事業はシンプルで、BtoC事業のエコシステムを補完する役割に近いです。AI技術に造詣が深く関心のあるデザイナーやフォトグラファーと協力し、サービスを提供しながら共同でテンプレートを作成し、ユーザーのニーズに応えたいと考えています。具体的な連携形態は非公開ですが、要は共同でテンプレートを作ることです。
問:なぜ9.9元という価格を思いついたのですか?なぜ最初から収益化を前提としたのですか?

9.9元に含まれる特典|ミャオヤスクリーンショット
答:収益化の潜在力には二つの要素があります。第一に、計算リソースのコストが非常に高いこと。これは業界関係者なら誰もが知っています。第二に、AIGC時代のビジネスロジックはインターネット時代とは根本的に異なります。AIGC時代では、ユーザーに初日から課金できない製品は、その後永遠にお金を稼げないのです。AIGC製品は誕生したその日から、ユーザーに課金すべきです。
インターネット時代のビジネスを抽象化してみると、本質的には情報流通とチャネルビジネスです。プラットフォームの役割は、A地点からB地点へ情報を移動・配信すること。何を配信しても、抽象的にはチャネルです。最初は無料ですが、徐々に手数料を取ったり、他で二次収益化を図ったりします。
しかし、AI時代に変わるものはチャネルではなく、工場です。AI製品自体が工場であり、配信プラットフォームではないのです。工場が生産する商品が、初日に売れないなら、その後も売れません。だからこそ、優れたAI製品には収益化の大きな可能性があると信じています。
ミャオヤが9.9元を選んだのは、さまざまな計算と考察の末の結果で、比較的シンプルで理解しやすい価格帯を提供したいと考えたからです。ユーザーの自発的な拡散状況を観察したところ、9.9元という価格はユーザーにとって受け入れやすく、理解しやすいようです。
問:爆発的人気に伴い、待ち時間が長くなりましたが、現在は短縮されつつあるものの、まだ3〜4時間程度です。どのような最適化を行いましたか?コストはどうですか?
答:現在の待ち時間短縮は、計算リソースの大幅な拡張によるものです。一方で容量を増やしている一方、ユーザーの利用量も増え続けており、待ち時間の問題は依然として存在します。根本的な解決策は計算リソースの拡大です。拡張コストは管理可能です。価格設定には多くの要素を考慮しています。他のチームと話したところ、この製品を開発するには多くの目に見えないハードルがあり、克服が難しいと聞いています。外見上は似た製品が作れても、ユーザーが大量にアップロードすれば、計算コストが非常に高くなり、経済的に非効率になるため、開発しないのです。この点で、会社はミャオヤに非常に大きなスペースと支援を提供しています。有料化により、当社としては比較的健全な状態を保てています。
問:BtoB製品がリリースされた後、9.9元以外の価格設定はありますか?答:製品への関心はありがとうございます。詳細は差し控えます。基本的なビジネスロジックに則り、最終的には利益を出す必要があります。収入、コスト、利益の問題です。すでに黒字化しているかはまだ計算できませんが、比較的健全なビジネスモデルだと考えています。
問:写実的ポートレートという分野でどこまで到達すれば、満足して他の事業展開を考えますか?
答:まだまだ道のりは長いと思います。今はちょうど旅の始まりです。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News












