Web3を超えて、資本の新星AIGCのファンタスティックな漂流
TechFlow厳選深潮セレクト
Web3を超えて、資本の新星AIGCのファンタスティックな漂流
ブロックチェーンが生産関係の革新と最適化であるなら、AIは生産力の飛躍的向上である。

執筆:0xmin
最近、暇つぶしに、シリコンバレーのインターネット投資家たちに「今注目している分野は?」と尋ねてみた。
内心ではまた「SaaS」や「Web3」といったいつものキーワードが出てくると思っていたが、意外にも「AI」が最も頻繁に挙げられ、多くの一流VCがAI系スタートアップに注目し始め、巨額の資金調達が次々と明らかになっている。
例えば、Meta(旧Facebook)のエンジニアLin Qiao氏は退職後、オープンソースのディープラーニングフレームワークPyTorchを基盤に起業し、Stable DiffusionなどのAI画像生成を支援するプラットフォームを開発している。
複数のトップVCが競って参画したこのプロジェクトは、まだPPTと夢しかない段階だったが、最終的にBenchmarkやSequoia Capitalも参加して億ドル規模の評価額で数千万ドルの資金を調達した。
これはAIにおけるFOMO(恐怖による投資)の一つの縮図である。
10月17日、英国のオープンソース人工知能企業Stability AIは1億100万ドルの資金調達を発表し、評価額は10億ドルに達してユニコーン入りを果たした。Coatue、Lightspeed Venture Partners、O'Shaughnessy Ventures LLCなどが出資に参加している。
ここ最近話題のAIアート生成といえば、この会社を外せない。Stability AIは今年、テキストから画像を生成するディープラーニングモデル「Stable Diffusion」をリリースした。これは文字の説明に基づいて詳細な画像を生成できるものであり、その登場によりAI絵画という分野がさらに盛り上がっている。
最新のTigerの投資家向けレターによると、彼らはすでに静かにAI分野の大手OpenAIにも投資しているという。
AIのハリケーンがテクノロジー・ベンチャーキャピタル界を席巻しており、このFOMOの波は、Sequoia Capitalの一文にも関係している。
2022年9月23日、Sequoia米国公式サイトは「Generative AI: A Creative New World(生成的AI:創造的な新世界)」と題する記事を公開し、AIGC(AI-Generated Content=AI生成コンテンツ)が新たなパラダイムシフトの始まりを示すと考えている。
記事の著者はSequoiaのパートナー二人、Sonya Huang氏とPat Grady氏だが、面白いことに第三の著者として明記されているのはGPT-3である。OpenAIが開発したディープラーニングベースの言語予測モデルであり、簡単に言えば文脈に基づく生成型AIシステムだ。
GPT-3にヒントや文脈を提供すれば、それに対する続きを自動生成してくれる。つまり素材を与えれば、文章作成を代行してくれるのだ。
さらに、この記事の挿絵もMidjourneyを使って生成された。キーワードを入力するだけで美しいイラストが得られるため、多くのイラストレーターが不安を感じており、中国の微博(ウェイボ)では「絵画はAIに置き換えられるのか」というトピックがトレンド入りし、多くのクリエイターが議論に加わった。

画像出典:知著網
テキストや画像だけでなく、音声や動画もAI生成が可能になっている。
ポッドキャスト「Podcast.ai」の第1回には、亡くなったアップル創設者スティーブ・ジョブズが初ゲストとして登場し、アメリカの人気ポッドキャスターJoe Roganと20分間にわたる対談を行った。大学やコンピュータに対する見解、仕事観、信仰について語っている。
死者が復活することはない。これはもちろんAIによるものだ。
Podcast.aiは完全にAIによって生成されたポッドキャストであり、ジョブズの伝記やネット上にある彼の音声録音を集めてPlay.htの言語モデルで大量に学習させることで、「偽のJoe Roganがジョブズをインタビューする」という音声コンテンツを作り出した。
これらすべてがAIGC(人工知能生成コンテンツ)の一例である。かつてAIはコンテンツ制作の補助ツールにすぎなかったが、今やAI自体が創作の主体となり、執筆、デザイン、絵画、動画制作といった創造的作業を独立して完遂できるようになっている。
PGCからUGCへと進化することでコンテンツ産業は大きく発展したが、AIGCの台頭はさらに革命的な飛躍をもたらし、社会の歴史的プロセスさえも変える可能性がある。
Play.htはこう述べている。「我々は未来において、すべてのコンテンツ制作がAIによって生成され、人間がそれを指揮すると信じています。最も創造的な作業は、人間が自分の意図をモデルにどれだけ正確に伝えられるかにかかっています。」
AIGCとメタバース
AIGCとWeb3の融合を考えるとき、まず思い浮かぶのがメタバースだ。理由は単純で、真のメタバースを実現するには膨大な高品質な「コンテンツ」が必要だからである。
PGCのビジネスモデルでは、コンテンツの制作と収益化の権利が少数者に集中しており、人的リソースも限られているため、大規模なメタバースコンテンツの生成には到底追いつかない。
UGCによって誰もがクリエイターになれるようになったことで、生産能力のボトルネックはある程度解消され、多様性のニーズにも応えられたが、コンテンツの質はまちまちで、「ゴミコンテンツ」も多く、むしろマイナスの影響も出やすく、依然としてメタバースの要求には届かない。
真のメタバースへの到達には、AIGCこそが人類の生産力の制約を突破し、高効率かつ高品質なコンテンツを大量に生み出す鍵となる。
最も現実味のある例としてゲームを挙げよう。ゲーム内の美術、ボイス、シナリオなどは理論的にはすべてAIが補助または完全に担当できる。例えば最近、BilibiliのUP主「抜糸レモン製作組」はAIを活用してわずか6時間でシンプルな二次元ギャルゲーのデモを作成した。

この分野の成長スピードは、多くの人の予想をはるかに超えるだろう。
AIとWeb3の交差点に立つ
Web3の本質が「非中央集権」だとすれば、現在のAIGCは間違いなく中央集権的である。
過去にはAIモデルはオープンソースで存在していたが、ここ数年で大型モデルはますます閉鎖的になり、インターネット大手との結びつきも強くなっている。
AIGCの王者ともいえるOpenAIを例に取ろう。2015年にマスク氏らが設立したOpenAIは、当初から「非営利組織」として位置づけられ、「全人類が均等に恩恵を受けるように安全な方法で汎用人工知能を実現する」ことを目的とし、株主利益のためではなく公共の利益のために活動するとされていた。
しかし2019年、OpenAIは理念に反して「OpenAI LP」という営利法人に移行し、「OpenAI Inc」という母会社がこれを統括する構造になった。
構造変更から数カ月後、マイクロソフトが10億ドルを出資。条件として、GPT-3やCodexなどの技術を商業利用する権利を得た。
批判が相次いだ。アレン人工知能研究所所長のOren Etzioni氏は「非営利は競争力がないというのは同意できない……規模や資金が多いことが成功につながるなら、IBMが首位から陥落するはずがない」と指摘した。
共同創設者の一人、イーロン・マスク氏ですら、「これは『オープン』という理念に反する。実質的にOpenAIはマイクロソフトに支配されている。」と批判している(注:マスク氏は2019年にOpenAIの理事会を離脱済み)。

もしOpenAIが生産力の王者なら、それは同時に生産関係の問題にも直面している。公共財か営利組織か、長期的な持続可能性はどう保つのか…。
私たちの見方では、Web3は公共財やコモンズ・パラダイムを構築する機会を提供している。過去、公共財は大きな価値を生み出してきたが、自己維持可能な価値獲得手段が欠けていた。Web3の経済システムは、公共財に新たな価値獲得の道を定義し、得られた価値を最適に分配することで、公共財と共有資源の持続的発展を支えることができる。
まず第一に、AIモデルが必要とするデータの生成を、Web3の組織形態で集約することが可能になる。
成熟した強力なAIモデルは、膨大なデータを「学習材料」として必要とし、外部からの訓練・チューニングも不可欠である。そのため「AIトレーナー」といった職業も生まれている。
データは本来「独占性」を持っており、現在、大量のデータは大手テック企業が所有しており、データの生成や配布へのアクセスを開放するインセンティブはほとんどない。
しかし一方で、世界中には研究者にデータとモデル訓練を開放するオープンソースコミュニティも存在する。
-
Common Crawl:10年分のインターネットデータを蓄えた公共リポジトリ。一般的なAI訓練に使用可能。
-
LAION:非営利組織で、大規模機械学習のモデルとデータセットを一般に提供することを目指し、CLIPでフィルタリングされた58.5億の画像・テキストペアからなるLAION5Bを公開。公開直後に世界最大の公開画像・テキストデータセットとなった。
-
EleutherAI:非中央集権的コミュニティで、22の異なるデータソースから構成される825.18GiBの英語テキストデータセット「The Pile」を公開。言語モデル研究に広く利用されている。
現時点では、これらの組織は依然として非営利であり、主にボランティアの「愛のこもった貢献」によって運営されている。
では、Web3を用いてAIデータの生成とアクセスをどう最適化できるか?
CoinFundは一連のアイデアを提示している。例えば、トークンをインセンティブとしてオープンデータセットの作成を促進し、データ貢献量に応じて分配を行う。大規模なテキスト・画像データセットにラベル付けしてAI訓練を支援するような活動にも適用できる。こうしたオープンソースコミュニティをDAO化することも可能だ。良質なオープンデータセットは、大規模モデル研究のアクセシビリティ向上と性能改善に不可欠である。
優れた大規模AIモデルは独自のトークンを持つことができ、そのモデルを基盤とする製品の下流収益がトークン価値に還元される。これによりデータセット貢献者にも公正な報酬が行き渡る。つまり、Web3はデータの貨幣化とより良い公共財の構築を可能にする。
第二に、大規模ニューラルネットワークの訓練には膨大な計算リソースが必要であり、過去10年間でAIモデルの計算需要は3〜4ヶ月ごとに倍増している。
例えば、OpenAIのGPT-3は1750億のパラメータを持ち、訓練には3640ペタFLOPS-dayが必要。世界最速のスーパーコンピュータでも2週間、普通のノートPCでは1000年以上かかる。
そのためAI訓練にはGPUやASICといった数学演算に特化したハードウェアが必要だが、これらはGoogle Cloud、AWS、Microsoft Azure、IBMといった少数のクラウドサービスプロバイダーに寡占されている。
ここに、Web3の非中央集権的ガバナンス/市場モデルとAI計算のもう一つの接点が生まれる。
例えば、非中央集権的なガバナンスとインセンティブシステムを使い、計算リソースの提供を促進・分配することができる。トークンによるモデル訓練資金調達の「賞金制度」を想像してみよう。成功した調達者はモデルの優先計算権を得る。
現在、すでに同様の取り組みを行うプレイヤーがいる。Gensynは、ブロックチェーンを用いてディープラーニングタスクの実行を検証し、トークンで支払いをトリガーすることで、未使用の計算能力を貨幣化している。
ブロックチェーンが生産関係の革新ならば、AIは生産力の飛躍である。 二つの融合は新たな火花を生み出す可能性があり、多くの投資機関が注目している領域でもある。例えばCoinFundのRishin Sharma氏は、AIとWeb3の交差点で活動する以下の三種類のチームを探していると明言している:
1. オープンAIを核心ミッションとするチーム
2. データや計算リソースといった公共リソースをより良く管理し、AIモデル構築を支援するコミュニティ
3. AIを活用して創造性、安全性、革新性をメインストリームアプリに持ち込む製品
TechFlowもこの分野の起業・投資機会を非常に高く評価している。もしAIGCやWeb3に関連する挑戦を検討している方は、ぜひ交流を希望する。Twitter(@TechFlowPost)のDMまたはWeChat:Mintomoonまでご連絡ください。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News












