対話 SIGパートナーTim Gong：AIエージェントはツールではなく、人間と協働する新しい種である

2023.12.22

共有先

TechFlow厳選深潮セレクト

対話 SIGパートナーTim Gong：AIエージェントはツールではなく、人間と協働する新しい種である

創造性を持つ人間と機械が協働することは、将来の主流な勤務形態となる。

2023.12.22 - 01:48:18

Web3業界の深掘り報道に専念し潮流を洞察

創造性を持つ人間と機械が協働することは、将来の主流な勤務形態となる。

対談者：

王峰：ランコム・インタラクティブ創設者、マーズファイナンスおよびElement発起人

Tim Gong：SIG中国創業パートナー、ByteTrade会長

編集者の言葉：2023年の大晦日、王峰はTim Gongと対話を交わし、情報の並べ替え、エントロピー、パブリックチェーン、そしてWeb3の未来について語り合った（リンク：王峰が大晦日にTim Gongと対話：情報の並べ替え、エントロピー及びWeb3の明日について）。この対話からすでに一年が経過した。この一年でChatGPTが急速に普及し、LLMは情報の生成と配信に深い影響を与えた。その間、Tim Gong博士の認知にはどのような進展があり、彼が率いるByteTradeはどのような取り組みを行ってきたのか？クリスマス前夜、王峰は再びTim Gongと対話を交わした。

2022年6月、SIGはシンガポールに本社を置くWeb3情報アプリ向け基礎ソフトウェアプラットフォームByteTradeの新規4000万ドルの資金調達を主導すると発表した。SIG中国の創業パートナーであるTim Gongは同社の会長に就任した。Tim Gongは上海交通大学で物理学を専攻し、プリンストン大学で電子工学の博士号を取得した。SIGは字節跳動（ByteDance）の初期投資家であり、これまで最大の出資株主でもある。

昨年の大晦日に王峰とTim Gongは「なぜ分散型の情報配信が必要なのか」というテーマ、つまりよく言われるWeb3について議論した。その後、OpenAIがChatGPTをリリースした。過去一年間、LLMは情報の生成と配信に大きな変化をもたらした。多くのSIG投資先のWeb3、クラウドコンピューティング、あるいはAI企業も、この一年で機会を捉え、製品戦略を適時調整した。では、Tim Gongはこの一年でどのような新たな見解を得たのか。

以下は王峰とTim Gongの対話全文：

1. 多くの起業家や投資家が今、「AIネイティブ」な製品や企業について語っています。あなたにとってのAIネイティブとは何ですか？

一般的によく使われる定義として、「AIがなければ機能しない製品」というものがあります。例えばcopilotのような製品はおそらくAIネイティブとは言えないでしょう。なぜなら、AIがなくてもGoogle検索、Microsoft Office、GitHub Codespacesは依然として十分に有用な製品であり、AIが提供するのは体験の段階的な向上にすぎないからです。

一方、AIエージェントのような製品は、ユーザーが自然言語でやり取りするだけでよく、AIが理解し、計画し、推論し、タスク全体を実行します。これはまさにAIネイティブです。AIエージェントは単なるツールではなく、人と協働する新しい「種」なのです。

人が情報を検索する（Google代表）→ 情報が人を探す（字節跳動代表）→ 個人のAIエージェントが人間の情報の生産と消費を支援する。私たちは常にエントロピー低減を実現するための新しい方法を生み出しているのです。

2. 新しい種としてのAIエージェントは、人類を代替するものですか？

もちろん違います。最近、曾鳴教授が指摘したように、「創造性を持つ人間と機械の協働が、将来の主流となる働き方だ」と考えます。

現在、市場におけるAIエージェントの定義は広範囲にわたります。大規模モデルに知識、記憶、感覚（「目と耳」）、行動能力（「手」）を提供するあらゆるアプリケーションがエージェントと呼ばれます。もちろん、エージェントには人間の直接的な延長であるものも含まれます。たとえば、大規模モデル駆動のロボット、個人用IoTスマートデバイス、またはデジタルツイン環境などです。現在市場に出ている大規模モデル関連のスタートアップ企業のほぼ100％が、エージェントの開発に取り組んでいます。

3. もしAIエージェントが将来の主要な製品形態となるなら、それは将来的なソフトウェアエコシステム全体にどのような影響を与えるでしょうか？

曾鳴教授がかつて述べた「Web2のソフトウェアエコシステムは、人間をより良いツールにする」に対し、私は将来のソフトウェアエコシステムは主にAIエージェントに奉仕するものになると信じています。なぜなら、人間はもはやAIエージェントとのみやり取りすればよく、他のすべてのソフトウェアは人間と直接関係しなくなるからです。エージェント、あるいは「ロボット」は、あなたが情報を得るのを助け、お金を稼ぐ（仕事や取引）のを助け、学ぶのを助け、さらには社交まで助けてくれます。あなたの個人的なエージェントは、あなたが最も信頼し、最も役立つ相棒となり、あなたはそれとのみ対話すればよいのです。

たとえば、最近のLLM分野で非常に流行しているプロンプトエンジニアリング（提示語エンジニアリング）や、プライベート知識ベースを使ってプロンプトの文脈を補完するRAG技術などは、すべてAIエージェントを対象としたソフトウェアです。これがまさに基盤ソフトウェアレベルでのAIネイティブなのです。

Mistral AIの創業者も最近述べました。比較的小さなオープンソースLLM、例えば70億パラメータのモデルは、開発者が自分で実行でき、十分な「知性」を発揮できる可能性があるため、エージェントの革新にとって最適な領域（sweet spot）になるだろうと。

4. オープンソースのLLMについて言えば、一部の人々は未だに懐疑的です。最近のOpenAI Dev Dayで発表された一連の製品群は、一夜にして台頭したテック大企業の圧倒的優位性を示しています。OpenAIの先行き優位性はあまりにも強力ですが、AIの未来は中央集権的になるのでしょうか？

オープンソースの大規模モデルは、いまやますます高速に進化しており、競争力も高まっています。数日前にHugging Faceで検索したところ、Llama2アーキテクチャに基づいて再トレーニングまたはファインチューニングされたオープンソース大規模モデルが1000以上もあり、それらの性能ランキングでのOpenAIとの差も着実に縮まっています。

また、OpenAI Dev Dayで発表された一連の製品——モデルのファインチューニング、RAG知識ベース、構造化出力、アプリケーションオーケストレーションなど——は、すでに優れたオープンソースの解決策が存在していました。むしろアプリケーションの層面では、OpenAIがオープンソースの革新を追いかけて模倣していると言えるほどです。

5. しかし、LLMの研究開発や推論にはGPUリソースが大量に必要であり、非常に中央集権的になりやすい。多くの人々は、「GPUリッチ（豊富なGPUを持つ）」大手企業と「GPUプア（GPU不足の）」スタートアップ企業の格差はますます広がると指摘しています。

私はこれに反対です。簡単に言えば、今最も重要なオープンソース大規模モデルであるllama2は、GPUリッチなMetaが公開したものではありませんか？同じくGPUリッチなGoogle、Microsoft、Amazonは、今日までに影響力のあるものをほとんど出していません。GPUは明らかに革新のための十分条件ではありません。革新は人によるものであり、GPUによるものではないのです。オープンソースの最大の利点は、人々を一つにまとめられることです。さらに、GPUの計算能力がますます安価になっていくにつれ、モデル訓練の主な課題は算力ではなく、データ、特にプライベートドメインのデータに移っていくでしょう。

さらに言えば、GPUリッチであることさえ、大規模モデルの革新にとって必須条件ではないかもしれません。個人用コンピュータやエッジサーバーには大量の空きGPUがあります。これらはモデルの訓練には向かないかもしれませんが、アプリケーションの95％を占めるファインチューニングと推論のワークロードには、このような分散型GPUリソースが大きく貢献できます。

もっと期待しているのは、CPUで大規模モデルの推論を行うというさらなる科学技術革新です。社会全体には大量のアイドル状態のCPU計算能力とメモリがあります。この分野の先端的研究は多く行われており、私たちのポートフォリオ企業の中にも、Second Stateのように、個人用ノートPCやIoTエッジデバイス上でオフラインで大規模モデルを実行することを可能にしている会社があります。

私は分散型AI大規模モデルアプリケーションの未来に大きな期待を寄せています。

6. 分散型AIエージェントの実現可能性については話しました。しかし、それらは本当に必要なのでしょうか？あなたのビジョンにおいて、分散化はユーザーのどのようなニーズを満たすのでしょうか？

しかも、AIエージェントは、各個人の情報の出入り口を完全に掌握する可能性があるため、我々はそれに対して極めて高い信頼を寄せる必要があります。それを他人に支配させることは到底許容できず、広告主の商業的誘導にも耐え難いでしょう。そのため、エージェントは個人所有のもの、つまり分散型であるべきです。個人や企業には、分散型インフラが必要です。

さらに言えば、個人のロボットアシスタント、IoTスマートデバイス、デジタルツインなどは、元来ユーザー自身が所有するコンピュータであり、本質的に分散型です。ByteTradeでは、これを「プライベートエッジクラウド」と呼んでいます。

しかし、個々のプライベートエージェントは協力する必要があります。人間と同じように、それぞれのエージェントは他のエージェントとリソースを交換する必要があるのです。その交換内容は、計算資源（例えばあなたのエージェントが空いているGPUを持っている場合）、情報、資産、あるいは現実社会における権限（例えばあなたのエージェントが政府のライセンスを持ち、制限付き資産を取引できる場合）など多様です。これらはすべてまったく新しい機会です。

7. 人間同士の協働は組織関係によって実現されます。人間と機械の協働は、何によって実現されるのでしょうか？

現代商業文明の基盤は貨幣、つまり人間同士の価値交換ネットワークです。私たちのスマートエージェントも、エージェント同士、およびエージェントと人間との間にビジネス協働を可能にする価値交換ネットワークを必要としています。

李飛飛博士は最近のインタビューで、「この技術を考えるとき、人間の尊厳、人間の幸福、人間の仕事――これらを常に中心に据えるべきです」と述べました。人間とAIエージェントの相互作用と協働は、人間の尊厳を守るものでなければなりません。

幸運なことに、こうしたネットワークの基盤技術はすでに存在しています。それが、ブロックチェーンに基づく分散型台帳技術です。CryptoおよびWeb3コミュニティは、分散型P2P取引システムに関して多数の試みと革新を行ってきました。ByteTradeでは、量的かつ取引可能なエージェントの貢献を「Intelligenceの証明（Proof of Intelligence: PoI）」と呼びます。このintelligenceは広義の「知性」であり、人間または機械の知的労働の成果を意味します。

8. この世界では、誰もがDID（分散型アイデンティティ）を受け入れる必要がありますか？

Sam AltmanのWorldCoinは「人物存在の証明（Proof of Personhood）」を掲げています。OpenAIの創業者として、彼は将来のAI世界において、人間が価値ネットワークに参加するには「自己証明」が必要になることを認識しています。DIDはこのビジョンを実現するための具体的な技術手段の一つにすぎません。

ByteTradeのProof of Intelligence（PoI）は、人間とスマートAIエージェントを同一のネットワーク内で価値交換できるようにします。ここでの初期の主要なシナリオとしては、エージェントが人間の好みを学習し、その人間を代表して他のエージェントとやり取りすることが考えられます。例えば：

あるエージェントは、ユーザーのVR世界内でのデジタルツインとして、他の人のエージェントとデジタル世界で交流する。
あるエージェントは、自ノード上の空きGPUリソースを販売し、別のエージェントの空きストレージリソースと交換する。
あるエージェントは、特定の分野で優れた性能を発揮するファインチューン済み大規模モデルを持っている（例：そのエージェントの人間パートナーが業界の専門家である）。このモデルを他のエージェントに「貸し出す」ことができる。
あるエージェントは、他のエージェントが特定の問題をより良く解決するのに役立つプライベートドメインデータを持っている。これらのデータを販売したり、データを基に計算サービスを提供したりできる。
あるエージェントはDAOやパブリックチェーンのステーキングノードを運用し、追加のステーキング資金を投入するエージェントと収益を共有できる。

これらのエージェント間の交換はすべて、PoIの具体的な表現です。これらのPoIはブロックチェーン上でさまざまな形態を取り得ます。例えば、均質な計算リソースはfungible token（代替可能トークン）として、特殊で唯一無二のデータやアルゴリズムはNFTとして表現可能です。このintelligenceの価格決定は、分散型RFQネットワーク（例：Otomic）やNFT取引所（例：Element）によって行われます。

9. 明らかに、AIの中央集権化を促進するもう一つの巨大な力は政府です。中国であろうと米国であろうと、人工知能産業関係者は、米中両政府が大規模モデルを「規制」しようとしていることに疑問を抱いていません。ベンチャーキャピタル界では、規制が革新を妨げるのではないかと懸念する声も多く聞かれますが、ご意見をお聞かせください。

私は大規模モデル、ひいてはAGIが社会に害を及ぼすリスクは確かに存在すると考えます。しかし、問題解決の方法は技術革新と業界自律に依拠すべきです。例えば、大規模モデルは偽ニュースを生成できる一方で、それを検出することもできます。私たちの各エージェントは独立して情報の真偽を判断でき、その結果をNFTとしてブロックチェーン上に記録することもできます。例えば、AのエージェントがBのモデルとAのデータを使ってリアルな短編動画を作成した場合、Aは同時にその動画の出所を証明するNFTを発行します。これにより、この動画を見る誰もがその真正性を追跡できるようになります。

異なるエージェントが情報の真偽について意見が分かれる場合、PoIはコミュニティが合意に達するための優れた仕組みを提供します。

Elon MuskがXで実現したCommunity Notesは、ユーザーがコンテンツに対して投票する仕組みであり、非常に成功した試みの一つです。しかし、OpenAIの取締役会での「宮廷闘争」からもわかるように、利害関係のない（no skin in the game）投票は非常に危険であり、容易に悪用されてしまいます。

AIエージェントを使えば、コンテンツの真偽に対する投票を大規模に行うことができます。そしてPoIは経済的メカニズムであり、エージェントおよびその背後にいる人間が投票に対してコストを負担すること、つまりskin in the gameを持つことを可能にします。この方向の起業プロジェクトに私は大きな期待を寄せています！

10. 起業企業の話が出ましたが、あなたが会長を務めるByteTradeは、すでにこうした取り組みを始めているのでしょうか？

はい、ByteTradeは設立当初から、各個人が持つ計算リソースをつなぎ合わせ、分散型の「パーソナルクラウド」を構築することを目指していました。これは、今日私たちが語っているエージェントと何も変わりません。過去一年の主な変化は、AIの力がさらに強くなり、AIエージェントの応用シナリオと需要が一段と高まったことです。ByteTradeとしては、来年、いくつかの製品モジュールを段階的に発表していく予定です。

Terminus OSは私たちのパーソナルクラウド製品です。オープンソースのAI大規模モデルやエージェントを個人が実行できる分散型計算プラットフォームを提供します。
Terminusには、特に金融やブロックチェーンなど高度なセキュリティが求められるコアアプリケーション（ウォレット、DIDによる身元確認など）がプリインストールされます。
Terminus Marketplaceは分散型アプリケーションマーケットプレイスです。ByteTradeおよびサードパーティの開発者が、AIエージェント、コンテンツ推薦エンジン、自動取引ロボットなどのアプリをここでリリースできます。
OtomicはRFQに基づく取引ネットワークです。Terminus内で動作するロボットが主に価格提示と自動取引を実行します。この分散型RFQメカニズムは、ほぼすべての暗号資産および従来の金融デジタル資産・デリバティブの取引を可能にします。

ByteTradeは、オープンソースの大規模モデルおよびAIエージェントに対して、分散型のソフトウェア開発・リリース・実行インフラを提供する一方で、パブリックチェーンを基盤とするPoI価値交換ネットワークを構築することで、AIエージェント間の協働を可能にしています。来年、皆さんとこうした課題についてさらに深く議論できる機会があることを心待ちにしています！

素晴らしい、本日はお時間をいただきありがとうございました。ByteTradeの製品を心より楽しみにしています！

TechFlow公式コミュニティへようこそ

Telegram購読グループ：https://t.me/TechFlowDaily

Twitter公式アカウント：https://x.com/TechFlowPost

Twitter英語アカウント：https://x.com/BlockFlow_News

原文リンク

お気に入りに追加

SNSで共有

作者

MarsBit