
対話 Kaito CEO:Web3のための究極のGPTを構築する
TechFlow厳選深潮セレクト

対話 Kaito CEO:Web3のための究極のGPTを構築する
新しいデータ配布パラダイムにおいて、Web3がもたらす機会が、テクノロジー企業によるデータ独占の経済論理を完全に変えると私は確信している。
TechFlow:Sunny
Kaito: Yu Hu

「新しいデータ配信パラダイムの下で、Web3がもたらす機会は、テクノロジー企業によるデータ独占という経済的論理を完全に変えると私は確信しています。」
-- Yu Hu
Web3の情報を効率的に取得するには?一般ユーザーにとっては、Twitter、Discord、Telegram、メディアサイトが主な情報源です。分析能力が高いユーザーは、オンチェーンデータブラウザーやガバナンスフォーラム、ポッドキャスト、コンサルティングレポートなどを使用することもあります。Web3の情報はWeb2よりも断片化されており、暗号ネイティブの複数のソーシャルアプリやブロックチェーン上に分散しており、宝探しのような状態であり、Googleに代表される検索経路とは大きく異なります。
どの業界も混乱から秩序へと発展していく過程を経ます。従来の世界で検索エンジンが登場する前は、情報もまた極めて分散しており、ユーザーはどこに行けばどのような情報を得られるかを知る必要がありました。Googleの出現により、全世界の一般ユーザーがインターネット全体の情報を非常に効率的にインデックスできるようになりました。そして大規模言語モデル(LLM)の登場は、さらに情報インデックスの効率を新たな次元へと引き上げました。
現在のWeb3における情報検索は、どの段階にあるのでしょうか?数年前と比較すれば、確かに大きな進歩があります。Etherscan、Dune、Nansenが登場する前は、一般ユーザーがブロックチェーン情報を調べるのは大海撈針のようなものでした。しかし今日でも、伝統的な世界の情報がすでに検索エンジン時代から大規模言語モデル時代へと移行している中、Web3の情報インデックスは、原生的な検索エンジンが存在しないため、依然として情報が極度に分散した検索エンジン以前の時代に留まっています。ユーザーは情報取得の専門家である必要があります。在庫量、DAU(日次アクティブユーザー)、プロトコル収益、コミュニティの見解、ガバナンス提案など、それぞれ異なるチャネルから情報を得る方法を知らなければなりません。Kaitoの創業者兼CEOであるYu Hu氏は、数年後に振り返ったとき、このような原始的な状態がほとんど想像できないほどになるだろうと確信しています。
Yu Hu氏は2020年からすでに、Web3の情報インデックスにおける課題——極度の分散、組織の欠如、Googleに代表される従来の検索エンジンとの非互換性——に気づいていました。当時、彼自身のニーズが実は業界全体のニーズそのものであることに気づきました。そこで彼は即座に仕事を辞め、Web3検索エンジンの開発に全力を注ぎ込みました。Yu氏の言葉を借りれば、「私はWeb3の情報インデックスのあり方を検索エンジン以前の時代から検索エンジン時代へ、そして最終的には大規模言語モデル時代へと導きたい。これにより、業界全体の関係者や次の10億人のWeb3ユーザーに、まったく新しい、効率的な情報インデックスの手段を提供したいのです」と述べています。
Kaitoの検索エンジンは、Auto GPTフレームワークと複数のChatGPTバックエンドを活用し、エージェントネットワークを構築しています。このネットワークは検索、情報処理、データクリーニング、アノテーションなどのさまざまなタスクを処理でき、高品質なWeb3情報サービスを提供することを目指しており、ユーザーとの共同創造を通じて体験の最適化と経済的利益の拡大を積極的に模索しています。
Yu氏との深掘り対話の中で、私たちはAI大規模言語モデルがWeb3ユーザーをどう支援できるか、またコミュニティ主導の共同創造による分散型AI検索エンジンの将来像について議論しました。メディアとして、我々はまた、従来のメディアと人工知能をどのように融合させ、情報の真実性と独自性を高めるかについても探りました。
ハイライト要約
-
新しいデータ配信パラダイムの下で、Web3がもたらす機会は、テクノロジー企業によるデータ独占という経済的論理を完全に変えると私は確信しています。
-
Web2時代では、情報の多くはインターネット上に保存されています。一方、Web3の世界では多くの情報がブロックチェーン上に存在しており、これはインターネットとは全く異なる情報アーキテクチャです。ブロックチェーン上の情報をクロールするにはノードを設定する必要があります。Googleのように汎用クローラーを使うことはできません。
-
将来的にはユーザーと深く共創していきたいと考えています。もしユーザーが私たちのプラットフォーム上で誤った情報を発見した場合、フィードバックの仕組みを通じてユーザーが参加し、情報の質を共同で改善できるようにしたいのです。
-
Web3の環境ではデータの所有権を重視しており、ユーザーがデータ処理プロセスや製品の共創に参加してほしいと考えています。ユーザーがより多く利用することで、私たちのモデルの能力はさらに強化されます。
-
検索エンジンとメディアの間には本質的に上下流の関係があり、メディアは検索エンジンの情報源の一部であるというのが最も根本的な関係です。
暗号のウサギ穴へ
TechFlow: 剑橋大学の優秀な学生からCitadelのファンドマネージャー、そしてCryptopunk保有者を経て、なぜWeb3とAIに特化したスタートアップを設立しようと思ったのですか?
Yu:
私のバックグラウンドは商学・経済学系で、伝統的な金融分野で約10年働いてきました。投資銀行やヘッジファンドを経て、最後はCitadelなどで株式市場投資を行っていました。しかし2017年頃に暗号資産に出会い、この新興技術に強い興味を持ち始め、余暇を使って研究を始めました。これは単なる新技術ではなく、全く新しい資産クラスでもあったからです。
2020年のDeFiサマーには、多くの時間を研究に費やしました。DeFiは比較的基礎的な概念ですが、他の点とは異なり、預入量や収益などの指標データがすべて公開されているため、ファンダメンタル分析が可能です。当時、私はこの分野で多くの研究を行い、機会を探していました。
その際、暗号業界における情報の伝達が非常に混沌として散漫であることを強く感じました。これは私が伝統的金融市場で経験した情報格差と似ていました。伝統的金融領域では、情報検索を支援する優れた金融ツールが多数あります。
しかしブロックチェーン領域では、TwitterやDiscordなどのソーシャルプラットフォーム上の情報を効果的に検索できる検索エンジンさえありません。これにより情報収集は非常に困難になりました。
2021年、私はCryptoPunkを購入しました。このNFTは業界全体にとって重要な瞬間を象徴しています。私はWeb3の将来に強い確信を持っており、その信念は今も続いています。
業界の発展と自分の興味を考慮し、2021年末に退職して起業を決意しました。情報検索の難題を解決する製品を開発し、私と同じような人々を支援したい。それが私の起業の原点です。
TechFlow: 2017〜2021年の間、あなたの研究の重点は何でしたか?重要なインスピレーションはありましたか?2017年以来、業界に対するあなたの認識はどのように変化しましたか?
Yu:
私にとって最大の啓示は、長期的な視点で物事を捉えることの大切さです。
-
初期の啓示は、異なる金融相互作用の形に関する理解でした。もともと金融分野にいた私にとって、これが所有権という概念に対する価格付けの違いについての基本的な枠組みでの考察を促しました。
これは深い洞察だと考えます。なぜなら、これが各業界における基本的属性へと進化してきたからです。
-
2020年と2021年には、過去20年間にGoogleやFacebookといったテックジャイアントが享受した技術的恩恵について考えるようになりました。
しかし、それ以上に深い考えは、もしこのままのパターンが続けば、今後50年、100年先のテクノロジーの構図は完全に変わる可能性があるということです。その中で最も重要な部分が、データの所有権かもしれません。
私たちは現在、Google、Instagram、Facebookなどのテクノロジー製品を無料で利用できますが、本当の価値はこれらの製品の背後にある巨大なデータにあります。ユーザーはデータの価値を十分に認識しておらず、そのデータは完全にテクノロジー企業の手の中にあります。
新しいデータ配信パラダイムの下で、Web3がもたらす機会は、この経済的論理を完全に変えると私は確信しています。
データの所有権はユーザーの手に戻り、新製品はコミュニティ主導で生まれるようになります。こうした新製品は、私たちの未来に対する見方をさまざまなレベルで変え、データとユーザーの相互作用の論理や関係性も変えていくでしょう。
Web3の情報規模と特徴:分散化と相互運用性
TechFlow:Kaitoでは、Web3情報の相互運用性をどのように統合・実現していますか?これはWeb2時代の方法と何が異なりますか?
Yu:
まず簡単に紹介しますと、Kaitoには2つの主要製品があります。
-
1つは機関投資家向けのプロフェッショナル検索プラットフォームで、研究者、メディア関係者、業界建設者など、大量の関連情報を調査する必要がある専門家向けのサービスです。
-
もう1つは一般消費者向けの検索エンジンで、Web3版のGoogleのようなものです。
私たちの統合プロセスは主に3つの側面に分けられます。
-
まず第一に情報源です。Web3に関連するデータが何であるかを把握し、TwitterやDiscordなどのプラットフォーム上で関連情報をフィルタリングし、技術的に統合します。
-
第二に整理です。これらのデータをクリーニングし、アノテーションを施して非構造化データを構造化データに変換します。自社のデータベース内でアノテーションを行い、AIや大規模モデルを利用して理解を深めることもあります。
-
第三にデータの可読性です。つまり、ユーザーとどのようにインタラクションするかです。検索、情報フィード、チャート、チャットなど、さまざまな形式を取ることができます。最終的な目標はユーザーとの緊密なインタラクションを築き、データをより操作しやすくすることです。
この3つのステップが、データを統合し操作可能にする鍵となります。
Web3とWeb2の情報の違いは主に3つあります。
-
まず、情報伝達の方法が全く異なることです。Web3時代では、情報は本質的により分散的で混乱しています。Web2時代とは異なり、Web3では情報は公式メディアだけでなく、公式アカウント(例:FTX)が重大な出来事を発表する際でも、コミュニティのアカウントに注目が集まります。Discordなどのプラットフォームでは、情報の伝達はさらに分散的になります。
-
第二の違いは情報の基盤インフラです。Web2時代では情報は主にインターネット上に保存されています。一方、Web3の世界では多くの情報がブロックチェーン上にあり、ブロックチェーンはインターネットとは全く異なる情報アーキテクチャです。ブロックチェーン上の情報をクロールするにはノードを設定する必要があります。Googleのように汎用のクローラーを使うことはできません。
-
第三の違いは情報のやり取りの方法です。Web2時代では、データのクリーニングやアノテーションは高度に中央集権的に行われます。GoogleやChatGPTも大規模なチームがこれを担当しています。一方、Web3時代では、多くのものをユーザーと共創でき、インセンティブによって共創行動を促進できます。例えばWeb3の範囲内では、コミュニティと開発者が共同で新しい検索エンジンを創造し、Web3コミュニティに新しい検索体験を提供しています。
TechFlow:Web3のパブリックデータとプライベートデータの現在の規模はどのくらいですか?将来はどう変化すると予想されますか?
Yu:
私たちが独自に収集したデータによると、毎日約百万件の機関からの情報を処理しています。パブリックデータを加えると、この数字は数千万に達する可能性があります。さらにTelegram、Discordなどのプライベートデータを加えれば、確実に億単位を超えます。これが私たちの日々のデータ量です。将来のトレンドについては、ユーザー数の増加や情報源の多様化に伴い、このデータ量はさらに増加すると予想されます。ブロックチェーン関連の企業だけでなく、中央集権的な企業も同様の傾向に直面しています。
また、情報の性質も変化する可能性があります。現在のところ、ほとんどの情報は取引に関連していますが、ブロックチェーンの応用範囲が広がるにつれて、他の分野の情報も急速に増加するでしょう。
人工知能がWeb3を支援
TechFlow: 大規模言語モデルをどのように活用してAI作業システムを構築しているのですか?また、さまざまなデータソースをどう処理し、最適な回答を決定しているのですか?
Yu:
現在、私たちはAuto GPTアーキテクチャを採用し、複数のChatGPTモデルをバックエンドに配置し、これらが共同でエージェント作業システムを構成しています。
-
各エージェントは異なるタスクを担当します。ユーザーが検索リクエストを出すと、最初のエージェントがその意味内容とニーズを分析し、どのデータソースで答えを探すべきかを判断します。複数のエージェントが存在し、それぞれがTwitter、Discord、研究など特定のデータソースに特化しています。
-
これらのエージェント間でコミュニケーションを取り合い、最適な答えを見つけ出し、その答えがユーザーの質問に合っているか評価します。このフレームワークでは、現在ChatGPTを基盤の大規模モデルとしていますが、同時に自社モデルのファインチューニングや完全な独自モデルの訓練も検討しています。
ChatGPTは事前学習済みモデルです。自身の知識ベースを使ってユーザーの質問に答えられますが、その知識範囲を超える内容には答えられません。私たちはChatGPTの意味理解と論理的推論能力を活用し、現在進行中のイベントを学ばせるようにしています。これはいわゆるコンテキスト学習です。
最適化すべき内容は多く、そのためエージェントネットワークが必要です。ある問題に対してはGPT-4のようなより複雑なモデルが必要かもしれませんが、一般的には比較的シンプルなモデルで十分です。これは人間が情報を処理する際に、状況に応じて異なる認知能力を動員するのと似ています。深い文献には集中力が必要ですが、簡単な質問には容易に答えが得られます。
同様に、データベースのレベルでも、需要に応じてネットワークを運営します。将来はデータベース自体も分散型管理に移行し、より効率的なスケーリングを可能にするかもしれません。
データのクリーニング、アノテーション、処理のプロセスでは、ユーザーと共に価値を創造したいと考えています。データはAI企業にとって極めて重要だからです。
Web3の環境ではデータの所有権を重視しており、ユーザーがデータ処理プロセスに参加し、製品の共同開発に貢献してほしいと考えています。ユーザーがより多く利用することで、モデルの能力はさらに強化され、体験も向上し、さらなるユーザー獲得につながります。また、皆がこのプロセスで経済的利益を共有できるようにすることが、私たちが目指す共創理念です。
TechFlow:Kaitoは、ユーザーがブロックチェーン業界の虚偽情報に対処し、データ品質を確保するためにどのように支援していますか?
Yu:
現在、私たちの重点は3つあります。
まず、情報源のフィルタリングです。Twitterを例にすると、ソーシャルグラフの手法を使ってユーザーをフィルタリングし、スパム情報を排除します。
次に、情報源の提示を重視しています。通常、ユーザーがChatGPTのような大規模言語モデルを使うとき、結果がどのように生成されたか分かりませんが、私たちはすべての検索結果に情報源を明記し、ユーザーが情報の信頼性をよりよく判断できるようにしています。これは従来の大規模言語モデルに対して行った重要な技術的最適化です。
最後に、ユーザーとの共創を希望しています。ユーザーが私たちのプラットフォーム上で無駄な情報や虚偽情報を発見した場合、フィードバックの仕組みを提供し、ユーザーが参加して情報の質を共に高めていけるようにしたいのです。
分散化が人工知能を支援
TechFlow:Web3時代におけるAIの発展可能性、特に自己学習とデータ共有の能力についてどう考えますか?また、ブロックチェーンのどの核心的特性がAIの将来に影響を与えると思いますか?
Yu:
OpenAIとブロックチェーンの間には直接的な関係はありません。OpenAIは非常に重要なAIの成果物ですが、そのモデル訓練は大量のデータと文献に基づき、人間によるアノテーションも雇用によって行われており、訓練プロセスは中央集権的な運営です。一方、Web3はそれ自体が新しい地平を切り開き、破壊的革新をもたらす可能性があります。しかし現在、まだ多くの人がWeb3の破壊的な本質を完全に理解していないのが現状です。
人工知能の潜在的可能性
最近、AIの教祖的存在であるGeoff Hinton氏は「人類は知能の進化における『通過点』にすぎない」と述べました。ChatGPTはすでに非常に優れていますが、それでもAIの成果物のごく一部にすぎません。長期的には、AI産業には非常に大きな発展可能性があります。
人間とは異なり、AIの同一モデルの複数のコピーは新たに学んだことを共有できます。これはAIの潜在的な強みです。
現時点ではAIはまだ使命を果たしていませんが、その将来は計り知れないと思っています。ここで重要な仮定があります。AIの発展は止まらないということです。なぜなら、AIの発展には強力な原動力があるからです。ある国がAI研究を減速しても、他の国々はAI技術の発展を続けるでしょう。したがって、AIの発展トレンドは安定的で持続的かつ止められないものになると信じています。
ブロックチェーンの属性
この過程で、ブロックチェーンの本質とは何でしょうか?公平性、信頼性、安定性、個人のコントロール権。これらがブロックチェーンの最も重要な核となる要素だと思います。なぜなら、あらゆる中央集権的な組織は巨大な危険をもたらす可能性があるからです。これが、マスク氏がOpenAIがClose AIになってしまったことに不満を感じる理由を説明できます。
ある程度、その意見は理解できます。しかし、この枠組みの中で、データの所有者やその他いくつかの制限を別の角度から設けることができれば、我々のシステム全体は比較的強力な負のフィードバック原則を持つことができるでしょう。
この思考はやや哲学的・抽象的ですが、検証可能な方向がたくさんあると考えます。Web3はAI市場の台頭とともにますます重要になっています。これが最近私が得た一つの思考です。
時間が真の分散化を明らかにする
Web3において、本質的にはあまり中央集権的な要素はありません。これは非常に分散化されたものです。例えば、昨年から今年にかけて起きたFTXの問題やUSDCのデペグ事件などの災害的な出来事は、本質的に中央集権的な性質に起因しています。
しかし、ビットコインやイーサリアムなどの完全に分散化されたプロトコルは非常に安定して動作しており、強固なサービス原則を持っています。これは非常に重要です。先ほど述べた派生的なものの中には、公正なコミュニティ共創などもあり、これらは非常に分散化された基盤の上に成り立っています。
従来のメディアとAI検索エンジンの関係
TechFlow: AI検索エンジンはメディア業界にどのように影響を与えますか?AIはメディアを代替し、誰もが高品質なコンテンツを作れるようになるとお考えですか?
Yu:
検索エンジンとメディアの間には本質的に上下流の関係があり、メディアは検索エンジンの情報源の一部であるというのが最も根本的な関係です。
大規模言語モデルが登場する前から、検索エンジンは存在していました。中国の今日头条のようなメディアアグリゲータープラットフォームも、AI企業を使ってニュースの自動生成、整理、要約などの浅層的な作業を行っており、すでにAIの能力を活用しています。
しかし、いくつかのものは決して、あるいはあまり代替されないと私は思います。例えば、独占的な情報であるインタビュー、調査報道などは、メディア独自の価値です。
ブロックチェーンのプライベートデータにおけるプライバシー保護とデータ共創
TechFlow: チェーン上でのデータと行動に関するプライバシー保護について、将来の見通しを教えてください。Kaitoはこれらの課題にどう対処していますか?
Yu:
この話題自体が非常に重要だと思います。
この問題に関して、私たちは中立的な検索エンジンです。つまり、インターネット上でもブロックチェーン上でも、公開されている情報はすべて収録します。しかし、プライベートまたは保護された情報については、現在も将来も収録しません。なぜなら、そうした情報は誰もがアクセスできるわけではないからです。
データの共創プロセスにおいて、私たちはブロックチェーンと人工知能の交差点に立ち、ユーザーと共に新たなデータ価値を創造したいと考えています。私たちはブロックチェーン分野の問題解決を目的としており、本質的にはAI企業に近いです。現在のチームメンバーの多くは成熟したテクノロジー企業出身で、AI関連のバックグラウンドを持ち、Web3の将来に強い信念を抱いています。初期のチームメンバーの多くはWeb3コミュニティから来ており、一丸となって自らの製品を創造しています。
AIとブロックチェーンのバランスについては、私たちの発展過程には明確な均衡点はないと考えています。私たちはAI技術を活用して、情熱を注ぐ垂直領域のニーズを解決します。情報のインデックス、配信、あるいは今後関わる可能性のある他の分野であっても、特定の業界に役立つサービスを提供することを目的としています。新しい技術を用いて、より効率的かつ良い方法で有用なサービスを提供し、それを業界に取り入れていくのです。
従来のビジネスモデルvs. コミュニティ共創型経済モデル
TechFlow: 現在のチームではコミュニティ共同建設についてどのような方法を検討していますか?ユーザーをインセンティブする方法はありますか?
Yu:
最もシンプルで明快な方法は、ユーザーが貢献するデータに一定の経済的価値を持たせ、規制とコンプライアンスの範囲内で運営することです。このプラットフォームでは、ユーザーの検索、閲覧、行動すべてがモデルの最適化に貢献し、より良い体験を提供します。この正のインセンティブを通じて、ユーザーがコミュニティ共創に積極的に参加することを促します。それが私たちの目標です。
現在、Kaitoには2つのビジネスモデルがあります。1つは機関向けで、従来のサブスクリプション方式を採用し、有料サービスを提供します。もう1つは一般向けで、完全無料ですが、ChatGPTのように追加の有料機能が存在する可能性があります。また、データAPIサービスを提供し、業界内の他の分散型プロトコルにデータサポートを提供しており、これが別のビジネスモデルです。
TechFlow:他のインセンティブ方式やトークン決済を採用してユーザーを惹きつけることを検討していますか?
Yu:
これは実際には2つの問題だと思います。
まず、トークンが必要かどうか、そしてエコシステム全体でトークンにどのような用途があるかです。
トークンには価値があると考えます。トークンがなくてもプロジェクトは正常に運営できますし、優れた製品と自己完結型の収益モデル(データや広告収入など)があれば、良好な収益を得られます。
しかし私たちにとって、もっとワクワクするのは、早期からコミュニティ共創の概念を構築できることです。この枠組みでは、トークンが必要だと考えます。
具体的な運用方法や今後のアイデアは、発展状況に応じて決めていきます。サブスクリプションなどの課金モデルをトークンで支払えるようにするかは、別の話題です。私たちにとって、トークンの利点は明白です。効率性や商業的価値の観点から、他の方法よりもシンプルです。
また、ビジネスの観点から言えば、Stripeのような第三者仲介業者を完全に回避できます。しかし、課題もあります。業界全体で、政府や税務当局への申告を簡単にサポートしてくれる優れた第三者サービス企業がまだ見つかっていません。
現段階では、これが私たちが直面している問題かもしれません。
TechFlow: では、トークンのコミュニティガバナンスについて、最近何か面白い経済モデルを研究しましたか?
Yu:
最近、暗号業界では大きな変化があり、特にトークンガバナンスにおいて顕著です。以前は多くのトークンが純粋なガバナンストークンとされていましたが、最近ではDYDXなど、経済的価値を捕獲できるトークンが増えています。これにより懸念も生まれており、コミュニティがガバナンス価値だけでなく、経済的価値も捕獲できる状態を実現したいという声があります。
TechFlow特別報道
TechFlow:最後の質問です。独占的な内容を教えていただけますか?例えば、Kaitoの今後のマイルストーンや開発計画について。期待できる特別な新機能や提携はありますか?
Yu:
私たちは、ユーザーが検索エンジンをまったく新しい方法で使えるようにする予定です。例えば、価格チャートのスクリーンショットを解析したり、オンチェーン情報源とインタラクションしたりして、マルチモーダル検索を実現します。
私たちのビジョンは、誰もが関連情報に完全に新しい、最高で、最も便利な方法でアクセスできるようにすることです。将来の可能性は非常に大きく、このビジョンを段階的に実現していきます。将来的な検索エンジンが現在とは全く異なる、まったく新しい体験をもたらすと信じています。現在、業界全体はまだ初期段階にあり、大規模言語モデルと検索エンジンをどうより良く統合し、シンプルで破壊的なユーザー体験を提供できるかを模索しています。
TechFlow公式コミュニティへようこそ Telegram購読グループ:https://t.me/TechFlowDaily Twitter公式アカウント:https://x.com/TechFlowPost Twitter英語アカウント:https://x.com/BlockFlow_News














