
ブロックチェーンに灯火を灯す:LLMがブロックチェーンとのインタラクションに開く新たな可能性
TechFlow厳選深潮セレクト

ブロックチェーンに灯火を灯す:LLMがブロックチェーンとのインタラクションに開く新たな可能性
ブロックチェーンとゼロ知識証明は、大規模な計算能力を必要とする複雑なモデルのトレーニングや推論に対して十分な処理性能を提供できないため、LLM とブロックチェーンを統合するほうがより合理的である。
著者:Yiping, IOSG Ventures
大規模言語モデル(LLM)とブロックチェーンの研究シリーズ第二弾へようこそ。前回の記事では、技術的観点からLLMとブロックチェーン技術を統合する方法、およびなぜLLMフレームワークがブロックチェーン分野に適しているのかについて議論しました。また、今後LLMとブロックチェーンが融合する可能性のある道筋も描きました。
今回の記事では、より実践的なアプローチを取り、ブロックチェーンのユーザー体験を大きく変える可能性がある8つの特定の応用分野について深掘りしていきます。さらにエキサイティングなことに、これらの画期的なアプリケーションは来年中に現実のものになると予測しています。
さあ、共にブロックチェーンとのインタラクションの未来を探っていきましょう。以下に、議論する8つのアプリケーションの概要を示します:
1. ブロックチェーンへの組み込み型AI/LLM機能の統合
2. LLMを活用したトランザクション履歴の分析
3. LLMによるセキュリティ強化
4. LLMを活用したコード作成
5. LLMを使用したコード読解
6. LLMによるコミュニティ支援
7. LLMによる市場追跡
8. LLMによるプロジェクト分析
ブロックチェーンへの組み込み型AI/LLM機能の統合
ブロックチェーンは、人工知能(AI)機能とモデルを内蔵するようになります。開発者はAI関数にアクセスし、分類、回帰、テキスト補完、AIGCなどの典型的な機械学習タスクをオンチェーンで実行できます。開発者はスマートコントラクトを通じてこれらのAI機能を呼び出すことができます。

このような内蔵機能により、開発者は自身のスマートコントラクトに知性と自律性を付与できます。分類、回帰、AIGCは代表的なAIタスクです。これらの機能がブロックチェーン分野でどのように使われているか、いくつかの事例プロジェクトと共に見ていきましょう。
分類
分類は、アドレスがボットか人間かを判別するために使用できます。これは現在のNFT販売の状況を変える可能性があります。また、DeFiエコシステムのセキュリティを向上させることも可能です。DeFiスマートコントラクトは悪意ある取引をフィルタリングし、資金流出を防ぐことができます。
回帰(Regression)
回帰分析は予測に利用でき、ファンドや資産運用に応用されます。Numer.aiはすでにAIを活用して資金運用を支援しています。Numerは高品質な株式市場データを提供し、データサイエンティストがそれらを使って機械学習を適用し、株価を予測しています。
AIGC
多くのNFTプロジェクトはIP宇宙を構築しようとしていますが、限られたコンテンツ量では「宇宙」と呼ぶには不十分です。もしオンチェーンでAIGCを使い、比較的低コストで無数のブランドスタイルに沿ったコンテンツを出力できれば、IP宇宙のスケールは飛躍的に拡大します。モデルはテキスト、イラスト、音楽、音声、動画まで生成可能です。コミュニティ参加者が共同でモデルのファインチューニングを行うことで、期待に応じた出力を得られます。このプロセス自体がコミュニティ参加感を高めます。
BottoはAIGCモデルを使ってアート作品を生成しています。コミュニティがお気に入りの画像に投票し、その結果を基にAIGCモデルを共同でファインチューニングしています。

ブロックチェーンをデータベースと見なすなら、Databendはそのデータベースに内蔵AI機能を統合しています。以下の機能を提供しています:
-
ai_embedding_vector:文書から埋め込みベクトルを生成
-
ai_text_completion:指定されたプロンプトに基づいてテキストを補完
-
cosine_distance:2つの埋め込みベクトル間のコサイン距離を計算
-
ai_to_sql:自然言語指示をSQLクエリに変換

ブロックチェーンにAI能力を提供する
いくつかのプロジェクトがブロックチェーンにAI能力を提供しようとしています。
GizaはZKML(ゼロナレッジ機械学習)に取り組んでいます。オフチェーンで推論証明を生成し、オンチェーンで検証を行います。現在、EVM互換チェーンおよびStarkNetをサポートしています。Gizaは最近Yearn.financeと提携を発表し、YearnはGizaのAI機能を活用してリスク評価能力を向上させる予定です。

Modulus Labsも同様の方向性で活動しています。彼らはAI用の高性能回路を生成するための証明システムの改善に注力しています。チェスAIやイーサ価格予測AIなどのデモを公開しています。新しく発表されたzkMonは、世界初のゼロ知識証明付きGANによるNFTコレクションです。

LLMを活用したトランザクション履歴の分析
トランザクション履歴の分析は通常、Debankのような特定アプリケーションによって行われます。手動での分析は困難で、データ収集・クリーニング・分析が必要であり、ユーザーにはプログラミング能力が求められます。しかしLLMはデータの分析と可視化が可能なので、新しいアプローチが登場しています。LLMを使えば、カスタムニーズに応じてオンチェーンデータを分析できます。勝率、パフォーマンス比など、任意の情報を分析可能です。
RSS3はWeb3ユーザーアクティビティ用のChatGPTプラグインを開発し、この方向に進んでいます。ユーザーはウォレットアドレス、ENS、Lensを入力してオンチェーン活動を照会でき、プラグインは人間が読みやすい形式で取引情報を出力します。ただし、Azuki保有者が何人いるか、どのスマートコントラクトが最も人気かといった複雑なクエリには対応していません。また、プラグインが提供するアドレスやラベルが正確とは限りません。

DeFiLlamaもChatGPTプラグインをリリースしています。ユーザーは自然言語でDeFiLlama上の任意のデータを照会できます。簡単なフィルタリングやソート操作も可能です:

DuneもGPTを製品に統合し、以下の機能を実現しています:
-
クエリの説明:LLMを使ってクエリ内容を解釈
-
クエリ翻訳:他のSQL方言をDuneSQLに変換
-
自然言語クエリ:自然言語でクエリを作成可能
-
検索:LLMで検索結果を改善
-
ガイドナレッジベース:ドキュメントと対話できるチャットボット
LLMによるセキュリティ強化
LLMは論理的推論能力を持つため、悪意ある取引をフィルタリングし、スマートコントラクトのファイアウォールとして機能できます。以下はボット活動を阻止する具体的な例です:
アドレスを入力すると、LLMは外部プラグイン経由で全取引データを取得し、履歴を分析してそのアドレスがボットである可能性を判断します。この機能はNFT販売など、ボットを歓迎しないDappsに組み込むことができます。
以下はChatGPTを使った簡単な例です。ChatGPTはRSS3のWeb3ユーザーアクティビティプラグインでアカウントの取引履歴を取得し、分析してボット可能性を出力しています。

より多くの取引履歴を投入し、ボット関連データセットでLLMをファインチューニングすれば、精度をさらに高められます。以下はこうしたアプリケーションの動作フロー例です。キャッシュ層やデータベース層を追加することで、レスポンス速度を向上させ、コストを削減できます。

LLMを活用したコード作成
LLMは開発者がより速く、より良いコードを書くのを支援するために広く使われています。開発者の指示に従い、コードを自動生成できます。ただし現時点では、開発者が詳細な指示を与える必要があります。LLMがプロジェクト全体のコードを自動生成するのはまだ難しいです。
コード用途で人気のあるLLMモデルには、StarCoder、StarCoder+、Code T5、LTM、DIDACT、WizardCoder、FalCoder-7B、MPT30Bなどがあります。
これらすべてのモデルはスマートコントラクトの作成に使えますが、必ずしもスマートコントラクト専用のデータでトレーニングされているわけではありません。改善の余地はあります。
現在HuggingFace上には、スマートコントラクト関連のデータセットが1つしかありません。それは「より巧妙な監査済みスマートコントラクト」で、11.3万件のスマートコントラクトを含みます。テキスト分類、テキスト生成、脆弱性検出などのタスクに利用可能です。

開発支援ツールよりも、自動コード生成の方が将来性があります。スマートコントラクトは比較的短く単純なため、LLMによる自動生成に適しています。LLMはブロックチェーン分野で以下の通り開発者を支援できます。
テスト
まず、LLMは良質なスマートコントラクトに対してテストコードを自動生成できます。Codiumは既存プロジェクトのテストを自動生成できます。現在JSとTSをサポートしています。Codiumはまずコードベースを理解し、各関数、ドキュメント文字列、コメントを分析します。その後、コード分析をコメントとしてファイルに戻し、テスト計画を出力します。ユーザーは好みのテストを選択でき、Codiumが選択されたテストコードを生成します。

他にも選択した機能に対してテストを生成できる支援ツールがあります。

同様の処理をGPT-4上で再現することも可能です。

まずコード分析を要求するのは、LLMがそのタスクにより多くの時間を費やすように促すためです。LLMはどのタスクが難しいかを認識せず、各トークンに同じ計算リソースを割り当てます。これにより複雑なタスクで不正確な結果が出る可能性があります。そのため、「コード分析をしてください」と指示することで、LLMがより多くのトークン/時間を割いて思考し、高品質な結果を出力できます。この手法は「チェイン・オブ・ソート(Chain-of-Thought)」とも呼ばれます。
より長いスマートコントラクトに対応するには、より大きなコンテキストを持つLLM、あるいは記憶を保持するための工学的設計が必要です。
補助スクリプトの生成
次に、LLMで展開スクリプトなど補助スクリプトを自動生成できます。
展開スクリプトは手動展開時の潜在的エラーを減らすことができます。このアイデアはテスト自動生成と非常に似ています。

自動フォーク
好況期には多数のフォークプロジェクトが登場し、チームは元のコードベースにわずかな変更を加えます。これはLLMに最適なユースケースです:LLMはチームのニーズに応じてコードを自動的に修正できます。通常特定部分の変更だけでよく、LLMにとっては比較的容易です。
コードの自動生成
さらに一歩進めば、LLMは開発者の要望に応じてスマートコントラクトを自動生成できるでしょうか?JS、Rust、Pythonで書かれた複雑なソフトウェアと比べ、スマートコントラクトは比較的短く単純です。外部ライブラリも少ないため、LLMにとって**スマートコントラクトの書き方を理解するのは相対的に容易です**。
すでに自動コード生成の進展が見られています。GPT-engineerはその先駆者の一つです。ユーザーの要望を満たし、不明点を質問した後、コーディングを開始します。コードにはプロジェクト全体を実行可能なスクリプトも含まれ、GPT-engineerは開発者のためにプロジェクトを自動起動できます。
ユーザーが要望を入力すると、GPT-engineerはそれを分析し、必要に応じて追加質問を行います。必要な情報をすべて収集した後、まずタスクに必要な主要なクラス、関数、メソッドを含むプログラム設計を出力します。その後、各ファイルのコードを生成します。
このようなプロンプトで、カウンター用スマートコントラクトを生成できます。

生成されたスマートコントラクトはコンパイル可能で、期待通りに動作します。

GPT-engineerは当初Python向けに設計されていたため、Hardhat関連コード生成時に問題が生じます。GPT-engineerはHardhatの最新バージョンを知らないため、時折時代遅れのテストや展開スクリプトを生成することがあります。
コードにバグがある場合、コードベースとコンソールエラーログをLLMに提供できます。LLMはコードを繰り返し修正し、正常に動作するまで改善できます。[flo](https://flocli.vercel.app/)のようなプロジェクトがこの方向に進んでいます。現時点ではfloはJSのみをサポートしています。
スマートコントラクト生成の正確性を高めるには、GPT-engineerのプロンプトを工夫できます。テスト駆動開発(TDD)方式を取り入れ、LLMが特定のテストに合格するように生成を制約することで、出力されるプログラムの品質を高められます。
LLMを活用したコード読解
LLMはコードをよく理解できるため、LLMで開発者向けドキュメントを作成できます。LLMはコード変更を追跡し、ドキュメントを更新することも可能です。これは前回の研究レポート『Exploring Developer Experience on ZKRUs: An In-Depth Analysis』の末尾でも議論しました。
ドキュメントを読むのが従来の方法なら、コードと対話するのは新しい方法です。ユーザーはコードについて何でも質問でき、LLMが回答します。LLMはコードを解説し、開発者がオンチェーンのスマートコントラクトを素早く理解するのを助けます。コード経験のない人も、スマートコントラクトを理解できるようになります。
Web2の世界ではすでにこの傾向が見られます。多くのコード支援ツールがコード解説機能を持っています。
Etherescanも新しい機能を紹介しており、ユーザーがコードと対話できるよう、LLMの能力を利用しています。

コード理解ができるようになったとき、監査はどう変わるでしょうか? 論文『do you still need a manual smart contract audit』の実験では、LLMは脆弱性検出において40%のヒット率を達成し、ランダムベースラインを上回りました。しかし誤検出率も高かったのです。著者は、適切なプロンプトが鍵だと指摘しています。
プロンプト以外にも、以下の理由が応用を制限しています:
-
現在のLLMはこの目的のために特別に訓練されていません。トレーニングデータにスマートコントラクトコードベースと対応する監査報告書が含まれていない可能性があります。
-
最も深刻な脆弱性は、異なる機能が組み合わさった論理的問題であることが多いです。LLMは現時点でトークン数に制限されており、長大なコンテキストを必要とする論理的課題を解決できません。
これらの問題は決して解決不能ではありません。大手監査会社は数千件の監査報告書を持っており、それを使ってLLMをファインチューニングできます。大規模トークン制限を持つLLMも登場しています。Claudeは10万トークン、新発表のLTM-1は驚異の500万トークン制限を持ちます。これらの課題に取り組むことで、LLMによる脆弱性検出能力は大幅に向上するでしょう。LLMは監査官を支援し、監査プロセスを加速できます。これは段階的に進展するでしょう。以下が想定される進化の軌跡です:
1. 監査官の言語整理と報告書のフォーマット支援。同一監査会社内の言語の一貫性を確保できます。通常、異なるチームにはそれぞれの用語の好みがあります。
2. 潜在的脆弱性の特定と検証を支援。
3. 監査草案レポートの自動生成。
LLMによるコミュニティ支援
ガバナンスはコミュニティの重要な部分です。コミュニティメンバーは自分の支持する提案に投票でき、それが製品の未来を形作ります。
重要な提案には多くの背景情報やコミュニティ討論があります。投票前にそれらすべてを理解するのは困難です。LLMはコミュニティメンバーが選択肢の未来への影響を迅速に把握し、投票を支援できます。
Q&Aチャットボットも別の潜在的応用です。すでにプロジェクトドキュメントに基づくQ&Aボットを見かけています。さらに大きなナレッジベースを構築できます。プレゼンテーション、ポッドキャスト、GitHub、Discordチャット、Twitter Spaceなど異なるメディアや情報源を挿入できます。Q&Aボットはドキュメント検索欄に存在するだけでなく、Discordでコミュニティメンバーに即時サポートを提供したり、Twitterでプロジェクトのビジョンを発信し、どんな質問にも答えたりできます。
AwesomeQAは現在この方向に進んでいます。以下の3つの機能を実現しています:
-
ChatGPT連携でコミュニティメンバーの質問に回答
-
コミュニティメッセージからデータ駆動のインサイトを得る(FAQ分析など)
-
未解決の問題など重要なメッセージを発見

現在のQ&Aボットが直面する難題の一つは、ベクトルデータベースから関連コンテキストを正確に取得し、LLMに提供する方法です。例えば、複数要素に対して複数特徴をフィルタ条件付きで照会する場合、ボットはベクトルDBから関連コンテキストを取得できないかもしれません。
ベクトルデータベースの更新も別の課題です。現在の解決策はデータベースの再構築、または名前空間を使って更新することです。埋め込みに名前空間を追加することは、データにラベルを付けるようなものです。これにより開発者が対応する埋め込みを見つけ、更新しやすくなります。

LLMによる市場追跡
市場は変化に富み、毎日多くのことが起こります。KOL(キーオピニオンリーダー)が新しい考えを発信し、ニュースレターや製品メールが大量に届きます。LLMがあなたのために最も重要なアイデアやニュースを選んでくれます。また、内容を要約して読む時間を短縮し、市場の動きについていくのを助けます。
minmax.ai はニュース分野に注力しています。特定テーマの最新ニュースを要約し、そのトピックに対する感情分析も提供します。
Boring reports はニュースからセンセーショナルな内容を排除し、重要な詳細に焦点を当て、読者が正しい意思決定ができるよう支援します。
ロボットアドバイザリーは現在最もホットな分野の一つです。LLMはロボットアドバイザリーの普及を推進できます。LLMは取引アドバイスを提供し、株式情報などを背景に投資ポートフォリオの管理を支援できます。
Numer.aiのようなプロジェクトはAIで市場を予測し、ファンドを運営しています。LLMが管理するポートフォリオもあり、ユーザーはRobinhoodでそれらをフォローできます。
Composer はAI搭載の取引アルゴリズムを提供します。AIはユーザーの洞察に基づいて特定の取引戦略を構築し、自動的にバックテストを行います。ユーザーが戦略に満足すれば、Composerが自動で取引を実行します。
LLMによるプロジェクト分析
プロジェクト分析は通常、大量の資料を読み、長文の調査レポートを書くことを伴います。LLMは短い文章の読解・作成が得意です。これを長文にも拡張できれば、LLMはある程度プロジェクト分析を出力できるのでしょうか?おそらく可能です。ホワイトペーパー、ドキュメント、イベントプレゼンを入力し、LLMにプロジェクトや創業者を分析させられます。トークン数の制限があるため、まず論文のアウトラインを作成し、得られた情報をもとに各セクションを更新・最適化するというアプローチが考えられます。
BabyAGIのようなプロジェクトはすでにこの方向で進展しています。以下はBabyAGIの派生であるBlockAGIの出力例です。

LLMはTwitterや公開スピーチから創業者の人格を分析することもできます。例えば、Tweet Analyzerは最近のツイートを取得し、LLMで個人特性を分析できます。

結論
以上が、LLMが近い将来ブロックチェーンコミュニティを支援できる8つの具体的な方向性です:
1. ブロックチェーンへの組み込み型AI/LLM機能の統合。
2. LLMを活用したトランザクション履歴の分析。
3. LLMによるセキュリティ強化。
4. LLMを活用したコード作成。
5. LLMを使用したコード読解。
6. LLMによるコミュニティ支援。
7. LLMによる市場追跡。
8. LLMによるプロジェクト分析。
LLMは暗号資産分野のすべての関係者―プロジェクト所有者、アナリスト、エンジニア―に恩恵をもたらします。創業者はLLMで文書作成やQ&Aなどのタスクを自動化できます。エンジニアはLLMでより速く、より安全にコードを書けます。アナリストはプロジェクト調査をより簡単に進められます。
長期的には、GameFi分野でのLLM応用にも潜在的チャンスがあります。LLMはゲーム内でより面白いタスクを生成し、さまざまな役割を演じられます。ゲーム世界はよりリアルで魅力的になります。NPCはプレイヤーの行動に動的に反応し、ユーザーの解決方法に応じて多数のエンディングが生まれます。
LLMは既存プロジェクトに統合可能ですが、新規参入者にも機会を提供します。例えばオンチェーンデータ分析分野にはすでにトッププレイヤーがいます。DuneはLLMを統合してUXを改善できます。しかしLLMは新規参入者にもチャンスを与えます。彼らはLLMを製品設計の中核に据えることができます。AI主導、AI中心の革新的製品が、オンチェーンデータ分析分野に新たな競争をもたらすかもしれません。
LLMのWeb2とWeb3での用途には重なりがありますが、製品化の方法は異なるかもしれません。Web3で使うデータはWeb2とは異なります。LLMのナレッジベースもWeb2とWeb3で異なる可能性があります。Web3データにはブロックチェーン、トークン価格、ツイート、プロジェクト、研究成果などが含まれます。したがって、エンドユーザーにサービスを提供するには、Web2とWeb3向けに異なるLLMが必要です。
LLMの隆盛により、AIxBlockchainがますます注目されています。しかし、多くのAIxBlockchainは短期間では現実的ではありません。ブロックチェーンとゼロナレッジ証明は、複雑なモデルの大規模な学習・推論に必要な計算能力を提供できません。小規模モデルでは複雑なタスクを解決できません。より現実的なアプローチは、ブロックチェーン分野にLLMを応用することです。LLMは他のAIテーマと比べて最近大きな進展を遂げています。LLMとブロックチェーンを組み合わせるのはより合理的です。
LLMコミュニティはトークン制限の改善と応答精度の向上に努力しています。ブロックチェーンコミュニティに残されたのはデータソースとデータパイプラインです。洗浄されたデータはLLMのファインチューニングに使い、ブロックチェーン環境下での精度を高められます。データパイプラインはより多くのブロックチェーン関連アプリをLLMに統合し、暗号資産特化型エージェントの開発を進められます。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News














