
EthStorage創業者:データ可用性はロールアップのセキュリティをどのように保証するのか?
TechFlow厳選深潮セレクト

EthStorage創業者:データ可用性はロールアップのセキュリティをどのように保証するのか?
本編では、「データ可用性と分散型ストレージ」という観点から、Rollupの分散化について探ります。
司会:Franci
ゲスト:EthStorage 創設者 Qi Zhou
イントロダクション
本シリーズは「分散型Rollup」に関するインタビューシリーズの最終回です。今回は「データ可用性(DA)と分散型ストレージ」という観点から、Rollupの分散化について探ります。ゲストとしてEthStorage創設者のQi Zhou氏をお迎えし、DAがどのようにイーサリアムメインネットのセキュリティ特性を再利用できるか、EIP-4844およびdanksharding、異なるDAモデル間のセキュリティ比較について議論しました。Zhou氏にはまた、次期イーサリアムアップグレードにおいて、EthStorageがどのようにEIP-4844と統合されるのかについても紹介していただきました。

ゲスト紹介
皆さまと、私たちが取り組んでいるイーサリアムのDA技術およびその上に構築する分散型ストレージに関する考えを共有できることを嬉しく思います。私は2018年よりWeb3業界にフルタイムで参画しています。それ以前はGoogleやFacebookといった大手企業でエンジニアとして勤務しており、ジョージア工科大学(Georgia Institute of Technology)にてPhD号を取得しています。2018年以降、主にWeb3インフラに関わる研究・開発に従事してきました。これはかつて大手企業で分布式システムや分布式ストレージの分野に携わっていた経験とも関係していますが、同時にこの分野にはブロックチェーン全体においてまだ多くの改善余地があると考えているためでもあります。当初取り組んでいた実行シャーディング技術(いわゆるイーサリアムシャーディング1.0)から、現在のデータシャーディング(シャーディング2.0)、さらにはデータ可用性(DA)に至るまで、一貫してWeb3インフラの革新に注力してきました。
私たちは常にイーサリアムのロードマップを密接に追って研究・学び、コミュニティの一員として参加・改善活動を行っています。昨年末には、イーサリアム財団から「データ可用性サンプリング」に関する研究に対して支援を受けるという栄誉を得ました。これにはdankshardingに関する理論的研究、特にデータの効率的な復元方法なども含まれます。同時に、イーサリアムのDA技術に基づいて、EthStorageというイーサリアム用データレイヤーを開発しています。この層では、イーサリアムのスマートコントラクトを活用して、オフチェーンのデータストレージを大規模に検証することが可能です。これはイーサリアムにとって非常に意義深い貢献であると考えており、本日はEthStorageがDA技術を活かしてデータストレージネットワークをどう構築していくかについて、皆さんと共有できることを大変嬉しく思います。
インタビュー内容
第一部:DAの定義に関する考察
データ可用性(DA)がRollupの安全性をどう保証するか
DAの研究を通じて、多くの人がDAの定義について誤解していることに気づきました。今日は、この点について深く議論できることを嬉しく思います。これまでにも、Dankrad Feist氏などのイーサリアム財団メンバーとともに、DAおよびそれがイーサリアムL2において果たす重要な役割について議論してきました。
前述したように、イーサリアムRollupの基本的な仕組みでは、オンチェーンの取引をオフチェーンに移動し、その後、不正防止証明(fraud proof)や有効性証明(validity proof)といった証明手段を使って、L1のスマートコントラクトに対してその実行結果が正しいことを伝えます。
ここで極めて重要なのは、イーサリアムネットワーク自体が持つセキュリティを再利用しつつ、計算能力を大幅に拡張できるようにすることです。つまり、計算処理をオンチェーンからオフチェーンに移すことでスケーリングを実現しますが、同時にイーサリアム本来のセキュリティも維持しなければなりません。
例えばOptimistic Rollupの場合、sequencerが悪意ある行動をとったときに誰かがこれを挑戦(チャレンジ)できる仕組みが必要です。そのためには、オフチェーンでのオリジナル取引データがどのようなものかを知る必要があります。もしオフチェーンのオリジナル取引データにアクセスできない場合、sequencerをオンチェーン上で挑戦するための取引記録を得られず、挑戦ができません。したがって、DAが安全性を保証するのは、すべてのオフチェーン取引のメタデータがオンチェーンで確認可能になるためです。
ブロックスペースの拡張
すべての取引データをオンチェーンに載せる必要があるため、計算処理が不要でも膨大なデータ量が発生します。DAが解決しようとする核心課題は、このブロックスペースを効率的に拡張する技術だと言えます。ブロックチェーンの構造に詳しい方ならご存知のように、各ブロックには多数の取引データが含まれており、この取引データを格納する領域を「ブロックスペース」と呼びます。
現在のイーサリアムでは、1ブロックあたりの容量は約200~300KB程度です。しかし、このサイズでは今後のイーサリアムスケーリング要件を満たすことはできません。簡単に計算すると、200KBのブロック容量を、1取引あたり平均100バイトで割ると、約2000件の取引が可能になります。これをイーサリアムのブロック生成時間12秒で割ると、TPS(1秒あたりの取引数)は約166に制限されることになります。ただし、実際にはガスリミットや他の要因により、実質的な上限は約100TPS程度とされています。これはイーサリアムのスケーリング計画にとっては依然として非常に小さな数字です。
そのため、イーサリアムL2は、安全性を確保しつつ、大量のブロックデータをブロックスペースに格納する方法を模索しています。これにより、不正防止証明や有効性証明がイーサリアムのブロックスペース内のデータを再利用して検証できるようになり、最終的にオフチェーンでの取引計算結果の安全性がイーサリアムによって保証されるのです。これがDAとイーサリアムのセキュリティとの根本的な関係です。
ネットワーク帯域コストとストレージコストの観点から見るDA
DAの主なコストは二つあります。一つはネットワーク帯域コスト、もう一つはストレージコストです。
まずネットワーク帯域コストについてですが、現在のビットコインやイーサリアムでは、P2Pネットワーク上でブロックをgossip(ブロードキャスト)方式で全ノードに配信しています。「新しいブロックができたので、こんな内容です」と全ノードに通知する方式です。この方式の利点は、非常に高い安全性を持ち、すべてのネットワークノードが最終的に同じデータのコピーを持つことができる点です。
一方の欠点は、ネットワーク帯域と遅延に対する負荷が非常に大きくなることです。イーサリアムはPoSアップグレード後も12秒ごとにブロックを生成しています。もしブロックサイズが大きすぎて伝播に12秒以上かかると、多数のブロックが生成できず、結果としてネットワーク全体の帯域効率が著しく低下し、受け入れがたいレベルにまで達する可能性があります。このため、DAは大量のデータをブロックチェーンに載せる際の帯域問題を解決する技術といえます。
もう一つのコストはストレージコストです。これについてはイーサリアム財団でも多くの議論が行われています。設計上の核心的解決策として、DAにアップロードされたブロックデータを永久に保存しない仕組みを採用しています。
ここに新たな問題が生じます。多くのデータがオンチェーンに載せられたとしても、1週間または2週間後にイーサリアムプロトコルによって削除されてしまいます。このような過程において、これらのDAデータをより良い形で分散的に長期保存する方法はないでしょうか?
これが私たちがEthStorageの設計にあたって抱いた初期の動機です。第一に、多くのRollupプロジェクトはデータをより長期間保存する必要があること。第二に、こうしたデータがあれば、DAネットワークを通じて、より低コストで完全なオンチェーンアプリケーションを実現できるということです。たとえば、完全オンチェーンのNFTや、DAppのフロントエンド、さらにはソーシャルネットワークにおける多数の投稿やコメントなども、DAネットワークを利用してイーサリアムL1と同等のセキュリティを享受しながらブロックチェーンにアップロードできます。
こうした理由から、私たちがイーサリアムのDA技術を研究し、多くのコア開発者と議論した結果、「イーサリアムには、プロトコルのアップグレードなしに、分散的かつモジュール化されたストレージ層が必要である」と結論づけました。それはデータの長期保存問題を解決するための、真に分散化されたストレージレイヤーなのです。
第二部:異なるDA方式に関する考察
EIP-4844とdankshardingの関係、およびなぜEIP-4844を導入する必要があるのか
Proto-danksharding、すなわちEIP-4844は、イーサリアムにとって次の重大なアップグレードの一つだと考えています。なぜEIP-4844が必要なのかというと、イーサリアム財団がdankshardingのアップグレードロードマップを見積もった際、その完了に3〜5年かかると予想していました(これは2020〜2021年の話です)。
この期間中、イーサリアム上には急速に多くのRollupが登場すると予測されていました。しかし、dankshardingが提供するデータインターフェースと、現在Rollupが使用しているcalldataインターフェースはまったく異なります。この違いにより、既存のアプリケーションが新しいインターフェースに迅速かつシームレスに移行できず、dankshardingの恩恵をすぐに享受できなくなる恐れがありました。
昨年のDevconでVitalik氏も言及していましたが、イーサリアムがL2にさらに良いサービスを提供するために、L2開発者が将来のdankshardingと同じインターフェースで契約を開発できるようにすべきだと述べていました。そうすれば、dankshardingがアップグレードされた時点で、すでにテスト済みの契約を改修することなく、そのまま新機能の恩恵を受けられるのです。
そこでEIP-4844は、dankshardingの超簡易版として位置づけられます。dankshardingと同じアプリケーションインターフェースを提供するもので、新しいopcode「Data Hash」と、新しいデータオブジェクト「Binary Large Objects(Blob)」を導入します。
これらのデータオブジェクトは、Rollupが事前にdankshardingのデータ構造に互換性を持つように設計されています。つまり、dankshardingでも同様のData HashやBlobという概念が提供される予定です。EIP-4844は、こうしたアイデアを次のイーサリアムアップグレードで先行実装するものです。そのため、EIP-4844の設計仕様、たとえばPre-compileや新規命令などを確認すると、将来的なdankshardingがアプリケーション層とどのように相互作用するかの姿が垣間見えます。
イーサリアムは応用面から考えており、早期のアップグレードを通じて、アプリケーションがスケーリング技術の恩恵をより容易に享受できるようにし、追加のアップグレードコストを回避することを目指しています。
ただし、EIP-4844には一つの課題があります。それは、ブロックスペースの拡張問題を解決していない点です。この問題を真正面から解決するのはdankshardingです。現在のイーサリアムブロックサイズは約200KBですが、dankshardingの仕様では最大32MB(約32,000KB)にまで拡張され、実に100倍以上のスケールアップが見込まれています。一方、現時点のEIP-4844は、ブロックデータのオンチェーン伝送における帯域問題を解決していません。
dankshardingがブロックスペースの拡張問題をどう解決するか
EIP-4844の設計では、データのオンチェーン伝送時も、従来のcalldataと同様にP2Pネットワークによるブロードキャストを使用します。この方式は、結局のところP2Pネットワークの帯域幅という物理的ボトルネックに制約され続けます。一方、dankshardingの設計ではP2Pブロードキャスト方式を変更し、データサンプリング技術を導入することで、すべてのブロックデータをダウンロードしなくても、そのデータが利用可能であることを検証できるようにします。
ある意味で、これはZKのアプローチに似ています。データサンプリングによって、ネットワーク内にdankshardingによって生成された32MB/ブロックのデータが存在することを確認できます。しかし、実際にすべての32MBをダウンロードしてローカルに保存する必要はありません。もちろん、十分な帯域とストレージ性能を持つマシンであればそのようにしてもよいですが、普通のバリデーターにとっては、全データのダウンロードは必須ではありません。
EIP-4844テストネットの開発と経験
最近、我々は内部のEIP-4844テストネットを稼働させ、対応するスマートコントラクトを展開してテストを行いました。Blobデータのアップロード、コントラクト呼び出し、データ検証まで、すべてのプロセスを正常に実行できています。したがって、EIP-4844が正式にリリースされた時点で、即座に当社のコントラクトを展開できる準備が整っています。
また、現在イーサリアムの開発者たちとの協力を進めながら、既に開発済みのコントラクトを通じて、今後の各種Rollup開発や学習、ツール開発の時間を短縮できるよう貢献したいと考えています。
最近、EIP-4844用のツールセットとして多数のコードをイーサリアムに提出しました。Solidityは現状data hash opcodeをサポートしていないため、新しいスマートコントラクトによるサポートも含めています。こうした作業はすべて、イーサリアム財団の開発者たちと連携して進めています。
データ可用性委員会(DAC)の応用と限界
現在、L2ユーザーが支払うコストの90%以上がデータ可用性費用に充てられています。このコストを削減するために、ZKSyncのZKPorterやArbitrum Novaなど、多くのL2プロジェクトが独自のDAC(Data Availability Committee)を設立して、独自のデータレイヤーを提供しています。
しかし、この委員会モデルには追加の信頼前提が伴います。つまり、イーサリアムと同等のセキュリティを得るためには、委員会メンバーとして信頼できる大手データプロバイダーや有名企業を選定する必要があります。とはいえ、これは「誰でも参加可能な非許可型(permissionless)」という分散化の原則に反するという批判も多くあります。実際、多くのDACはL2プロジェクトと密接な関係にある少数の組織で構成されています。
たとえばArbitrum Novaの場合、先日確認したところ、6〜7ノード程度の委員会で構成されており、Google CloudやAmazon Web Services上にノードを配置してデータを保存しています。これらはすべてのArbitrum Nova上の実行データを保持しており、その結果、実行コストがイーサリアムの約1/1000まで削減されています。これは、すべてのデータをイーサリアムL1に書き込まないためです。しかし、依然として中央集権的傾向が強く、高価値のアプリケーションでは大きな懸念が残ります。特に、数百万ドルから数億ドル規模の資金を取り扱う場合、データ委員会がデータを常に利用可能に保つことを信頼せざるを得ないのです。
一方、EthStorageの設計には「データ委員会」という概念は一切ありません。設計上、誰でもデータプロバイダーとして参加できるようにしています。そして、暗号化された証明を通じて、本当にデータを保存していることを証明します。理論的には、たとえ「7〜8の委員会ノードがある」と言っても、物理的には同一のデータを1カ所にしか保存せず、複数のアドレスから提供しているように見せかけることが可能です。
では、データが本当に十分な物理的コピーを持っているかをどう証明するか? これがEthStorageの重要なイノベーションであり、イーサリアム財団のESP(エコシステム支援プログラム)へのプレゼンテーションでも重点的に強調した点です。EthStorageはZK暗号技術を活用し、L2のデータ提供ノードが許可不要で参加でき、かつ多数のストレージコピーを持っていることを証明することで、データの安全性をより確実に保証します。
したがって、DACはデータをL1にアップロードするコストを一時的に下げるための過渡的解決策にすぎないと考えます。一方、EthStorageは暗号技術と、イーサリアムL1のスマートコントラクト上での検証メカニズムを組み合わせることで、より優れたデータ保存ソリューションを提供できると信じています。今後、イーサリアム4844のリリースに合わせて、こうしたイノベーションの詳細とネットワーク上での実行結果を積極的に公開していく予定です。
EthStorageとDACの違い
EthStorageは、いわゆる「ストレージロールアップ(Storage Rollup)」としてのイーサリアムストレージレイヤーです。現在のL2がEVMの実行を行うのではなく、巨大なデータベース(キーバリュー型データベース)であると仮定しましょう。そのサイズは10TB、100TB、あるいはPB単位にもなり得ます。
このような巨大データベースのデータが、イーサリアムと同等のセキュリティを獲得するにはどうすればよいでしょうか? まず第一段階として、この大規模データをすべてDAを通じてイーサリアムL1に公開し、DAレイヤー上で誰もがそのデータにアクセスできるようにします。しかし、このデータが永続的に保存される保証はありません。なぜなら、イーサリアムのDAデータは数週間(通常2〜4週間)後にプロトコル上から削除されてしまうからです。
そこで第二段階として、これらのデータをアップロードした後、L2ノード上に長期保存します。これはDACとは異なり、データ保存ノードは許可不要で、誰でも参加可能です。そして、保存の証明を行い、それに応じた報酬を得ます。この仕組みは、FilecoinやArweaveなどのストレージ証明設計から着想を得ていますが、イーサリアムのDAフレームワークおよびスマートコントラクトに特化した、独自のストレージ証明ネットワークと検証システムを構築しています。この点において、イーサリアムエコシステム、ひいては分散型ストレージ分野全体に対して、我々は独特の貢献をしていると確信しています。
ストレージ証明の仕組み
FilecoinやArweaveを含むすべてのストレージ証明メカニズムでは、まずユーザーのメタデータをエンコードする必要があります。このエンコード処理は、データプロバイダーのアドレスに基づいて行われます。つまり、各プロバイダーは独自のアドレスを持ち、そのアドレスとメタデータを組み合わせて「ユニークなレプリカ(unique replica)」と呼ばれるものを生成して保存します。たとえば「hello world」というデータは、従来の中心化データベースや一般的な分散システムでは、異なる物理マシンにそれぞれ「hello world」として保存されます。しかし、EthStorageでは、4〜5台、あるいは10〜20台のマシンに保存する場合でも、各データプロバイダーのアドレスに基づいて異なる形にエンコードされ、それぞれ異なるデータとして保存されます。
この方式の利点は、暗号学的手法を通じて、複数の異なるアドレス(=異なるストレージプロバイダー)がデータをエンコードし、そのエンコード済みデータを保存していることを証明できることです。FilecoinやArweaveも同様の仕組みですが、それらは静的データを対象としています。一方、EthStorageはイーサリアムDAの「ホットデータ」を対象としており、イーサリアムのスマートコントラクト上で、これらのデータが多数の物理的コピーを持っていることを検証できます。つまり、各エンコード済みデータがネットワーク上に保存されていることを証明でき、かつそのエンコードされたデータ自体が、異なるプロバイダーのアドレスによって異なるものになっているため、真正な物理的分散が保証されます。
このように、既存の分散型ストレージのアイデアを最適化・改良する一方で、イーサリアムのDA方式に対しても多くの最適化が必要です。たとえば、動的データの更新時に、ガスコストを抑えてスマートコントラクト上で効率的に証明を行う方法など、多くの先端技術と研究課題が存在します。
EthStorageが無許可のストレージ証明をどう維持するか
イーサリアムには「アーカイブノード」と呼ばれるノードがあり、すべての取引履歴とワールドステートを保存しています。しかし、今後のdankshardingでは、年間約80TBのデータが生成されると予想されています。イーサリアムが3〜4年運用されれば、200〜300TBのデータが蓄積され、今後も増加し続けます。これはアーカイブノードにとって大きな負担です。なぜなら、アーカイブノードを運営しても、データ保存に対してトークノミー上のインセンティブが存在しないためです。
EthStorageはまず、データの永続保存に対するインセンティブ設計という課題を解決する必要があります。これに関しては、Arweaveの「割引キャッシュフロー(discounted cash flow)」モデルを採用してインセンティブを実現しています。また、これをスマートコントラクト上で効率的に実行できるように設計しています。
第二に、無許可型の参加方式です。我々のインセンティブ設計では、ネットワーク内に10、50、あるいは100のノードがデータを保存することを奨励しています。したがって、任意のノードが他のいずれかのノードと接続し、データを同期した後、直ちにデータストレージプロバイダーとして参加できます。さらに、データ保存に対するインセンティブ最適化設計も今後進める予定です。
第三に、ストレージノードが一度にすべてのデータ(数百TB、長期的にはPB級)を保存する必要がある場合、単一ノードのコストは非常に高くなります。そこで、さらに「データシャーディング(data sharding)」という仕組みを導入しています。これにより、一般のノードは4TBの容量(現在の設計値。将来的には8TBなどにアップグレード可能)があればよく、ネットワーク内のアーカイブデータの一部だけを保存できます。ただし、インセンティブメカニズムを通じて、最終的にすべてのデータがL2ネットワーク内で完全に保存されるように保証します。
このように、アーカイブノードによるデータ肥大化問題、トークノミーインセンティブ問題、非中央集権的参加問題など、多くの課題があります。これらはすべて、イーサリアムのスマートコントラクトをL1に展開することで自動的に実現可能です。私たちの役割はデータネットワークを提供し、十分なデータコストを持つ者がデータをダウンロードしてストレージ証明を生成し、イーサリアムネットワークに提出して報酬を得られる環境を整えることです。現在、スマートコントラクトの設計はほぼ完了しており、イーサリアム4844のDevnet上ですでにデバッグを開始しています。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News














