Chainbase 본질 분석: 1500만 달러 펀딩 유치, 최대 규모의 풀체인 데이터 네트워크로 크립토와 AI가 시너지를 발휘하다

2024.08.01

Chainbase 본질 분석: 1500만 달러 펀딩 유치, 최대 규모의 풀체인 데이터 네트워크로 크립토와 AI가 시너지를 발휘하다

체인베이스(Chainbase)는 모든 블록체인 데이터를 통합된 생태계로 통합하여 AGI 시대에 가장 크고 신뢰할 수 있으며 안정적이고 투명한 데이터 원천이 되는 것을 목표로 하고 있다.

2024.08.01 - 09:30:08

ChainbaseAI

Web3 심층 보도에 집중하고 흐름을 통찰

글: TechFlow

현재 암호화 시장은 점차 정리 국면으로 접어들고 있다. 서사가 잠잠해지고 기존 프로젝트들이 두각을 나타내지 못할 때, 새로운 알파(Alpha) 기회는 어디에 있는가?

외부를 보면 AGI 시대의 물결이 이미 도래했으며, 내부를 살펴보면 AI는 여전히 올해 내내 지속되는 암호화 서사이며, 관심과 유동성을 끌어모으는 핵심 요소다.

다만 이제 AI 분야에서 더욱 세밀하게 "구조적" 기회를 찾아야 한다:

AI의 세 가지 기본 요소인 컴퓨팅 파워, 알고리즘, 데이터를 중심으로 보면, 앞선 두 요소는 Render Network, IO, Bittensor 등 선도적인 프로젝트들이 이미 등장했으며, 유사한 프로젝트들이 몰려 경쟁이 치열한 레드오션 상태다. 반면 데이터 관련 프로젝트들은 주로 DePIN 방향으로 발전하고 있다.

반면 웹3 고유의 체인 상 데이터를 효과적으로 활용하는 것은 여전히 알파를 발견할 수 있는 보물창고다.

한편, 일차 시장의 민감한 자금들은 이미 행동으로 선택을 나타내고 있다:

최근 중량급 펀딩 소식이 다시 등장했다. 데이터 분야 프로젝트 Chainbase가 매트릭스파트너스(Matrix Partners)의 리드 아래 1,500만 달러 규모의 A라운드 펀딩을 완료했다고 발표했다. 이에 인터넷 기업의 전략적 투자와 함께 Hash Global, Folius Ventures, JSquare, DFG, MaskNetwork, Bodl Ventures, Bonfire Union Ventures 등 유명 기관들도 참여했다.

자금의 흐름은 어느 정도 서사에 대한 예측과 프로젝트에 대한 신뢰를 의미한다. 그렇다면 Chainbase는 왜 자금의 사랑을 받고 있는가?

TLDR : 최대 규모의 올체인(All-chain) 데이터 네트워크, 개방형 데이터 스택 기술

다음은 긴 설명 없이도 Chainbase를 빠르게 이해할 수 있는 핵심 포인트들이다.

더 높은 차원의 제품: 체인 상 데이터라고 하면 보통 스마트머니 분석, 대시보드 구성, 데이터 조회 등을 떠올린다. 그러나 Chainbase는 이러한 응용들을 가능하게 하는 더 높은 차원의 인프라(Infra) 제품이며, 인프라가 할 수 있는 것은 그 이상이다.
최대 규모의 올체인 데이터 네트워크: 이 높은 차원의 축은 바로 '최대 규모의 올체인 데이터 네트워크'에서 시작된다. 즉 광범위하고 단편화된 암호화 세계의 모든 체인의 데이터뿐 아니라 오프체인 데이터까지 수집 및 가공하여 가치를 채굴할 수 있는 데이터 금광을 형성하는 것이다.
탄탄한 프로젝트 배경/팀/후원: Chainbase는 15,000명 이상의 개발자와 8,000개 이상의 프로젝트를 확보하고 있으며, 5,000억 건 이상의 올체인 데이터 호출을 처리하고 있다. 팀원들은 주요 기술 기업의 데이터 전문 분야 출신이며, 위에 언급된 투자사 외에도 Eigenlayer로부터 경제적 보안, Cosmos로부터 합의 보안이라는 최고 수준의 협력사 지원을 받고 있다.
자기일관적인 데이터 네트워크 실현 로직: 공용 블록체인처럼 '먼저 체인이 있고 나서 애플리케이션이 생기는' 방식과 달리, Chainbase는 처음부터 기술 개발자와 일반 사용자를 타깃으로 고품질 데이터를 제공하며, 생태계와 사례가 성숙한 후에 자체 데이터 네트워크를 구축한다.
크립토 네이티브(Crypto Native) AI 대규모 언어 모델: 업계 대부분의 GPT 오버레이 프로젝트들과 달리, Chainbase는 자체 개발한 Theia AI 모델을 보유하고 있으며, 원생(onchain) 고품질 데이터를 활용해 훈련시키고 다중 모달 상호작용을 지원함으로써 Web3 X AI의 초석이 될 잠재력을 지닌다.

모든 체인 내외의 데이터가 기여되어 각자의 가치를 발휘할 수 있게 되고, 누구나 데이터와 AI를 통해 자신에게 맞는 사용 사례를 찾을 수 있게 된다면;

Web3는 비로소 자신의 온체인 데이터 인프라를 갖게 된다. 이 시장의 가능성은 무한하며, 알파의 기운이 감지되고 있다.

디파이(DeFi)에 있어서 오라클처럼, AI에 있어서 데이터처럼, 올체인 데이터가 '지능의 춤'을 추기 시작한다면, 암호화 무대에서는 어떤 새로운 드라마가 펼쳐질까?

조기 입장권을 준비해두자. 지금부터 Chainbase, 즉 최대 규모의 올체인 데이터 네트워크의 제품 메커니즘, 적용 사례, AI 역량, 경제 모델을 미리 심층 분석해보자.

체인 상 데이터, 아직 효율적으로 활용되지 않은 '암지식(Dark Knowledge)'

Chainbase를 이해하고 그 비즈니스 로직을 파악하기 위해 먼저 데이터의 가치를 알아야 한다.

벌써 2017년, 《이코노미스트》의 표지 기사에서 "데이터는 석유를 대체해 새로운 시대에 가장 가치 있는 자원이 되었다"고 말했다. 그리고 2024년 현재, AGI(범용 인공지능) 트렌드의 부상과 함께 데이터라는 최고의 자원은 AI에 의해 더욱 효율적으로 채굴·활용되고 있다:

OpenAI는 45TB의 원시 데이터에서 570GB의 데이터를 추출해 GPT-3를 훈련시켰으며, 방대하고 신속하며 실시간이며 체계적인 데이터를 활용했고, GPT-4는 말할 것도 없다. 데이터의 질과 양이 계속 확장되면서 AI의 우수한 성능을 가능하게 하고 있다.

이에 비해 암호화 세계의 체인 상 데이터는 여전히 효율적으로 활용되지 못하고 있다.

현재 Web3의 데이터는 마치 다양한 구석에 누워 있는 것 같다. 대부분의 암호화 프로젝트들이 하는 일은 누워 있는 데이터를 일으켜 세우는 정도다. 예를 들어 전통적인 데이터베이스 방식을 이용해 인덱스로 체인 상 데이터를 조회하거나, Text to SQL 방식을 통해 요청을 SQL 코드로 변환하고 결과를 보여주는 정도다...

당신이 사용하는 체인 상 데이터는 지능적으로 분석되지 않으며, 실시간 피드백도 불가능하고, 암호화 세계의 모든 체인 전체를 통합적으로 탐색하여 GPT처럼 지식과 지혜를 출력하는 것도 불가능하다.

우리는 체인 상 데이터로 객관적이고 기계적인 "무엇인가"라는 질문에는 답할 수 있지만, 지능화된 "어떻게 해야 하는가"에 대한 답은 여전히 없다. 즉, 체인 상 데이터는 겉으로는 모두에게 공개돼 있지만 실질적으로는 여전히 잠들어 있는 '암지식(Dark Knowledge)'이다.

지능적이지 않고, 능동적이지 않으며, 창의적이지도 않고, 분산화도 충분하지 않다.

대부분의 암호화 프로젝트는 데이터를 활용할 때 커뮤니티의 능동성을 최대한 발휘하지 못하고 있다.

암호화 커뮤니티에는 숨은 영웅들이 많으며, 본인의 투자연구 필요에 따라 직접 샘플을 만들어 다른 사람들에게 어떤 시나리오에서 어떻게 데이터를 활용해야 하는지 알려줄 수 있지만, 현재까지 이런 분산화된 '지식 공동 구축'은 보편적이지 않다.

또한 체인 상 데이터는 정리에서 가공, 출력에서 활용까지의 전 과정에서 커뮤니티가 참여할 공간이 거의 없으며, 암호화 생태계의 다양한 참여자들의 적극성을 극대화해 더 큰 데이터 네트워크를 구축하는 방법은 여전히 매력적이며 실현돼야 할 주제다.

따라서 우리는 체인 상 데이터를 효율적으로 활용해야 하며, 더 나아가 분산화된 방식으로 데이터를 활용해야 한다:

SQL 쿼리, 인덱싱, 비실시간 활용 방식에서 벗어나 더 지능화된 방식으로 "차원 상승"해야 한다.
OpenAI처럼 중앙집권적인 방식에서 더 투명하고, 신뢰 가능하며, 오픈소스이고 커뮤니티가 공동 구축하는 방식으로 전환해야 한다.

이것이 바로 Chainbase가 등장할 순간이다.

만체귀일(萬鏈歸一), 올체인 데이터의 등장 무대

위의 배경을 바탕으로 Chainbase를 이해하기 쉬워진다:

세계에서가장 큰 올체인 데이터 네트워크를 구축하여 모든 블록체인 데이터를 하나의 통합된 생태계로 통합함으로써 AGI 시대에 가장 신뢰 가능하고 안정적이며 투명한 데이터 소스가 되는 것을 목표로 한다.

보다 쉽게 설명하면, 어떤 체인의 어떤 데이터라도 누구나 더욱 지능적으로 활용할 수 있다는 의미다.

"올체인 데이터 네트워크"라는 개념이 일시에 이해되지 않는다면, 우선 올체인 데이터를 현미경으로 자세히 들여다보자.

첫째, 올체인 데이터란 얼마나 '완전한가'?

각 체인은 자체 아키텍처와 데이터를 갖고 있지만, Chainbase는 만체귀일(萬鏈歸一)에 가깝게 BTC, ETH 등 수십 개의 주요 L1/L2 체인을 포함해 EVM 및 비EVM 체인의 모든 데이터를 하나의 통합된 생태계에 통합한다.

둘째, 이 올체인 데이터에는 정확히 무엇이 들어 있나?

답은 블록체인에 관한 모든 것이다.

이 답변이 너무 추상적이라 느껴진다면, 자세히 살펴보면 다음과 같은 종류의 데이터를 확인할 수 있다:

Raw 데이터: 블록체인에 처음 기록된 데이터로, 블록, 계약, 거래 등을 포함한다.
Decoded(디코딩) 데이터: 원시 데이터에서 정보를 추출하여 인간이 읽을 수 있는 형식으로 변환한 데이터. 예를 들어 다양한 DeFi 프로토콜의 거래 상황 등.
Abstracted(추상화) 데이터: 고급 데이터로, 중요한 정보와 지표를 추출하여 비즈니스 분석과 의사 결정에 더 적합하게 만든다. 예를 들어 토큰, 가격, 명문&룬 등 이해하기 쉽거나 특정 분석이 필요한 부분.

이는 마치 요리를 하고 싶을 때 (데이터를 분석하려 할 때) 재료를 날것(Raw)에서 반숙(Abstracted)까지 다양하게 사용할 수 있는 것과 같다.

특히 주목할 점은, Chainbase 데이터 네트워크의 이러한 올체인 데이터는 실시간 제공(새로고침 간격 3초 미만)이 가능하다는 점이다. 즉 재료의 익힘 정도를 마음대로 고를 수 있을 뿐 아니라, 재료 자체도 항상 신선하다는 의미다.

이는 현재 대부분의 암호화 데이터 프로젝트가 달성하지 못한 데이터 신선도다.

그렇다면, 이렇게 방대한 올체인 데이터는 어디서 오는가?

체인 상 데이터의 경우, 어떤 체인의 NODE 운영자 또는 RPC 제공자는 누구나 Chainbase 네트워크에 접속해 공개 데이터 게이트웨이(open data gateway)를 통해 해당 체인의 데이터를 제공할 수 있다.

이것이 바로 Chainbase의 데이터 입구(Data Accessibility Layer)를 구성한다. 기술적 이해가 어느 정도 필요하기 때문에 자세한 설명은 뒷부분의 아키텍처 분석에서 다루겠으며, 여기서는 기능 설명에 그친다.

마지막으로, 이 올체인 데이터는 얼마나 큰가?

Chainbase 공식 웹사이트의 공개된 데이터에 따르면, 현재 네트워크에는 PB 단위의 데이터가 저장되어 있으며, 매일 1.1억~1.5억 건의 올체인 데이터 호출을 처리하고 있으며, 누적 호출 횟수는 총 5,000억 건을 넘었다.

이러한 데이터 호출의 출처는 이미 협력 중인 15,000명 이상의 개발자와 8,000개 이상의 암호화 프로젝트에서 비롯된다.

우리 눈에 보이지 않는 암호화 세계 깊은 곳에서, 방대한 올체인 데이터 네트워크가 이미 형성되고 있다.

데이터 규모 측면에서 볼 때, 최대 규모의 올체인 데이터라는 명성은 실로 명부부실이다. 하지만 이를 뒷받침하는 '네트워크' 개념은 어디에 있는가?

전체 관점에서 보면, 앞서 언급한 Data Accessibility Layer가 우선적으로 모든 체인의 데이터를 흡수하며 입구 역할을 수행한다.

둘째, 올체인 데이터 처리는 OpenAI나 클라우드 사업자처럼 중앙집권적으로 이루어지는 것이 아니라, Chainbase는 토큰 인센티브 기반, 커뮤니티 주도, 다자간 공동 참여 및 분담의 처리 구조를 구축하여 데이터를 가공한다.

셋째, 앞서 언급한 체인 내외 원시 데이터가 처리된 후 Chainbase의 데이터 네트워크에서 확인 가능해지며, 네트워크 내 개발자들은 원시 데이터를 기반으로 '스크립트'를 작성해 데이터의 정의, 추출, 변환, 처리를 가능하게 하고, 올체인 데이터에서 가치 있는 정보를 추출하여 분석할 수 있다.

이러한 점에서 보면, 올체인 데이터는 이면에서 무대로 나오기까지 수집, 처리, 제시, 활용 등의 여러 단계를 거쳤다. 데이터 활용에 대해 '도(道)' 차원의 지원을 제공하며, 구체적인 '술(術)'에는 다음과 같은 것들이 포함된다:

월렛이 단일 인터페이스에서 여러 블록체인의 자산을 관리하고 조회할 수 있도록 하여 사용자의 편의성을 높임.

보안 분야: 공격 추적, 보안 경보 제공, 심층 보안 분석 수행으로 블록체인 네트워크 보호.

소셜 분야: 서로 다른 블록체인 사용자가 원활하게 상호작용하고 콘텐츠를 공유할 수 있는 소셜 플랫폼 구축.

DeFi: DeFi 플랫폼이 서로 다른 블록체인 간 대출 및 빌림을 지원할 수 있도록 하여 유동성과 유연성 증가.

참고로 위 내용은 단지 예시일 뿐이며, 인프라 제품으로서 Chainbase의 장점은 이러한 애플리케이션들이 모두 가능하지만, 인프라가 할 수 있는 것은 훨씬 더 많다는 점이다.

4단계 이중합의 아키텍처, 질서정연한 무대의 기반

올체인 데이터가 무대 앞에서 춤을 추기 위해서는 반드시 무대 뒤의 지지가 필요하다.

Chainbase의 4단계 이중합의 아키텍처 데이터 네트워크는 실제로 무대의 4개 기둥 역할을 한다. 각 계층마다 고유한 기능이 있어 올체인 데이터 활용을 위한 무대를 함께 마련하며, 모든 무대 뒤 작업이 질서정연하게 이루어지도록 보장한다.

올체인 네트워크를 설명하면서 앞서 이 아키텍처에 대해 간략히 언급했지만, 이제 좀 더 자세한 관점에서 분석해보자.

Chainbase의 모든 비즈니스가 데이터와 관련돼 있으므로, 데이터의 입력, 처리, 출력 과정을 관찰 기준으로 삼아 아래에서 위로 4단계 아키텍처가 각각 무엇을 하는지 살펴보자:

데이터 취득 계층: 올체인 데이터의 입구로, 데이터가 어떻게 네트워크에 진입하는지를 해결한다.
합의 계층: 데이터 처리 시 데이터 상태가 변화하면, 분산화된 네트워크가 어떤 방식으로든 데이터 상태 변화에 대해 합의를 도출해야 한다. 이것이 대부분의 암호화 프로젝트가 익숙한 '합의의 전통적인 맛'이다.
실행 계층: 데이터 처리 비즈니스가 발생할 수 있으므로, 다양한 방식을 통해 데이터 처리가 안전하고 효율적으로 실행되도록 보장해야 한다.
협처리 계층: 데이터 출력 장소로 쉽게 이해할 수 있으며, 데이터가 어떻게 출력되고, 누구를 위해 사용되며, 어디에 사용되는지 등의 문제를 포함한다. 여기서 '협처리'란 커뮤니티가 공동 협력하여 고품질 데이터를 생성하고 다양한 시나리오에 적용한다는 의미다.

위 논리에 따르면 데이터가 어떻게 들어오고, 어떻게 가공되며, 어떻게 활용되는지에 대해 Chainbase의 4단계 아키텍처는 각각의 역할을 수행한다.

다음으로 이 4단계를 각각 분해하여 각 계층의 작동 방식과 존재 가치를 살펴보자.

데이터 취득 계층: 올체인 데이터의 롤업, 오프체인 데이터의 안전한 통합

이 계층은 Chainbase의 데이터 입구다.

체인 상 데이터의 경우, 어떤 체인의 NODE 운영자나 RPC 제공자는 누구나 Chainbase 네트워크에 접속해 공개 데이터 게이트웨이(open data gateway)를 통해 해당 체인의 데이터를 제공할 수 있다.

오프체인 데이터의 경우, 소셜미디어 사용자의 행동 데이터 등 역시 ZK 등의 신뢰 가능한 방식을 통해 공개 데이터 게이트웨이를 거쳐 데이터 취득 계층에 진입하며, 롤업 방식으로 Chainbase 네트워크에 연결되어 프라이버시를 보장하면서 데이터를 확보할 수 있다.

본질적으로 이것은 분산화된 데이터 호수(data lake)와 같으며, 데이터를 축적하는 역할을 한다. 동시에 ZKP는 업로드된 데이터가 정확함을 보장하면서도 개인정보를 보호한다. 다중 노드가 데이터 저장 및 검증(SCP)에 공동 참여하는 방식은 데이터의 신뢰성과 조직 방식의 분산화를 보장한다.

합의 계층: 코스모스(Cosmos)의 CometBFT 합의 메커니즘으로 상태 동기화 보장

모든 암호화 제품은 공개적이고 신뢰가 제한된 환경에서 사건의 상태 변화에 대해 어떻게 일치를 이루는가라는 고전적 문제에 직면한다.

Chainbase에 구체적으로 적용하면, 이는 데이터 처리 상태의 변화를 의미한다.

상태 변화에 대해 합의를 이루려면 블록체인과 합의 알고리즘의 사용이 필수적이다. Chainbase는 코스모스의 CometBFT 합의 알고리즘을 채택했는데, 여기서는 기술적인 설명을 생략하겠다.

이것은 개선된 비잔틴 장애 허용(BFT) 알고리즘으로, 네트워크 노드의 최대 3분의 1이 고장 나거나 악의적인 행동을 하더라도 합의를 도출할 수 있다. 일부 노드가 악의를 가져도 합의가 가능하다.

이러한 관용 임계값은 효율성과 탄력성을 겸비하여 대량 데이터 부하 하에서 효율적으로 합의를 도출해야 하는 데이터 처리 시나리오에 적합하다.

실행 계층: EigenLayer + 체인 상 데이터베이스, 성능 보장과 추가적인 경제적 보안 도입

Chainbase 네트워크에 데이터 호출 요청이 발생하면, 실행 계층이 활약할 수 있다.

데이터 조작은 모두 '공간', 즉 데이터베이스가 필요하다. Chainbase는 자체 개발한 Chainbase DB 체인 상 데이터베이스를 사용하여 데이터와 작업의 병렬 처리를 지원하며, 높은 동시성 호출 요구에 대응하여 전체 네트워크의 성능과 처리량을 보장한다.

하지만 데이터가 실행된다고 해서 그것이 충분히 안전하게 실행된다는 의미는 아니다.

따라서 Chainbase의 해결책은 EigenLayer로부터 경제적 보안을 얻는 것이다.

EigenLayer의 상속 특성을 활용해 Chainbase는 자체 액티브 검증 서비스(AVS)를 구축했다. 이 방식을 통해 Chainbase는 이더리움 지분 제공자들로부터 이더리움에서 상속받은 강력한 경제적 보안을 얻어 자체 데이터 처리 서비스의 보안을 보장할 수 있다.

협처리 계층: 커뮤니티 공동 구축, 다양한 참여자들이 각자의 역할을 수행하여 데이터 가치를 극대화

이 계층은 우리의 직관에 가장 가까우며, 데이터가 어떻게 활용되어 가치를 발휘하는지 직접 볼 수 있다.

암호화 세계에서는 다양한 응용 시나리오에서 방대하고 다양한 데이터가 생성되며, 이 고립되고 다양한 데이터에서 가치를 추출하는 것이 협처리 계층이 해결해야 할 문제다.

Chainbase의 이 계층 설계의 주요 아이디어는 다수의 개발자가 협력하여 지식을 축적함으로써 집단 지성을 창출하는 것이다.

이러한 협력은 구체적인 기능으로 다음과 같이 표현된다:

지식 기여: 사용자는 데이터 처리 및 전문 작업 모델 분야의 전문 지식을 협처리 계층에 기여할 수 있다. 이러한 협업 환경은 집단 지성을 활용해 네트워크 기능을 강화한다.
지식 자산화: 협처리 계층은 지식 기여를 자산으로 전환하고, 이러한 자산의 분배, 유통, 거래를 관리하여 기여자의 지식과 노력에 보상을 제공한다.
CBT 토큰 생태계: 네트워크 인센티브 구조에서 필수적인 부분으로, 결제, 정산, 스테이킹, 거버넌스를 촉진하며, 뒷부분에서 자세히 설명할 것이다.