
DataFi: 탈중앙화 데이터 서비스가 데이터 경제를 어떻게 혁신할 수 있을까?
작성: Risk Taker88
번역: TechFlow
세계에는 엄청난 양의 데이터가 존재하며, 그 규모는 놀라운 속도로 증가하고 있다. 글로벌 시장 조사 기관 IDC는 2025년이 되면 이 수치가 33ZB에서 175ZB로 증가할 것으로 추정한다.
데이터량이 방대함에도 불구하고, 여러 기업과 산업, 경제권 사이에서는 제대로 활용되지 못하고 있다. 주요 문제는 '데이터 실孤島'에 있다. 데이터 실孤島란 한 부서나 조직이 수집한 데이터를 다른 부서가 사용할 수 없는 상황을 말한다. 더 큰 범위에서도 마찬가지인데, 한 기업이 수집한 데이터는 보통 다른 기업과 공유되지 않는다.
데이터 경제(Data Economy)는 이러한 상황을 바꾸게 될 것이다.
데이터 경제란 생산자와 소비자가 데이터를 수집하고 정리하여 통찰력을 얻고 이를 화폐화하는 글로벌 디지털 생태계이다. 중요한 점은 참여자들이 그 과정에서 수익을 창출할 수 있다는 것이다. 이 경제체제 내에서 데이터는 다양한 출처에서 생성되며, 검색 엔진, 소셜미디어 플랫폼, 온라인 데이터 제공업체, 사물인터넷(IoT) 기기를 사용하는 기업 등 누구나 데이터 공급자가 될 수 있다.
데이터 경제에 참여하면 많은 이점을 누릴 수 있다. 기업들은 타 참여자들과 데이터를 교환함으로써 새로운 사업 분야를 개척할 수 있다. 예를 들어 의료기기 제조업체는 사용자의 심박수나 인슐린 수치 같은 건강 정보를 대량 보유하고 있다. 의료기기 판매 외에도, 병원 및 의료기관에 윤리적이고 안전한 방식으로 환자 추적 데이터를 제공해 협력할 수 있다. 모든 참여자들이 이러한 데이터 교환에서 이득을 얻으며, 의료기기 제조업체는 새로운 수익원을 창출하게 된다.
Streamr
예측에 따르면 전 세계적으로 생성되는 데이터의 약 30%가 실시간 데이터이며, 이 중 95%는 IoT 장치에서 발생할 것으로 보인다. 만약 이 예측이 맞는다면 Streamr은 미래를 구축하고 있다고 말할 수 있다. Streamr은 사용자가 실시간 데이터 스트림(특히 IoT 장치에서 생성된 데이터 포함)을 교환하고 이를 화폐화할 수 있는 탈중앙화 플랫폼이다. 핵심은 실시간 데이터를 생산자로부터 소비자에게 전달하는 Streamr 네트워크에 있다.
Streamr 네트워크 내의 모든 데이터는 데이터 스트림(data stream) 형태로 존재한다. 데이터 스트림은 어떤 종류의 데이터든 가능하며, 스마트홈 센서, 상업용 데이터 제공업체 또는 데이터베이스 시스템 등 다양한 출처에서 생성될 수 있다. 데이터 스트림의 예시를 살펴보면 다음과 같다.

이 숫자들은 고성능 엔진에서 나온 것으로, RPM이 상승함에 따라 온도도 함께 상승한다. 기계공학 엔지니어들에게 매우 유용한 현장 데이터이며, 엔진 재설계 시 실제 작동 데이터를 활용할 수 있게 된다.
Streamr에서는 사용자가 데이터 스트림을 수집하여 데이터 얼라이언스(data alliance)로 패키징한다. 사용자의 동의 하에 서로 다른 사용자들의 실시간 데이터를 하나의 데이터 얼라이언스에 담을 수 있다. 데이터 얼라이언스는 Streamr 마켓플레이스에서 판매 가능한 콘텐츠이며, 사용자가 실시간 데이터를 화폐화하는 방법이다. 구매자(또는 Streamr 용어로 ‘구독자’)가 데이터 얼라이언스를 구매하면 DATA 토큰이 해당 데이터 스트림 생산자들에게 분배된다. 모든 데이터 얼라이언스가 동일한 것은 아니다. 구성 모델, 사용 사례, 수익 구조 또는 기타 특성에 따라 다를 수 있다.
나는 Streamr 플랫폼과 데이터 얼라이언스가 데이터 경제에서 중요한 역할을 할 것이라 믿는다. 이는 허가 없이 누구나 참여할 수 있으며, 탈중앙화되고 P2P 방식의 제품으로, 일반 사용자도 자신의 실시간 데이터를 수익화할 수 있도록 한다.
Ocean Protocol
DataFi 분야에서 선두주자 중 하나는 Ocean Protocol이다. DataFi란 데이터와 데이터 서비스를 새로운 자산 클래스로 간주하는 탈중앙화 금융(DeFi)의 한 분야라고 정의할 수 있다. Ocean Protocol은 바로 이 분야의 최전선에 서 있으며, 데이터 제공자가 직접 소비자에게 데이터를 판매할 수 있도록 하는 탈중앙화 데이터 공유 프로토콜이다.

이 프로토콜은 데이터 제공자가 데이터의 완전한 소유권을 구매자에게 넘기지 않고도 안전하게 데이터를 화폐화할 수 있도록 한다. 정책 입안자, 인공지능(AI) 또는 머신러닝 엔지니어 같은 데이터 소비자는 원래 접근하기 어려웠거나 불가능했던 사설 데이터셋에 접근할 수 있어 이 프로토콜의 혜택을 받는다.
Ocean Protocol에서 가장 중요한 개념 중 하나는 데이터 토큰(datatokens)으로, 특정 데이터셋이나 데이터 서비스에 대한 접근 권한을 제공한다. 프로토콜 상의 모든 데이터셋이나 데이터 서비스는 각각 고유한 데이터 토큰을 갖는다. 데이터셋에 접근하려면 데이터 제공자에게 1.0개의 데이터 토큰을 보내야 한다. 또한 자신이 가진 1.0개의 데이터 토큰을 타인에게 전송함으로써 접근 권한을 양도할 수도 있다. 여기서 중요한 점은 데이터 자체를 구매하는 것이 아니라, 데이터에 대한 접근 권한만을 구매한다는 것이다.
컴퓨트-투-데이터(Compute-to-Data, CtD)는 개인정보 보호를 유지하면서 데이터를 공유할 수 있도록 해주는 영리한 기술적 해결책이다. 당신이 어떤 데이터셋을 '임대'하고 싶지만 보안상 이유로 망설이고 있다고 가정하자. 한 데이터 과학자가 당신의 데이터를 사용하고 싶어 한다. CtD는 이러한 문제를 해결하는 도구이다. 데이터 소비자는 데이터가 저장된 위치(당신의 하드웨어, Google 스프레드시트 파일 등 무엇이든 가능)를 떠나지 않은 상태에서 모델을 실행할 수 있다. CtD는 데이터 소유자와 데이터 소비자 사이의 보호막이라고 볼 수 있다.

CtD의 작동 방식은 알고리즘을 데이터에 적용할 때 결과만 데이터 소비자에게 전송되고, 데이터셋 자체는 전송되지 않는다는 점이다. 이를 통해 데이터 소유자는 개인정보를 보호하면서 데이터를 수익화할 수 있다. 데이터를 직접 소비자에게 혹은 마켓플레이스에서 판매할 수 있으며, 데이터 소비자는 모델 학습을 위한 더 많은 데이터를 확보하게 된다. 또 다른 이점은 데이터 소비자가 컴퓨팅 인프라를 자체적으로 보유할 필요가 없다는 점이다. 모든 계산이 데이터 소유자의 하드웨어에서 수행되기 때문이다.
Ocean Protocol에서는 데이터뿐 아니라 알고리즘 역시 자산으로 간주된다. 연구자는 자신의 알고리즘을 화폐화할 수 있다. 다른 데이터 자산과 마찬가지로 제공자는 알고리즘 자체를 판매하거나 단순히 접근 권한만을 판매할 수 있다. 알고리즘 개발자는 알고리즘에 대한 접근 권한만을 판매하기로 결정할 수 있는데, 이 경우 알고리즘은 공개된다. 반면 알고리즘 자체가 아닌 계산 서비스만 판매한다면 그것은 비공개 상태로 유지된다.
Chainlink
마지막으로 오랜 역사와 신뢰를 가진 프로젝트인 체인링크(Chainlink)를 살펴보자.
많은 DeFi 애플리케이션은 외부 데이터를 필요로 한다. 예를 들어, 블록체인 기반 베팅 시장은 여러 도박 회사의 실시간 배당률 정보를 받아야 하며, ETH 선물 가격과 관련된 증권을 거래할 수 있는 탈중앙화 거래 앱은 CME(시카고상품거래소) 같은 외부 거래소에서 ETH 선물 가격을 가져올 수 있어야 한다. 따라서 대부분의 경우 스마트 계약을 현실 세계의 정보와 연결해야 한다.
이때 블록체인 오라클(Oracle)이 등장한다. 오라클은 리얼월드 데이터를 DeFi 기반 스마트 계약에 입력하는 제3자 서비스이다. 탈중앙화 오라클은 더 나아가 여러 오라클을 하나의 시스템으로 결합하여, 다수의 데이터 소스를 조회하고 그 데이터를 블록체인으로 반환한다. 이렇게 함으로써 단일 장애 지점(SPOF)의 위험을 줄이는 것을 목표로 한다.
체인링크는 선도적인 탈중앙화 오라클 네트워크이다. 그 아키텍처는 세 가지 구성 요소로 이루어져 있다: 기본 요청 모델(Basic Request Model), 탈중앙화 데이터 모델(Decentralized Data Model), 오프체인 리포팅(Off-Chain Reporting). 기본 요청 모델은 이름 그대로, 스마트 계약이 바이낸스에서 SOL의 거래 가격을 알아야 할 때 이 모델이 해당 작업을 수행한다. 이 아키텍처 구성 요소는 단일 데이터 소스에서 데이터를 조회하는 역할을 한다.
탈중앙화 데이터 모델은 체인상 집계(on-chain aggregation) 개념을 도입한다. 다수의 독립된 오라클 노드로부터 데이터를 집계함으로써 응답의 신뢰성과 정확성을 높인다. 체인링크의 데이터 제공 기능은 바로 이 탈중앙화 데이터 모델을 기반으로 한다. 데이터 제공은 날씨 정보, 기업 재무 데이터, 스포츠 경기 결과, 자산 가격 등 오프체인 데이터 소스를 의미한다. 데이터는 체인상에서 집계되어 소비자가 언제든지 결과를 조회할 수 있도록 한다.
마지막으로, 오프체인 리포팅은 체인링크를 탈중앙화 맥락에서 진정으로 독특하게 만든다. 대부분의 처리는 체인 외부에서 이루어진다. 오라클 운영자(노드)들은 피어 투 피어 네트워크를 통해 서로 통신하며, 각 노드는 정기적으로 데이터를 보고하고 서명으로 승인한다. 모든 보고서는 한 번의 트랜잭션으로 집계되며, 이것이 해당 라운드의 최종 답변이 되어 전송된다. 여러 건의 트랜잭션이 아닌 하나의 트랜잭션으로 보고서를 집계하는 주요 이점은 오라클 노드가 지불하는 수수료가 훨씬 적어진다는 점이다. 이는 체인링크 블록체인 상의 혼잡을 줄여준다.
결론
과장 없이 말하자면, 데이터는 이제 하나의 독립된 자산 클래스가 되었다. 데이터와 데이터 서비스는 의료에서 전자상거래에 이르기까지 모든 분야와 산업에 걸쳐 점점 더 중요해지고 있다. 데이터 경제는 정보로부터 가치를 추출하기 위해 데이터를 수집, 분석 및 공유하는 글로벌 디지털 생태계로서, 모든 분야에 영향을 미칠 것이다.
그러나 현재 글로벌 경제 내에서 '데이터 흐름'에는 몇 가지 문제가 있다. 현재 상황에서 가장 심각한 문제 중 하나는 데이터가 데이터 실孤島 안에서 생성되고 저장된다는 점이다. 데이터가 다른 참여자에게 도달하지 못하면 그 가치는 감소한다. 두 번째 문제는 소유권의 부재이다. 우리의 데이터는 소셜미디어 대기업이나 의료기기 제조업체 등에 의해 광범위하게 기록되고 기하급수적으로 증가하고 있지만, 우리는 보통 그 데이터의 소유자가 아니다. 이러한 데이터는 우리의 동의 없이 사용되거나 판매되고 있다.
데이터 디파이(Data DeFi)는 데이터 수집과 공유 방식을 바꿀 것이다. 아직 DataFi가 초기 단계이지만, 이미 데이터 서비스를 탈중앙화하려는 다양한 프로젝트들이 등장하고 있다. Ocean Protocol과 Streamr과 같은 플랫폼은 데이터 생산자가 마켓플레이스에서 제품과 서비스를 수익화할 수 있도록 지원한다. 이러한 플랫폼은 사용자에게 수익원을 창출할 뿐만 아니라, 데이터 소유권을 다시 데이터 생산자에게 돌려준다. 데이터 소비자 입장에서는 기존에는 접근하기 어려웠거나 불가능했던 데이터를 안전하고 윤리적인 방식으로 이용할 수 있게 되는 이점이 있다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News














