
YZi Labs이 참여 투자, AI '데이터 채굴' 프로젝트 Gata를 한 문장으로 이해하기
글: Patti, ChainCatcher
2025년 4월 말, Gata는 YZi Labs, IDG Blockchain, Maelstrom Fund 등을 투자사로 포함한 400만 달러의 시드 라운드 펀딩을 완료했다고 발표했으며, 이는 커뮤니티 내에서 다시금 에어드랍 계획에 대한 관심을 불러일으키며 여러 '매점포획' 커뮤니티의 인기 프로젝트 순위에 올랐다.
공식 정보에 따르면, Gata는 이전 이름 Aggregata에서 개명한 것으로, 고품질 학습 데이터의 생성, 분배 및 활용을 더욱 공정하고 효율적인 방식으로 수행하기 위해 설립된 탈중앙화 AI 데이터 인프라 플랫폼이다. 이 프로젝트는 초기 단계부터 Binance Labs의 지원을 받았으며, MVB(Most Valuable Builder) 프로그램에 선정되었고, BNB 체인 생태계 Catalyst Awards에서 '혁신 우수상'을 수상하기도 했다.
탈중앙화 AI 데이터 가치 사슬
기존 데이터 플랫폼과 달리, Gata는 데이터를 단순한 학습 자료로 보지 않고, 데이터셋, 모델, 중간 가중치, 프로세스 및 실행 환경 등을 아우르는 일종의 'AI 자산'으로 확장한다. 그 핵심 목표는 탈중앙화 방식을 통해 AI 학습 데이터의 생산, 사용, 가치 분배 프로세스를 재구성하여 더 많은 사람들이 공정하게 AI 경제에 참여할 수 있도록 하는 것이다.
이를 위해 Gata는 사용자를 위한 'GPT-to-Earn' 메커니즘에서부터 자동화된 데이터 에이전트 도구인 'DataAgent', 그리고 탈중앙화된 데이터 마켓과 모델 학습 파이프라인에 이르기까지 비교적 완전한 제품 체계를 구축하며, '사용자가 데이터 생성 → 플랫폼에서 평가 및 선별 → 모델 학습에 활용 → 사용자에게 보상 지급'이라는 폐쇄 루프를 형성해 나가고 있다.
플랫폼 핵심 모듈 및 기능
1. GPT-to-Earn
Gata가 처음 출시한 제품은 Chrome 브라우저 확장 프로그램인 GPT-to-Earn이다. 사용자가 ChatGPT 등의 언어 모델을 이용할 때, 이 확장 프로그램은 익명 대화 데이터를 자동으로 업로드하여 이후 학습에 활용되며, 업로드된 데이터에 대해 포인트 보상을 제공한다.
2. DataAgent
DataAgent는 Gata 플랫폼의 핵심 도구로, 전통적인 데이터 주석 프로세스를 대체하는 것을 목표로 한다. 사용자는 특정 DataAgent 스크립트를 실행함으로써 AI가 구조화된 학습 데이터를 자동 생성하고 품질을 평가하도록 할 수 있다.
예를 들어 현재 주력하고 있는 DVA(Data Validation Agent)는 이미지-텍스트 쌍 데이터셋에 대해 자동 점수를 매겨 유용한 데이터와 무효한 데이터를 구분하며, 이를 Stable Diffusion, GPT-4o 등 최신 모델의 학습에 활용한다.
3. 탈중앙화 데이터 저장소 및 체인 상 마켓
Gata는 BNB 체인의 Greenfield 네트워크 위에 구축되어 있으며, 이를 통해 데이터 소유권이 명확하고 위변조 불가능하도록 탈중앙화된 저장 기능을 활용한다. 동시에 체인 상 데이터 마켓을 개발하여 사용자가 생성한 데이터를 상품화하여 거래할 수 있도록 하며, 파인튜닝 도구와 학습 클라이언트를 통합함으로써 비기술 사용자도 쉽게 AI 데이터 경제에 참여할 수 있도록 한다.
에어드랍 참여 방법
Gata는 '데이터는 자산이며, 참여는 곧 가치'라고 강조하며, 커뮤니티 인센티브의 핵심 요소로서 GPT-to-Earn 및 DataAgent 중심의 에어드랍 계획을 설계하였다. 사용자는 다음 방법들을 통해 참여할 수 있다:
-
Chrome 확장 프로그램 설치 및 ChatGPT 대화 업로드 권한 부여, EVM 지갑 연결
-
DVA 실행 후 ChatGPT와 상호작용하며 작업 완료하여 포인트 획득
-
Discord, X 등의 소셜 계정 연결 후 작업 수행, 친구 초대 등을 통해 포인트 획득
사용자가 데이터를 업로드할 때는 소량의 BNB 가스비를 지불해야 하며, 공식 크로스체인 브릿지를 통해 메인넷에서 BNB를 Greenfield 네트워크로 전송할 수 있다.
데이터 마이닝? 아직은 시간이 필요하다
Web3에서 '데이터 마이닝'은 이미 전통적인 데이터 분석 의미를 넘어서 사용자 데이터의 가치를 포착하는 새로운 메커니즘으로 자리 잡았다. Lens, CyberConnect 등의 소셜 프로토콜에서 사용자의 소셜 행동을 체인에 기록하여 자산화하거나, Ocean Protocol에서 데이터를 NFT화하여 타인의 라이선스 사용을 가능하게 하는 것처럼, '데이터는 자산'이라는 개념은 새로운 패러다임이 되고 있다.
Gata의 GPT-to-Earn과 DataAgent 모델 또한 이러한 추세의 산물이다. 비록 Gata가 '누구나 데이터를 채굴할 수 있는' 전체 메커니즘을 구축하려 하지만, 진정한 지속 가능한 데이터 경제 폐쇄 루프를 형성하기 위해서는 여전히 도전 과제가 존재한다.
Gata의 제품 구성도를 보면, 경량화된 사용자 진입점부터 기반 인프라까지 초보적인 형태를 갖추고 있지만, 데이터 품질 관리, 인센티브 폐쇄 루프 구축, 데이터의 실제 활용 등 핵심 요소들에서는 여전히 더 많은 기술적 및 생태계 지원이 필요하다.
미래의 AI 경제에서 데이터는 플랫폼 독점에서 벗어나 모두가 참여하는 형태로 나아갈 것이다.
'데이터 마이닝'이라는 새로운 개념은 아직 이론 검증과 메커니즘 정교화 단계에 머물러 있다. Gata가 이 경로의 실천 사례가 될 수 있을지는 여전히 미해결 상태인 장기 과제이다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News












