
AI에서 클라우드 컴퓨팅까지, Akash는 GPU 군비 경쟁의 최적 해법이 될 수 있을까?
저자: Vincent Jow
번역: 1912212.eth, Foresight News
요약
Akash는 사용되지 않은 GPU 공급과 GPU 컴퓨팅이 필요한 사용자를 연결하는 탈중앙화 컴퓨팅 플랫폼으로, GPU 컴퓨팅의 '에어비앤비(Airbnb)'가 되는 것을 목표로 한다. 다른 경쟁자들과 달리 Akash는 범용 기업용 GPU 컴퓨팅에 집중한다. 2023년 9월 GPU 메인넷 출시 이후 현재 네트워크에는 150~200개의 GPU를 보유하고 있으며, 이용률은 50~70% 수준이며 연간 총 거래액(GMV)은 50만~100만 달러이다. 인터넷 마켓플레이스와 유사하게 Akash는 USDC 결제 건당 20%의 수수료를 부과한다.
우리는 GPU 기반 병렬 처리의 부상으로 인한 인프라 대변혁의 초기 단계에 있다. 인공지능(AI)은 세계 GDP를 7조 달러 증가시키고 3억 개의 일자리를 자동화할 것으로 예상된다. GPU 제조사 엔비디아(Nvidia)는 매출이 2022년 270억 달러에서 2023년 600억 달러, 2025년에는 약 1000억 달러에 이를 것으로 전망된다. 클라우드 컴퓨팅 업체들(AWS, GCP, Azure 등)의 엔비디아 칩 투자 비율은 한 자릿수에서 현재 25%까지 상승했으며, 앞으로 몇 년 내 50% 이상에 이를 것으로 예측된다. (출처: Koyfin)
모건스탠리는 2025년 초거대 규모(hyperscale) GPU 인프라 서비스(IaaS) 시장 기회가 400~500억 달러에 이를 것으로 추정했다. 예를 들어, GPU 컴퓨팅의 30%를 30% 할인된 가격으로 2차 시장에서 재판매한다면 이는 100억 달러의 수익 기회가 된다. 초거대 규모 외부 공급원에서 추가로 발생하는 50억 달러의 수익 기회를 더하면 총 150억 달러의 수익 잠재력이 존재한다. 만약 Akash가 이 시장의 33% 점유율을 차지해 50억 달러의 GMV를 달성하고, 20%의 수수료율을 적용한다면, 이는 10억 달러의 순수익으로 전환된다. 여기에 10배의 배수를 적용하면 약 100억 달러의 시가총액이 도출된다.
시장 개요
2022년 11월 OpenAI가 ChatGPT를 출시하면서 가장 빠르게 사용자 기반을 확장하는 기록을 세웠다. 2023년 1월 1억 명, 5월에는 2억 명의 사용자에 도달했다. 이는 생산성 향상과 300만 개 일자리 자동화를 통해 세계 GDP를 7조 달러 증가시킬 것으로 추산되는 막대한 영향을 가져왔다.
AI는 연구개발(R&D)의 소규모 분야에서 급속도로 회사의 최대 지출 우선순위로 부상했다. GPT-4 개발 비용은 1억 달러, 연간 운영비용은 2.5억 달러이다. GPT-5는 25,000개의 A100(엔비디아 하드웨어 기준 약 2.25억 달러)과 총 10억 달러의 하드웨어 투자가 필요할 것으로 예상된다. 이로 인해 AI 중심 업무 부하를 지원하기 위한 충분한 GPU를 확보하려는 기업 간 군비경쟁이 벌어지고 있다.

이러한 AI 혁명은 CPU에서 GPU 기반 병렬 처리로의 전환을 가속화하는 인프라 대변혁을 촉발했다. 역사적으로 GPU는 대규모 이미지 렌더링 및 처리를 동시에 수행하기 위해 사용되었고, CPU는 직렬 처리용으로 설계되어 이러한 동시 작업이 불가능하다. 고메모리 대역폭 덕분에 GPU는 AI 모델 학습, 최적화, 개선과 같은 병렬 처리 문제 해결을 위한 컴퓨팅 용도로 진화해왔다.
1990년대에 GPU 기술을 선도한 엔비디아는 최고 수준의 하드웨어와 CUDA 소프트웨어 스택을 결합하여 AMD와 인텔 등의 주요 경쟁자보다 수년 앞서 나가는 우위를 구축했다. 2006년 개발된 엔비디아의 CUDA 스택은 개발자가 엔비디아 GPU를 활용해 워크로드를 가속하고 프로그래밍을 단순화할 수 있도록 해준다. 현재 400만 명의 CUDA 사용자와 5만 명 이상의 개발자가 CUDA를 사용하며 강력한 프로그래밍 언어, 라이브러리, 도구, 애플리케이션, 프레임워크 생태계를 형성하고 있다. 시간이 지남에 따라 엔비디아 GPU가 데이터센터에서 인텔 및 AMD CPU를 능가할 것으로 예상된다.

초거대 클라우드 제공업체와 대형 기술기업들이 엔비디아 GPU에 지출하는 비용은 급증하고 있다. 2010년대 초반 낮은 한 자릿수 수준에서 2015~2022년 중간 한 자릿수, 2023년 25%까지 증가했다. 앞으로 몇 년 안에 엔비디아가 클라우드 제공업체 자본지출(CAPEX)의 50% 이상을 차지할 것으로 보며, 이는 엔비디아의 매출을 2022년 250억 달러에서 2025년 1000억 달러로 성장시킬 것으로 기대된다. (출처: Koyfin)

모건스탠리는 2025년까지 초거대 클라우드 제공업체의 GPU IaaS 시장이 400~500억 달러에 이를 것으로 추정한다. 이는 여전히 초거대 클라우드 제공업체 전체 매출의 일부에 불과하며, 현재 상위 3개 초거대 클라우드 제공업체의 총 매출은 약 2500억 달러 이상이다.
GPU에 대한 강력한 수요로 인해 공급 부족 현상은 뉴욕타임스, 월스트리트저널 등 주요 언론에서 광범위하게 보도되고 있다. AWS CEO는 "수요가 공급을 초과하고 있으며, 모든 기업에게 해당된다"고 말했다. 엘론 머스크는 2023년 2분기 테슬라 실적 통화회의에서 "계속해서 엔비디아 하드웨어를 가능한 한 빨리 받을 것"이라고 밝혔다.
Index Ventures는 투자 포트폴리오 기업을 위해 직접 칩을 구입해야 했다. 주류 기술 기업 외부에서는 거의 엔비디아 칩을 구입할 수 없으며, 초거대 클라우드 제공업체로부터도 장시간 대기해야 한다.
다음은 AWS와 Azure의 GPU 요금제이다. 아래 표시된 바와 같이 1~3년 예약 시 30~65%의 할인이 제공된다. 초거대 클라우드 제공업체들은 수십억 달러를 들여 용량을 확장하고 있기 때문에 수익 예측 가능성을 제공하는 투자 기회를 찾고 있다. 이용률이 60% 이상이라면 1년 예약 요금제가, 35% 이상이라면 3년 예약 요금제가 유리하다. 미사용 용량은 재판매될 수 있으므로 총 비용을 크게 줄일 수 있다.

만약 초거대 클라우드 제공업체가 500억 달러 규모의 GPU 컴퓨팅 임대 사업을 구축한다면 미사용 컴퓨팅 능력을 재판매하는 것은 거대한 기회가 될 것이다. 미사용 계산 능력의 30%를 30% 할인된 가격으로 재판매한다고 가정하면, 초거대 클라우드 제공업체의 GPU 컴퓨팅 재판매 시장은 100억 달러 규모가 된다.
그러나 초거대 클라우드 제공업체 외에도 Meta, 테슬라 등 대기업, CoreWeave, Lambda 등 경쟁업체, 자금이 풍부한 AI 스타트업 등 다양한 공급원이 존재한다. 2022년부터 2025년까지 엔비디아는 약 3000억 달러의 매출을 창출할 것으로 예상된다. 초거대 클라우드 제공업체 외부에서 700억 달러의 칩이 있다고 가정하고, 이 중 20%의 계산 능력을 30% 할인된 가격으로 재판매한다면 추가로 100억 달러의 시장이 형성되어 총 200억 달러 규모가 된다.
Akash 개요
Akash는 2015년 설립되어 2020년 9월 코스모스 앱체인으로 메인넷을 출시한 탈중앙화 컴퓨팅 마켓플레이스이다. 그 비전은 초거대 클라우드 제공업체보다 훨씬 저렴한 미활용 컴퓨팅 리소스를 제공함으로써 클라우드 컴퓨팅을 민주화하는 것이다.
블록체인은 요청, 입찰, 임대, 정산 기록의 조정 및 결제를 처리하며, 실행은 체외(off-chain)에서 이루어진다. Akash는 컨테이너를 호스팅하며 사용자는 그 안에서 어떤 클라우드 네이티브 애플리케이션도 실행할 수 있다. Akash는 쿠버네티스(Kubernetes)를 포함한 일련의 클라우드 관리 서비스를 구축했으며, 이는 컨테이너의 오케스트레이션 및 관리를 담당한다. 배포는 블록체인과 분리된 사설 P2P 네트워크를 통해 전송된다.
Akash의 첫 번째 버전은 CPU 컴퓨팅에 초점을 맞췄다. 절정기에 연간 총 거래액은 약 20만 달러였으며 4,000~5,000개의 CPU를 임대했다. 그러나 두 가지 주요 문제가 있었다. 하나는 진입 장벽(코스모스 지갑 생성 및 AKT 토큰으로 워크로드 결제 필요)이고, 다른 하나는 고객 이탈 문제였다. (지갑에 AKT를 충전해야 했으며, AKT가 바닥나거나 가격 변동 시 워크로드가 중단되었고 대체 제공업체가 없었다.)

지난 1년 동안 Akash는 CPU 컴퓨팅에서 GPU 컴퓨팅으로 전환하였으며, 이는 컴퓨팅 인프라와 공급 부족의 패러다임 전환을 활용한 것이다.

Akash GPU 공급
Akash의 GPU 네트워크는 2023년 9월 메인넷에 출시되었다. 이후 Akash는 150~200개의 GPU로 확장되었으며, 이용률은 50~70% 수준이다.

다음은 여러 제공업체의 엔비디아 A100 가격 비교로, Akash의 가격이 경쟁사보다 30~60% 저렴하다.

Akash 네트워크에는 7개국에 걸쳐 약 19개의 독립적인 제공업체가 있으며, 15종 이상의 칩을 공급하고 있다. 가장 큰 제공업체는 DCG가 지원하는 Foundry로, 암호화폐 채굴 및 스테이킹 사업도 하고 있다.

Akash는 전통적으로 AI 워크로드를 지원하는 데 사용되는 기업용 칩(A100)에 주로 집중하고 있다. 소비자용 칩도 일부 제공하지만, 전력 소비, 소프트웨어, 지연 문제로 인해 과거에는 AI에 사용하기 어려웠다. FedML, io.net, Gensyn 등 몇몇 기업은 AI 에지 컴퓨팅을 구현하기 위한 오케스트레이션 레이어를 구축하고 있다.
시장이 점점 훈련(training)보다 추론(inference) 중심으로 이동함에 따라 소비자용 GPU가 더 실현 가능해질 수 있지만, 현재 시장은 주로 훈련에 기업용 칩을 사용하는 데 집중하고 있다.

공급 측면에서 Akash는 초거대 공용 클라우드 제공업체, 사설 GPU 제공업체, 암호화폐 채굴업체, 미활용 GPU를 보유한 기업에 주목하고 있다.
-
초거대 공용 클라우드 제공업체: 가장 큰 가능성은 초거대 공용 클라우드 제공업체(Azure, AWS, GCP)가 고객이 Akash 마켓플레이스에서 미사용 용량을 재판매할 수 있도록 허용하는 것이다. 이를 통해 자본 투자의 수익 예측 가능성을 확보할 수 있다. 한 초거대 클라우드 제공업체가 이를 허용하면 경쟁사들도 시장 점유율 유지 차원에서 따라올 가능성이 높다. 앞서 언급했듯이 초거대 클라우드 제공업체는 500억 달러 규모의 IaaS 기회를 갖고 있어 Akash 시장에 대규모 2차 거래 기회를 창출할 수 있다.
-
사설 클라우드 경쟁업체: 초거대 공용 클라우드 제공업체 외에도 GPU 임대 서비스를 제공하는 사설 클라우드 기업(CoreWeave, Lambda Labs 등)이 있다. 초거대 클라우드 제공업체가 자체 ASIC을 개발해 대체 하드웨어를 만들려는 경쟁 구도 속에서 엔비디아는 일부 사설 기업에 더 많은 공급을 제공하고 있다. 사설 경쟁업체들의 가격은 일반적으로 초거대 클라우드 제공업체보다 저렴하다(A100 기준 최대 50% 할인). CoreWeave는 가장 잘 알려진 사설 경쟁업체 중 하나로, 원래 암호화폐 채굴업체였다가 2019년 데이터센터 구축 및 GPU 인프라 제공으로 전환했다. 현재 70억 달러의 밸류에이션으로 투자 유치 중이며 엔비디아의 지원을 받고 있다. CoreWeave는 급성장 중이며 2023년 매출 5억 달러, 2024년에는 15~20억 달러에 이를 것으로 예상된다. CoreWeave는 4.5만 개의 엔비디아 칩을 보유하고 있으며, 이들 사설 경쟁업체들이 총 10만 개 이상의 GPU를 보유하고 있을 것으로 추정된다. 이들 고객층에게 2차 시장을 제공하면 사설 경쟁업체들이 공용 초거대 클라우드 제공업체와의 경쟁에서 점유율을 확보할 수 있을 것이다.
-
암호화폐 채굴업체: 암호화폐 채굴업체는 전통적으로 엔비디아 GPU의 주요 소비자였다. 암호화 증명(PoW)의 계산 복잡성으로 인해 GPU는 작업 증명 네트워크의 주도적 하드웨어가 되었다. 이더리움이 작업 증명에서 지분 증명(PoS)으로 전환함에 따라 과잉된 대량의 채굴용 칩이 발생했다. 이들 칩 중 약 20%는 AI 워크로드에 재사용 가능할 것으로 추정된다. 또한 비트코인 채굴업체들도 수익 다각화를 원하고 있다. 지난 몇 개월간 Hut 8, Applied Digital, Iris Energy, Hive 등 주요 비트코인 채굴업체들이 AI/머신러닝 전략을 발표했다. Akash 상위 공급업체 중 가장 큰 곳은 최대 비트코인 채굴업체 중 하나인 Foundry이다.
-
기업: 앞서 언급했듯이 Meta는 15,000개의 A100을 보유하고 있으며 이용률은 5%이다. 마찬가지로 테슬라도 15,000개의 A100을 보유하고 있다. 기업용 컴퓨팅의 이용률은 일반적으로 50% 미만이다. 이 분야에 막대한 벤처캐피탈이 투입되면서 많은 AI/ML 스타트업들이 칩을 조기에 구매하고 있다. 미사용 용량을 재판매할 수 있다면 소규모 기업들의 총소유비용(TCO)을 낮출 수 있다. 흥미롭게도, 오래된 GPU를 임대하는 데는 잠재적인 세제 혜택이 있을 수 있다.
Akash GPU 수요 측면
2022년과 2023년 대부분 기간 동안 GPU 네트워크 출시 이전에는 CPU 기반 연간 GMV가 약 5만 달러 수준이었다. GPU 네트워크 출시 이후 GMV는 연간 50만~100만 달러 수준으로 증가했으며, GPU 네트워크 이용률은 50~70%이다.

Akash는 사용자 진입 장벽 감소, 사용자 경험 개선, 사용 사례 확대에 주력하고 있다.
-
USDC 결제: Akash는 최근 안정적인 결제 수단으로 USDC 사용을 허용함으로써 고객이 AKT 구매 및 보유 시 가격 변동 위험에서 벗어날 수 있게 되었다.
-
Metamask 지갑 지원: Akash는 Metamask 스냅(Snap)을 도입해 코스모스 전용 지갑 생성 없이도 쉽게 시작할 수 있도록 했다.
-
엔터프라이즈 지원: Akash 네트워크의 개발사인 Overclock Labs는 AkashML을 출시해 기업 고객의 Akash 네트워크 도입을 더욱 용이하게 하고 있다.
-
셀프서비스: Cloudmos는 최근 Akash에 인수되었으며, GPU 배포를 위한 사용자 친화적인 셀프서비스 인터페이스를 출시했다. 이전에는 명령줄 코드를 통해 배포해야 했다.
-
선택권: 주로 엔비디아 기업용 칩에 집중하고 있지만, Akash는 소비자용 칩도 제공하며, 2023년 말 기준 AMD 칩 지원도 추가했다.

Akash는 네트워크 내 실제 사용 사례 검증도 진행하고 있다. GPU 테스트넷 기간 동안 커뮤니티는 인기 있는 여러 AI 모델의 추론을 네트워크를 통해 배포하고 실행할 수 있음을 입증했다. Akash Chat과 Stable Diffusion XL 애플리케이션 모두 Akash의 추론 실행 능력을 보여주었다. 장기적으로 추론 시장이 훈련 시장보다 훨씬 더 클 것으로 본다. 현재 AI 기반 검색 비용은 0.02달러(구글 현재 비용의 10배)이다. 연간 3조 건의 검색을 고려하면 연간 600억 달러 규모가 된다. 예시로, OpenAI 모델 훈련 비용은 약 1억 달러이다. 양쪽 모두 비용이 낮아질 수 있지만, 장기적인 수익 풀의 차이는 매우 크다는 점을 보여준다.
현재 대부분의 고성능 칩 수요가 훈련에 집중되어 있다는 점을 감안해, Akash는 현재 Akash 네트워크를 통해 모델을 훈련시킬 수 있음을 입증하고 있으며, 2024년 초에 이를 출시할 계획이다. 단일 공급업체의 동일한 칩 사용 후 다음 단계는 다수 공급업체의 이기종 칩을 활용하는 것이다.
Akash의 로드맵은 매우 방대하다. 현재 진행 중인 제품 기능으로는 개인정보 보호 관리 지원, 필요 시(on-demand)/예약 인스턴스, 발견성 향상 등이 있다.
토큰 모델 및 인센티브
Akash는 AKT 결제에 대해 4%, USDC 결제에 대해 20%의 수수료를 부과한다. 이 20% 수수료율은 전통적인 인터넷 마켓플레이스에서 볼 수 있는 수준과 유사하다(Uber의 경우 30%).
Akash의 유통 토큰 비율은 약 58%(유통량 2.25억, 최대 공급량 3.88억)이다. 연간 인플레이션율은 8%에서 13%로 상향 조정되었다. 현재 유통 토큰의 60%가 21일간 스테이킹되어 있다.
AKT 공급량의 40%(기존 25%)와 GMV 수수료 수익의 일부는 커뮤니티 풀로 유입되며, 현재 이 풀에는 1000만 달러 상당의 AKT가 적립되어 있다.
이 자금의 용도는 아직 결정 중이나, 공적 기금, 제공업체 인센티브, 스테이킹, 잠재적 소각, 커뮤니티 풀 간에 분배될 예정이다.

1월 19일 Akash는 플랫폼에 1,000개의 A100을 유치하기 위한 500만 달러 규모의 시범 인센티브 프로그램을 시작했다. 장기적으로는 시장 참여 제공업체들에게 공급 측면에서 수익 예측 가능성을 제공하는 것이 목표다(예: 95%의 효과적인 이용률).
밸류에이션 및 시나리오 분석
다음은 Akash의 주요 성장 요인에 대한 몇 가지 시나리오와 설명적 가정이다:
단기 시나리오: Akash가 15,000개의 A100을 확보할 수 있다면 이는 약 1.5억 달러의 GMV를 창출할 것으로 추정된다. 20%의 수수료율을 적용하면 Akash의 프로토콜 수익은 3000만 달러가 된다. 성장 궤도를 고려해 AI 관련 밸류에이션 특성을 반영한 100배의 배수를 적용하면 30억 달러의 가치가 도출된다.
기준 시나리오: IaaS 시장 기회가 모건스탠리의 추정치와 일치해 500억 달러라고 가정한다. 70%의 이용률을 적용하면 150억 달러의 재판매 가능 용량이 생긴다. 이 용량을 30% 할인 판매하면 100억 달러가 되며, 초거대 외부 공급원에서 추가로 100억 달러를 더하면 총 200억 달러의 재판매 기회가 발생한다. 시장은 일반적으로 강력한 경쟁 격차(moat)를 형성하므로 Akash가 33%의 점유율을 달성할 수 있다고 가정한다(Airbnb의 휴가임대 점유율 20%, Uber의 라이드셰어 점유율 75%, DoorDash의 음식배달 점유율 65%). 20%의 수수료율을 적용하면 10억 달러의 프로토콜 수익이 발생한다. 10배의 배수를 적용하면 Akash의 시가총액은 100억 달러 수준이 된다.
낙관적 시나리오: 낙관적 시나리오는 기준 시나리오와 동일한 프레임워크를 사용한다. 더 다양한 고유의 GPU 공급원에 침투하고 점유율이 더 높아짐에 따라 200억 달러의 재판매 기회를 창출할 수 있다고 가정한다.

참고로, 엔비디아는 시가총액 1.2조 달러의 상장기업이며, OpenAI는 프라이빗 마켓에서 800억 달러, Anthropic은 200억 달러, CoreWeave는 70억 달러의 밸류에이션이 책정되었다. 암호화 분야에서는 Render와 TAO가 각각 20억 달러, 55억 달러 이상의 밸류에이션을 기록했다.
리스크 및 완화 방안:
공급 및 수요의 집중도: 현재 GPU 수요의 대부분은 대규모 언어 모델(LLM) 훈련을 위한 대형 기술 기업에서 발생하고 있다. 시간이 지남에 따라 더 작고 저렴하며 개인 데이터를 처리할 수 있는 AI 모델 훈련에 대한 관심이 증가할 것으로 본다. 파인튜닝(fine-tuning)은 모델이 범용에서 수직 전문화로 전환됨에 따라 점점 더 중요해질 것이다. 마지막으로 사용과 채택이 가속화되면서 추론(inference)이 더욱 중요해질 것이다.
경쟁: 미사용 GPU를 활용하려는 암호화 및 비암호화 기업들이 많다. 주요 암호화 프로토콜로는 다음과 같은 것들이 있다:
-
Render과 Nosana는 추론용 소비자용 GPU를 활용하고 있다.
-
Together는 개발자가 그 위에서 구축할 수 있는 오픈소스 훈련 모델을 개발하고 있다.
-
Ritual은 모델을 호스팅하는 네트워크를 구축하고 있다.
지연 문제 및 기술적 과제: AI 훈련은 매우 리소스 집약적인 작업이며, 모든 칩이 동일한 데이터센터에 위치하는 것이 일반적이기 때문에 탈중앙화되고 물리적으로 분산된 GPU 스택에서 모델 훈련이 가능한지는 여전히 의문이다. OpenAI는 애리조나에 75,000개 이상의 GPU를 갖춘 차세대 훈련 시설을 건설할 계획이다. 이러한 문제들을 FedML, Io.net, Gensyn 등 오케스트레이션 레이어 기업들이 해결하려 하고 있다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News











