
從雲計算到 AI ,Akash 會成為 GPU 軍備競賽的最優解?
TechFlow Selected深潮精選

從雲計算到 AI ,Akash 會成為 GPU 軍備競賽的最優解?
Akash 的 GPU 網絡於 2023 年 9 月在主網上線。從那時起,Akash 已經擴展到 150-200 個 GPU,利用率達到 50-70%。
作者:Vincent Jow
編譯:1912212.eth,Foresight News
總結
Akash 是去中心化計算平臺,旨在連接未充分利用的 GPU 供應與需要 GPU 計算的用戶,目標是成為 GPU 計算的「Airbnb」。與其他競爭對手不同,它們主要專注於通用、企業級 GPU 計算。2023 年 9 月推出 GPU 主網後,它已在其網絡上擁有 150-200 個 GPU,利用率達到 50-70%,年總交易價值為 50 萬美元至 100 萬美元。與互聯網市場相一致,Akash 對 USDC 支付收取 20% 的交易費。
我們正處於基礎設施的巨大變革之初,由 GPU 驅動的並行處理正在崛起。預計人工智能將使全球 GDP 增加 7 萬億美元,同時使 3 億個工作崗位實現自動化。而製造 GPU 的英偉達,預計其營收將從 2022 年的 270 億美元增至 2023 年的 600 億美元,到 2025 年將達到約 1000 億美元。雲計算廠商(AWS、GCP、Azure 等)在英偉達芯片上的資本支出已從個位數增長到如今的 25%,預計在未來幾年將達到 50% 以上。(來源:Koyfin)
摩根斯坦利估計,到 2025 年,超大規模 GPU 基礎設施即服務(IaaS)的機會將達到 400-500 億美元。作為例證,如果將 30% 的 GPU 計算通過二級市場以 30% 的折扣轉售,這將是一個 100 億美元的營收機會。再加上來自非超大規模來源的另一個 50 億美元的營收機會,總共將是 150 億美元的營收機會。假設 Akash 能夠佔據這個機會的 33% 市場份額(50 億美元的總交易價值),並以 20% 的交易費率,這將轉化為 10 億美元淨營收。應用一個 10 倍的倍數,將產生一個接近 100 億美元的市值結果。
市場概況
2022 年 11 月,OpenAI 推出 ChatGPT,創下了最快的用戶基數增長紀錄,到了 2023 年 1 月,達到 1 億用戶,到 5 月達到 2 億用戶。這帶來的影響是巨大的,估計通過提高生產力和自動化 300 萬個工作崗位,將使全球 GDP 增加 7 萬億美元。
人工智能迅速從研發的一個小眾領域崛起為公司最大的支出重點。創建 GPT-4 的成本為 1 億美元,年運行成本為 2.5 億美元。GPT-5 需要 25,000 個 A100(相當於 2.25 億美元的 Nvidia 硬件)和可能需要 10 億美元的總硬件投資。這在公司之間掀起了一場爭奪足夠 GPU 以支持人工智能為驅動的企業工作負載的軍備競賽。

這場人工智能革命引發了基礎設施的鉅變,加速了從 CPU 到 GPU 並行處理的轉變。歷史上,GPU 一直被用於同時大規模渲染和處理圖像,而 CPU 則設計為串行運行,無法同時進行這樣的操作。由於高內存帶寬,GPU 逐漸演變為處理其他具有並行問題的計算,例如訓練、優化和改進人工智能模型。
在上世紀 90 年代首創 GPU 技術的 Nvidia,將其一流的硬件與 CUDA 軟件堆棧相結合,建立了與競爭對手(主要是 AMD 和英特爾)相比的多年領先地位。Nvidia 的 CUDA 堆棧於 2006 年開發,允許開發人員優化 Nvidia GPU 以加速其工作負載並簡化 GPU 編程。有 400 萬 CUDA 用戶,超過 50,000 名開發人員正在使用 CUDA 進行開發,擁有強大的編程語言、庫、工具、應用程序和框架生態系統。我們預計隨著時間的推移,Nvidia GPU 將在數據中心中超越英特爾和 AMD CPU。

超大規模雲服務提供商和大型科技公司對 Nvidia GPU 的支出迅速增加,從 2010 年初的低水平個位數百分比佔比,到 2015 年 -2022 年的中等個位數佔比,再到 2023 年的 25%。我們認為,在未來幾年內,Nvidia 將佔據云服務提供商資本支出的 50% 以上。這有望推動 Nvidia 的營收從 2022 年的 250 億美元增至 2025 年的 1,000 億美元(來源:Koyfin)。

摩根斯坦利估計,到 2025 年,超大規模雲服務提供商的 GPU 基礎設施即服務(IaaS)市場規模將達到 400-500 億美元。這仍然只是超大規模雲服務提供商總營收的一小部分,目前排名前三的超大規模雲服務提供商今天的總營收約為 2500 億美元以上。
鑑於對 GPU 的強烈需求,GPU 供應短缺現象已被《紐約時報》和《華爾街日報》等媒體廣泛報道。AWS 首席執行官表示「需求超過了供應,對每個人都是如此」。埃隆·馬斯克在 2023 年第二季度特斯拉收益電話會議上表示「我們將繼續使用——我們會盡快地收到 Nvidia 的硬件」。
Index Ventures 不得不為其投資組合公司購買芯片。主流科技公司之外,幾乎不可能從 Nvidia 購買到芯片,而從超大規模雲服務提供商那裡獲取芯片也需要很長時間。
以下是 AWS 和 Azure 的 GPU 定價情況。如下所示,預訂 1-3 年可獲得 30-65% 的折扣。由於超大規模雲服務提供商正在投資數十億美元用於擴大容量,因此他們正在尋找能夠提供收入可見性的投資機會。如果客戶預計利用率超過 60%,最好選擇支付 1 年的預留定價,如果預計利用率超過 35%,則選擇 3 年。任何未使用的容量都可以重新銷售,從而大幅降低其總成本。

如果超大規模雲服務提供商構建了一個價值 500 億美元的 GPU 計算租賃業務,那麼重新銷售未使用的計算能力將是一個巨大的機會。假設有 30% 的計算能力以 30% 的折扣重新銷售,那就是一個價值 100 億美元的市場,重新銷售超大規模雲服務提供商的 GPU 計算能力。
然而,除了超大規模雲服務提供商之外,還有其他供應來源,包括大型企業(例如 Meta、特斯拉)、競爭對手(CoreWeave、Lambda 等)以及資金充裕的人工智能初創公司。從 2022 年到 2025 年,Nvidia 將創造約 3000 億美元的營收。假設在超大規模雲服務提供商之外還有 700 億美元的芯片,以 20% 的計算能力以 30% 的折扣重新銷售,這將為其增加另外 100 億美元,總計 200 億美元。
Akash 概覽
Akash 是一個去中心化計算市場,成立於 2015 年,於 2020 年 9 月作為 Cosmos 應用鏈推出主網。其願景是通過提供價格顯著低於超大規模雲服務提供商的未充分利用的計算資源,實現雲計算的民主化。
該區塊鏈處理協調和結算,存儲請求、競標、租賃和結算的記錄,而執行是在鏈下完成的。Akash 託管容器,用戶可以在其中運行任何雲原生應用程序。Akash 構建有一套雲管理服務,包括 Kubernetes 來編排和管理這些容器。部署是從一個與區塊鏈隔離的私人點對點網絡轉移的。
Akash 的第一版專注於 CPU 計算。在其巔峰時期,該業務的年度總交易額達到了約 20 萬美元,租賃了 4-5 千個 CPU。然而,存在兩個主要問題,即入門難度(需要啟動一個 Cosmos 錢包並使用 AKT 代幣支付工作負載)和客戶流失(必須為錢包充值 AKT,如果 AKT 用完或價格變動,工作負載將停止,沒有備用提供商)。

在過去的一年裡,Akash 已經從 CPU 計算轉變為 GPU 計算,利用了計算基礎設施和供應短缺的這一範式轉變。

Akash GPU 供應
Akash 的 GPU 網絡於 2023 年 9 月在主網上線。從那時起,Akash 已經擴展到 150-200 個 GPU,利用率達到 50-70%。

以下比較了幾家提供商的 Nvidia A100 價格,Akash 的價格比競爭對手便宜 30-60%。

在 Akash 網絡上有大約 19 個獨特的提供商,分佈在 7 個國家,供應超過 15 種類型的芯片。最大的提供商是 Foundry,這是一家由 DCG 支持的公司,也從事加密挖礦和權益質押。

Akash 主要專注於企業級芯片(A100),這些芯片傳統上用於支持 AI 工作負載。雖然他們也提供了一些消費級芯片,但由於功耗、軟件和延遲問題,這些芯片在過去通常難以用於 AI。有幾家公司如 FedML、io.net 和 Gensyn,正在嘗試構建一個編排層,以實現 AI 邊緣計算。
隨著市場越來越多地轉向推斷而非訓練,消費級 GPU 可能變得更具可行性,但目前市場主要集中在使用企業級芯片進行訓練。

在供應方面,Akash 專注於公共超大規模雲服務提供商、私人 GPU 提供商、加密礦工和持有未充分利用 GPU 的企業。
-
超大規模公有云服務提供商:最大的潛力是讓超大規模公有云服務提供商(Azure、AWS、GCP)允許他們的客戶在 Akash 市場上轉售未充分利用的容量。這將使他們能夠獲得資本投資的收入可見性。一旦一個超大規模雲服務提供商允許這樣做,其他人可能也需要跟進,以保持競爭份額。正如前面提到的,超大規模雲服務提供商可能會有一個 500 億美元的基礎設施即服務(IaaS)機會,為 Akash 的市場創造了一個大規模的二手交易機會。
-
私有云競爭對手:除了超大規模公有云服務提供商外,還有幾家私有云公司(CoreWeave、Lambda Labs 等)也提供 GPU 租賃服務。鑑於超大規模雲服務提供商試圖構建自己的 ASIC 作為替代硬件的競爭動態,Nvidia 已經向一些私有公司提供了更多的供應。私有競爭對手的定價通常比超大規模雲服務提供商更便宜(例如,A100 便宜多達 50%)。CoreWeave 是最知名的私有競爭對手之一,曾經是一家加密挖礦公司,於 2019 年轉變為建造數據中心並提供 GPU 基礎設施。它正在以 70 億美元的估值進行融資,並得到 Nvidia 的支持。CoreWeave 正在迅速增長,2023 年收入達到 5 億美元,預計 2024 年收入將達到 15-20 億美元。CoreWeave 擁有 4.5 萬塊 Nvidia 芯片,估計這些私人競爭對手總共可能擁有 10 萬多個 GPU。為他們的客戶群體啟用二級市場可能使這些私人競爭對手在與公共超大規模雲服務提供商的競爭中獲得份額。
-
加密礦工:加密礦工歷來是 Nvidia GPU 的大量消費者。由於解決密碼證明的計算複雜性,GPU 已經成為工作量證明網絡的主導硬件。隨著以太坊從工作量證明轉變為權益證明,這導致了大量的過剩產能。據估計,解放出來的芯片約有 20% 可以用於重用於 AI 工作負載。此外,比特幣礦工也希望實現收入多元化。在過去的幾個月中,Hut 8、Applied Digital、Iris Energy、Hive 和其他比特幣礦工都宣佈了人工智能 / 機器學習戰略。在 Akash 上最大的供應商是 Foundry,它是最大的比特幣礦工之一。
-
企業:正如之前所示,Meta 擁有大量 GPU,擁有 15,000 個 A100,利用率為 5%。同樣,特斯拉也有 15,000 個 A100。企業計算的利用率通常低於 50%。鑑於這一領域的大量風險投資,許多 AI/ML 初創公司也提前購買了芯片。能夠轉售未使用的容量將降低這些較小公司的總擁有成本。有趣的是,租賃舊 GPU 可能存在潛在的稅收優勢。
Akash GPU 需求側
2022 年和 2023 年大部分時間,在 GPU 網絡推出之前,CPU 的年化總值(GMV)約為 5 萬美元。自 GPU 網絡推出以來,GMV 已經達到 500,000 至 1,000,000 美元的年化水平,GPU 網絡上的利用率為 50-70%。

Akash 一直在努力減少用戶摩擦、改善用戶體驗和拓寬用例。
-
USDC 支付:Akash 最近允許使用 USDC 進行穩定支付,使客戶不再受到購買 AKT 和持有 AKT 直到支付時的價格波動影響。
-
Metamask 錢包支持:Akash 還實施了 Metamask Snap,以便更輕鬆地進行入門,而不必創建一個特定於 Cosmos 的錢包。
-
企業級支持:Akash 網絡的創建者 Overclock Labs 推出了 AkashML,可以通過企業級支持更輕鬆地引入用戶到 Akash 網絡上。
-
自助服務:Cloudmos 最近被 Akash 收購,還推出了一個易於使用的自助服務界面,用於部署 GPU。以前,部署必須通過命令行代碼完成。
-
選擇:雖然重點主要放在 Nvidia 企業級芯片上,但 Akash 也提供消費級芯片,並且截至 2023 年底,已添加對 AMD 芯片的支持。

Akash 還在通過網絡驗證用例。在 GPU 測試網絡期間,社區展示了它可以使用網絡部署和運行許多流行的 AI 模型的推理。Akash Chat 和 Stable Diffusion XL 應用程序都展示了 Akash 運行推理的能力。我們認為,隨著時間的推移,推理市場將比培訓市場大得多。今天 AI 驅動的搜索成本為 0.02 美元(是 Google 當前成本的 10 倍)。鑑於每年有 3 萬億次搜索,這將是每年 600 億美元。為了將其置於上下文中,訓練 OpenAI 模型的成本約為 1 億美元。雖然這兩者的成本可能都會降低,但這突顯了長期收入池的顯著差異。
考慮到今天對高端芯片的大多數需求都集中在培訓方面,Akash 目前還在努力展示他們可以使用 Akash 網絡來訓練一個模型,並計劃在 2024 年初推出該模型。在使用來自單一供應商的同質芯片之後,下一個項目將是使用來自多個供應商的異構芯片。
Akash 的路線圖非常大。正在進行的一些產品功能包括隱私管理支持、按需 / 保留實例和更好的可發現性。
代幣模型與激勵
Akash 對 AKT 支付收取 4% 手續費,對 USDC 支付收取 20% 手續費。這 20% 的收費率與我們在傳統互聯網市場上看到的類似(例如 Uber 的 30%)。
Akash 有大約 58% 的代幣在流通(流通中有 2.25 億,最大供應為 3.88 億)。每年的通貨膨脹率已從 8% 提高到 13%。目前,60% 的流通代幣已被鎖倉,鎖倉期為 21 天。
40%(之前為 25%)的通貨膨脹和 GMV 的收費率也會進入社區池,該社區池目前有 1000 萬美元的 AKT 代幣。
這些資金的用途仍在確定中,但將在公共資金、提供者激勵、質押、潛在銷燬和社區池之間進行分配。

在 1 月 19 日,Akash 啟動了一個 500 萬美元的試點激勵計劃,旨在將 1,000 個 A100 引入平臺。隨著時間的推移,目標是為參與市場的提供商提供供應端的收入可見性(例如 95% 的有效利用率)。
估值和場景分析
以下是幾種場景和 Akash 關鍵驅動因素的說明性假設:
短期情況:我們估計如果 Akash 能夠達到 15,000 個 A100,這將產生近 1.5 億美元的 GMV。以 20% 的抽成率計算,這將為 Akash 帶來 3000 萬美元的協議費用。考慮到增長軌跡,以 100 倍的倍數(考慮到 AI 的估值)計算,這將價值 30 億美元。
基準情況:我們假設 IaaS 市場機會與摩根士丹利的估計一致,為 500 億美元。假設 70% 的利用率,有 150 億美元的可轉售容量。假設這個容量打折 30%,得到 100 億美元,加上其他非超級擴展源的 100 億美元。鑑於市場通常享有強大的護城河,我們假設 Akash 能夠實現 33% 的份額(Airbnb 度假租賃市場份額的 20%,Uber 共享乘車市場份額的 75%,Doordash 送餐市場份額的 65%)。以 20% 的抽成率計算,這將產生 10 億美元的協議費用。以 10 倍的倍數計算,Akash 將成為 100 億美元的結果。
上行情況:我們的上行情況使用與基準情況相同的框架。我們假設由於能夠滲透更多獨特的 GPU 來源以及在份額增長方面更高,產生 200 億美元的轉售機會。

背景信息,Nvidia 是一家市值 1.2 萬億美元的上市公司,而 OpenAI 在私募市場的估值為 800 億美元,Anthropic 為 200 億美元,CoreWeave 為 70 億美元。在加密領域,Render 和 TAO 的估值分別為 20 億美元和 55 億美元以上。
風險與緩解措施:
供應和需求的集中度: 當前,GPU 需求的大部分來自大型科技公司對訓練極大、複雜的 LLM(大型語言模型)的需求。隨著時間的推移,我們相信會有更多對訓練規模較小的 AI 模型的興趣,這些模型更便宜且更能處理私有數據。微調將變得越來越重要,因為模型從通用型轉變為垂直特定型。最後,隨著使用和採用的加速,推斷將變得越來越關鍵。
競爭: 有許多加密和非加密公司試圖釋放未充分利用的 GPU。一些較為顯著的加密協議有:
-
Render 和 Nosana 正在釋放用於推斷的消費級 GPU。
-
Together 正在構建開源訓練模型,允許開發者構建在其上。
-
Ritual 正在構建託管模型的網絡。
延遲問題和技術挑戰: 鑑於 AI 訓練是一項非常資源密集的任務,考慮到所有芯片都位於一個數據中心,目前尚不清楚是否可以在去中心化的、非共同位置的 GPU 堆棧上訓練模型。OpenAI 計劃在亞利桑那州的一個地點建設擁有 75,000 多個 GPU 的下一個訓練設施。這些都是 FedML、Io.net 和 Gensyn 等編排層試圖解決的問題。
歡迎加入深潮 TechFlow 官方社群
Telegram 訂閱群:https://t.me/TechFlowDaily
Twitter 官方帳號:https://x.com/TechFlowPost
Twitter 英文帳號:https://x.com/BlockFlow_News











