
對話 Gensyn 聯合創始人 Ben Fielding:a16z 領投的去中心化計算協議,如何實現 AI 民主化?
TechFlow Selected深潮精選

對話 Gensyn 聯合創始人 Ben Fielding:a16z 領投的去中心化計算協議,如何實現 AI 民主化?
Gensyn 代表一種雙重性質的解決方案:它既是軟件連接的開源協議,也是資源補償的財務機制。
採訪:Sunny and Min,深潮 TechFlow
嘉賓:Ben Fielding,Gensyn Co-Founder
我們的目標不是壟斷整個機器學習生態系統,而是將Gensyn建立為優化計算資源利用的協議,僅位於電力之上,來顯著提升人類有效利用計算資源的能力。
-- Ben Fielding,Gensyn CoFounder
2024年1月,OpenAI CEO Sam表示,未來兩種重要“貨幣”將是算力和能源。
然而,作為AI時代的權力貨幣,算力往往被大公司所壟斷,特別是在AGI大模型領域,既然有壟斷,也就有反壟斷的力量,去中心化人工智能(Decentralized AI)應運而生。
“區塊鏈這一無需許可的組件可以為算力的買賣雙方創建一個市場(或任何其他類型的數字資源,如數據或算法),在全球範圍內無需中間商進行交易”,知名投資機構a16z曾在一篇文章如此闡述AI算力的區塊鏈之道,其描述項目即為Gensyn。
Gensyn 是去中心化的深度學習計算協議,旨在成為機器學習計算的基礎層,可通過智能合約方式可促進機器學習的任務分配和獎勵,來快速實現AI模型的學習能力,並降低深度學習訓練的價格。
Gensyn可將開發人員(任何能夠訓練機器學習模型的人)與解題者(Solver,任何想用自己機器訓練機器學習模型的人)聯繫起來。通過利用世界各地閒置的、具有機器學習能力的長尾計算設備(例如小型數據中心、個人遊戲電腦),將機器學習的可用計算能力提高10-100倍。
總結起來,Gensyn核心目標是通過區塊鏈計劃實現AI民主化。
2023年6月, Gensyn 宣佈完成4,300萬美元 A 輪融資,由 a16z 領投,CoinFund、Canonical Crypto、Protocol Labs、Eden Block 等參投。
Gensyn 由計算機科學和機器學習研究資深人士Ben Fielding和Harry Grieve於2020年創立。Harry Grieve曾就讀於布朗大學和阿伯丁大學,是一位數據科學家和企業家;Ben Fielding畢業於諾桑比亞大學,曾擔任SaaS平臺Fair Custodian的聯合創始人及Research Analytics董事。
深潮 TechFlow 採訪了Gensyn聯合創始人Ben Fielding,瞭解其加密AI之旅,以及Gensyn的AI武器。

從創始人視角看 Gensyn 的價值主張
TechFlow:是什麼激發了您創立 Gensyn ?
Ben:
我最初的背景是在學術界,曾經作為一名機器學習研究員,專注於神經架構搜索 (Neural Architecture Search) 領域。這個領域涉及優化深度神經網絡的結構,尤其是用於計算機視覺應用。
我的工作是開發算法,以群體方式演化神經網絡結構。這個過程包括同時訓練眾多候選模型架構,並逐步將它們演變為針對特定任務優化的單一元模型。
在此期間,我遇到了與計算資源相關的重大挑戰。作為一名博士生,我可以使用幾臺高性能 GPU,它們就放在我桌子下的大型工作站中,這些工作站是我設法購買的。
同時,像 Google 這樣的公司也在進行類似的研究,但他們在數據中心使用成千上萬的 GPU 和 TPU,持續運行數週。這種差異讓我意識到,儘管擁有除了充足的計算能力外的所有必要資源,世界各地的其他人也面臨同樣的限制,這阻礙了研究和社會進步的速度。我對這種情況感到不滿,這最終是我們創建了 Gensyn。

在全心投入 Gensyn 之前,我花了兩年時間共同創立了一家數據隱私初創公司。這家企業專注於管理消費者數據流和基於同意的用戶數據訪問,旨在改善個人與企業在數據方面的互動方式。
這段經歷教會了我寶貴的教訓,包括常見的創業陷阱,並加強了我對個人數據流和基於同意訪問的謹慎態度。
四年前,我關閉了我的創業項目,並加入了倫敦的一個加速器 Entrepreneur First,在那裡我遇到了我的合夥人 Harry Grieve 。就在那裡,我們啟動了 Gensyn,目的是解決全球計算資源的挑戰。我們最初的策略涉及跨單個組織的私有數據孤島分配計算任務 (聯邦學習),這非常有趣。我們很快意識到擴展這種方法至全球的更廣泛潛力。為了應對這一擴展的願景,我們必須解決與計算源本身相關的基本信任問題。
Gensyn 自那時起致力於通過證明、博弈論激勵機制和概率檢查的結合,確保在設備上處理的機器學習任務的準確性。雖然具體內容可能相當技術化,但 Gensyn 致力於開發一個系統,使全球任何人都可以使用任何計算設備來訓練機器學習模型。
TechFlow: Sam Altman 需要 7 萬億美元來經營 AI 芯片工廠,以應對全球芯片短缺問題。他的計劃在規模化芯片供應方面是否現實?與此同時,Gensyn 正在解決哪些與 Altman 的解決方案不同的AI問題?
Ben:
關於 AI 領域及其面臨的挑戰,Gensyn 正在解決與 Altman 面臨的問題類似的問題。本質上,解決計算訪問問題有兩種方式。機器學習正在變得越來越普遍,可能會集成到我們使用的每一項技術中,從命令式代碼過渡到概率模型。這些模型需要大量的計算能力。當你比較計算需求與世界芯片製造能力時,你會注意到顯著的差距;需求正在飛速上升,而芯片生產僅逐漸增長。
解決方案在於(1)製造更多芯片以滿足需求或(2)提高現有芯片使用效率。
最終,這兩種策略都是解決不斷增長的計算資源需求的必要手段。
我認為 Altman 有效地正面應對了這一問題。問題在於芯片供應鏈,這是一個非常複雜的系統。這個供應鏈的某些部分尤其具有挑戰性,只有少數公司有能力管理這些複雜性。目前,許多政府開始將其視為地緣政治問題,投資於國內重新定位半導體制造廠和解決供應鏈中的一些瓶頸問題。
在我看來,Altman 所提出的,是以 7 萬億美元的數字測試市場,以衡量全球金融市場對這一問題的關注程度。這個驚人的數字沒有被直接拒絕,這非常引人注目。它促使人們重新思考:“這聽起來荒謬,但是真的嗎?”
這種反應表明確實存在重大關切,並且人們願意撥出大量資金來解決這一問題。通過設定如此高的基準,Altman 實際上為任何未來的芯片生產努力創建了一個參考點。這一戰略舉措表明,即使實際成本沒有達到 7 萬億美元,也為該領域的大規模投資設定了先例,表明瞭解決芯片製造挑戰的堅定承諾。
Gensyn 的方法有所不同;我們旨在優化全球現有芯片的使用。許多這些芯片,從遊戲 GPU 到配備 M1、M2、M3 芯片的 Macbook,都沒有得到充分利用。
這些設備完全有能力支持 AI 處理,無需開發新的專用 AI 處理器。然而,利用這些現有資源需要一個協議,將它們整合成一個統一的網絡,類似於 TCP/IP 促進互聯網通信的方式。
這種協議將使這些設備能夠按需用於計算任務。
我們協議與傳統開源協議如 TCP/IP 之間的主要區別在於財務方面。雖然後者純粹是技術解決方案,但使用硬件資源本身涉及固有成本,如電費和硬件本身的物理成本。
為了解決這一問題,我們的協議融入了加密貨幣和去中心化原則,以建立價值協調網絡來激勵硬件所有者的貢獻。
因此,Gensyn 代表一種雙重性質的解決方案:它既是軟件連接的開源協議,也是資源補償的財務機制。
此外,機器學習市場面臨的挑戰不僅僅是計算資源。
-
數據訪問、知識共享等其他因素也起著關鍵作用。通過去中心化技術,我們可以促進這些不同組件的價值歸屬,推動更加集成和高效的生態系統。因此,Gensyn 並不是孤立地運作;我們解決了更廣泛挑戰的一部分,但其他解決方案也需要解決剩餘的問題。這種協作努力對於推動機器學習領域的發展至關重要。
定義 Gensyn 的雙重性( Dual-natured)解決方案
TechFlow:您能用最簡單的術語解釋一下 Gensyn 的雙重解決方案嗎?
Ben:
簡單地說,Gensyn 是一個基於開源軟件之上的點對點網絡,讓你的設備參與其中只需運行這款軟件,而且你的設備必須能夠執行機器學習訓練任務。這個網絡由多個節點組成,每個節點都像你的設備一樣運行該軟件,它們之間直接通信,共享有關可用硬件和待執行任務的信息。這樣做的好處是不需要中心服務器,你的設備可以直接與其他設備交互,從而避免了中心服務器的需求。
Gensyn 的一個重要特點是它的通信過程沒有中央權威,例如,如果你正在使用 MacBook,它會直接與其他 MacBook 連接和通信,交換有關硬件能力和可用任務的信息。
Gensyn 面臨的主要挑戰之一是驗證鏈下的非確定性 (non-deterministic) 計算,這些計算對於區塊鏈來說太大。
我們的解決方案是引入一個驗證機制,允許設備生成可驗證的計算證明。這個證明可以由其他設備檢查,確保工作的完整性,同時又不會透露將要驗證任務的哪些部分,從而防止設備僅完成可能被檢查的任務部分。
我們的系統鼓勵設備作為解決方案提供者和驗證者參與加密證明過程或選擇性工作重運行,以確定已完成任務的有效性。本質上,Gensyn 旨在實現節點之間的互操作,相互驗證工作,並就完成的任務達成共識。任務的支付在這個框架內執行,利用區塊鏈的信任機制。這個技術生態系統模仿了以太坊的功能,專注於節點間的相互驗證,以確保任務的完整性。
我們的主要目標是通過最小的計算努力實現任務完成的共識,確保系統的完整性,同時容納大規模機器學習任務。
綜上所述,Gensyn 可以分為兩個主要部分。
-
第一部分是區塊鏈方面,包括我之前提到的狀態機。這是參與者之間共享計算發生的地方。
-
Gensyn 的另一半涉及通信基礎設施,側重於節點如何相互作用以及處理機器學習任務。
這種設置允許任何節點執行任何計算,前提是它可以稍後在區塊鏈側驗證工作。
我們正在搭建一個覆蓋所有節點的通信基礎設施,以促進信息共享、必要時的模型分割以及廣泛的數據處理。這種設置支持各種模型訓練方法,如數據並行、模型並行和管道分區,而不需要立即的信任協調。
雙重性解決方案 = 狀態機+ 機器學習任務通信
Gensyn狀態機
TechFlow:Gensyn 鏈如何在特定的機器學習點對點網絡中發揮作用?
Ben:
最初,我們假設所有參與者都在按照他們的角色履行任務並生成相應的證明。然後,我們將注意力轉移到區塊鏈方面,在那裡我們維護一個類似於其他區塊鏈的共享狀態,包括哈希化交易和操作,還有哈希化前一個區塊,這樣形成了一個完整的鏈條。
參與者之間的共識是,如果一個區塊中的計算匹配併產生相同的哈希值,則認為工作正確完成,允許我們進入下一個鏈環。
Gensyn 使用 POS 運作機制,獎勵那些驗證區塊生成的貢獻。
創建一個區塊涉及對 (1) 機器學習驗證工作所需的操作進行哈希化,和 (2) 記錄該區塊內發生的交易。
雖然我們的方法與以太坊等系統相似,但我們的獨特貢獻主要在於通信方面,特別是節點如何管理和協作處理機器學習任務。
TechFlow:Gensyn 鏈與以太坊有何不同?如果核心基礎設施並非新穎,POS 鏈是如何設計來滿足機器學習的特定用例的?
Ben:
我們的區塊鏈核心結構並不新穎,除了一個新穎的數據可用性層。顯著的不同在於我們處理更大計算任務的能力,這使得我們的操作比以太坊上通常可能的更加高效。
這對於卷積運算 (convolution operations) 特別相關,這是許多機器學習模型的基本組成部分。
在以太坊虛擬機(EVM)中使用 Solidity 高效執行這些運算是具有挑戰性的。
Gensyn 鏈提供了更多的靈活性,允許我們更有效地處理這些計算,而不受 EVM 操作範圍的限制。
真正的挑戰在於實現模型的泛化性(Generalizability):這意味著模型能夠在遇到全新的樣本時準確預測其位置,即使此前未曾見過,因為它具備足夠廣泛的空間理解。
這種訓練過程需要大量的計算資源,因為它需要反覆通過模型傳遞數據。
Gensyn 的機器學習運行時的任務是獲取模型的圖形表示,並將其置於一個框架中,以便在執行計算時生成每個操作的完成證明。
這裡存在一個重要問題,即確定性和可重現性。
理想情況下,在數學世界中,重複一個操作應該產生相同的結果。然而,在計算硬件的物理世界中,不可預測的變量可能導致計算結果出現輕微變化。
到目前為止,在機器學習中的一定程度的隨機性是可以接受的,甚至是有益的,因為它有助於防止模型過度擬合,並促進更好的泛化。
然而,對於Gensyn而言,泛化性和可重現性都至關重要。
計算結果的變化可能導致完全不同的哈希值,這可能導致我們的驗證系統錯誤地標記工作為未完成,從而面臨財務損失的風險。為了應對這一點,我們的運行時確保操作在各個設備上都是確定性和可重現的,這是一種複雜但必要的解決方案。
這種方法在某種程度上類似於使用諸如PyTorch、TensorFlow或JAX等機器學習框架。用戶可以在這些框架內定義模型並啟動訓練。我們正在適應這些框架和底層庫,例如計算統一設備架構(CUDA),以確保模型執行時能夠在任何設備上以可重複的準確方式進行。
這確保了一臺設備上操作結果的哈希處理在另一臺設備上產生相同的哈希,突顯了我們系統中機器學習執行這一方面的重要性。
Gensyn通過開源區塊鏈通信協議實現了雲服務的去中心化,以支持去心化機器學習
TechFlow:那麼在Gensyn鏈之上,這套特定於機器學習網絡的區塊鏈通信設施又是如何的?
Ben:
通信基礎設施的目的是促進設備間的相互通信。其主要功能是允許一臺設備驗證另一臺設備生成的工作和證明。
在本質上,設備之間的通信用於互相驗證工作,這一過程需通過區塊鏈進行,因為區塊鏈在任何爭議中都扮演著中心仲裁者的角色。區塊鏈是我們系統中唯一的可信來源,缺少它就無法可靠地驗證參與方的身份,任何人都可能聲稱他們已經驗證了工作。
區塊鏈及其加密技術使身份驗證和工作確認變得安全。設備可以在這一機制下證明自己的身份並安全提交信息,使得其他方可以識別並驗證這些信息的真實性。
這一系統的最終目的是向設備所有者提供補償。如果你擁有可執行機器學習任務的硬件,你可以將其出租。
然而,在傳統系統中,這一過程複雜且成本高昂。例如,購買大量Nvidia GPU並出租它們——將資本支出轉化為運營支出,類似於雲服務提供商——涉及眾多挑戰。你需要找到對你硬件感興趣的AI公司,建立銷售渠道,發展模型傳輸和訪問的基礎設施,並管理包括服務級別協議(SLA)在內的法律和運營協議。SLA要求現場工程師確保與客戶約定的正常運行時間,任何停機都會導致基於合同的責任和潛在的財務風險。這種複雜性對個人或小企業是一個重大障礙,這也是集中式雲服務成為主流的原因之一。
Gensyn提供了一種更為有效的方法,消除了這些交易通常涉及的人力和商業成本。你只需運行一些軟件,而不依賴法律合同和工程師建設基礎設施。法律協議被智能合約取代,工作驗證通過自動化系統進行,檢查任務是否正確完成。不再需要手動處理違約索賠或尋求法律解決,所有這些都可以通過技術立即解決,這是一個顯著的優勢。這意味著供應商只需運行一些軟件,就可以立即從他們的GPU獲取收益,無需承擔任何額外麻煩。
關於 Go to Market
我們鼓勵供應商加入Gensyn網絡的方式是,告訴他們他們可以通過運行開源軟件,立即進入機器學習計算的需求市場。這是一個前所未有的機會,顯著擴大了市場,允許新入者挑戰像AWS這樣的傳統服務的統治地位。AWS和其他公司需要管理複雜的操作,而我們正在將這些操作轉換為代碼,創造新的價值流動途徑。
傳統上,如果你有一個需要訓練的機器學習模型並願意為計算付費,你的錢將流向壟斷供應的主要雲提供商。他們因能夠有效管理而佔據市場。儘管Google Cloud、Azure和其他公司的競爭日益激烈,這些供應商的利潤率仍然很高。
關於去中心化雲服務的目的:去中心化訓練 Vs. 去中心化推理
TechFlow:機器學習大致分為訓練 (training) 和推理 (inference) 兩部分。Gensyn 的 P2P 計算資源在在哪個部分發揮作用?
Ben:
我們的重點是訓練,這涉及到價值的提煉。
訓練包括從最初的學習到微調,而推理只涉及用數據查詢模型而不改變它,基本上是根據輸入看模型預測什麼。
-
訓練需要大量計算資源,通常是異步的,不需要即時結果。
-
相比之下,推理需要快速執行,以確保實時應用中用戶的滿意度,這與訓練時計算密集型的特性形成了明顯對比。
去中心化技術目前還不足以解決對推理至關重要的延遲問題。未來,為了有效地進行推理,模型需要儘可能靠近用戶部署,通過利用地理接近性來最小化延遲。
然而,啟動這樣的網絡頗具挑戰,因為其價值和效能會隨網絡規模的擴大而增長,這符合梅特卡夫法則,類似於我們在Helium網絡等項目中看到的發展動態。
因此,Gensyn 直接應對推理挑戰是不現實的;這個任務更適合由專注於優化延遲和網絡覆蓋的獨立實體來承擔。
我們支持專注於單一功能優化的協議,而非嘗試在多個領域同時發展,以避免效能的稀釋。這種專業化推動了競爭和創新,並導致了一系列各自精通生態系統特定方面的互操作協議。
理想情況下,除了運行Gensyn節點進行計算任務外,用戶還能操作其他功能節點,如推理、數據管理和數據標記。這些網絡的互聯將有助於構建一個強大的生態系統,其中機器學習任務可以在各種平臺間無縫轉移。這種去中心化的未來願景預示著一個新的網絡層次,每個層次都通過集體的貢獻增強機器學習的能力。
去中心化人工智能生態:如何與去中心化數據協議達成共贏?
TechFlow:考慮到計算和數據是機器學習的重要輸入,Gensyn 的計算協議如何與數據協議協作?
Ben:
計算只是一個方面;數據是另一個重要領域,同樣可以應用價值流動模型,儘管驗證和激勵機制不同。
我們設想一個豐富的生態系統,包括在像你的 MacBook 這樣的設備上運行的多個節點。你的設備上可能有一個 Gensyn 計算節點、一個數據節點,甚至是一個數據標記節點,通過遊戲化激勵或直接支付貢獻於數據標記,通常不直接意識到這些模型背後的過程。
這個生態系統為我們雄心勃勃地稱之為機器智能革命鋪平了道路,標誌著互聯網的新階段或進化。當前的互聯網作為一個巨大的人類知識文本形式的倉庫。
計算是重要的一環,數據則是另一關鍵領域,同樣可以應用價值流動模型,雖然驗證和激勵機制有所不同。
我們設想一個充滿活力的生態系統,包括在像MacBook這樣的設備上運行的多個節點。你的設備上可能不僅運行一個Gensyn計算節點,還可能包括數據節點和數據標記節點。通過遊戲化激勵或直接支付,這些節點將為數據標記做出貢獻,用戶通常不會意識到這些背後的複雜過程。
這個生態系統為我們所稱的機器智能革命鋪平了道路,標誌著互聯網進入一個新的發展階段。目前的互聯網是一個龐大的人類知識的文本庫。
我們展望的未來互聯網,是通過機器學習模型而不是文本來呈現互聯網。這意味著在全球範圍內,從MacBook到iPhone再到雲服務器,機器學習模型的片段將分佈在這些設備上,使我們能夠通過這一分佈式網絡進行查詢和推理。與由少數雲提供商控制的集中式模型相比,這種模型承諾了一個更開放的生態系統,得益於區塊鏈技術。
區塊鏈不僅促進資源共享,還確保了任務的即時驗證,驗證遠程設備的任務執行正確無誤且未被篡改。
Gensyn致力於在此框架內開發計算基礎,並鼓勵其他人探索數據網絡的激勵方案。理想情況下,Gensyn將與這些網絡無縫集成,提高機器學習訓練和應用的效率。我們的目標不是壟斷整個機器學習生態系統,而是將Gensyn建立為優化計算資源利用的協議,位於電力之上,顯著提升人類有效利用計算資源的能力。
Gensyn特別解決了將價值和數據轉化為模型參數的挑戰。本質上,如果你有一個數據樣本——無論是圖像、書籍、文本、音頻還是視頻——並且你希望將這些數據轉化為模型參數,Gensyn促進了這一過程。這使得模型能夠對未來類似數據做出預測或推斷,隨著參數的更新而進化。將數據提煉為模型參數的整個過程正是Gensyn的專長,而機器學習棧的其他方面則由其他系統管理。
額外話題:AI與加密貨幣初創公司是否受地理限制?
TechFlow:考慮到你豐富的經驗,你能比較一下早期作為技術領域的建設者和研究者在處理計算和技術的挫折和挑戰時,與你當前的經歷有何不同嗎?你能分享一下這種轉變和倫敦技術文化對你的發展和成就的影響嗎?
Ben:
倫敦乃至整個英國的科技環境與硅谷有著顯著的不同。儘管英國的技術社區充滿了傑出人才和開創性的工作,但它往往更加內向。這為新來者試圖融入這些圈子設置了障礙。
我認為,這種差異源於英國和美國之間態度的對比。美國人通常表現出更開放的風貌,而英國人通常更加懷疑和保守。這種文化細微差別意味著融入和適應英國的技術生態系統需要努力和時間。然而,一旦你做到了,你會發現一個充滿活力且豐富的社區,從事著引人入勝的項目。區別在於可見度和外聯;與硅谷不同,那裡的成就被大聲慶祝,倫敦的創新者傾向於更加低調地工作。
最近,英國特別是在向去中心化和人工智能轉變的過程中,似乎正在為自己開闢一個利基。這部分是因為美國和歐洲的監管發展。例如,最近美國的法規,如拜登總統的行政命令概述的那樣,對人工智能開發施加了一些限制,包括對超過特定閾值的項目強制政府報告。這些法規可能會抑制新開發者的熱情。相比之下,英國似乎採取了更開放的態度,傾向於開源而不是嚴格的監管,從而培養了一個更有利於創新的環境。
舊金山以其強大的開源運動而聞名,面臨著加州立法與聯邦行政命令相呼應的新挑戰。這些法規,儘管出發點是保護社會,但無意中將人工智能開發集中在已建立的實體中。這些實體有能力遵守監管要求,而潛在具有革命性想法的小型參與者則處於不利地位。英國認識到開源作為對人工智能開發進行社會監督的一種手段的價值,避免了對限制性政府監控的需求。開源實踐自然促進了審查和協作,確保人工智能技術在不扼殺創新的情況下保持受到檢查。
歐盟對人工智能的初步監管比我們在英國看到的要嚴格,英國設法找到了鼓勵開源開發的平衡點。這一策略不僅旨在實現相同的監管目標,還確保市場保持活力和競爭力。英國的定位對於培育一個充滿活力和開放的人工智能和加密創新生態系統特別有利。這對倫敦的科技行業來說是一個激動人心的時刻。
更多相關閱讀:
-
https://docs.gensyn.ai/litepaper
-
https://epicenter.tv/episodes/471
-
https://www.techflowpost.com/article/detail_14995.html
-
https://hyperobjects.substack.com/p/understanding-maximum-computing-supply
歡迎加入深潮 TechFlow 官方社群
Telegram 訂閱群:https://t.me/TechFlowDaily
Twitter 官方帳號:https://x.com/TechFlowPost
Twitter 英文帳號:https://x.com/BlockFlow_News












