
對話 Kaito CEO:搭建 Web3 的終極 GPT
TechFlow Selected深潮精選

對話 Kaito CEO:搭建 Web3 的終極 GPT
在新的數據分發範式下,我深信 Web3 帶來的機遇會完全改變科技公司壟斷數據的經濟邏輯。
深潮:Sunny
Kaito: Yu Hu

“在新的數據分發範式下,我深信Web3帶來的機遇會完全改變科技公司壟斷數據的經濟邏輯。”
-- Yu Hu
如何高效獲取Web3信息?對於普通用戶而言,推特、Discord、Telegram及媒體網站是獲取信息的主要途徑。對於更有分析能力的用戶來說,他們可能會選擇使用鏈上數據瀏覽器、治理論壇、播客或者諮詢報告。Web3信息相對於Web2更碎片化,主要分散在多個加密原生的社交應用和區塊鏈上,就像是尋寶一樣,與以谷歌為代表的搜索路徑大相徑庭。
每個行業的發展都會經歷從混亂到有序的過程。在傳統世界的搜索引擎誕生之前,信息同樣極度分散,用戶需要成為搜索的專家,知道要去哪些不同的網站獲取什麼樣的信息。谷歌的出現讓全世界普通用戶可以極其高效地索引整個互聯網的信息,而大語言模型的出現則更是將信息索引的效率提升到了一個新的維度。
今天的Web3信息檢索在什麼階段呢?相比於幾年之前,我們已經獲得了長足的發展:在Etherscan,Dune,Nansen出現之前,普通用戶要查找區塊鏈信息就像大海撈針一樣困難。然而即便在今天,當傳統世界的信息已經在從搜索引擎時代跨越入大語言模型時代的時候,Web3的信息索引因為沒有原生支持的搜索引擎,仍然停留在信息極度分散的前搜索引擎時代:用戶需要是獲取信息的專家,需要知道存倉量, 用戶日活,協議收入,社區觀點,治理提案分別都要去哪些不同的渠道獲得。Kaito的創始人兼CEO Yu Hu深信,幾年後當我們回看今天,這樣的原始狀態會是我們幾乎不敢想象的。
Yu Hu早在2020年就看到了Web3信息索引的痛點:極度分散,缺乏組織,並且不被以谷歌為代表的傳統搜索引擎兼容。當時,他發現自己的需求實際上正是整個行業的需求。因此,他果斷地辭去了工作,全身心地投入到打造Web3搜索引擎的事業中。正如Yu所言:“我希望引領Web3的信息索引模式從前搜索引擎時代,進入到搜索引擎時代,最終跨越至大語言模型時代,為全行業的從業者以及下一個10億Web3用戶提供一個全新的,高效的信息索引方式。”
Kaito的搜索引擎通過運用Auto GPT框架和多個ChatGPT後端,共同構建了一個代理網絡,可以處理各種任務,包括搜索、信息處理、數據清洗和標註,旨在提供更高質量的Web3信息服務,並積極探索以用戶共創的方式來優化體驗和擴大經濟收益。
在與Yu的深度對話中,我們討論瞭如何通過AI大語言模型來助力Web3用戶,並探討了如何構建基於社區共創去中心化AI搜索引擎的未來發展。作為媒體,我們還與Yu探討了如何將傳統媒體與人工智能相結合,以提升信息的真實性和獨特性的途徑。
精彩摘要
-
在新的數據分發範式下,我深信Web3帶來的機遇會完全改變科技公司壟斷數據的經濟邏輯。
-
在WEB2時代,信息大多存儲在互聯網上。而在WEB3的世界中,很多信息存在於區塊鏈上,區塊鏈是和互聯網完全不同的信息架構。爬取區塊鏈上的信息需要設置節點,而不能像Google那樣使用通用的爬蟲體系。
-
我們希望未來能與用戶深度共創。如果用戶在我們的平臺上看到不實信息,我們能有一個反饋機制,讓用戶參與其中,共同改進信息的質量。
-
在Web3的環境下,我們重視數據的所有權,因此希望用戶能參與到數據處理過程以及產品的共創中來。只有用戶更多地使用,我們的模型能力才會更加地強大。
-
搜索引擎和媒體之間本質上是一個上下游的關係,媒體是合作引擎信息源的一部分,這是最本質的關係。
掉入加密兔子洞
TechFlow: 你是如何從劍橋的優秀學生,到Citadel基金經理,再到Cryptopunk持有者,最後創辦一家專注Web3和AI的創業公司的?
Yu:
我的背景是商科經濟系背景,在傳統金融領域工作了約十年。我先後在投資銀行和對沖基金工作,最後在Citadel等公司從事二級市場投資。然而,我在2017年左右接觸到加密貨幣,對這項新興技術產生濃厚興趣,並開始在業餘時間進行相關研究,因為這不僅涉及到新技術,還是全新的資產類別。
在2020年的DeFi夏季,我投入大量時間進行研究。DeFi是一個相對基礎的概念,不同於其他的點,因為在DeFi中,你可以看到所有的存倉量、收入和其他指標數據,從而進行基本面分析。我當時做了很多這方面的研究,並尋找機會。
當時,我深刻感受到信息在加密行業中的傳播非常混亂和散亂,類似於我在傳統金融市場中遇到的信息差異很大。在傳統金融領域,有很多優秀的金融工具可以幫助大家檢索信息。
但在區塊鏈領域,連搜索引擎都無法有效地檢索區塊鏈相關信息,比如推特、Discord等社交平臺上的信息。這讓信息收集變得非常痛苦。
到了2021年,我購買了CryptoPunk,這個NFT標誌著整個行業的一個重要時刻。我對Web3的未來充滿信心,這個信心一直延續到現在。
在考慮了行業的發展和自己的興趣後,我在2021年底決定辭職,創業開發一款產品。我希望開發一款能夠解決信息檢索難題的產品,幫助像我這樣的人。這就是我創業的初衷。
TechFlow: 2017-2021年間,你的研究重點是什麼?有哪些關鍵的啟示?自2017年以來,你對行業的啟發有何變化?
Yu:
我覺得他對我來說最大的啟發是對整個歷程的長線思維。
-
最早期的啟發是關於不同金融交互方式的認知,因為我之前從事金融領域。這個啟發在基礎框架下引發了對所有權概念不同定價的思考。
我認為這是一個深刻的觀點,因為它演化成了各個行業方面的基本屬性。
-
在2020年和2021年,我開始思考過去20年科技巨頭崛起的科技紅利,比如Google、Facebook等科技巨頭的發展。
然而,我更深層次的想法是,如果延續這種模式,再往後50年、100年,科技的格局可能會完全改變,其中最重要的部分可能就是數據的所有權。
我們現在可以免費使用Google、Instagram、Facebook等科技產品,但真正的價值在於這些產品背後巨大的數據。用戶沒有真正意識到數據的價值,而這些數據完全掌握在科技公司手中。
在新的數據分發範式下,我深信Web3帶來的機遇會完全改變這種經濟邏輯。
數據的所有權將回到用戶手中,新產品將以社區共創的方式出現。這些新產品會在不同層面上影響我們對未來的看法,也會改變數據和用戶交互的邏輯和關係。
Web3的信息規模和特徵:去中心化和互操作性
TechFlow:在Kaito,你如何整合並實現Web3信息的互操作性?這與Web2時代的方法有何不同?
Yu:
我先簡單介紹一下,Kaito有兩個核心的產品。
-
一個是面向機構用戶的的專業搜索平臺,為專業人士提供服務(包括研究學者、媒體人員和行業建設者等)。他們需要花大量時間查閱相關信息。
-
另一個面向全體C端用戶市場的搜索引擎,類似於Web3的Google。
我們主要的整合過程可以分為三個方面。
-
首先是源頭,我們要了解哪些數據與Web3相關。例如,我們要篩選出推特和Discord等平臺上的相關信息,然後通過技術整合它們。
-
第二步是整理,我們對這些數據進行清洗和標註,將非結構化的數據轉化為結構化的數據。我們會在自己的數據庫中進行標註,也可能利用AI和大模型進行理解。
-
第三步是讓這些數據可讀,即如何與用戶交互。這可能採用不同的形式,如檢索、信息流、圖表甚至是聊天。最終目標是與用戶建立緊密的互動,讓這些數據更易於操作。
這三個步驟是我們整合數據並提供可操作性的關鍵。
Web3和Web2 的信息不同主要有三個方面。
-
首先,信息傳播方式完全不同。在WEB3時代,信息本質上更加去中心化和混亂。與Web2時代不同,信息在Web3時代通常不僅僅依賴官方媒體發佈,即使是官方賬號,如FTX,在發佈重大事件時也更多關注來自社區的賬號。例如,在Discord等平臺上,信息傳播就會更加去中心化。
-
第二個不同在於信息承載的基建。在WEB2時代,信息大多儲存於互聯網上。而在WEB3的世界中,很多信息存在於區塊鏈上,區塊鏈是和互聯網完全不同的信息架構。爬取區塊鏈上的信息需要設置節點,而不能像Google那樣使用通用的爬蟲體系。
-
第三個不同在於信息交互方式。在WEB2時代,數據清洗和標註等過程是高度中心化進行的,像Google和ChatGPT等都有大團隊來進行這些工作。而在WEB3時代,很多東西可以與用戶共創,通過激勵共創行為來實現。比如在Web3的範疇內,社區和開發者共同創造了全新的搜索引擎,為Web3社區帶來新的搜索體驗。
TechFlow:Web3的公有領域和私有領域數據的當前規模是多大?預計未來會有怎樣的變化?
Yu:
從我們自己收集的數據來看,我們每天會處理約百萬條來自機構的信息。如果加上公域數據,這個數字可能會擴大到千萬級別,而一旦再加上私域數據,如Telegram、Discord等,這個數目肯定會超過億級別。這是我們每天的數據量。至於未來的發展趨勢,我們可以預見到這一數據量將會繼續增長,因為隨著用戶數量的增加以及信息來源的日益增多,無論是區塊鏈還是相關的中心化企業,都將面臨這一趨勢。
另外,信息的性質也可能發生變化。目前,大多數信息涉及交易等方面,但隨著區塊鏈應用範圍的擴大,其他領域的信息也將迅速增加。
人工智能助力Web3
TechFlow: 你們是如何利用大語言模型模型構建你們的AI工作系統的?此外,你們是如何處理各種數據源並確定最佳答案的?
Yu:
目前,我們採用了Auto GPT的架構,將多個ChatGPT模型部署在後端,這些模型一起構成了一個代理工作系統。
-
每個代理負責不同的任務。當用戶提出一個搜索請求時,我們的第一個代理會分析其語義和需求,並確定應在哪個數據源中搜索答案。我們可能擁有多個代理,每個代理在不同領域有其專長,比如在推特、Discord、研究等不同的數據源中搜索信息。
-
這些代理之間會交流,找到最佳答案,然後我們會評估這個答案是否符合用戶的問題。在這個框架下,我們目前使用ChatGPT作為底層的大模型,但同時也在探索微調自己的模型或完全自主訓練我們的模型。
ChatGPT是一個預訓練的模型。它可以利用自身的知識庫回答用戶的問題,但是對於超出其知識範圍的內容,它就無法回答。我們和ChatGPT的對接方式是利用它的語義理解和邏輯推理能力,讓它學習當前正在發生的事件,這就是所謂的上下文學習。
我們需要優化的內容很多,因此有必要使用代理網絡。對於某些問題,我們可能需要使用更復雜的模型,如GPT-4,而一般來說,比較簡單的模型就可以滿足需求。這與人類在處理信息時根據不同情況調用不同的認知能力類似。對於深度文獻,我們可能需要高度集中去理解,而對於簡單問題,則更容易獲取答案。
同樣地,在數據庫的層面,我們會根據需求方的網絡來運行。未來我們可能會將數據庫也納入去中心化管理,這樣能更高效地進行擴容。
在數據的清洗、標註和處理過程中,我們希望與用戶共同創造價值,因為數據對於任何AI公司來說都非常重要。
在Web3的環境下,我們重視數據的所有權,因此希望用戶能參與到數據處理過程中,與我們共同打造我們的產品。只有用戶越多地使用,我們的模型能力才會更加強大。用戶體驗也會更好,進而吸引更多用戶使用產品,而大家也能在這個過程中分享經濟收益,這是我們希望實現的共創理念。
TechFlow:Kaito如何幫助用戶應對區塊鏈行業中的虛假信息並保證數據質量?
Yu:
我們目前的重點工作有三個方面。
首先,我們對信息源進行篩選。以推特為例,我們利用社交圖譜的方法來篩選用戶以排除垃圾信息。
其次,我們注重提供信息的來源。平時用戶使用大型語言模型,如ChatGPT時,用戶並不知道搜索結果是如何生成的,而我們為搜索結果都標註了信息來源,以幫助用戶更好地判斷信息的可信度。這一點是我們在傳統大語言模型上做出的重要技術優化。
最後,我們希望能與用戶共創。如果用戶在我們的平臺上發現無用或虛假信息,我們也會提供一個反饋機制,讓用戶參與其中,共同提高信息的質量。
去中心化助力人工智能
TechFlow:你如何看待AI在Web3時代的發展潛力,特別是關於其自我學習和數據共享的能力?同時,您認為區塊鏈的哪些核心特性可能對AI的未來發展產生影響?
Yu:
OpenAI和區塊鏈之間實際上沒有直接關係,OpenAI是一個非常重要的AI產出。其訓練模型是通過大量數據和文獻進行訓練,並且人工標註也是通過僱傭和人來進行的,訓練過程是中心化的運營。而Web3在其本身可能打開了一個新的格局,並且具有顛覆性。現在,有一些人還沒有完全意識到Web3的顛覆性內核。
人工智能的潛力
最近,人工智能領域的教父Geoff Hinton指出:“humanity is just a 'passing phase' in the evolution of intelligence”。ChatGPT儘管已經非常厲害,但依然只是AI產物的一小部分。所以長遠來看,人工智能產業有非常大的發展潛力。
不同於我們人類,AI同一模型的多個副本可以共享新學習到的東西,這是AI的潛在優勢。
現階段,AI尚未完成自己的使命,但我相信它的未來不可限量。其中,有一項重要的假設:AI的發展不可能放緩,因為發展AI有著強大的驅動力,即使一個國家放緩了AI的研究,其他國家也會繼續推進AI技術的發展。因此,AI的發展趨勢將是穩定、持久、而且不可遏制的。
區塊鏈的屬性
在這個過程中,區塊鏈的核心是什麼?公平、可信、穩定和個人掌控權,我認為這些是區塊鏈最重要的核心,因為任何中心化的組織都有可能帶來巨大的危險。這也可以解釋為什麼馬斯克對於OpenAI已經變成了Close AI感到非常不滿。
在某種程度上,我能理解他的觀點。然而,在這個框架下,如果我們能夠從另一個角度對這些東西進行一些限制,比如數據的所有者,或者其他方面的限制,那麼我們整個系統將會有一個比較強大的負反饋原則。
這個思考可能更多是哲學性和抽象性的,但我認為有很多可以驗證的方向。Web3在AI市場崛起之後變得越來越重要,我認為這是最近我得到的一個思考。
時間將揭示真正的去中心化
在Web3中,我認為本質上並沒有太多的中心化因素,它是一個非常去中心化的東西。比如行業中有一些負面的例子,從去年到現在發生了許多災難性的事件,比如FTX的問題,還有一些新聞報道,或者是USDC的Depeg事件,它們本質上都涉及到中心化本質。
但真正完全去中心化的東西,比如比特幣和以太坊等協議,運行非常穩定,它們本身有一個非常強的服務原則,這是非常重要的。而在剛才講到的一些衍生出來的東西中,可能還包括公平的社區共創等,這些都是在非常去中心化的基礎上產生的。
傳統媒體與AI搜索引擎的關係
TechFlow: AI搜索引擎將如何影響媒體行業?你認為AI能夠取代媒體,讓每個人都能創造高質量內容嗎?
Yu:
搜索引擎和媒體之間本質上是一個上下游的關係,就好比媒體是合作引擎信息源的一部分,這是最本質的關係。
在大型語言模型出現之前,搜索引擎一直存在,甚至包括國內的今日頭條等媒體聚合平臺也在使用AI公司進行一些淺層的快訊、梳理和總結等工作,這些都已經應用了AI的能力。
但我認為一些東西永遠不會或者不太會被取代,例如一些專有的信息,比如專訪、調查報道等,這些都是媒體的獨家價值。
區塊鏈私有數據的隱私保護與數據共創
TechFlow: 你能分享一下就是對未來鏈上數據和行為隱私保護的看法。Kaito有什麼策略來應對這些挑戰?
Yu:
我認為這個話題本身是非常重要的。
在這個問題上,我們是一箇中立的引擎,簡單來說,無論是在互聯網上還是區塊鏈上,我們會收錄任何公開的信息。但是,對於私有或受保護的信息,我們現在及將來都不會進行收錄。因為這些信息並非所有人都能夠訪問。
在共創數據的過程中,我們非常希望站在區塊鏈和人工智能的交叉點上,與用戶一起共同努力,創造新的數據價值。我們將目標定位為解決區塊鏈這個領域的問題,因此本質上更像一家人工智能公司。我們目前的團隊成員大多來自較成熟的科技公司,擁有人工智能相關的背景,同時他們對Web3的前景充滿信心。我們早期的團隊成員多數來自Web3社區,聚在一起齊心協力創造我們自己的產品。
至於AI和區塊鏈的平衡,我認為在我們的發展過程中,並不存在一個明確的平衡點。我們運用AI技術解決我們熱愛的垂直領域的需求,無論是信息索引、分發,還是其他可能涉足的領域,都是為了服務於特定的行業。我們運用新技術,以更有效率和好的方式提供有用的服務,將其納入相應行業中。
傳統商業模式Vs.基於社區共創的經濟模型
TechFlow: 所以你目前團隊有考慮過的一種就是社區共建有哪些方式,就是有哪些激勵用戶的方式?
Yu:
我認為最簡單直白的方式就是讓所有用戶貢獻的數據具有一定的經濟效益,並且在監管和合規範圍內運作。在這個平臺上,每個用戶的搜索、瀏覽和行為都幫助優化平臺的模型,從而提供更好的用戶體驗。通過這種正向激勵,我們鼓勵每個用戶積極參與社區共創。這正是我們的目標所在。
目前,Kaito有兩種商業模式。一種是機構版,採用傳統的訂閱方式,為機構提供付費服務。另一種是大眾版,完全免費,但可能會存在一些額外的付費功能,例如類似於ChatGPT的模式。另外,我們還提供一些數據的API服務,為行業中的其他去中心化協議提供數據支持,這是另外一套商業模式。
TechFlow:你們是否考慮採用其他激勵方式或使用代幣收款來吸引用戶?
Yu:
我認為這實際上是兩個問題。
首先,我們是否需要代幣,以及在整個生態中代幣有什麼用途?
我覺得代幣是有價值的。雖然如果沒有代幣,項目肯定可以正常運轉,只要能提供出色的產品和自給自足的盈利模式,比如通過數據或廣告收入,就可以實現良好的營收。
但是對我們來說,更令人興奮的是在早期階段就能打造出與社區共創的概念。在這樣的框架下,我們認為需要代幣。
具體如何操作,或者後續的想法,需要根據發展情況來決定。至於訂閱等收費模式是否可以通過代幣來支持,這可能是另一個話題。對我們而言,代幣的好處顯而易見,無論是從效率還是商業價值的角度來看,代幣都比其他方式更簡單。
另外,從商業角度來看,我們可以完全跳過第三方中介,不必依賴像Stripe這樣的支付公司。然而,我們也面臨一個挑戰,就是在整個行業中,我們還沒有找到特別好的第三方服務公司,能夠讓我們輕鬆與所有合規平臺,包括政府和稅務機構進行申報。
在當前行業階段,這可能是我們遇到的一個問題。
TechFlow: 那麼就是在代幣的社區治理方面,你最近有研究到什麼比較有意思的經濟模型嗎?
Yu:
最近在加密行業發生了一些大的變化,特別是在代幣治理方面。以前很多代幣被視為純粹的治理代幣,但現在越來越多的代幣能捕獲經濟價值,例如DYDX等。這引發了一些擔憂,大家希望能實現一個社區能捕獲經濟價值的狀態,而不僅僅是治理價值。
深潮獨家新聞
TechFlow:最後一個問題就是能否提供給我們一些獨家內容,比如揭示一下kaito即將到來的里程碑和發展計劃,有沒有什麼我們能期待看到的特別激動人心的新功能或新合作?
Yu:
我們計劃在未來使用戶能夠以全新的方式應用搜索引擎,比如通過截取價格走勢圖進行分析,甚至與鏈下信息源進行交互,實現多模態搜索。
我們的願景是為所有人提供一個完全不同的、最好的、最便捷的訪問所有相關信息的方式。我們相信未來的潛力非常巨大,我們將逐步完善並實現這個願景。我們希望未來的搜索引擎能夠帶來與現在截然不同的全新體驗。目前整個行業仍處於早期階段,我們正在探索如何更好地將大語言模型與搜索引擎結合,以提供簡單而顛覆性的用戶體驗。
搜索引擎的進步和創新已經產生了翻天覆地的變化。十幾年前,旅行者沒有Google地圖,在探索世界時只能依賴於Lonely Planet這樣的紙質指南書籍。現在隨著Google搜索引擎的出現,我們現在已經可以輕鬆便捷地搜索到所需的信息。然而,我們相信未來的搜索引擎將以一種超越我們的想象力的方式,帶來更加激動人心和顛覆性的變革。
引用:
歡迎加入深潮 TechFlow 官方社群
Telegram 訂閱群:https://t.me/TechFlowDaily
Twitter 官方帳號:https://x.com/TechFlowPost
Twitter 英文帳號:https://x.com/BlockFlow_News














