
Tether 推出本地 AI,小模型硬剛雲端大模型
TechFlow Selected深潮精選

Tether 推出本地 AI,小模型硬剛雲端大模型
算力、AI 模型、數據集、可脫離中心化雲端運行的智能能力,正成為 Tether 的第二大儲備資產。
撰文:Liam Akiba Wright
編譯:Luffy,Foresight News
Tether 的新項目 QVAC,以一個在穩定幣公司中十分罕見的理念開篇。該公司將旗下 QVAC Psy 描述為一系列「植根於心理史學原理」的基礎大模型。
心理史學這一概念源自艾薩克・阿西莫夫的經典科幻作品《基地》系列。書中主人公哈里・謝頓利用數學、統計學與社會動力學,預判大規模群體的行為走向,以此縮短銀河帝國崩塌後的黑暗時代。
《科幻百科全書》將阿西莫夫筆下的心理史學定義為一門虛構科學;哈里・謝頓的整套規劃,旨在預測未來事件,並在社會體系崩潰之際留存人類知識文明。
Tether 此番表述,實則是用科幻語言包裝自身的企業使命。
憑藉儲備資產、流動性與渠道分發能力,Tether 創造了加密行業規模最大的穩定幣系統;如今,它把這套底層邏輯復刻到人工智能領域。
USDT 穩定幣,構成 Tether 的第一大儲備根基;而算力、AI 模型、數據集、可脫離中心化雲端運行的智能能力,正成為 Tether 的第二大儲備資產。
從美元儲備邁向智能資產儲備
Tether 入局人工智能,延續了其核心業務的運作邏輯。USDT 將全球離岸美元需求轉化為以短期主權債券為主的儲備資產組合。
根據 Tether 2026 年一季度儲備鑑證報告,公司淨利潤達 10.4 億美元,儲備緩衝資金規模 82.3 億美元,代幣相關負債約 1830 億美元,直接及間接持有的美國短期國債規模約 1410 億美元。
雄厚的儲備基礎為 Tether 帶來持續營收、充足資產負債表容量,也使其有實力利用經營收益佈局長期基礎設施賽道。
CryptoSlate 此前曾分析,Tether 憑藉龐大穩定幣體量,可將儲備資金進行戰略性配置。今年 1 月,Tether 斥資購入 8888 枚比特幣,印證其可將利息收入與經營利潤轉化為長期比特幣配置需求。而 QVAC 項目,則是把這套資產配置邏輯,延伸至人工智能的全新賽道。
如今除比特幣、黃金、初創企業、能源產業、加密貨幣挖礦、通信基建等佈局外,Tether 正式重倉人工智能本身。這一定位,也讓 Tether 從單純的私人美元流動性發行方,轉型為私人數字基礎設施建設者。
「心理史學」 的科幻敘事,恰好契合這一戰略方向,Tether 將人工智能視作一層文明級底層架構,而非普通軟件賽道。QVAC 官方資料將自身定位為「無限穩定智能平臺」,主打優先本地運行的去中心化智能系統,旨在對標並替代中心化 AI。
QVAC 的願景指出,將所有智能交互都交由中心化服務器處理,不僅速度慢、穩定性差,更存在被管控限制的風險;而 QVAC 立志成為用戶專屬智能體系的邊緣端底層基座。
這套理念,與 Tether 的穩定幣理念相呼應。資金流轉無需許可、用戶數據自留掌控、人工智能就近本地運行。
而隱藏在阿西莫夫科幻概念之下,是 Tether 更嚴肅的判斷:當人工智能具備基礎設施級的韌性與抗風險性,其價值才會真正沉澱。
雲端大模型雖綜合能力更強,卻自帶平臺風險、定價風險、政策監管風險、網絡延遲風險與數據路由風險;本地 AI 模型雖犧牲部分性能,卻換來所有權、隱私性與持續可用的穩定性。
這套取捨邏輯,與加密行業理念高度契合。自我託管雖不如交易所託管便捷,直到交易所暴雷風險爆發,人們才懂其價值;本地 AI 雖不如雲端託管模型易用,一旦網絡中斷、API 接口變更、賬號封禁、數據無法外流,本地部署的優勢便會顯現。
QVAC:另闢賽道的邊緣 AI 架構
QVAC 的核心差異化在於底層架構。OpenAI、Anthropic、谷歌 DeepMind、xAI 等頂尖大模型,都在角逐通用能力、代碼能力、多模態交互、超長上下文推理、智能體應用與企業雲端部署。
而 QVAC 選擇了完全不同的賽道:可部署性、隱私保護、低延遲、可組合性、脫離單一平臺獨立存續。
QVAC 官方入門文檔將項目定義為開源、跨平臺生態系統,主打優先本地運行、點對點 AI 應用,兼容 Linux、macOS、Windows、安卓、iOS 全系統。用戶可在本地運行大語言模型、語音識別、檢索增強生成(RAG)等 AI 任務,也可通過內置 P2P 功能,將推理任務委託給其他設備節點。
這意味著 QVAC 的對標標準,與頂尖雲端 AI 大模型截然不同:前沿 AI 追求中心化服務所能提供的最強通用模型能力;QVAC 則聚焦推理發生地、運行控制權、數據是否留存設備本地、中心化服務失效後應用能否持續運轉。
Tether 於 2026 年 4 月推出 QVAC 軟件開發工具包(SDK),提供統一開發套件,支持開發者在任意設備上搭建、運行、微調 AI 應用,適配全平臺系統且無需改動代碼。
QVAC SDK 基於統一抽象層兼容各類本地推理引擎,包括自研 QVAC Fabric、llama.cpp 分支版本,同時集成 whisper.cpp、Parakeet、Bergamot 等語音與翻譯工具。
它早已超越單一模型發佈的範疇,更像是一套人工智能底層操作系統。開源 AI 生態如今已擁有大量成熟組件:Llama、Qwen、Mistral、Gemma、DeepSeek、Hugging Face、llama.cpp、Ollama 等一眾本地推理項目百花齊放。
QVAC 的核心押注是開發者亟需一套完整的邊緣端框架,通過統一接口整合模型加載、推理運算、語音識別、OCR 圖文識別、翻譯、文生圖、檢索增強生成、P2P 模型分發、委託推理與本地微調全流程。
QVAC 立志成為智能算力的分發底層,依託持續迭代的中端本地模型,搶佔邊緣 AI 生態入口。
QVAC Fabric 是整套技術架構的核心。Tether 表示,Fabric 可藉助 Vulkan、Metal 後端,在主流消費級硬件上完成模型微調,適配搭載高通 Adreno、ARM Mali 顯卡的安卓設備、蘋果自研芯片設備,以及配備 AMD、英特爾、英偉達硬件的 Windows、Linux 電腦。
同時針對移動設備顯存限制採用動態分塊技術,並支持 GPU 加速的 LoRA 微調流程與掩碼損失指令調優。
如果這套工作流能經外部開發者實測驗證,其價值將遠超普通開源模型發佈:模型權重只是基礎層,本地個性化微調適配才是核心增量。
MedPsy:QVAC 迎來首場硬核實力考驗
MedPsy 是 QVAC 首個落地的標杆級模型產品。5 月 7 日發佈在 Hugging Face 的技術報告顯示,QVAC MedPsy 是專為邊緣端部署打造的醫療健康語言模型,分為 17 億參數與 40 億參數兩個版本。
官方提出極具顛覆性的論斷,經過嚴格醫療專項後訓練的小型模型,性能可超越大型醫療基準模型,同時適配筆記本、高端移動設備乃至智能手機運行。
QVAC 表示,MedPsy-17 億參數在七項封閉式醫療基準測試中均分達 62.62 分,遠超谷歌 MedGemma-1.5-4B-it 的 51.20 分,參數規模不足對方一半;MedPsy-40 億參數均分 70.54 分,小幅領先 MedGemma-27B-text-it 的 69.95 分,參數規模僅為對方七分之一。
在 HealthBench 與高難度 HealthBench Hard 測試中,差距進一步拉大:MedPsy-4B 分別拿下 74.00 分、58.00 分,而 MedGemma-27B-text-it 僅為 65.00 分、42.67 分。
如果這些跑分能被第三方復現,將直接印證 QVAC 核心理念:特定高價值垂直領域,輕量化邊緣模型可挑戰超大型雲端系統。
訓練流程也彰顯了 QVAC 的競爭思路:MedPsy 以通義千問 3 為骨幹模型,通過多階段有監督微調、醫療問答強化學習迭代優化;實驗過程生成超 3000 萬條合成數據,採用雙階段課程訓練,並選用百川 M3-235B 大模型作為長文本推理監督教師模型。
目前其訓練語料尚未公開,這也是關鍵疑點:當前亮眼基準跑分均來自 QVAC 內部測評,訓練數據是否存在汙染、覆蓋範圍、提示詞構造、教師模型影響等關鍵問題,仍需外部驗證。
量化部署層面優勢突出,官方已發佈適配 llama.cpp 與 QVAC SDK 的 GGUF 量化版本,採用 Q4_K_M 量化可使模型體積壓縮 69%,同時均分損失不足 1 分。在兼顧體積與性能的最優方案下,40 億參數模型僅 2.72GB,17 億參數版本僅 1.28GB,可輕鬆落地本地設備。
QVAC 官方也明確風險提示,MedPsy 僅支持文本交互、僅限英文使用,不適用於臨床急救場景,存在大模型固有幻覺問題,且需開發者在應用全架構中保障用戶隱私安全。
醫療領域本身對本地推理有著極強剛需,MedPsy 前景值得期待;但唯有外部研究者復現基準跑分、並在真實臨床流程中實測,其實力才能真正證實。
便捷性 vs 掌控權:AI 行業的終極博弈
本地 AI 與雲端 AI 的爭論,常被簡化為隱私與性能的二選一。而 QVAC 重構了這套邏輯,本質是便捷性與自主掌控權的取捨。
雲端 AI 勝在極致易用,用戶打開應用、輸入指令、獲取結果,無需操心模型權重、設備顯存、量化參數、向量嵌入與運行環境兼容等複雜問題,平臺包攬所有技術複雜度。極致的便捷性,也是中心化 AI 平臺能迅速崛起的核心原因,用戶以極低門檻享受頂尖智能能力。
而 QVAC 要求開發者與用戶承擔更多運維責任,換來全新安全架構:本地離線運行、斷網可用、減少數據外洩、擺脫 API 依賴,同時打通點對點推理與模型分發通道。
根據 Tether SDK 介紹,搭載 QVAC 的應用可在弱網環境下穩定運行,甚至斷網狀態下人工智能仍可正常工作。2025 年 QVAC 早期公告進一步規劃:AI 智能體可直接部署在本地設備,設備間通過 P2P 網絡協同交互,搭配 WDK 套件可實現 AI 智能體自主進行比特幣、USDT 資產交易。
這正是 Tether 的完整頂層邏輯,資金、算力、智能體,遵循同一套自主主權設計範式。
當然,其去中心化敘事並非完美無缺。從用戶可自行下載模型、本地運行、敏感數據留存設備來看,QVAC 在推理層實現了高度去中心化,相比託管式 API 不再由平臺掌控每一次交互指令。依託 Holepunch 網絡架構,QVAC 還支持委託推理、去中心化模型分發等 P2P 底層能力,架構設計具備實質性創新。
但治理層面仍存在中心化屬性。QVAC 由 Tether 全資出資、命名統籌、市場推廣,旗艦應用、模型體系、SDK 路線規劃及「穩定智能」理念,均由單一企業主導。
這一現狀與其本地優先的核心價值並不衝突,只是將去中心化優勢限定在證據最紮實的推理運行層;整個生態仍需在默認註冊節點、版本發佈渠道、安全規範、模型准入、長期社區治理等方面,逐步建立分佈式管控機制。
復現測試決定 QVAC 最終高度
如今 QVAC 的公信力,完全取決於第三方復現結果。如果 MedPsy 的基準跑分能在外部測評環境中復刻,Tether 將真正落地「智能資產儲備」理念:輕量化、開源、可本地部署的垂直領域模型,足以在高敏感賽道比肩雲端超大模型。
即便第三方測試縮小甚至逆轉跑分差距,QVAC 的基礎設施價值依然成立,只是模型性能敘事會有所弱化。行業終極命題依舊迴歸科技亙古規律:極致便捷會催生權力集中,自主掌控則需付出運維成本。
這也正是阿西莫夫科幻理念的價值所在:《基地》中的心理史學,研究複雜大型系統在壓力下的演化規律;而 Tether 賦予其新內涵,聚焦基礎設施如何抵禦中心化壟斷。
科幻敘事格局宏大,技術落地尚處早期,但整體戰略邏輯清晰自洽。Tether 正依託全球最大穩定幣的持續現金流,搭建以本地運行、點對點網絡、開源工具、邊緣輕量化模型為核心的 AI 架構,將穩定幣的自主主權理念,從貨幣領域延伸至智能領域。
如今行業不再質疑,穩定幣巨頭有沒有實力佈局 AI?答案顯而易見。
真正的核心問題是,QVAC 能否打造足夠強悍的模型與基礎設施,讓用戶願意為了本地自主掌控,接受適度的運維門檻?
MedPsy 正是第一道可量化的門檻。第三方復現結果,將決定 QVAC 的心理史學敘事,終究只是科幻隱喻,還是正式躋身主流邊緣 AI 賽道、具備完整運營邏輯的底層架構。
歡迎加入深潮 TechFlow 官方社群
Telegram 訂閱群:https://t.me/TechFlowDaily
Twitter 官方帳號:https://x.com/TechFlowPost
Twitter 英文帳號:https://x.com/BlockFlow_News














