Tether 推出本地 AI，小模型硬剛雲端大模型

2026.05.13

分享至

TechFlow Selected深潮精選

Tether 推出本地 AI，小模型硬剛雲端大模型

算力、AI 模型、數據集、可脫離中心化雲端運行的智能能力，正成為 Tether 的第二大儲備資產。

2026.05.13 - 01:37:30

Tether

專注 Web3 行業深度報導，洞察潮水流動的方向

算力、AI 模型、數據集、可脫離中心化雲端運行的智能能力，正成為 Tether 的第二大儲備資產。

撰文：Liam Akiba Wright

編譯：Luffy，Foresight News

Tether 的新項目 QVAC，以一個在穩定幣公司中十分罕見的理念開篇。該公司將旗下 QVAC Psy 描述為一系列「植根於心理史學原理」的基礎大模型。

心理史學這一概念源自艾薩克・阿西莫夫的經典科幻作品《基地》系列。書中主人公哈里・謝頓利用數學、統計學與社會動力學，預判大規模群體的行為走向，以此縮短銀河帝國崩塌後的黑暗時代。

《科幻百科全書》將阿西莫夫筆下的心理史學定義為一門虛構科學；哈里・謝頓的整套規劃，旨在預測未來事件，並在社會體系崩潰之際留存人類知識文明。

Tether 此番表述，實則是用科幻語言包裝自身的企業使命。

憑藉儲備資產、流動性與渠道分發能力，Tether 創造了加密行業規模最大的穩定幣系統；如今，它把這套底層邏輯復刻到人工智能領域。

USDT 穩定幣，構成 Tether 的第一大儲備根基；而算力、AI 模型、數據集、可脫離中心化雲端運行的智能能力，正成為 Tether 的第二大儲備資產。

從美元儲備邁向智能資產儲備

Tether 入局人工智能，延續了其核心業務的運作邏輯。USDT 將全球離岸美元需求轉化為以短期主權債券為主的儲備資產組合。

根據 Tether 2026 年一季度儲備鑑證報告，公司淨利潤達 10.4 億美元，儲備緩衝資金規模 82.3 億美元，代幣相關負債約 1830 億美元，直接及間接持有的美國短期國債規模約 1410 億美元。

雄厚的儲備基礎為 Tether 帶來持續營收、充足資產負債表容量，也使其有實力利用經營收益佈局長期基礎設施賽道。

CryptoSlate 此前曾分析，Tether 憑藉龐大穩定幣體量，可將儲備資金進行戰略性配置。今年 1 月，Tether 斥資購入 8888 枚比特幣，印證其可將利息收入與經營利潤轉化為長期比特幣配置需求。而 QVAC 項目，則是把這套資產配置邏輯，延伸至人工智能的全新賽道。

如今除比特幣、黃金、初創企業、能源產業、加密貨幣挖礦、通信基建等佈局外，Tether 正式重倉人工智能本身。這一定位，也讓 Tether 從單純的私人美元流動性發行方，轉型為私人數字基礎設施建設者。

「心理史學」的科幻敘事，恰好契合這一戰略方向，Tether 將人工智能視作一層文明級底層架構，而非普通軟件賽道。QVAC 官方資料將自身定位為「無限穩定智能平臺」，主打優先本地運行的去中心化智能系統，旨在對標並替代中心化 AI。

QVAC 的願景指出，將所有智能交互都交由中心化服務器處理，不僅速度慢、穩定性差，更存在被管控限制的風險；而 QVAC 立志成為用戶專屬智能體系的邊緣端底層基座。

這套理念，與 Tether 的穩定幣理念相呼應。資金流轉無需許可、用戶數據自留掌控、人工智能就近本地運行。

而隱藏在阿西莫夫科幻概念之下，是 Tether 更嚴肅的判斷：當人工智能具備基礎設施級的韌性與抗風險性，其價值才會真正沉澱。

雲端大模型雖綜合能力更強，卻自帶平臺風險、定價風險、政策監管風險、網絡延遲風險與數據路由風險；本地 AI 模型雖犧牲部分性能，卻換來所有權、隱私性與持續可用的穩定性。

這套取捨邏輯，與加密行業理念高度契合。自我託管雖不如交易所託管便捷，直到交易所暴雷風險爆發，人們才懂其價值；本地 AI 雖不如雲端託管模型易用，一旦網絡中斷、API 接口變更、賬號封禁、數據無法外流，本地部署的優勢便會顯現。

QVAC：另闢賽道的邊緣 AI 架構

QVAC 的核心差異化在於底層架構。OpenAI、Anthropic、谷歌 DeepMind、xAI 等頂尖大模型，都在角逐通用能力、代碼能力、多模態交互、超長上下文推理、智能體應用與企業雲端部署。

而 QVAC 選擇了完全不同的賽道：可部署性、隱私保護、低延遲、可組合性、脫離單一平臺獨立存續。

QVAC 官方入門文檔將項目定義為開源、跨平臺生態系統，主打優先本地運行、點對點 AI 應用，兼容 Linux、macOS、Windows、安卓、iOS 全系統。用戶可在本地運行大語言模型、語音識別、檢索增強生成（RAG）等 AI 任務，也可通過內置 P2P 功能，將推理任務委託給其他設備節點。

這意味著 QVAC 的對標標準，與頂尖雲端 AI 大模型截然不同：前沿 AI 追求中心化服務所能提供的最強通用模型能力；QVAC 則聚焦推理發生地、運行控制權、數據是否留存設備本地、中心化服務失效後應用能否持續運轉。

Tether 於 2026 年 4 月推出 QVAC 軟件開發工具包（SDK），提供統一開發套件，支持開發者在任意設備上搭建、運行、微調 AI 應用，適配全平臺系統且無需改動代碼。

QVAC SDK 基於統一抽象層兼容各類本地推理引擎，包括自研 QVAC Fabric、llama.cpp 分支版本，同時集成 whisper.cpp、Parakeet、Bergamot 等語音與翻譯工具。

它早已超越單一模型發佈的範疇，更像是一套人工智能底層操作系統。開源 AI 生態如今已擁有大量成熟組件：Llama、Qwen、Mistral、Gemma、DeepSeek、Hugging Face、llama.cpp、Ollama 等一眾本地推理項目百花齊放。

QVAC 的核心押注是開發者亟需一套完整的邊緣端框架，通過統一接口整合模型加載、推理運算、語音識別、OCR 圖文識別、翻譯、文生圖、檢索增強生成、P2P 模型分發、委託推理與本地微調全流程。

QVAC 立志成為智能算力的分發底層，依託持續迭代的中端本地模型，搶佔邊緣 AI 生態入口。

QVAC Fabric 是整套技術架構的核心。Tether 表示，Fabric 可藉助 Vulkan、Metal 後端，在主流消費級硬件上完成模型微調，適配搭載高通 Adreno、ARM Mali 顯卡的安卓設備、蘋果自研芯片設備，以及配備 AMD、英特爾、英偉達硬件的 Windows、Linux 電腦。

同時針對移動設備顯存限制採用動態分塊技術，並支持 GPU 加速的 LoRA 微調流程與掩碼損失指令調優。

如果這套工作流能經外部開發者實測驗證，其價值將遠超普通開源模型發佈：模型權重只是基礎層，本地個性化微調適配才是核心增量。

MedPsy：QVAC 迎來首場硬核實力考驗

MedPsy 是 QVAC 首個落地的標杆級模型產品。5 月 7 日發佈在 Hugging Face 的技術報告顯示，QVAC MedPsy 是專為邊緣端部署打造的醫療健康語言模型，分為 17 億參數與 40 億參數兩個版本。

官方提出極具顛覆性的論斷，經過嚴格醫療專項後訓練的小型模型，性能可超越大型醫療基準模型，同時適配筆記本、高端移動設備乃至智能手機運行。

QVAC 表示，MedPsy-17 億參數在七項封閉式醫療基準測試中均分達 62.62 分，遠超谷歌 MedGemma-1.5-4B-it 的 51.20 分，參數規模不足對方一半；MedPsy-40 億參數均分 70.54 分，小幅領先 MedGemma-27B-text-it 的 69.95 分，參數規模僅為對方七分之一。

在 HealthBench 與高難度 HealthBench Hard 測試中，差距進一步拉大：MedPsy-4B 分別拿下 74.00 分、58.00 分，而 MedGemma-27B-text-it 僅為 65.00 分、42.67 分。

如果這些跑分能被第三方復現，將直接印證 QVAC 核心理念：特定高價值垂直領域，輕量化邊緣模型可挑戰超大型雲端系統。

訓練流程也彰顯了 QVAC 的競爭思路：MedPsy 以通義千問 3 為骨幹模型，通過多階段有監督微調、醫療問答強化學習迭代優化；實驗過程生成超 3000 萬條合成數據，採用雙階段課程訓練，並選用百川 M3-235B 大模型作為長文本推理監督教師模型。

目前其訓練語料尚未公開，這也是關鍵疑點：當前亮眼基準跑分均來自 QVAC 內部測評，訓練數據是否存在汙染、覆蓋範圍、提示詞構造、教師模型影響等關鍵問題，仍需外部驗證。

量化部署層面優勢突出，官方已發佈適配 llama.cpp 與 QVAC SDK 的 GGUF 量化版本，採用 Q4_K_M 量化可使模型體積壓縮 69%，同時均分損失不足 1 分。在兼顧體積與性能的最優方案下，40 億參數模型僅 2.72GB，17 億參數版本僅 1.28GB，可輕鬆落地本地設備。

QVAC 官方也明確風險提示，MedPsy 僅支持文本交互、僅限英文使用，不適用於臨床急救場景，存在大模型固有幻覺問題，且需開發者在應用全架構中保障用戶隱私安全。

醫療領域本身對本地推理有著極強剛需，MedPsy 前景值得期待；但唯有外部研究者復現基準跑分、並在真實臨床流程中實測，其實力才能真正證實。

便捷性 vs 掌控權：AI 行業的終極博弈

本地 AI 與雲端 AI 的爭論，常被簡化為隱私與性能的二選一。而 QVAC 重構了這套邏輯，本質是便捷性與自主掌控權的取捨。

雲端 AI 勝在極致易用，用戶打開應用、輸入指令、獲取結果，無需操心模型權重、設備顯存、量化參數、向量嵌入與運行環境兼容等複雜問題，平臺包攬所有技術複雜度。極致的便捷性，也是中心化 AI 平臺能迅速崛起的核心原因，用戶以極低門檻享受頂尖智能能力。

而 QVAC 要求開發者與用戶承擔更多運維責任，換來全新安全架構：本地離線運行、斷網可用、減少數據外洩、擺脫 API 依賴，同時打通點對點推理與模型分發通道。

根據 Tether SDK 介紹，搭載 QVAC 的應用可在弱網環境下穩定運行，甚至斷網狀態下人工智能仍可正常工作。2025 年 QVAC 早期公告進一步規劃：AI 智能體可直接部署在本地設備，設備間通過 P2P 網絡協同交互，搭配 WDK 套件可實現 AI 智能體自主進行比特幣、USDT 資產交易。

這正是 Tether 的完整頂層邏輯，資金、算力、智能體，遵循同一套自主主權設計範式。

當然，其去中心化敘事並非完美無缺。從用戶可自行下載模型、本地運行、敏感數據留存設備來看，QVAC 在推理層實現了高度去中心化，相比託管式 API 不再由平臺掌控每一次交互指令。依託 Holepunch 網絡架構，QVAC 還支持委託推理、去中心化模型分發等 P2P 底層能力，架構設計具備實質性創新。

但治理層面仍存在中心化屬性。QVAC 由 Tether 全資出資、命名統籌、市場推廣，旗艦應用、模型體系、SDK 路線規劃及「穩定智能」理念，均由單一企業主導。

這一現狀與其本地優先的核心價值並不衝突，只是將去中心化優勢限定在證據最紮實的推理運行層；整個生態仍需在默認註冊節點、版本發佈渠道、安全規範、模型准入、長期社區治理等方面，逐步建立分佈式管控機制。