深潮 TechFlow 消息,3 月 17 日,據 Tether CEO Paolo Ardoino 披露,Tether AI 團隊發佈了新版 QVAC Fabric,集成跨平臺 BitNet LoRA 框架,可在消費級 GPU 及智能手機上實現十億參數級大模型的訓練與推理。
新版 QVAC Fabric LLM 首次實現了 BitNet LoRA 微調與推理在 AMD、Intel、Apple Metal 及移動端 GPU 上的跨平臺運行。在旗艦設備上,GPU 推理速度較 CPU 提升 2 至 11 倍,內存佔用較全精度模型減少最高 90%。Tether 團隊已在 Pixel 9、S25 及 iPhone 16 等旗艦手機上完成最高 38 億參數模型的微調,並在 iPhone 16 上實現最高 130 億參數模型的微調。相關代碼已開源至 GitHub。




