TechFlow 보도에 따르면, 3월 17일 테더(Tether)의 CEO 파올로 아르도이노(Paolo Ardoino)는 테더 AI 팀이 새로운 QVAC Fabric을 공개했다고 밝혔다. 이 새로운 QVAC Fabric은 크로스플랫폼 BitNet LoRA 프레임워크를 통합하여, 일반 소비자용 GPU 및 스마트폰에서도 10억 개 이상의 파라미터를 가진 대규모 언어 모델(LLM)의 학습과 추론을 가능하게 한다.
새로운 QVAC Fabric LLM은 AMD, 인텔(Intel), 애플 메탈(Apple Metal) 및 모바일 GPU 등 다양한 플랫폼에서 BitNet LoRA 기반 미세 조정(fine-tuning) 및 추론을 처음으로 실현하였다. 최신 고사양 기기에서는 GPU 기반 추론 속도가 CPU 대비 2배에서 최대 11배까지 향상되었으며, 전체 정밀도(full-precision) 모델에 비해 메모리 사용량이 최대 90% 감소하였다. 테더 팀은 픽셀 9(Pixel 9), 갤럭시 S25(S25), 아이폰 16(iPhone 16) 등 최신 고사양 스마트폰에서 최대 38억 개 파라미터 규모의 모델 미세 조정을 완료하였으며, 아이폰 16에서는 최대 130억 개 파라미터 규모의 모델 미세 조정도 성공적으로 수행하였다. 관련 소스 코드는 이미 GitHub에 공개되었다.




