TechFlow 소식, 6 월 30 일 The Information 보도에 따르면 한 관계자는 이번 달 초 OpenAI 엔지니어들이 일부 동료들에게 몇 가지 새롭게 개발된 최적화 기술을 기반으로 모델 추론 비용을 절반 이상 절감할 수 있는 방안을 찾았다고 밝혔다고 전했다. 엔지니어들이 이 새로운 기술을 무료 또는 유료 계정이 없는 방문자가 ChatGPT 를 사용하는 시나리오에 적용한 결과, 필요한 엔비디아 그래픽 처리 장치 (GPU) 수를 일시적으로 수백 개까지 줄인 것으로 나타났다.
즐겨찾기 추가
소셜 미디어 공유




