실리콘플로우: DeepSeek-R1 및 V3 API, 배치 추론 기능 지원, R1 가격 75% 인하
7x24h 속보
실리콘플로우: DeepSeek-R1 및 V3 API, 배치 추론 기능 지원, R1 가격 75% 인하
금시데이터 보도에 따르면, 실리콘플로우는 즉시 실리콘클라우드(SiliconCloud) 플랫폼의 DeepSeek-R1 및 V3 API가 배치 추론(Batch Inference)을 지원한다고 발표했다. 사용자는 배치 API를 통해 요청을 실리콘클라우드에 전송할 수 있으며, 실시간 추론 속도 제한의 영향을 받지 않으며, 작업 완료까지 예상 소요 시간은 24시간 이내이다. 실시간 추론 대비 DeepSeek-V3 배치 추론 가격은 50% 직접 인하되었으며, 특히 3월 11일부터 3월 18일까지 DeepSeek-R1 배치 추론은 특별 할인 적용으로 가격이 75% 인하되며, 입력 가격은 1위안/백만 토큰, 출력 가격은 4위안/백만 토큰이다.
TechFlow 소식에 따르면, 3월 11일 금십데이터 보도에 따르면 실리콘플로우(SiliconFlow)는 자사의 SiliconCloud 플랫폼에서 DeepSeek-R1 및 V3 API가 즉시 배치 추론(Batch Inference)을 지원한다고 발표했다. 사용자는 배치 API를 통해 요청을 SiliconCloud에 전송하면 실시간 추론 속도 제한의 영향을 받지 않으며, 작업 완료까지 예상 소요 시간은 24시간 이내다.
실시간 추론 대비 DeepSeek-V3의 배치 추론 가격은 무려 50% 인하되었으며, 특히 3월 11일부터 3월 18일까지 DeepSeek-R1 배치 추론은 특별 할인 적용으로 가격이 75% 할인되며, 입력 기준 100만 토큰당 1위안, 출력 기준 100만 토큰당 4위안의 가격으로 제공된다.




