TechFlowの報道によると、3月11日、金十データが伝えたところによれば、Silicon Flowは即日より、同社のプラットフォームSiliconCloudにおけるDeepSeek-R1およびV3 APIにおいてバッチ推論(Batch Inference)をサポートすることを発表した。ユーザーはバッチAPIを通じてSiliconCloudにリクエストを送信可能で、リアルタイム推論のレート制限を受けず、タスクは24時間以内の完了が見込まれる。
リアルタイム推論と比較して、DeepSeek-V3のバッチ推論は価格が50%低下する。また、3月11日から3月18日までの期間中、DeepSeek-R1のバッチ推論はさらに75%割引の特別価格となり、入力価格は1元/100万トークン、出力価格は4元/100万トークンとなる。




