TechFlow tin tức, ngày 11 tháng 3, theo báo cáo của Jinsi Shuju, Silicon Flow thông báo kể từ bây giờ nền tảng SiliconCloud đã hỗ trợ tính năng suy luận theo lô (Batch Inference) cho API DeepSeek-R1 & V3. Người dùng gửi yêu cầu qua API theo lô tới SiliconCloud sẽ không bị giới hạn bởi tốc độ suy luận thời gian thực và dự kiến sẽ hoàn thành nhiệm vụ trong vòng 24 giờ.
So với suy luận thời gian thực, giá suy luận theo lô DeepSeek-V3 giảm trực tiếp 50%, trong đó từ ngày 11 đến ngày 18 tháng 3, giá ưu đãi suy luận theo lô DeepSeek-R1 giảm tới 75%, giá đầu vào là 1 nhân dân tệ/triệu Tokens, giá đầu ra là 4 nhân dân tệ/triệu Tokens.




