TechFlow, 11 mars — Selon une information relayée par Jinshi Données le 11 mars, Silicon Flow a annoncé que sa plateforme SiliconCloud prend désormais en charge l'inférence par lots (Batch Inference) pour les API DeepSeek-R1 et V3. Dès maintenant, les utilisateurs peuvent envoyer des requêtes via l'API par lots à SiliconCloud sans être soumis aux limitations de débit propres à l'inférence en temps réel, avec une exécution prévue dans un délai de 24 heures.
Par rapport à l'inférence en temps réel, le prix de l'inférence par lots DeepSeek-V3 est réduit de 50 %. Du 11 au 18 mars inclus, l'offre promotionnelle pour l'inférence par lots DeepSeek-R1 atteint même une réduction de 75 %, avec un tarif de 1 yuan par million de tokens en entrée et de 4 yuans par million de tokens en sortie.




