TechFlowの報道によると、11月27日、DeepSeekは新しい数学推論モデル「DeepSeekMath-V2」を発表した。このモデルは自己検証可能なトレーニングフレームワークを採用しており、DeepSeek-V3.2-Exp-Baseに基づいて構築されている。LLMバリデーターが生成された数学的証明を自動的に審査し、高難度のサンプルを活用して性能を継続的に最適化している。(金十)
お気に入りに追加
SNSで共有
TechFlowの報道によると、11月27日、DeepSeekは新しい数学推論モデル「DeepSeekMath-V2」を発表した。このモデルは自己検証可能なトレーニングフレームワークを採用しており、DeepSeek-V3.2-Exp-Baseに基づいて構築されている。LLMバリデーターが生成された数学的証明を自動的に審査し、高難度のサンプルを活用して性能を継続的に最適化している。(金十)
DeepSeekは、自己検証可能なトレーニングフレームワークを採用した新たな数学推論モデル「DeepSeekMath-V2」をリリースした。このモデルはDeepSeek-V3.2-Exp-Baseに基づき、LLMバリデーターが生成された数学的証明を自動的に審査し、高難度のサンプルを活用して性能を継続的に最適化する。(金十)