TechFlowより、3月14日付で『ホワール・ラボ』が報じたところによると、DeepSeek V4および姚順雨氏が主導する騰訊(テンセント)の新モデル「混元」が、いずれも4月にリリースされる予定である。
同報道によれば、梁文鋒氏が長年にわたり開発を進めてきたマルチモーダル大規模言語モデルであるDeepSeek-V4は、コーディング能力の大幅な向上に加え、LTM(Long-Term Memory:長期記憶)においても画期的な進展を遂げるという。
先日、OpenRouterは2つの謎のモデル「Healer Alpha」と「Hunter Alpha」を新たに公開した。これらはDeepSeek V4の試験版ではないかと推測されており、中国国内のIPアドレスから直接アクセス可能である。
これらのモデルによる自己紹介によると、「Hunter Alpha」は1兆パラメータ、コンテキスト長100万トークンの大規模モデルであり、エージェント指向ワークフロー、長期にわたる複雑タスク、および高度なツール呼び出しに特化して設計されている。
一方、「Healer Alpha」はフルモーダル対応モデルで、コンテキストウィンドウは26万トークン。視覚および音声入力をネイティブに認識し、クロスモーダルな推論を実行するとともに、複雑なマルチステップタスクを高精度かつ信頼性高く遂行できる。
本稿執筆時点では、この2つのモデルについて公式な公認声明は一切発表されていない。
また、『ホワール・ラボ』の別の報道によれば、騰訊首席AI科学者の姚順雨氏が4月に「混元」の新モデル(パラメータ数30B規模)をリリースする予定である。これは、姚氏が昨年12月に騰訊へ参画して以来、初となる注目度の極めて高い製品であり、業界内外から大きな期待が寄せられている。




