TechFlow の報道によると、6 月 30 日、美団公式発表により、美団は新一代大規模モデル「LongCat-2.0」を正式にリリースし、同時にオープンソース化した。本モデルの総パラメータ数は 1.6T に達し、5 万カードの国産計算力クラスター上で全流程のトレーニングと推論を完了した業界初の兆パラメータモデルである。ネイティブで 1M の超長コンテキストをサポートし、コアは Agentic Coding シナリオにおけるコードの理解、生成、実行に焦点を当てている。
技術面では、LongCat-2.0 は LongCat Sparse Attention(LSA)スパース注意力メカニズムを採用し、長文の計算量を二乗級から線形級に削減。ゼロ計算エキスパートメカニズムを通じてトークンレベルの動的活性化(33B~56B)を実現し、さらに MOPD アーキテクチャを導入して Agent、Reasoning、Interaction の 3 組のエキスパート能力を融合した。トレーニング効率面では、チームは 3 年をかけて国産計算力適応の難題を克服し、月間平均日故障率を 70% 以上削減。トレーニング MFU を 1.5 倍向上させ、定常状態の日間スループットは 1T tokens/day を超えた。
性能評価面では、LongCat-2.0 は SWE-bench Pro で 59.5 点を獲得し、Gemini 3.1 Pro(54.2)、GPT-5.5(58.6)および Claude Opus 4.6(57.3)を凌駕。BrowseComp では 79.9 点を獲得し、最先端のクローズドソースモデルのレベルに到達した。




