深潮 TechFlow 消息,5 月 09 日,螞蟻百靈今日發佈萬億級旗艦思考模型 Ring-2.6-1T,專為複雜真實任務場景設計。模型創新引入可調節 Reasoning Effort 機制,支持 high與 xhigh 兩檔推理強度。在真實任務執行類評測中,PinchBench 得分 87.6,高於 GPT-5.4x High、Gemini-3.1-Pro high與 Claude-Opus-4.7x high;在高難推理任務上,ARC-agi-V2 得分 77.78,與 Gemini-3.1-Pro high和 Claude-Opus-4.7x high 處於同一水位。(金十)
添加收藏
分享社交媒體




