深潮 TechFlow 消息,人工智能公司 Sahara AI 宣佈與微軟合作,為微軟提供高精度標註數據,共同推出開源基準 MATHVISTA。
該基準專為測試 GPT-4V、Claude、Gemini 等模型在真實場景下的推理與決策能力,目前歷史下載量已超 27 萬次。這類高質量標註數據正是 AI Agent 能有可靠推理與決策能力的基礎,直接影響數百萬用戶每日使用的agent表現。
目前微軟、亞馬遜、Snap 及麻省理工學院(MIT)等機構均已採用 Sahara AI 的數據服務與 Agentic AI 解決方案。
添加收藏
分享社交媒體




