深潮 TechFlow 消息,02 月 27 日,Sentient今日宣佈推出Arena平臺,旨在為企業級AI智能體提供實時壓力測試環境,解決當前智能體在複雜、高風險業務場景中推理能力不足的問題。首批參與機構陣容強大,包括Founders Fund、Pantera、Franklin Templeton(富蘭克林鄧普頓)、alphaXiv、Fireworks、OpenRouter、OpenHands等。Arena平臺模擬企業真實工作環境的混亂性,不僅評判結果正確性,還記錄完整推理軌跡,為跨模型、跨技術棧的AI能力提供中立基準。
首個挑戰聚焦文檔推理能力,這是金融分析、客戶服務等場景的基礎。調研顯示,雖有85%企業希望成為"智能體企業",但僅四分之一擁有成熟治理體系。Arena將於2026年3月起在舊金山舉行線下活動,目前正邀請全球AI開發者申請加入首期隊列。





