TechFlowより:人工知能企業Sahara AIは、マイクロソフトとの提携を発表し、高精度のアノテーション済みデータをマイクロソフトに提供することで、オープンソースのベンチマーク「MATHVISTA」を共同でリリースしました。
このベンチマークは、GPT-4V、Claude、Geminiなどのモデルが実際のシナリオにおいて推論・意思決定能力を発揮できるかを評価するために特化して設計されており、これまでのダウンロード回数は27万回を超えています。こうした高品質なアノテーション済みデータこそが、AIエージェントが信頼性の高い推論・意思決定能力を備えるための基盤であり、毎日何百万ものユーザーが利用するエージェントのパフォーマンスに直接影響を与えます。
現在、マイクロソフト、アマゾン、Snap、マサチューセッツ工科大学(MIT)など、複数の機関がSahara AIのデータサービスおよびAgentic AIソリューションを採用しています。




