TechFlow 보도에 따르면, 인공지능 기업 사하라 AI(Sahara AI)가 마이크로소프트와 협력하여 고정확도 어노테이션 데이터를 제공하고, 오픈소스 벤치마크 MATHVISTA를 공동 출시한다고 발표했다.
이 벤치마크는 GPT-4V, 클로드(Claude), 제미니(Gemini) 등 모델의 실제 상황에서의 추론 및 의사결정 능력을 평가하기 위해 특별히 설계되었으며, 현재까지 누적 다운로드 수가 27만 건을 넘었다. 이러한 고품질 어노테이션 데이터는 AI 에이전트가 신뢰할 수 있는 추론 및 의사결정 능력을 갖추기 위한 핵심 기반이며, 전 세계 수백만 명의 사용자가 매일 이용하는 에이전트의 성능에 직접적인 영향을 미친다.
현재 마이크로소프트, 아마존, 스냅(Snap), 매사추세츠공과대학(MIT) 등 다양한 기관이 사하라 AI의 데이터 서비스 및 에이전틱 AI 솔루션을 채택하고 있다.




