TechFlow 소식에 따르면, 2월 27일 Sentient사는 기업용 AI 에이전트를 대상으로 실시간 스트레스 테스트 환경을 제공하는 ‘Arena’ 플랫폼을 출시한다고 발표했다. 이 플랫폼은 현재 복잡하고 고위험 비즈니스 시나리오에서 AI 에이전트가 보이는 추론 능력 부족 문제를 해결하기 위해 개발됐다. 초기 참여 기관으로는 Founders Fund, Pantera, Franklin Templeton(프랭클린 템플턴), alphaXiv, Fireworks, OpenRouter, OpenHands 등이 포함되어 있다. Arena 플랫폼은 기업의 실제 업무 환경이 지닌 혼란스러운 특성을 모사하여, 단순히 결과의 정확성만 평가하는 데 그치지 않고 전체 추론 과정을 기록함으로써 다양한 모델 및 기술 스택 간 AI 역량을 비교·측정할 수 있는 중립적 벤치마크를 제공한다.
첫 번째 도전 과제는 금융 분석 및 고객 서비스 등 다양한 분야의 기반이 되는 문서 기반 추론 능력에 초점을 맞춘다. 관련 조사에 따르면, 기업 중 85%가 ‘에이전트 기반 기업(Agent Enterprise)’이 되기를 희망하지만, 실제로 성숙한 거버넌스 체계를 갖춘 기업은 단지 4분의 1에 불과하다. Arena 플랫폼은 2026년 3월부터 샌프란시스코에서 오프라인 행사를 개최할 예정이며, 현재 전 세계 AI 개발자를 대상으로 첫 번째 참가자 팀 모집을 진행 중이다.





