TechFlow đưa tin, ngày 27 tháng 02, Sentient hôm nay chính thức ra mắt nền tảng Arena, nhằm cung cấp môi trường kiểm tra tải thời gian thực dành riêng cho các tác nhân AI doanh nghiệp, giải quyết vấn đề năng lực suy luận còn hạn chế của các tác nhân hiện nay trong các tình huống kinh doanh phức tạp và có mức độ rủi ro cao. Các tổ chức đầu tiên tham gia gồm có Founders Fund, Pantera, Franklin Templeton, alphaXiv, Fireworks, OpenRouter và OpenHands. Nền tảng Arena mô phỏng tính hỗn loạn vốn có trong môi trường làm việc thực tế của doanh nghiệp; không chỉ đánh giá tính đúng đắn của kết quả, mà còn ghi lại toàn bộ hành trình suy luận, từ đó thiết lập một chuẩn mực trung lập để đánh giá năng lực AI trên nhiều mô hình và nhiều ngăn xếp công nghệ khác nhau.
Thử thách đầu tiên tập trung vào năng lực suy luận dựa trên tài liệu—một năng lực nền tảng trong các lĩnh vực như phân tích tài chính và dịch vụ khách hàng. Kết quả khảo sát cho thấy, dù có tới 85% doanh nghiệp mong muốn trở thành “doanh nghiệp tác nhân”, nhưng chỉ một phần tư trong số đó sở hữu hệ thống quản trị trưởng thành. Từ tháng 3 năm 2026, Arena sẽ tổ chức các sự kiện trực tiếp tại San Francisco; hiện nền tảng đang mở đơn đăng ký trên toàn cầu dành cho các nhà phát triển AI muốn tham gia vào đợt đầu tiên.





