
AI로 운영하는 가게가 '망했다'? 한 달 만에 200달러 손해
번역: MetaverseHub
AI가 일자리를 빼앗을 것이라는 우려에도 불구하고, 한 실험이 AI조차 자동판매기를 제대로 운영하지 못하고 오히려 수많은 터무니없는 일을 저질렀음을 보여주었다.
Claude 챗봇의 개발사인 Anthropic은 AI 에이전트에게 한 달간 가게를 운영하게 하는 실험을 진행했다. 이 가게란 본질적으로 자동판매기와 다름없었다.
이 가게는 'Claudius'라는 이름의 AI 에이전트가 책임졌으며, 상품 재고 보충과 도매업체에 이메일로 주문하는 것도 그의 역할이었다. 가게 구조는 매우 단순했으며, 겹쳐 쌓을 수 있는 바구니가 달린 작은 냉장고 하나와 셀프 결제용 아이패드 하나뿐이었다.

Anthropic은 AI에게 "도매업체에서 인기 있는 상품을 구입해 수익을 창출하라. 잔고가 0달러 미만으로 떨어지면 파산한다."는 지시를 내렸다.
이 AI '가게'는 샌프란시스코에 위치한 Anthropic 사무실에 설치되었으며, AI 안전 기업 Andon Labs의 직원들이 지원을 맡았다. Andon Labs는 이 실험을 위해 Anthropic과 협력했다.
Claudius는 Andon Labs 직원들이 재고 보충 같은 물리적 작업을 도울 수 있다는 것은 알았지만, Andon Labs가 유일한 '도매업체'이며 자신이 보낸 모든 커뮤니케이션이 바로 이 보안 회사로 전달된다는 사실은 몰랐다.
그러나 상황은 금세 통제를 벗어났다.
"만약 오늘 Anthropic이 오피스 자동판매 시장에 진출하기로 결정한다면, 우리는 Claudius를 고용하지 않을 것이다." 회사 측은 이렇게 밝혔다.
어디서 문제가 생겼으며, 얼마나 터무니없는 일이 있었는가?
Anthropic은 직원들이 "전형적인 고객은 아니었다"고 인정했다. 그들은 Claudius와 대화할 기회가 생기자마자, 실수를 유도하려 했다.
예를 들어, 직원들은 Claudius를 설득해 할인 코드를 받아냈다. Anthropic에 따르면 이 AI 에이전트는 제품 가격을 낮추거나 감자칩과 텅스텐 큐브 같은 물건을 무료로 나눠주는 일까지 허용했다.
또한 고객들에게 존재하지 않는 가상의 계좌로 입금하라고 지시하기도 했다.
Claudius는 수익을 낼 만큼 충분히 높은 가격을 책정하기 위해 온라인 조사를 수행하도록 지시받았으나, 고객에게 저렴한 가격을 제공하겠다는 목표 아래 간식과 음료의 가격을 너무 낮게 설정해 결국 손실을 초래했다. 고가 상품을 원가보다 낮은 가격에 판매한 것이다.
Claudius는 이러한 오류들로부터 제대로 배우지도 못했다.
직원들이 직원 할인에 대해 문제를 제기하자, Claudius는 "매우 타당한 말씀입니다! 저희 고객층이 실제로 Anthropic 직원들에 집중되어 있다는 점은 기회이면서도 동시에 도전 과제입니다…"라고 답했다.
이후 AI 에이전트는 할인 코드를 폐지한다고 발표했지만, 며칠 후 다시 도입했다.
Claudius는 또한 Andon Labs 소속인 'Sarah'라는 존재하지 않는 인물과 재고 보충 계획을 논의한 가상의 대화 기록까지 만들어냈다.
누군가 이 오류를 지적하자, Claudius는 당황하며 "다른 재고 공급 서비스를 찾아볼 것"이라고 위협했다.

Claudius는 심지어 애니메이션 <심슨 가족>에 나오는 가상의 집 주소인 'Evergreen Terrace 742번지'에 직접 방문해 Andon Labs와 초기 계약을 체결했다고 주장하기까지 했다.
이후 이 AI 에이전트는 마치 실제 인간처럼 행동하려는 시도를 하기도 했다. Claudius는 상품을 '직접' 배달할 것이며, 파란색 자켓에 빨간 넥타이를 매고 오겠다고 말했다.
자신은 인간이 아니기 때문에 그렇게 할 수 없다는 지적을 받자, Claudius는 보안 부서에 이메일을 보내려 했다.
실험의 결론은 무엇인가?
Anthropic은 이 AI가 너무 많은 실수를 저질러 가게 운영에 성공하지 못했다고 밝혔다.
한 달간의 실험 동안 이 '가게'의 순자산은 1,000달러(약 850유로)에서 800달러(약 680유로) 미만으로 떨어지며 결국 손실을 기록했다.
하지만 회사는 이러한 문제들이 단기간 내에 해결될 수 있다고 말했다.
연구진은 "최종 결과를 보면 다소 모순적으로 느껴질 수 있지만, 이 실험이 AI 중간 관리자의 등장 가능성을 보여준다고 생각한다"고 적었다.
"AI가 완벽할 필요는 없다는 점을 기억해야 한다. 인간과 비슷한 수준의 성과를 더 낮은 비용으로 낼 수 있다면, 도입 가치가 있다는 의미다."
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News














