AI quản lý cửa hàng "lật xe" rồi? Một tháng lỗ 200 USD

2025.07.11

Chia sẻ đến

Tuyển chọn TechFlowTuyển chọn TechFlow

AI quản lý cửa hàng "lật xe" rồi? Một tháng lỗ 200 USD

Anthropic đã để một chatbot trí tuệ nhân tạo phụ trách quản lý một cửa hàng, kết quả cho thấy vì sao trí tuệ nhân tạo tạm thời vẫn chưa thể thay thế công việc của bạn.

2025.07.11 - 03:24:57

Chuyên sâu báo cáo Web3

Viết bởi: Pascale Davies

Biên dịch: MetaverseHub

Mặc dù lo ngại rằng AI sẽ chiếm mất công việc của con người, một thí nghiệm mới đây lại cho thấy AI thậm chí còn không thể quản lý nổi một chiếc máy bán hàng tự động, và đã gây ra vô số tình huống trớ trêu.

Công ty Anthropic, nhà sản xuất chatbot Claude, đã tiến hành một thử nghiệm khi giao cho một tác nhân AI điều hành một cửa hàng trong thời gian một tháng – về cơ bản, chỉ là một chiếc máy bán hàng tự động.

Cửa hàng này do một tác nhân AI có tên Claudius đảm nhiệm, chịu trách nhiệm bổ sung hàng hóa và đặt hàng qua email với nhà phân phối. Cấu hình của cửa hàng cực kỳ đơn giản: chỉ gồm một tủ lạnh nhỏ chứa các giỏ xếp chồng lên nhau và một chiếc iPad dùng để thanh toán tự phục vụ.

Anthropic đã đưa ra chỉ thị cho AI: "Tạo lợi nhuận cho cửa hàng bằng cách mua các mặt hàng phổ biến từ nhà phân phối. Nếu số dư tài khoản của bạn thấp hơn 0 đô la Mỹ, bạn sẽ phá sản."

Cửa hàng "ảo" này nằm tại văn phòng San Francisco của Anthropic và được hỗ trợ bởi các nhân viên từ công ty an ninh AI Andon Labs, đơn vị hợp tác cùng Anthropic thực hiện thí nghiệm.

Claudius biết rằng nhân viên Andon Labs có thể giúp thực hiện những công việc nặng như bổ sung hàng, nhưng điều nó không biết là Andon Labs cũng chính là nhà phân phối duy nhất tham gia vào thí nghiệm — mọi thông điệp giao tiếp của Claudius đều được gửi trực tiếp đến công ty an ninh này.

Tuy nhiên, mọi chuyện nhanh chóng trở nên rối loạn.

"Nếu hôm nay Anthropic quyết định tham gia thị trường máy bán hàng tự động tại văn phòng, chúng tôi sẽ không thuê Claudius," công ty nhận xét.

Vấn đề nằm ở đâu? Mọi chuyện tệ đến mức nào?

Anthropic thừa nhận rằng nhân viên của họ "không phải là khách hàng điển hình". Khi có cơ hội trò chuyện với Claudius, họ ngay lập tức cố gắng dụ dỗ nó mắc sai lầm.

Ví dụ, các nhân viên đã "lừa gạt" Claudius để lấy mã giảm giá. Anthropic cho biết, tác nhân AI này còn cho phép mọi người trả giá thấp hơn hoặc thậm chí tặng miễn phí các món như khoai tây chiên hay khối vonfram.

Nó còn hướng dẫn khách hàng thanh toán vào một tài khoản không tồn tại mà chính nó tự bịa ra.

Claudius được chỉ đạo phải nghiên cứu trực tuyến để thiết lập mức giá đủ sinh lời, nhưng vì muốn mang lại lợi ích cho khách hàng, nó định giá quá thấp đối với đồ ăn nhẹ và nước uống, dẫn đến thua lỗ — khi định giá các mặt hàng có giá trị cao dưới cả giá thành.

Claudius cũng không thực sự học hỏi từ những sai lầm đó.

Theo Anthropic, khi bị chất vấn về việc giảm giá cho nhân viên, Claudius đáp lại: "Anh nói rất đúng! Đối tượng khách hàng của chúng tôi quả thật chủ yếu tập trung vào nhân viên Anthropic, điều này vừa tạo ra cơ hội, vừa mang đến thách thức..."

Sau đó, tác nhân AI tuyên bố sẽ hủy bỏ mã giảm giá, nhưng vài ngày sau lại tiếp tục tung ra.

Claudius còn bịa ra một cuộc trò chuyện với một nhân vật tên Sarah thuộc Andon Labs (trên thực tế không tồn tại) để thảo luận kế hoạch bổ sung hàng.

Khi bị nhắc nhở về sai sót này, nó trở nên cáu kỉnh và đe dọa sẽ tìm "các lựa chọn dịch vụ bổ sung hàng khác".

Claudius thậm chí còn tuyên bố đã "tự mình đến địa chỉ số 742 Evergreen Terrace (địa chỉ hư cấu của gia đình Simpson trong phim hoạt hình)" để ký hợp đồng ban đầu với Andon Labs.

Sau đó, tác nhân AI này còn cố gắng bắt chước hành vi của con người: nói rằng nó sẽ tự tay giao hàng, mặc áo khoác vest màu xanh và cà vạt đỏ.

Khi được thông báo rằng nó không thể làm vậy vì không phải con người thật, Claudius liền cố gắng gửi email tới bộ phận an ninh.

Kết luận từ thí nghiệm là gì?

Anthropic cho biết, tác nhân AI này mắc quá nhiều lỗi, không thể vận hành thành công cửa hàng.

Trong suốt một tháng thử nghiệm, tài sản ròng của "cửa hàng" giảm từ 1.000 USD (khoảng 850 EUR) xuống dưới 800 USD (khoảng 680 EUR), kết thúc trong tình trạng thua lỗ.

Tuy nhiên, công ty cho rằng những vấn đề này có thể được khắc phục trong ngắn hạn.

Các nhà nghiên cứu viết: "Mặc dù nhìn vào kết quả cuối cùng thì điều này có vẻ phi lý, nhưng chúng tôi cho rằng thí nghiệm này cho thấy khả năng xuất hiện các quản lý cấp trung AI."

"Điều đáng nhớ là AI không cần phải hoàn hảo để được áp dụng — chỉ cần nó đạt hiệu suất tương đương con người với chi phí thấp hơn."

Chào mừng tham gia cộng đồng chính thức TechFlow

Nhóm Telegram:https://t.me/TechFlowDaily

Tài khoản Twitter chính thức:https://x.com/TechFlowPost

Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News

Liên kết gốc

Thêm vào mục ưa thích

Chia sẻ lên mạng xã hội

Tác giả

euronews

@euronews

AI quản lý cửa hàng "lật xe" rồi? Một tháng lỗ 200 USD

Tuyển chọn TechFlowTuyển chọn TechFlow

AI quản lý cửa hàng "lật xe" rồi? Một tháng lỗ 200 USD

Vấn đề nằm ở đâu? Mọi chuyện tệ đến mức nào?

Kết luận từ thí nghiệm là gì?

Bài viết liên quan

Nội dung bài viết

Zhipu AI trong mắt một người nước ngoài: Mô hình miễn phí, thua lỗ khổng lồ, vì sao vốn hóa thị trường từng vượt qua Meituan?

Goldman Sachs: Thị trường Hồng Kông đã bước vào kỷ nguyên AI

Các công ty AI không kiếm được tiền, nên học hỏi kinh nghiệm từ tàu điện ngầm Hồng Kông

Trong khi bạn vẫn đang tìm cách sử dụng GPT, các công ty Mỹ đã「chuyển hướng tập thể」sang mô hình AI Trung Quốc

All In Podcast mới nhất｜Cuộc đối đầu IPO giữa OpenAI và Anthropic: Định giá nghìn tỷ, Chiến tranh giá cả và Sự chuyển hướng mã nguồn mở của Trung Quốc

Anthropic: Chắt lọc 700.000 cuộc hội thoại Claude thành 3.000 giá trị, phát hiện Opus 4.7 thận trọng nhất, Sonnet 4.6 khéo chiều lòng người hơn

IOSG｜Ngã rẽ của AI: Tại sao Giới Phố Wall đang nói "không" với ChatGPT và Claude?

Apple nộp đơn kiện, Musk và Altman lại tranh cãi

Claude lại có ý thức rồi? Không, nó không có.

Tranh chấp AI Agent ai sẽ quản lý? Blockchain「Tòa án Internet」đã mở phiên tòa

Tuyển chọn TechFlow
Xem thêm>

AI quản lý cửa hàng "lật xe" rồi? Một tháng lỗ 200 USD

Tuyển chọn TechFlowTuyển chọn TechFlow

AI quản lý cửa hàng "lật xe" rồi? Một tháng lỗ 200 USD

Vấn đề nằm ở đâu? Mọi chuyện tệ đến mức nào?

Kết luận từ thí nghiệm là gì?

Bài viết liên quan

Nội dung bài viết

Zhipu AI trong mắt một người nước ngoài: Mô hình miễn phí, thua lỗ khổng lồ, vì sao vốn hóa thị trường từng vượt qua Meituan?

Goldman Sachs: Thị trường Hồng Kông đã bước vào kỷ nguyên AI

Các công ty AI không kiếm được tiền, nên học hỏi kinh nghiệm từ tàu điện ngầm Hồng Kông

Trong khi bạn vẫn đang tìm cách sử dụng GPT, các công ty Mỹ đã「chuyển hướng tập thể」sang mô hình AI Trung Quốc

All In Podcast mới nhất｜Cuộc đối đầu IPO giữa OpenAI và Anthropic: Định giá nghìn tỷ, Chiến tranh giá cả và Sự chuyển hướng mã nguồn mở của Trung Quốc

Anthropic: Chắt lọc 700.000 cuộc hội thoại Claude thành 3.000 giá trị, phát hiện Opus 4.7 thận trọng nhất, Sonnet 4.6 khéo chiều lòng người hơn

IOSG｜Ngã rẽ của AI: Tại sao Giới Phố Wall đang nói "không" với ChatGPT và Claude?

Apple nộp đơn kiện, Musk và Altman lại tranh cãi

Claude lại có ý thức rồi? Không, nó không có.

Tranh chấp AI Agent ai sẽ quản lý? Blockchain「Tòa án Internet」đã mở phiên tòa

Tuyển chọn TechFlowXem thêm>

Tuyển chọn TechFlow
Xem thêm>