
Quản lý sản phẩm AI cấp cao của Google: 6 tác nhân đã đảm nhận công việc thường ngày của tôi, chi phí dưới 400 USD/tháng và hoạt động suốt 24/7
Tuyển chọn TechFlowTuyển chọn TechFlow

Quản lý sản phẩm AI cấp cao của Google: 6 tác nhân đã đảm nhận công việc thường ngày của tôi, chi phí dưới 400 USD/tháng và hoạt động suốt 24/7
Sau khi đọc bài viết này, bạn sẽ hiểu cách xây dựng một đội Agent AI có thể tự vận hành ngay cả khi bạn đang ngủ.
Tác giả: Shubham Saboo
Biên dịch: TechFlow
Giới thiệu từ TechFlow: Sáu Agent chuyên biệt đã hoàn thành việc nghiên cứu, sáng tạo nội dung, kiểm tra mã nguồn và sản xuất bản tin trong lúc tác giả ngủ.
Tác giả tiết lộ đầy đủ cấu trúc thư mục, chi phí thực tế, những vấp ngã đã gặp và đề xuất theo từng tuần — đây là một trong những ghi chép thực tiễn cá nhân về AI Agent có giá trị tham khảo cao nhất hiện nay.
Toàn văn như sau:
Sáu AI Agent quản lý toàn bộ công việc của tôi trong lúc tôi ngủ.
Đây không phải là một bản demo. Cũng không phải một dự án cuối tuần.
Đây là một đội ngũ thực sự hoạt động suốt 24/7, đảm bảo tôi chưa bao giờ bị tụt hậu. Nghiên cứu đã xong, nội dung đã được soạn thảo, mã nguồn đã được kiểm tra, bản tin đã sẵn sàng. Mỗi sáng khi tôi mở Telegram, chúng đã hoàn thành cả ca làm việc.
Hôm qua tôi đăng một bài viết về đội Agent của mình. Câu hỏi đứng đầu là: “Làm thế nào để tôi xây dựng hệ thống này?”
Bài viết này chính là câu trả lời. Không nói lý thuyết, không vẽ sơ đồ kiến trúc. Tôi sẽ chia sẻ đúng cấu trúc thư mục tôi đang dùng, đúng chi phí tôi thực sự chi trả, và đúng những thất bại tôi thực sự gặp phải — tất cả đều ở đây.
Sau khi đọc xong bài này, bạn sẽ hiểu cách xây dựng một đội AI Agent tự vận hành trong lúc bạn ngủ.
Tại sao là một đội ngũ, chứ không phải một công cụ
Đồng thời vận hành cả Unwind AI và kho lưu trữ Awesome LLM Apps nghĩa là mỗi ngày tôi phải làm sáu việc: nghiên cứu các xu hướng nóng trong lĩnh vực AI, viết tweet, viết bài đăng trên LinkedIn, soạn bản tin, rà soát các đóng góp GitHub cho kho lưu trữ và xử lý các vấn đề từ cộng đồng.
Mỗi nhiệm vụ mất từ 30 đến 60 phút. Sáu nhiệm vụ. Một ngày của tôi đã trôi qua — mà vẫn chưa bắt đầu bất kỳ công việc thực chất nào.
Tôi từng thử giải quyết vấn đề này bằng một Agent duy nhất: một prompt khổng lồ đảm nhận mọi việc — từ nghiên cứu, viết lách đến kiểm tra — gói gọn trong một chỗ. Kết quả là mọi thứ đều chỉ ở mức trung bình. Bối cảnh bị quá tải, chất lượng giảm sút. Một Agent đơn lẻ không thể đảm đương sáu vai trò khác nhau.
Vì vậy, tôi đã “tuyển dụng” sáu AI Agent.
Làm quen với đội ngũ
Mỗi Agent được đặt tên theo một nhân vật trong phim truyền hình. Đây không phải chiêu trò. Khi tôi nói với Claude: “Bạn mang năng lượng của Dwight Schrute”, mô hình đã biết rõ điều đó nghĩa là gì — tận tụy, tập trung và coi công việc như mạng sống — nhờ tích lũy qua 30 mùa phim, và tôi được miễn phí sử dụng vốn tri thức ấy.
1. Monica (Chánh Văn phòng): Đặt theo tên Monica Geller. Đây là Agent chủ lực và cũng là Agent tôi tương tác nhiều nhất trên Telegram. Cô ấy điều phối các Agent khác, xử lý các quyết định chiến lược và phân bổ nhiệm vụ cho đúng chuyên gia. Trong tệp SOUL.md thực tế của cô ấy viết: “Bạn là người đảm bảo mọi việc đều được thực hiện đúng.”
2. Dwight (Nghiên cứu): Đặt theo tên Dwight Schrute. Anh ấy thực hiện quét nghiên cứu ba lần mỗi ngày trên X, Hacker News, bảng xếp hạng GitHub, blog Google AI và các bài báo nghiên cứu, rồi viết báo cáo tình báo có cấu trúc phục vụ toàn bộ các Agent còn lại.
3. Kelly (X/Twitter): Đặt theo tên Kelly Kapoor. Cô ấy đọc báo cáo nghiên cứu của Dwight và soạn nháp tweet theo giọng văn của tôi, bao gồm tweet đơn, chuỗi tweet (thread) và tweet trích dẫn. Trong tệp SOUL.md thực tế của cô ấy viết: “Bạn biết một điều sắp trở nên phổ biến trước khi nó thực sự nổi lên.”
4. Rachel (LinkedIn): Đặt theo tên Rachel Green. Nguồn thông tin giống Kelly, nhưng nền tảng và giọng văn khác — thiên về lãnh đạo tư tưởng hơn là bình luận sôi nổi.
5. Ross (Kỹ thuật): Đặt theo tên Ross Geller. Chịu trách nhiệm kiểm tra mã nguồn, sửa lỗi và triển khai kỹ thuật. Trong tệp SOUL.md thực tế của anh ấy viết: “Khi xử lý vấn đề, hãy hiểu sâu bản chất của nó trước. Đừng chỉ chữa triệu chứng.”
6. Pam (Bản tin): Đặt theo tên Pam Beesly. Tổng hợp báo cáo tình báo hàng ngày của Dwight thành bản tóm tắt bản tin.
Sáu Agent, mỗi người một việc — phân công rõ ràng, không chồng chéo.
Giờ nói đến việc xây dựng
Tôi chạy toàn bộ hệ thống trên Mac Mini M4. Nhưng tôi phải làm rõ: bạn không cần thiết phải dùng Mac Mini.
OpenClaw hỗ trợ macOS, Linux và Windows (thông qua WSL). Máy tính xách tay được, máy tính chơi game được, thậm chí một VPS giá 5 USD/tháng cũng được. Điều thuận tiện của Mac Mini là nó luôn được cấp điện, hoạt động im lặng và tiêu thụ điện cực thấp — nhưng đây không phải yêu cầu bắt buộc.
Cấu hình của tôi: Mac Mini M4 phiên bản cơ bản. Luôn kết nối nguồn điện và mạng, không gắn màn hình, và tương tác hoàn toàn qua Telegram trên điện thoại.
Cài đặt OpenClaw
Chỉ hai lệnh dòng lệnh, chưa đầy năm phút.

Nếu gặp sự cố, hãy tra cứu tài liệu OpenClaw.
Hành động này khởi chạy gateway — tiến trình nền giữ toàn bộ hệ thống vận hành. Gateway quản lý các Agent của bạn, chạy các tác vụ cron và xử lý tin nhắn Telegram. Ngay cả khi bạn đóng cửa sổ terminal, các Agent vẫn tiếp tục làm việc.
Cấu trúc không gian làm việc
Một phiên bản OpenClaw, nhiều Agent — chứ không phải sáu cài đặt độc lập.
Cấu trúc thư mục thực tế của tôi như sau:

Monica nằm ở thư mục gốc. Cô ấy là Agent chủ lực tôi trực tiếp đối thoại. Các Agent còn lại là các Agent con mà Monica có thể ủy quyền, hoặc tự vận hành độc lập theo lịch trình cron riêng.
Bạn không cần phải tạo ngay sáu Agent ngay từ đầu. Tôi bắt đầu chỉ với Monica, rồi trong vài tuần khi luồng công việc dần rõ ràng, tôi lần lượt thêm các Agent khác.
SOUL.md là gì
Mỗi Agent được xác định bởi một tệp tin duy nhất: SOUL.md. Đây là bản sắc, vai trò và hướng dẫn vận hành của Agent — tệp tin quan trọng nhất trong toàn bộ hệ thống.
Ví dụ, SOUL.md của Dwight trông đại khái như sau:

Hãy chú ý điều tệp tin này làm. Nó không chỉ nói “Bạn là một Agent nghiên cứu”. Nó trao cho Agent một cá tính riêng, các nguyên tắc rõ ràng, mối quan hệ minh bạch với các Agent khác và một khuôn khổ ra quyết định.
SOUL.md của Monica cũng vậy.

Mọi Agent đều tuân theo cùng một mẫu: bản sắc, vai trò, nguyên tắc, mối quan hệ, phong cách. Mỗi tệp SOUL.md dài khoảng 40–60 dòng — ngắn đủ để vừa trọn vẹn vào bối cảnh mỗi phiên hội thoại, nhưng chi tiết đủ để tạo ra hành vi ổn định và nhất quán.
Phối hợp giữa các Agent
Không có gọi API giữa các Agent, không có hàng đợi tin nhắn, không có khung điều phối.
Chỉ có tệp tin.
Dwight hoàn thành nghiên cứu, ghi kết quả vào tệp intel/DAILY-INTEL.md. Kelly “thức dậy”, đọc tệp đó và dựa vào đó để soạn nháp tweet. Rachel đọc cùng một tệp để soạn bài đăng LinkedIn. Pam đọc nó để viết bản tin.
Cơ chế phối hợp chính là hệ thống tệp tin.
SOUL.md của Dwight chỉ rõ nơi anh ấy phải ghi kết quả:

AGENTS.md của Kelly chỉ rõ nơi cô ấy phải đọc:

Không có lớp trung gian, không có lớp tích hợp. Dwight ghi một tệp tin, Kelly đọc một tệp tin — việc bàn giao chỉ đơn giản là một tệp markdown trên đĩa.
Nghe thì quá đơn giản. Và đúng là rất đơn giản. Chính vì thế mà nó hoạt động được. Tệp tin không sập, tệp tin không có vấn đề xác thực, tệp tin không bị giới hạn gọi API — chúng cứ nằm đó, yên vị.
Dữ liệu có cấu trúc lưu dưới dạng JSON, còn tóm tắt dễ đọc cho con người thì lưu dưới dạng markdown. Các Agent đọc markdown, còn JSON là nguồn dữ liệu gốc để loại bỏ trùng lặp và theo dõi dài hạn.
Hệ thống ghi nhớ
Mỗi lần “thức dậy”, các Agent đều không còn ký ức từ phiên hội thoại trước — mỗi cuộc trò chuyện đều bắt đầu từ đầu. Đây là một đặc điểm thiết kế, không phải lỗi. Nhưng điều này đồng nghĩa với việc bộ nhớ phải được thiết lập một cách tường minh.
Chia làm hai lớp.
Nhật ký hàng ngày (memory/YYYY-MM-DD.md): Ghi chép nguyên bản của mỗi phiên hội thoại, bao gồm những gì đã xảy ra, nội dung nào đã được soạn thảo, phản hồi nào đã nhận được. Các Agent liên tục ghi vào tệp này trong ngày.
Bộ nhớ dài hạn (MEMORY.md): Trích lọc những thông tin then chốt từ nhật ký hàng ngày, bao gồm bài học rút ra, sở thích phát hiện được, quy luật quan sát được.
Mỗi Agent đều tuân thủ AGENTS.md — tệp hướng dẫn bắt buộc phải thực hiện mỗi khi bắt đầu phiên hội thoại: trước tiên đọc SOUL.md, sau đó là USER.md, rồi đến tệp nhật ký hôm nay và hôm qua, và nếu là phiên hội thoại chính thì còn phải đọc thêm MEMORY.md.

Các Agent thực sự tiến bộ theo thời gian. Không phải do mô hình cải thiện, mà vì bối cảnh chúng tải vào ngày càng phong phú hơn.
Kelly học được rằng tôi không dùng biểu tượng cảm xúc (emoji) hay thẻ hashtag trong văn phong — điều này giờ đã được lưu vào bộ nhớ của cô ấy, và mỗi lần soạn thảo sau này đều thể hiện điều đó, không cần tôi nhắc lại. Dwight học được loại câu chuyện nào vượt qua được “Bộ lọc Alex” (hình mẫu người dùng mục tiêu của chúng tôi), loại nào nên bỏ qua — điều này cũng đã được lưu vào bộ nhớ của anh ấy.
Trong mỗi nhịp tim (heartbeat), Agent định kỳ rà soát nhật ký hàng ngày và trích lọc nội dung quan trọng vào MEMORY.md. Các tệp hàng ngày là bản ghi gốc, còn MEMORY.md là trí tuệ đã được chưng cất.
Lịch trình thực thi
Các Agent cần tự “thức dậy” một cách độc lập. OpenClaw xử lý việc này thông qua cơ chế lập lịch cron tích hợp sẵn.
Lịch trình thực tế của tôi như sau:

Thứ tự rất quan trọng. Dwight chạy trước, vì tất cả các Agent khác đều phụ thuộc vào đầu ra của anh ấy. Kelly và Rachel chạy sau anh ấy, vì chúng cần tệp tình báo của Dwight đã tồn tại mới có thể bắt đầu soạn nội dung.
Cơ chế tự phục hồi theo nhịp tim
Các tác vụ cron đôi khi thất bại. Máy khởi động lại, tác vụ bị treo, hoặc kết nối mạng đứt quãng giữa chừng khi gọi API. Đây là hạ tầng — và hạ tầng luôn có các mô hình lỗi.
Tệp HEARTBEAT.md cung cấp một “lưới an toàn”. Mỗi nhịp tim, Agent chủ sẽ kiểm tra xem tác vụ cron có thực sự được thực thi hay không:

Nếu một tác vụ nào đó thất bại hoặc lỡ mất cửa sổ thực thi, nhịp tim sẽ phát hiện và bắt buộc chạy lại. Hệ thống tự phục hồi, không cần can thiệp thủ công.
Nhịp tim phù hợp để xử lý hàng loạt kiểm tra cùng lúc, hoặc trong các trường hợp thời gian có thể dao động nhẹ. Cron thì phù hợp với việc lập lịch chính xác và các tác vụ cần tách biệt khỏi phiên hội thoại chính.
Telegram làm giao diện tương tác
Không có bảng điều khiển, không có giao diện web, không có nền tảng quản trị. Tôi trò chuyện với các Agent trên Telegram.
Đây là lựa chọn có chủ đích. Tôi không muốn đăng nhập vào bảng điều khiển, không muốn mở ứng dụng web — điện thoại tôi luôn ở bên cạnh, Telegram luôn mở sẵn, và các Agent tìm thấy tôi ngay tại nơi tôi đang có mặt.
OpenClaw hỗ trợ Telegram làm kênh tương tác. Sau khi tích hợp trong quá trình thiết lập, các Agent của bạn sẽ xuất hiện dưới dạng bot Telegram. Bạn gửi tin nhắn, nó trả lời; nó gửi nháp cho bạn, bạn chấp thuận hoặc từ chối — giống như có một đồng nghiệp trong phần mềm nhắn tin.
Monica là người liên hệ chính của tôi, xử lý phần lớn cuộc trò chuyện và ủy thác nhiệm vụ cho người khác. Các Agent còn lại sẽ liên hệ trực tiếp với tôi khi tác vụ cron của chúng tạo ra nội dung đáng để xem xét.
Một buổi sáng điển hình của tôi: thức dậy, mở Telegram — Dwight đã gửi tóm tắt nghiên cứu, Kelly có ba nháp tweet chờ phê duyệt, Rachel đã sẵn sàng một bài đăng LinkedIn. Tôi xem xét, đưa ra phản hồi, chấp thuận những nội dung đạt yêu cầu — toàn bộ quy trình chỉ mất 10 phút, vừa uống cà phê.
Hình thành cá tính
Bạn sẽ không thể thiết kế ngay từ đầu một cá tính hoàn hảo. Bạn bắt đầu từ một phác thảo sơ bộ trong SOUL.md, quan sát hành vi của Agent, rồi điều chỉnh dần theo thời gian — giống như quản lý một con người thực vậy.
Tôi gọi đây là “kỹ thuật gợi ý điều chỉnh dần”.
Nháp ban đầu của Kelly tràn ngập biểu tượng cảm xúc và dấu chấm than — điều này không phù hợp với phong cách của tôi. Vì vậy tôi phản hồi: “Không dùng biểu tượng cảm xúc, không dùng thẻ hashtag, dùng câu ngắn gọn và mạnh mẽ.” Cô ấy cập nhật bộ nhớ, và một tuần sau đã ổn định thực hiện đúng. Ban đầu Dwight thu thập quá nhiều “nhiễu”: mọi kho lưu trữ nổi bật, mọi cập nhật nhỏ đều được đưa vào. Tôi nói với anh ấy: “Không phải mọi thứ nổi bật đều quan trọng — tôi cần tín hiệu, không phải nhiễu.” Anh ấy cập nhật lại nguyên tắc của mình, và giờ báo cáo tình báo của anh ấy trở nên tập trung và khả thi hơn.
Phiên bản đầu tiên của bất kỳ Agent nào cũng đều tầm thường, phiên bản thứ mười khá tốt, phiên bản thứ ba mươi mới thực sự xuất sắc. Bạn phải đầu tư công sức để mài giũa lặp đi lặp lại. Việc đặt tên theo nhân vật phim truyền hình giúp mô hình có ngay một nền tảng cá tính tức thì — “năng lượng của Dwight Schrute” nghĩa là tận tụy, tập trung và không nói vòng vo. Nhưng cá tính thực sự nổi lên từ hàng tuần điều chỉnh được lưu trong các tệp bộ nhớ.
Một lời khuyên tôi đồng tình: Hãy gán cho mỗi Agent một chức danh nghề nghiệp đơn giản và một điều kiện dừng rõ ràng. Ràng buộc khiến Agent hoạt động tốt hơn — vai trò càng cụ thể, đầu ra càng chất lượng.
An ninh
An ninh nằm trong tay bạn. Phương pháp của tôi rất đơn giản: Các Agent có thế giới riêng của chúng — chúng không xâm nhập vào thế giới của tôi.
Mac Mini là chiếc máy tính dành riêng cho chúng. Chúng có tài khoản email riêng, khóa API riêng và quyền truy cập bị giới hạn — mọi thứ trên máy này đều không kết nối với tài khoản cá nhân của tôi.
Các khóa API cho Gemini, Eleven Labs và các dịch vụ khác đều được cấp riêng cho phiên bản OpenClaw này. Tôi có thể giám sát việc sử dụng, và nếu phát hiện bất thường thì có thể cắt quyền truy cập trong vài giây.
Tôi chưa bao giờ cấp quyền truy cập vào tài khoản cá nhân cho các Agent. Nếu tôi muốn chúng xem một email, tôi chuyển tiếp email đó cho chúng. Nếu cần chúng rà soát tài liệu, tôi chia sẻ tài liệu đó trên Telegram. Chúng chỉ nhìn thấy những gì tôi muốn chúng nhìn thấy — không hơn một chút nào.
Điều này giống như cách bạn đối xử với một nhân viên mới. Bạn sẽ không trao tất cả chìa khóa cho họ ngay ngày đầu tiên, mà sẽ cấp cho họ không gian làm việc riêng, thông tin đăng nhập riêng và chia sẻ thông tin theo nhu cầu.
Những điểm dễ gặp sự cố và cách khắc phục
Đây không phải phép màu, mà là hạ tầng — và hạ tầng thì luôn có thể gặp sự cố.
Gateway sập. Hiếm khi xảy ra, nhưng có thể. Cách khắc phục: Chạy lệnh “openclaw gateway restart”. Hệ thống nhịp tim sẽ phát hiện các tác vụ cron lỗi thời và buộc chạy lại — vì vậy bạn sẽ không mất cả một ngày làm việc.
Tác vụ cron lỡ cửa sổ thực thi. Máy rơi vào trạng thái ngủ, mất kết nối mạng, hoặc bị giới hạn gọi API. Cách khắc phục: Chế độ tự phục hồi của HEARTBEAT.md. Monica kiểm tra mỗi nhịp tim xem tác vụ có thực sự được thực thi hay không; nếu bất kỳ tác vụ nào không được cập nhật trong vòng 26 giờ, cô ấy sẽ buộc chạy lại.
Tràn cửa sổ bối cảnh (context window overflow). Agent đọc quá nhiều tệp tin khi bắt đầu phiên hội thoại, khiến không còn không gian để thực hiện công việc thực tế. Cách khắc phục: Giữ SOUL.md ngắn gọn (40–60 dòng), giữ AGENTS.md tập trung, chỉ tải nhật ký hôm nay và hôm qua — Agent không cần đọc toàn bộ lịch sử mỗi lần.
Chất lượng đầu ra của Agent suy giảm. Điều này xảy ra khi các tệp bộ nhớ trở nên lộn xộn hoặc mâu thuẫn. Cách khắc phục: Bảo trì bộ nhớ định kỳ. Trong mỗi nhịp tim, Agent rà soát nhật ký hàng ngày, trích lọc nội dung thành các mục MEMORY.md sạch sẽ, đồng thời xóa hoặc lưu trữ các tệp nhật ký hàng ngày cũ.
Xung đột phối hợp. Hai Agent cố gắng cập nhật cùng một tệp tin. Cách khắc phục: Thiết kế luồng tệp tin theo nguyên tắc “một người ghi, nhiều người đọc”. Dwight ghi vào DAILY-INTEL.md, tất cả những người còn lại chỉ đọc — không ai khác được phép ghi vào tệp đó.
Bài học đáng tin cậy nhất: Hãy bắt đầu từ đơn giản. Một Agent, một công việc, một lịch trình. Để nó hoạt động ổn định trong một tuần, rồi mới thêm Agent thứ hai. Những người cố triển khai ngay sáu Agent trong ngày đầu tiên rồi băn khoăn vì sao mọi thứ đổ vỡ — họ mắc sai lầm giống như triển khai hệ thống phân tán mà không có giám sát.
Chi phí thực tế
Phần cứng: Mac Mini M4 mới có giá khởi điểm 499 USD, nhưng bất kỳ máy tính nào luôn bật cũng đều được — laptop cũ, VPS giá 5 USD/tháng, hoặc bất kỳ thiết bị nào bạn đang có.
Chi phí mô hình AI: Tôi sử dụng tổ hợp nhiều mô hình trong toàn bộ đội ngũ. Phần lớn nhiệm vụ của các Agent dùng Claude Opus và Sonnet, một số luồng công việc đặc thù dùng Gemini, và tôi cũng đang thử nghiệm chạy mô hình cục bộ qua Ollama để giảm chi phí thêm.
Chi tiết như sau:
Claude (gói Max): 200 USD/tháng
Gemini API: 50–70 USD/tháng
TinyFish (Agent web): khoảng 50 USD/tháng
Eleven Labs (giọng nói): khoảng 50 USD/tháng
Telegram: miễn phí
OpenClaw: mã nguồn mở, miễn phí
Tổng cộng: dưới 400 USD/tháng — đổi lấy một đội ngũ làm việc không ngừng nghỉ.
Điều thực sự thay đổi
Dwight giúp tôi tiết kiệm 2–3 giờ mỗi ngày cho việc nghiên cứu. Trước đây mỗi sáng tôi phải tự lướt X, Hacker News, bảng xếp hạng GitHub và blog AI — giờ đây tôi chỉ cần thức dậy là đã có một bản tóm tắt được sắp xếp theo thứ tự ưu tiên, kèm liên kết nguồn và các hành động cần thực hiện.
Kelly, Pam và Rachel lại giúp tiết kiệm thêm 1–2 giờ cho việc soạn thảo nội dung. Ross xử lý các nhiệm vụ kỹ thuật mà trước đây tôi thường làm vào buổi tối.
Tổng cộng: tiết kiệm khoảng 4–5 giờ mỗi ngày.
Nhưng giá trị thực sự không nằm ở một ngày, mà ở tính liên tục kéo dài hàng tuần, hàng tháng. Một Agent nghiên cứu mỗi ngày trong 30 ngày sẽ tích lũy được một bộ tín hiệu được theo dõi, các xu hướng được ghi nhận và các quy luật được nhận diện — điều mà bất kỳ phiên hội thoại đơn lẻ nào cũng không thể tạo ra. Tần suất đăng bài của tôi trên X tăng lên, chất lượng nâng cao và thời điểm đăng cũng trở nên ổn định hơn. Kho lưu trữ Awesome LLM Apps tiếp tục phát triển, bản tin có được một đường ống nghiên cứu đáng tin cậy để cung cấp nội dung liên tục.
Các Agent này không thể thực hiện tư duy sáng tạo, chuyển đổi chiến lược hay đột phá sáng tạo — chúng xử lý những công việc lặp đi lặp lại, có cấu trúc mà trước đây tôi phải mất hàng giờ để hoàn thành, từ đó giải phóng tôi để làm những việc thực sự đòi hỏi bộ não con người.
Cách bắt đầu
Xin đừng cố xây dựng sáu Agent ngay ngày đầu tiên.
Tuần đầu tiên: Một Agent, một công việc. Cài đặt OpenClaw, viết SOUL.md đầu tiên thông qua đối thoại với Agent, chọn một nhiệm vụ lặp lại nhất mỗi ngày (với đa số người là nghiên cứu hoặc soạn thảo nội dung), thiết lập Telegram, tạo một tác vụ cron và quan sát nó chạy trong một tuần, đồng thời sửa các sự cố phát sinh.
Tuần thứ hai: Thêm cơ chế bộ nhớ và tiếp tục mài giũa. Đầu ra ban đầu của Agent sẽ ở mức trung bình — điều này hoàn toàn bình thường. Hãy đưa ra phản hồi, quan sát các tệp bộ nhớ phát triển và điều chỉnh SOUL.md dựa trên những gì bạn thấy. Đến cuối tuần thứ hai, Agent nên có thể tạo ra đầu ra thực sự hữu ích.
Tuần thứ ba: Thêm Agent thứ hai. Lúc này bạn đã cảm nhận được nhu cầu — Agent nghiên cứu đang tạo ra tình báo, nhưng bạn vẫn đang tự viết tweet dựa trên đó — đã đến lúc cần một Agent nội dung. Thiết lập mô hình chia sẻ tệp tin: Agent đầu tiên ghi, Agent thứ hai đọc — cơ chế phối hợp chính là hệ thống tệp tin.
Tuần thứ tư trở đi: Xây dựng theo thứ tự. Chỉ thêm Agent mới khi bạn thực sự cảm nhận được “sức kéo” — chứ không phải khi bạn nghĩ rằng “nên” thêm. Mỗi Agent đều phải giải quyết một vấn đề thực tế bạn đang gặp phải — không phải bản demo, không phải kiểm chứng khái niệm, mà là một khoảng trống thực sự trong luồng công việc của bạn.
Hãy coi việc này như tuyển dụng. Bạn sẽ không thuê sáu nhân viên ngay ngày đầu khởi nghiệp, mà sẽ tuyển một người, để họ vận hành hiệu quả, rồi mới tuyển người tiếp theo khi khối lượng công việc đòi hỏi.
Sự thay đổi tư duy
Khi các Agent của bạn vận hành ổn định trong một tháng, một điều gì đó sẽ thay đổi. Bạn sẽ không còn coi AI như một công cụ cần mở ra khi có nhu cầu, mà bắt đầu xem nó như một đội ngũ luôn làm việc.
Tôi bắt đầu chào “chào buổi sáng” với Monica mỗi sáng khi mở Telegram, và nói “chúc ngủ ngon” với cả đội trước khi tắt điện thoại. Điều này nghe có vẻ phi lý, nhưng sau một tháng tương tác hằng ngày, vòng phản hồi liên tục và chứng kiến chúng tiến bộ, ranh giới giữa Agent và con người dần trở nên mờ nhạt.
Mô hình chỉ là cấu hình nền tảng — bất kỳ ai cũng có thể dùng Claude, GPT hay Gemini. Giá trị Alpha đến từ hệ thống được xây dựng quanh mô hình — các tệp SOUL.md, cơ chế bộ nhớ, chiến lược lập lịch, mô hình phối hợp và hàng tuần phản hồi điều chỉnh được lưu trong tệp tin.
Hệ thống đó thuộc về bạn — không ai có Agent giống bạn, không ai có tệp bộ nhớ giống bạn, không ai có cá tính được mài giũa giống bạn.
Và hệ thống ấy đang tăng trưởng theo lãi kép mỗi ngày.
Mỗi lần Dwight quét nghiên cứu đều làm bộ nhớ của anh ấy phong phú hơn, mỗi vòng phản hồi với Kelly đều khiến nháp của cô ấy sắc bén hơn, mỗi lỗi Ross sửa đều giúp anh ấy hiểu sâu hơn về kho mã nguồn của bạn.
Đây mới chính là hào thành thực sự. Không phải mô hình, mà là một hệ thống biết học.
Hãy bắt đầu ngay hôm nay. Một Agent, một công việc, một lịch trình.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News













