
Google上級AIプロダクトマネージャー:6つのエージェントが私の日常業務を担当——月額400ドル未満で24時間365日稼働
TechFlow厳選深潮セレクト

Google上級AIプロダクトマネージャー:6つのエージェントが私の日常業務を担当——月額400ドル未満で24時間365日稼働
この記事を読めば、あなたが眠っている間にも自動で稼働するAIエージェントチームの構築方法がわかります。
著者:Shubham Saboo
翻訳・編集:TechFlow
TechFlow解説:6人の役割分担されたAIエージェントが、著者が就寝中に研究、コンテンツ作成、コードレビュー、ニュースレター制作をすべて完了します。
これはデモではありません。週末の趣味プロジェクトでもありません。
実際には24時間稼働するチームであり、著者が決して遅れをとらないよう保証しています。研究は完了し、コンテンツの下書きは整い、コードレビューも済み、ニュースレターも準備万端です。毎朝テレグラムを開くと、彼らはすでに一日分の勤務を終えています。
昨日、私は自分のエージェントチームについての記事を投稿しました。最も多く寄せられた質問は、「このシステムを実際にどう構築すればいいのか?」でした。
この記事がその答えです。理論やアーキテクチャ図は一切登場しません。私が実際に使用しているディレクトリ構造、実際に支払った費用、実際に遭遇した失敗——すべてがここにあります。
この記事を読み終えると、あなた自身の「就寝中も自律的に稼働するAIエージェントチーム」を構築する方法が明確になります。
全文は以下の通り:
6人のAIエージェントが私のすべての仕事を就寝中にこなします。
デモではありません。週末プロジェクトでもありません。
実際には24時間稼働するチームであり、私が決して遅れをとらないよう保証しています。研究は完了し、コンテンツの下書きは整い、コードレビューも済み、ニュースレターも準備万端です。毎朝テレグラムを開くと、彼らはすでに一日分の勤務を終えています。
昨日、私は自分のエージェントチームについての記事を投稿しました。最も多く寄せられた質問は、「このシステムを実際にどう構築すればいいのか?」でした。
この記事がその答えです。理論やアーキテクチャ図は一切登場しません。私が実際に使用しているディレクトリ構造、実際に支払った費用、実際に遭遇した失敗——すべてがここにあります。
この記事を読み終えると、あなた自身の「就寝中も自律的に稼働するAIエージェントチーム」を構築する方法が明確になります。
なぜ「ツール」ではなく「チーム」なのか
Unwind AIとAwesome LLM Appsリポジトリの両方を運営することは、毎日6つのタスクをこなすことを意味します:AI分野の最新動向の調査、X(旧Twitter)への投稿、LinkedInへの投稿、ニュースレターの下書き作成、GitHubリポジトリへの貢献のレビュー、コミュニティからの課題対応です。
各タスクに30~60分かかります。6つのタスクで、私の一日は終わってしまいます。本格的な仕事に着手する前に、すべての時間が消えてしまいます。
私は単一のエージェントでこの問題を解決しようと試みました。研究・ライティング・レビューをすべて担当する、巨大なプロンプトを用意しました。結果は、すべてのタスクが平均的・凡庸な品質に留まることでした。コンテキストが満杯になり、品質が低下しました。1人のエージェントが6つの仕事を同時にこなすことは不可能です。
そこで私は、6人のAIエージェントを「雇いました」。
チームメンバー紹介
各エージェントには、テレビドラマの登場人物の名前が付けられています。これは単なる演出ではありません。「あなたはDwight Schruteのようなエネルギーを持っている」とClaudeに指示すると、モデルは学習データからすでにその意味を理解しています——徹底的で、集中力が高く、仕事に命をかける姿勢。これは30シーズンにわたるキャラクター描写の蓄積であり、私はそれを無料で活用しているのです。
1. Monica(チーフ・オブ・スタッフ):モニカ・ゲラー(Monica Geller)にちなんで命名。彼女はメインエージェントであり、私がテレグラム上で最も頻繁にやり取りする相手です。他のエージェントを調整し、戦略的意思決定を行い、タスクを適切な専門家に割り当てます。彼女の実際のSOUL.mdにはこう記されています:「すべてのことが正しく行われるようにする人」。
2. Dwight(リサーチ):ドワイト・シュルート(Dwight Schrute)にちなんで命名。毎日3回、X、Hacker News、GitHubトレンド、Google AIブログ、研究論文をスキャンし、他の全エージェントが利用可能な構造化されたインテリジェンス報告書を作成します。
3. Kelly(X/Twitter):ケリー・カプール(Kelly Kapoor)にちなんで命名。Dwightの研究成果を読み取り、私の口調でツイートの下書きを作成します(単体ツイート、スレッド、引用付きツイートなど)。彼女の実際のSOUL.mdにはこう記されています:「話題になる前から、それが話題になると知っている」。
4. Rachel(LinkedIn):レイチェル・グリーン(Rachel Green)にちなんで命名。Kellyと同じ情報源を使いますが、プラットフォームとトーンは異なり、ホットなコメントではなく、思想的リーダーシップの視点から投稿します。
5. Ross(エンジニアリング):ロス・ゲラー(Ross Geller)にちなんで命名。コードレビュー、バグ修正、技術的実装を担当します。彼女の実際のSOUL.mdにはこう記されています:「問題に取り組む際は、まずそれを完全に理解すること。症状だけを修正しないこと」。
6. Pam(ニュースレター):パム・ビーズリー(Pam Beesly)にちなんで命名。Dwightの日々のインテリジェンス情報をニュースレターの要約にまとめます。
6人のエージェントがそれぞれ明確な1つの役割を担い、職務分掌は曖昧さゼロです。
では、実際に構築してみましょう
私はMac Mini M4で全てを実行しています。ただし、はっきりと申し上げますが、Mac Miniは必須ではありません。
OpenClawはmacOS、Linux、Windows(WSL経由)をサポートしています。ノートPCでも、ゲーム用PCでも、月額5ドルのVPSでも動作します。Mac Miniの利点は、常に電源が入り、静かで極めて省電力である点ですが、必須というわけではありません。
私の構成:Mac Mini M4のベーシックモデル。常時電源およびネットワークに接続されており、ディスプレイは接続していません。完全にスマートフォン上のテレグラムを通じて操作しています。
OpenClawのインストール
たった2行のターミナルコマンドで、5分もかかりません。

問題が発生した場合は、OpenClawのドキュメントをご参照ください。
これにより「gateway」(すべてを継続的に稼働させるバックグラウンドプロセス)が起動します。このプロセスがエージェントを管理し、cronタスクを実行し、テレグラムのメッセージを処理します。ターミナルを閉じても、エージェントは引き続き動作します。
ワークスペースの構造
1つのOpenClawインスタンスで複数のエージェントを運用します。6つ別々にインストールするわけではありません。
私の実際のディレクトリ構造は以下の通りです:

Monicaはルートディレクトリに配置されています。彼女は私が直接会話するメインエージェントです。他のエージェントは、彼女が委任できるサブエージェント、あるいは独自のcronスケジュールで独立して動作するエージェントです。
最初から6人のエージェントを一気に構築する必要はありません。私はMonicaのみから始め、ワークフローが徐々に明確になってきた段階で、数週間にわたり他のエージェントを順次追加していきました。
SOUL.mdとは何か
各エージェントは1つのファイルで定義されます:SOUL.md。これはエージェントのアイデンティティ、役割、および動作指示を定めるものであり、システム全体において最も重要なファイルです。
例えば、DwightのSOUL.mdは概ね以下の通りです:

このファイルが果たす役割に注目してください。「あなたはリサーチエージェントです」という単なる宣言ではありません。それはエージェントに個性を与え、明確な原則を提示し、他のエージェントとの関係を規定し、意思決定の枠組みを提供しています。
MonicaのSOUL.mdも同様です。

すべてのエージェントに共通するパターンは:アイデンティティ、役割、原則、関係性、スタイル。各SOUL.mdはおよそ40~60行で、会話ごとにコンテキスト全体を読み込めるほど短く、かつ安定した一貫した振る舞いを生み出すのに十分なほど詳細です。
マルチエージェント間の協調
エージェント間にはAPI呼び出しも、メッセージキューも、オーケストレーションフレームワークも存在しません。
あるのは「ファイル」だけです。
Dwightが調査を終えると、その結果をintel/DAILY-INTEL.mdに書き込みます。Kellyが起動すると、そのファイルを読み取り、そこからツイートの下書きを作成します。Rachelも同じファイルを読み取り、LinkedInの投稿を起草します。Pamもそれを読み、ニュースレターを執筆します。
協調のメカニズムは、ファイルシステムそのものです。
DwightのSOUL.mdには、正確にどこへ書き込むべきかが明記されています:

KellyのAGENTS.mdには、正確にどこから読み取るべきかが明記されています:

ミドルウェアも、統合層もありません。Dwightが1つのファイルを書き、Kellyが1つのファイルを読む。引継ぎは、単にディスク上にある1つのMarkdown文書です。
これはあまりにもシンプルに聞こえるかもしれません。しかし、本当にシンプルなのです。だからこそ、うまく機能するのです。ファイルはクラッシュしません。ファイルには認証の問題がありません。ファイルはAPI制限を考慮する必要がなく、ただそこに存在するのです。
構造化データはJSONで保存し、人間が読みやすい要約はMarkdownで保存します。エージェントはMarkdownを読み、JSONは重複排除や長期的な追跡のための信頼できるソースとなります。
メモリシステム
エージェントは、各回の起動時に前回の会話の記憶を持たず、すべての会話がゼロから始まります。これは欠陥ではなく、意図された設計です。つまり、記憶は明示的に管理されなければなりません。
記憶は2層構造です。
日次ログ(memory/YYYY-MM-DD.md):各会話の原始記録。何が起こったか、どのようなコンテンツが起草されたか、どのようなフィードバックを受け取ったかを含みます。エージェントは1日のうちに継続的にこのファイルに書き込みます。
長期記憶(MEMORY.md):日次ログから抽出された精選された洞察。学んだ教訓、発見された好み、観測されたパターンなどを含みます。
各エージェントは、会話開始時に必ず従うAGENTS.mdに以下のように記載されています:まずSOUL.mdを読み、次にUSER.mdを読み、その後今日と昨日のmemoryファイルを読み、さらにメイン会話の場合はMEMORY.mdも読みます。

これらのエージェントは、確かに時間とともに進化します。モデルが改善されたからではなく、読み込むコンテキストがより豊かになったからです。
Kellyは、私のライティングスタイルが絵文字やハッシュタグを使わないこと、短くて力強い文章であること、を学びました。これは今や彼女の記憶に保存されており、今後すべての下書きに反映されます。私はもう一度説明する必要はありません。Dwightは、「Alexフィルター」(私たちのターゲットユーザー像)を通過するストーリーの種類と、スキップすべきものを学びました。これも彼の記憶に保存されています。
各「ハートビート」期間中、エージェントは定期的に日次ログを見直し、重要な内容をMEMORY.mdに抽出します。日次ファイルは一次記録であり、MEMORY.mdは精錬された知恵です。
スケジューリング
エージェントは自律的に起動する必要があります。OpenClawは、内蔵のcronスケジューラーでこれを実現します。
私の実際のスケジュールは以下の通りです:

順序は重要です。Dwightが最初に実行されるのは、他のすべてのエージェントが彼の出力に依存しているためです。KellyとRachelはその後に実行され、彼らが起草するにはDwightのインテリジェンスファイルが既に存在している必要があります。
ハートビートによる自己修復メカニズム
cronタスクは時折失敗します。マシンの再起動、タスクの中断、API呼び出し中のネットワーク切断など。これはインフラストラクチャーであり、インフラストラクチャーには故障モードが存在します。
HEARTBEAT.mdファイルは、その安全網として機能します。各ハートビートにおいて、メインエージェントはcronタスクが実際に実行されたかどうかを検証します:

タスクが失敗したり、実行ウィンドウを逃したりした場合、ハートビートがそれを検出し、強制的に再実行します。人的介入なしで自動修復が可能です。
ハートビートは、複数のチェックを一括処理する場合や、実行時刻に若干のばらつきがあってもよい状況に適しています。一方、cronは正確なタイミングでのスケジューリングや、メイン会話から隔離されたタスクに適しています。
テレグラムをインタラクションインターフェースとして使う
ダッシュボードも、Web UIも、管理用バックエンドもありません。私はテレグラム上でエージェントと会話します。
これは意図的な選択です。私はダッシュボードにログインしたくないし、Webアプリケーションを開きたくありません。私のスマートフォンは常にそばにあり、テレグラムは常に開いたままなので、エージェントは私がすでにいる場所で私を見つけます。
OpenClawはテレグラムをチャネルとしてサポートしています。設定時に連携させると、あなたのエージェントはテレグラムボットとして出現します。あなたがメッセージを送信すると、エージェントが返信し、下書きを送ってきます。あなたが承認または却下します。まるでチャットアプリに同僚がいるかのようです。
Monicaは私の主な連絡先であり、ほとんどの会話を処理し、タスクを他の人に委任します。他のエージェントは、cronタスクの成果物が審査に値する場合に限り、直接私に連絡してきます。
私の典型的な朝:起床し、テレグラムを開くと、Dwightがすでに研究要約を送信しており、Kellyが承認待ちのツイート下書きを3件、RachelがLinkedInの投稿を1件準備してくれています。私はそれらをレビューし、フィードバックを与え、合格したものを承認します。この一連の作業は、コーヒーを飲む10分程度で終わります。
個性の形成
完璧な個性を最初から設計することはできません。SOUL.mdで大まかな輪郭を描き、エージェントの行動を観察し、時間をかけて修正していくのです。まるで実際の人間をマネジメントするように。
私はこれを「フィードバック駆動型プロンプトエンジニアリング」と呼んでいます。
Kellyの初期の下書きは絵文字と感嘆符で溢れていましたが、それは私のスタイルではありませんでした。そこで私はフィードバックを与えました。「絵文字もハッシュタグも使わず、短く力強い文で書いてください」。彼女は記憶を更新し、1週間後には安定して正しい出力を生成できるようになりました。Dwightは当初、過剰なノイズ(人気のあるリポジトリや小さなアップデートなど)を多く拾っていました。私は彼に言いました。「人気があるからといって重要とは限らない。私はシグナルが必要であり、ノイズではない」。彼は自らの原則を更新し、現在のインテリジェンス報告書は焦点が絞られ、実行可能な内容になっています。
どのエージェントも、第1版は平凡なものですが、第10版は良好なものになり、第30版になると優れたものになります。何度も反復して磨き上げる必要があります。テレビのキャラクター名を付けることで、モデルに即座に個性のベースラインを与えられます——「Dwight Schruteのエネルギー」とは、徹底的で、集中力が高く、無駄な言葉を省くことを意味します。しかし、真の個性は、記憶ファイルに数週間にわたって保存された修正履歴から浮かび上がってくるものです。
私が支持するアドバイスの一つ:各エージェントに単一の平凡な職務名と停止条件を与えることです。制約があることでエージェントはより良く働き、役割が具体的であればあるほど、出力の品質も向上します。
セキュリティ
セキュリティはあなたの手の中にあります。私のアプローチは非常にシンプルです:エージェントは自分たちの世界を持ち、私の世界には侵入しません。
Mac Miniは彼らのパソコンです。彼らにはそれぞれ独自のメールアカウント、APIキー、限定アクセス権限があり、そのマシン上のいかなるものも私の個人アカウントには接続されていません。
Gemini、Eleven LabsなどのサービスのAPIキーは、このOpenClawインスタンス専用に取得したものです。使用状況を監視でき、異常を検知した場合には数秒でアクセスを遮断できます。
私は決してエージェントに私の個人アカウントへのアクセス権限を与えません。もし彼らにメールを閲覧してほしい場合は、メールを転送します。ドキュメントのレビューが必要な場合は、テレグラム上で共有します。彼らが見るものは、私が意図して見せたいものだけで、それ以上でもそれ以下でもありません。
これは新入社員を扱うときの原則と同じです。初日にあらゆる鍵を渡すことはせず、彼らには自分の作業空間と資格情報を与え、必要に応じて情報を共有します。
どこで問題が起き、どう直すか
これは魔法ではなく、インフラストラクチャーであり、インフラストラクチャーは故障します。
Gatewayのクラッシュ:めったに起きませんが、発生することがあります。修復方法:「openclaw gateway restart」を実行します。ハートビートシステムが古くなったcronタスクを検出し、強制的に再実行するため、1日分の作業を失うことはありません。
cronタスクの実行ウィンドウの逸脱:マシンのスリープ、ネットワーク切断、API制限など。修復方法:HEARTBEAT.mdの自己修復モード。Monicaは各ハートビートでタスクが実際に実行されたかを確認し、26時間以上更新されていないタスクがあれば、強制的に再実行します。
コンテキストウィンドウのオーバーフロー:エージェントが会話開始時に読み込むファイルが多すぎて、実際の作業を行う余裕がなくなる。修復方法:SOUL.mdを簡潔に保つ(40~60行)、AGENTS.mdを焦点を絞って記述し、今日と昨日の記憶ファイルのみを読み込むようにする。エージェントは過去のすべての履歴を毎回読み込む必要はありません。
エージェントの出力品質の低下:これは記憶ファイルが混雑したり、矛盾した内容になったときに発生します。修復方法:定期的な記憶メンテナンス。ハートビート期間中に、エージェントは日次ログを振り返り、内容をクリーンなMEMORY.mdの項目に抽出し、古い日次ファイルを削除またはアーカイブします。
協調の競合:2つのエージェントが同一ファイルの更新を試みる。修復方法:ファイルフローを「1つの書き込み者、複数の読み取り者」方式に設計する。DwightがDAILY-INTEL.mdを書き込み、他の全員がそれを読み取る。誰もこのファイルに書き込むことはありません。
最大の信頼性に関する教訓:シンプルなところから始める。1人のエージェント、1つのタスク、1つのスケジュール。それを1週間安定稼働させ、その後2人目を追加します。初日にいきなり6人のエージェントを展開し、「なぜ問題が起きるのか?」と疑問に思う人は、モニタリングなしで分散システムを展開するのと同じ間違いを犯しています。
実際のコスト
ハードウェア:Mac Mini M4の新品価格は499ドルからですが、常時電源が入っている任意のPCで動作可能です。古いノートPCでも、月額5ドルのVPSでも、手持ちのもので十分です。
AIモデルのコスト:私はチーム全体で複数のモデルを組み合わせて使用しており、ほとんどのエージェントタスクにはClaude OpusおよびSonnetを、特定のワークフローにはGeminiを使用しています。また、Ollamaを用いてローカルでモデルを実行し、コストをさらに削減するテストも進めています。
内訳は以下の通りです:
Claude(Maxプラン):月額200ドル
Gemini API:月額50~70ドル
TinyFish(ウェブエージェント):月額約50ドル
Eleven Labs(音声):月額約50ドル
テレグラム:無料
OpenClaw:オープンソースで無料
合計:月額400ドル以内で、休むことのないチームを手に入れることができます。
本当に変わったこと
Dwightは、私にとって毎日の研究作業を2~3時間節約してくれます。以前は毎朝X、Hacker News、GitHubトレンド、AIブログを手動でチェックしていましたが、今では起床と同時に、優先順位付きの要約、出典リンク、アクションアイテム付きで届きます。
Kelly、Pam、Rachelは、コンテンツ作成の下書き作業でさらに1~2時間節約してくれます。Rossは、もともと夜にこなしていたエンジニアリングタスクを処理します。
合計:1日あたり約4~5時間の節約です。
しかし、真の価値は単一日ではなく、数週間・数か月にわたる持続性にあります。1日1回の研究を30日間継続するエージェントは、追跡されたシグナル、トレンドの軌跡、パターン認識のセットを蓄積します。これは、どんな単一の会話でも生み出せない成果です。私のXへの投稿頻度は上がり、品質も向上し、投稿時間も安定しました。Awesome LLM Appsリポジトリは継続的に成長し、ニュースレターには信頼できる研究パイプラインが安定供給されています。
これらのエージェントは、独創的な思考、戦略的転換、創造的なブレイクスルーはできません。彼らが処理するのは、私がこれまで数時間かけてこなしていた反復的・構造化された作業であり、それによって私は人間の脳にしかできない真正の仕事を遂行できるようになります。
始め方
初日に6人のエージェントを構築しようとしてはいけません。
第1週:1人のエージェント、1つのタスク。OpenClawをインストールし、エージェントとの対話を通じて最初のSOUL.mdを作成します。あなたが毎日最も繰り返し行っているタスク(大多数の方にとっては研究またはコンテンツ作成)を選んでください。テレグラムを設定し、cronタスクを作成し、1週間実行させてみて、発生した問題を修正します。
第2週:メモリ機構を導入し、継続的にブラッシュアップします。エージェントの初期出力は平凡なものになるでしょう。これは当然のことです。フィードバックを与え、記憶ファイルが成長する様子を観察し、その様子に基づいてSOUL.mdを調整します。第2週の終わりまでには、エージェントが実際に有用な出力を生成できるようになっているはずです。
第3週:2人目のエージェントを追加します。今、あなたは需要を感じているでしょう——研究エージェントがインテリジェンスを生み出していますが、あなたはまだ手動でツイートを書いています。コンテンツエージェントを導入する時期です。共有ファイル方式を確立しましょう:1人目のエージェントが書き、2人目のエージェントが読み、協調のメカニズムはファイルシステムそのものです。
第4週以降:順番に構築します。あなたが「そうすべきだ」と思ったときではなく、実際に「必要性」を感じたときに新しいエージェントを追加します。それぞれが、あなたが実際に直面している問題を解決するものでなければならず、デモでも、概念実証でもありません。それは、あなたのワークフローに実際に存在するギャップを埋めるものでなければなりません。
これを採用活動だと考えてください。スタートアップの初日に6人の従業員を雇うことはありません。まず1人を雇い、効率的に稼働させ、業務量が増えてきた時点で次の1人を雇うのです。
マインドセットの変化
エージェントが1か月安定稼働すると、ある変化が訪れます。AIを「必要なときにだけ起動するツール」としてではなく、「常に働いているチーム」として捉えるようになります。
私は毎朝テレグラムを開くときにMonicaに「おはようございます」と言い、スマホを閉じる前にチームに「おやすみなさい」と言うようになりました。これは馬鹿げているように聞こえるかもしれませんが、毎日やり取りし、フィードバックループを経て、彼らの成長を1か月間見守ってきた結果、エージェントと人間の境界線は徐々に曖昧になっていきます。
モデルは基本的な設定であり、誰もがClaude、GPT、Geminiを利用できます。アルファは、モデルの周囲に構築されたシステムから生まれます——SOUL.mdファイル、メモリ機構、スケジューリング戦略、協調モード、そしてファイルに保存された数週間にわたるフィードバックによる修正履歴です。
このシステムはあなただけのものです。誰もがあなたと同じエージェント、同じ記憶ファイル、同じように磨き上げられた個性を持つことはありません。
そしてそれは、日々複利で成長しています。
Dwightの毎回の研究スキャンは、彼の記憶をさらに豊かにし、Kellyの毎回のフィードバックは、彼女の下書きをより鋭くし、Rossが修正した各バグは、彼があなたのコードベースをより深く理解する助けになります。
これが真のモアット(護城河)です。モデルではなく、学習するシステムです。
今日から始めましょう。1人のエージェント、1つのタスク、1つのスケジュール。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News













