
ClawdBot 創業者との対話:AI はレバレッジであり、代替手段ではない
TechFlow厳選深潮セレクト

ClawdBot 創業者との対話:AI はレバレッジであり、代替手段ではない
「プログラミング言語はもはや重要ではなく、重要なのは私のエンジニアリング思考です。」
編集:宝玉
これは、ClawdBot/OpenClaw の作者である Peter Steinberger 氏による、もう一つの40分間のインタビューです。司会は Peter Yang 氏です。
Peter 氏は、PSPDFKit の創業者であり、iOS 開発経験が約20年に及びます。2021年、同社は Insight Partners から戦略的投資として1億ユーロを調達し、その後彼は「引退」を選択しました。現在、彼が開発した Clawdbot(現・OpenClaw)が話題沸騰中です。Clawbot は WhatsApp、Telegram、iMessage を通じてユーザーと会話できるAIアシスタントで、その背後にはユーザーのパソコン上で動作するさまざまなアプリケーションが接続されています。
Peter 氏は、Clawbot を次のように表現しています:
「まるであなたのパソコンの中に住んでいる友人のようだ。ちょっと変だけれど、驚くほど賢い。
このインタビューでは、彼が興味深い多くの見解を語っています。「複雑なエージェント(Agent)オーケストレーションシステムは『slop(ごった煮/無意味な出力)生成器』にすぎない」という理由、なぜ「AIを24時間連続稼働させる」ことが虚栄心の指標にすぎないのか、そしてなぜプログラミング言語そのものがもはや重要でなくなったのか、といったテーマについてです。
1時間でプロトタイプ、30万行のコード
Peter Yang 氏が「Clawbot とはそもそも何なのか? なぜロゴがロブスター(海老)なのか?」と尋ねました。
Peter Steinberger 氏は、まずロブスターの質問には直接答えず、あるエピソードを語りました。「引退」後に彼は、いわゆる「vibe coding(直感ベースのコーディング)」——つまりAIエージェントにコード作成を任せることでプログラミングを行うスタイルに没頭しました。しかし問題は、そのエージェントが30分も走る場合もあれば、2分で止まり、ユーザーに質問を投げてくることもある点です。食事に出かけた帰りに確認すると、すでに長時間フリーズしてしまっていることもあり、非常にイライラします。
そこで彼は、「スマホからいつでも自分のPCの状態を確認できるもの」が欲しくなりました。ただ、彼はそれを自ら手をつけることはありませんでした。なぜなら、「こんなものは大企業が必ず実現するはずだ」と思っていたからです。
「昨年11月になっても誰も実現していないのを見て、『じゃあ、自分でやろう』と思った。
最初のバージョンは極めてシンプルなものでした。WhatsApp を Claude Code に接続し、メッセージを送信するとAIが起動し、結果を返すという仕組みです。これを1時間で構築しました。
その後、このツールは「命を持った」のです。現在の Clawbot は約30万行のコードから成り、ほぼすべての主要なメッセージングプラットフォームに対応しています。
「これがまさに未来の方向性だと私は確信しています。今後、誰もが生涯を通じて付き添ってくれる、超強力なAIを持つようになるでしょう。
彼はまた、「一度AIにあなたのPCへのアクセス権限を与えてしまえば、基本的にあなたができることは何でもできるようになります」と述べています。

モロッコの朝
Peter Yang 氏は、「今はPCの前に座って監視する必要はなく、単に指示を出すだけでよい」と述べました。
Peter Steinberger 氏はうなずきましたが、別の話をしたいと話しました。
かつて彼はモロッコで友人の誕生日を祝っていた際、自分自身がClawbotを頻繁に使っていたことに気づきました。道を尋ねたり、レストランの推薦を頼んだりするのは些細なことでした。しかし、本当に驚いたのはその日の朝のことです。Twitterで、ある人が彼のオープンソースライブラリにバグがあるとツイートしたのです。
「私はそのツイートの写真を撮り、WhatsAppに送信しました。
AIはそのツイートの内容を読み取り、これはバグ報告であると理解しました。そして対応するGitリポジトリをcheckoutし、問題を修正し、コードをコミット。さらに、Twitterでその人物に「すでに修正済みです」と返信しました。
「そのとき、正直『これ、本当にできるの?』と思いました。
さらに驚くべき出来事もありました。彼は路上を歩いていて、面倒だからと音声メッセージを送信しました。ところが、実は彼はClawbotに音声メッセージ機能を一切実装していませんでした。
「画面に『入力中…』と表示された瞬間、『やばい、これで終わりだ』と思いました。ところが、AIは普通に返信してくれたのです。
後で彼がAIにどうやって実現したのかを尋ねると、こう答えたそうです。「受信したファイルには拡張子がありませんでしたので、ファイルヘッダーを確認したところOgg Opus形式だと判明しました。あなたのPCにはffmpegがインストールされていたため、それを用いてWAVに変換しました。次にwhisper.cppを探しましたが、インストールされていませんでした。しかし、あなたのOpenAI APIキー(key)を見つけたので、curlを使って音声をAPIに送信し、文字起こしを行いました。」
Peter Yang 氏はこれを聞いて、「こういうAIは本当に工夫がすごいですね。でも、少し怖い気もします」とコメントしました。
「ウェブ版ChatGPTよりもずっと優れています。まるで枷を外されたChatGPTのようなものです。多くの人はまだ気づいていませんが、Claude Codeなどのツールはプログラミングに強いだけでなく、どんな課題にも柔軟に対応できる能力を持っています。

CLI(コマンドラインインターフェース)軍団
Peter Yang 氏は、「これらの自動化ツールはどのように構築しているのですか? 自分で書いているのでしょうか、それともAIに依頼しているのでしょうか?」と尋ねました。
Peter Steinberger 氏は笑いました。
ここ数カ月、彼は自らの「CLI軍団」を着実に拡充し続けています。エージェントが最も得意とするのは何か? それはコマンドラインツールの呼び出しです。なぜなら、訓練データにはそれが大量に含まれているからです。
彼はGoogleサービス全体(Places APIを含む)にアクセスできるCLIを作成しました。また、MemeやGIFを検索する専用ツールも作り、AIがメッセージ返信時にMemeを送れるようにしました。さらに、音を可視化するツールまで作成し、AIが音楽を「体験」できるように試みました。
「私は地元のデリバリープラットフォームのAPIをハッキングし、AIが配達まであと何分かを教えてくれるようにしました。また、Eight SleepのAPIを逆解析して、ベッドの温度制御も可能にしました。
【注:Eight Sleepは、ベッド表面の温度を調整できるスマートマットレスで、公式にはAPIは提供されていません。】
Peter Yang 氏が「これらはすべてAIに依頼して作ったのですか?」と追及すると、Peter Steinberger 氏は次のように答えました。
「もっとも面白いのは、私がPSPDFKitでAppleエコシステム開発を20年間行ってきたことです。SwiftやObjective-Cに精通しており、非常に専門的でした。しかし、復帰後は別の道を選ぶことに決めました。Appleがすべてを管理しようとするやり方に嫌気が差し、Macアプリの市場規模が小さすぎると思ったからです。
しかし、ある技術スタックから別のものへと移行する過程は非常に苦しいものでした。概念はすべて理解できても、文法が分からないのです。「propとは何か?」「配列を分割するにはどうすればいい?」といった小さな疑問ひとつひとつを調べなければならず、自分がまるで初心者のように感じられました。
「ところがAIの登場によって、こうした苦しみはすべて消え去りました。システム思考力、アーキテクチャ設計能力、審美眼、依存関係の判断力——これらこそが真に価値のあるスキルであり、今ではあらゆる分野へ容易に転用できます。
彼は一瞬間を置いて、こう続けました。
「突然、自分には何でも作れるような気がしたのです。プログラミング言語はもはや重要ではなく、私のエンジニアリング的思考力が本質なのです。

現実世界の制御
Peter Steinberger 氏は、自分の環境設定を実際にデモし始めました。AIに与えられた権限の一覧は驚くほど広範囲に及びます。
メール、カレンダー、すべてのファイル、Philips Hue照明、Sonosスピーカー。彼はAIに朝に起こしてもらい、徐々に音量を上げるように指示できます。さらにAIはセキュリティカメラへのアクセスも可能です。
「あるとき、AIに『不審者がいないか監視しておいて』と指示しました。翌朝、AIは『Peterさん、不審者がいます』と告げました。録画映像を見返すと、AIは一晩中私のソファをスクリーンショットし続けていたのです。カメラの画質が悪かったため、ソファが人間のように見えていたようです。
ウィーンのアパートでは、AIはKNXスマートホームシステムの制御も可能です。
「本当に私を家の外に閉じ込めてしまうこともできます。
Peter Yang 氏が「これらはどのように接続されているのですか?」と尋ねると、Peter Steinberger 氏はこう答えました。
「単にAIにそう言うだけです。こうしたAIはとても工夫が上手で、APIを探したり、Google検索をしたり、あなたのシステム内からAPIキーを探し出したりします。
ユーザーたちの使い方はさらに大胆です:
- あるユーザーはTescoのオンラインショッピングをAIに依頼
- あるユーザーはAmazonでの注文をAIに依頼
- あるユーザーはすべてのメッセージをAIが自動返信するように設定
- あるユーザーはAIを家族グループチャットに招待し、「家族の一員」として扱っている
「私はBritish AirwaysのウェブサイトでチェックインをAIに依頼しました。これはまさにチューリングテストです。航空会社のウェブサイト上でブラウザ操作を行うのですが、あのUIの反直感的な難しさはご存知の通りです。
初回は約20分かかりました。当時はシステムがまだ未熟だったため、AIはDropbox内からパスポートを検索し、情報を抽出してフォームを埋め、人間による認証(CAPTCHAなど)を通過しなければならなかったのです。
「今では数分で完了します。AIは『私は人間です』ボタンをクリックできます。なぜなら、AIは実在のブラウザを完全に制御しており、その行動パターンは人間とまったく区別がつかないからです。

アプリの80%が消える
Peter Yang 氏は、「新規ユーザーが安全に始めるための、おすすめの使い方を教えてください」と尋ねました。
Peter Steinberger 氏は、「それぞれのユーザーが異なる道を歩みます」と答えました。ある人はインストール直後からiOSアプリの開発を始め、ある人はすぐにCloudflareの管理を開始します。あるユーザーは1週目は自分用に導入、2週目は家族に導入、3週目には企業向けバージョンの開発を始めたといいます。
「私は非技術系の友人にClawbotを導入したところ、彼が私にpull requestを送ってくるようになりました。彼は人生で一度もpull requestを送ったことがありませんでした。
しかし、彼が本当に語りたいのは、より大きな展望です。
「考えてみてください。このツールは、あなたのスマートフォン上のアプリの80%を置き換えてしまう可能性があります。
なぜMyFitnessPalを使って食事を記録する必要があるでしょうか?
「私は無限のリソースを持つアシスタントを持っています。すでにケンタッキーで失敗した選択をしたことを認識済みです。写真を送るだけで、AIはそれをデータベースに保存し、カロリーを計算し、ジムに行くよう促してくれます。
なぜEight Sleepの温度設定をアプリで行う必要があるでしょうか? AIはAPI権限を持っているため、直接設定してくれます。なぜタスク管理アプリを使う必要があるでしょうか? AIがすべて記憶してくれます。なぜフライトチェックインのアプリを使う必要があるでしょうか? AIが代わりに行います。なぜショッピングアプリを使う必要があるでしょうか? AIが商品を推薦し、注文し、配送状況を追跡します。
「アプリの層全体がゆっくりと消えていくでしょう。なぜなら、APIがあれば、それらは単にAIが呼び出すサービスに過ぎなくなるからです。
彼は、2026年が個人向けAIアシスタントの探求が本格的に始まる年になると予測し、大手企業も参入すると見ています。
「Clawbotが最終的に勝者になるとは限りませんが、この方向性は正しいものです。

Just Talk to It(ただ話しかけるだけ)
話題はAIプログラミングの方法論へと移ります。Peter Yang 氏は、「Just Talk to It」というタイトルの、非常に話題となった記事を書いたと紹介し、その詳細な説明を求めました。
Peter Steinberger 氏の核心的な主張は、「エージェント・トラップ(agentic trap)」にはまらないことです。
「私はTwitterで、エージェントの強さに気づいた人々が、さらにそれを強化しようと躍起になり、結果として『ウサギ穴』に落ち込んでしまう様子を何度も見ています。彼らはワークフローを加速するために複雑なツールを構築しますが、結局はツール作りに終始し、真に価値あるものを生み出していません。
彼自身もその罠に陥ったことがあります。初期段階で、スマホから端末にアクセスするためだけにVPNトンネルを2カ月かけて構築しました。あまりに完成度が高かったため、ある日、レストランで友人と食事をしていた際、彼は会話に参加せず、ずっとスマホでvibe codingをしてしまったのです。
「私は自分自身の精神衛生のために、その作業をやめざるを得ませんでした。

Slop Town(ごった煮町)
最近、彼を最も苛立たせていたのは「Gastown」と呼ばれるオーケストレーションシステムです。
「これは極めて複雑なオーケストレーターで、同時に10〜20個のエージェントを実行し、それらが互いに通信・分担します。『ウォッチャー(観察者)』、『オーバーシャー(監督者)』、『メイヤー(市長)』、『pcats(多分『一般市民』または『ペットの猫』など、冗談で入れられた役割)』など、他にも何があるのか分かりません。
Peter Yang 氏:「待ってください。市長もいるんですか?」
「はい、Gastownプロジェクトには『市長』がいます。私はこのプロジェクトを『ごった煮町(Slop Town)』と呼んでいます。
さらにRALPHモード(「使い捨て」型の単一タスクループ。AIに小さなタスクを与え、完了したらすべてのコンテキストや記憶を破棄し、ゼロから再スタートする、という繰り返し処理)……
「これは究極のトークン燃費機です。一晩中走らせたとしても、翌朝得られるのは究極のごった煮(slop)です。
問題の核心は、「これらのエージェントにはまだ『審美眼』がない」ことです。ある面では驚くほど賢いですが、あなたが適切に導かず、望む結果を明示しない限り、出力されるのは単なるごった煮です。
「他人がどのように仕事をしているかは知りませんが、私がプロジェクトを始めるときは、いつも漠然としたアイデアしかありません。構築し、遊び、感じながら、徐々にビジョンが明確になっていきます。いくつかの試みをし、うまくいかないものもあり、その都度考えが進化して、最終的な形へと至ります。次のプロンプト(提示文)は、私が見たもの、感じたもの、考えたものに基づいて決まります。
もしすべてを事前の仕様書に詰め込もうとすれば、こうした人間とAIの相互作用のサイクルを逃すことになります。
「感覚も審美眼も伴わないまま、良いものを生み出すことができるとは思えません。
Twitterでは、「RALPHのみで生成された」ノートアプリを自慢する投稿がありました。Peter 氏はこれに対し、「確かにRALPHが生成したように見えます。普通の人がそんなデザインをするはずがありません」と返信しました。
Peter Yang 氏はまとめました。「多くの人がAIを24時間走らせるのは、アプリを作るためではなく、『自分はAIを24時間走らせることができる』という証明のためです。」
「これは、基準となる比較対象がないままの『大きさ比べ』のようなものです。私も26時間ループを走らせたことがありますが、そのときはとても満足していました。しかし、これは単なる虚栄心の指標であり、何の意味もありません。『すべてを作れる』ということは、『すべてを作るべき』ということでもなければ、『それが良いものになる』ということでもありません。

Plan Modeはハック(ごまかし)にすぎない
Peter Yang 氏は、「コンテキスト管理はどのように行っていますか? 長い会話になるとAIが混乱してしまうので、手動で圧縮したり要約したりする必要はないですか?」と尋ねました。
Peter Steinberger 氏は、「これは旧来の方式の問題です」と答えました。
「Claude Codeにはまだこの問題がありますが、Codexははるかに優れています。紙面上ではコンテキスト長が30%ほどしか増えていませんが、実感としては2〜3倍の余裕があります。これは内部の推論機構に関係しているのだと思います。現在、私のほとんどの機能開発は、単一のコンテキストウィンドウ内で完結できており、議論と構築が同時進行で行われています。
彼はworktrees(作業ツリー)は使いません。なぜなら「不必要な複雑さ」だからです。代わりに、clawbot-1、clawbot-2、clawbot-3、clawbot-4、clawbot-5 のように、複数のリポジトリを並列でcheckoutしています。空いているものを使い、テストを終えたらmainブランチへプッシュし、同期させます。
「工場のようなイメージです。すべてが忙しい場合はそうなりますが、1つだけ使うと待ち時間が長くなり、フロー状態に入れないのです。
Peter Yang 氏は、「これはリアルタイムストラテジー(RTS)ゲームのようですね。攻撃部隊を率いており、その管理と監視が必要です」と述べました。
Plan Mode(計画モード)に関して、Peter Steinberger 氏は次のような物議を醸す見解を述べました。
「Plan Modeは、Anthropic社がやむを得ず導入したハック(ごまかし)です。なぜなら、モデルが衝動的すぎて、いきなりコードを書き始めてしまうからです。最新のモデル、例えばGPT 5.2を使えば、単に会話するだけで済みます。『この機能を作りたい。こうすべきだ、ああすべきだ。このデザインスタイルが好きだ。いくつかの案を出して、まず話し合おう』と伝えると、AIは提案を行い、あなたと議論し、合意に至った後に実装を始めます。
彼はタイピングしません。話します。
「私はほとんど常に話しかけています。

Discord駆動開発
Peter Yang 氏は、「新しい機能を開発する際のプロセスはどのようなものですか? まず問題を探索する? それともまず計画を立てる?」と尋ねました。
Peter Steinberger 氏は、「私がこれまでに行った中で、おそらく最も狂気じみた行為」と表現する一件のことを語りました。彼は自分のClawbotを公開Discordサーバーに接続し、誰もが彼のパーソナルAIと、彼のパーソナルな記憶を共有した状態で、公開の場で会話できるようにしたのです。
「このプロジェクトを言葉で説明するのは非常に難しいです。映画『アイアンマン』のジャーヴィスと、『HER(ヒア)』のAIが融合したような存在です。実際に私が対面でデモすると、誰もが非常に興奮しますが、Twitterで画像とキャプションを投稿しても、まったく話題になりません。そこで、『自分で体験してもらう』ことにしました。
ユーザーたちはDiscordで質問をしたり、バグを報告したり、新機能を要望したりします。現在の彼の開発プロセスは、Discordの会話スクリーンショットを撮り、それをターミナルにドラッグ&ドロップし、「この件について話し合おう」とAIに伝えるというものです。
「私はタイピングするのが面倒なので、『この機能はサポートされていますか?』という質問に対しては、AIにコードを読ませ、FAQを1本書いてもらっています。
さらに、彼はクローラーを自作し、毎日少なくとも1回、Discordのhelpチャンネルをスキャンして、AIに最大の課題を要約させ、それを解決するという運用も行っています。

MCPも、複雑なオーケストレーションも不要
Peter Yang 氏は、「あなたは多エージェント、複雑なスキル、MCP(Model Context Protocol)などの華やかな技術を使っていますか?」と尋ねました。
「私のスキルの多くは生活スキルです。食事記録、買い物など、そういうものです。プログラミングに関するスキルはほとんどありません。そもそも必要ないからです。私はMCPも使わず、こうした技術は一切使っていません。
彼は複雑なオーケストレーションシステムを信用していません。
「私は『人間がループの中にいる』状態で、より良い感触の製品を作ることができます。あるいは、もっと速い方法もあるかもしれませんが、私は既にAIがボトルネックではなく、むしろ自分の思考速度や、たまにCodexの応答を待つ時間の方がボトルネックになっています。
彼の前PSPDFKit共同創業者で、元弁護士の人も、今では彼にPR(pull request)を送ってくるようになりました。
「AIは、技術的背景のない人々にもものづくりを可能にします。これは驚くべきことです。もちろん、『このようなコードは完璧ではない』と反論する人もいます。しかし、私はそのpull requestを『プロンプトリクエスト』と見なし、そこに込められた『意図』を重視しています。ほとんどの人は、同じシステム理解を持っていないため、モデルを最適な結果へと導くことができません。だから私は、まずその『意図』を受け取り、それをもとに自分で実装したり、あるいはそのPRを基に書き直したりします。
彼は共同著者(co-author)として彼らを記載しますが、他人のコードをそのままマージすることはほとんどありません。

自分だけの道を見つける
Peter Yang 氏はまとめました。「したがって、肝心なポイントは、slop generator(ごった煮生成器)を使わず、人間をループの中に保つことです。なぜなら、人間の脳と審美眼は代替不可能だからです。」
Peter Steinberger 氏は補足しました。
「あるいは、自分だけの道を見つけることです。多くの人が『あなたはどうやってやっているのですか?』と聞きますが、答えは『あなた自身で探すしかない』です。こうしたスキルを習得するには時間がかかり、自分の間違いを犯す必要があります。これは他のどんなスキルを学ぶときと同じですが、ただ、この分野は特に変化が激しいのです。
ClawdBot は clawd.bot およびGitHubで入手可能です。CladはWを含み、C-L-A-W-D-B-O-Tと綴り、ロブスターのハサミを連想させます。
(注:ClawdBotはすでにOpenClawに名称変更済み)
Peter Yang 氏は、「私も試してみようと思います。PCの前に座ってAIと会話するのではなく、外で子どもを連れて歩いているときに、いつでも指令を出せるようになりたいです。」と述べました。
「きっと気に入ると思いますよ。」Peter Steinberger 氏はそう言いました。

Peter Steinberger 氏の核心的な主張は、以下の2文に集約されます:
- AIはすでに、あなたのスマートフォン上のアプリの80%を置き換えられるほど強力になっている
- しかし、ループの中に人間の審美眼と判断がなければ、出力されるのは単なるごった煮(slop)である
一見矛盾するこの2つの主張は、実は同じ結論を指しています:AIはレバレッジ(てこ)であり、代替品ではありません。AIはあなたの既存の資産——システム思考力、アーキテクチャ設計能力、優れた製品に対する直感——を拡大するだけです。それらがなければ、どれだけ多くのエージェントを24時間並列稼働させても、ただ大量のslopを生産するだけです。

彼の実践そのものが、最高の証左です:20年のiOS開発経験を持つベテランプログラマーが、数カ月のうちにTypeScriptで30万行のコードからなるプロジェクトを構築しました。それは新しい言語の文法を学んだからではなく、言語に依存しない、普遍的なスキルを活かしたからです。
「プログラミング言語はもはや重要ではありません。重要なのは私のエンジニアリング的思考力です。」
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News













