
Entretien avec le fondateur de ClawdBot : l’IA est un levier, pas un substitut
TechFlow SélectionTechFlow Sélection

Entretien avec le fondateur de ClawdBot : l’IA est un levier, pas un substitut
« Les langages de programmation ne sont plus importants ; ce qui compte, c’est ma capacité à penser comme un ingénieur. »
Rédaction : Bao Yu
Il s’agit d’un autre entretien de 40 minutes avec Peter Steinberger, créateur de ClawdBot/OpenClaw, animé par Peter Yang.
Peter est le fondateur de PSPDFKit et possède près de 20 ans d’expérience en développement iOS. Après qu’Insight Partners ait réalisé un investissement stratégique de 100 millions d’euros dans sa société en 2021, il a choisi de « prendre sa retraite ». Aujourd’hui, son outil Clawdbot (désormais rebaptisé OpenClaw) connaît un succès fulgurant. Clawbot est un assistant IA capable de discuter avec vous via WhatsApp, Telegram ou iMessage, tout en étant connecté aux diverses applications installées sur votre ordinateur.
C’est ainsi que Peter décrit Clawbot :
« C’est comme un ami qui vit dans votre ordinateur — un peu bizarre, mais d’une intelligence effrayante. »
Dans cet entretien, il partage plusieurs idées fascinantes : pourquoi les systèmes complexes d’orchestration d’agents constituent des « générateurs de slop » (de « bouillie »), pourquoi laisser une IA fonctionner 24 heures d’affilée n’est qu’un indicateur de vanité, et pourquoi les langages de programmation ne comptent plus.
Un prototype en une heure, 300 000 lignes de code
Peter Yang demande à Peter Steinberger ce qu’est réellement Clawbot, et pourquoi son logo représente un homard.
Peter Steinberger ne répond pas directement à la question sur l’homard, mais raconte plutôt une histoire. Après sa « retraite », il s’est pleinement plongé dans la « vibe coding » — une méthode de programmation intuitive assistée par des agents IA. Le problème ? Ces agents peuvent tourner pendant une demi-heure… ou s’arrêter au bout de deux minutes pour vous poser une question. Vous partez déjeuner, et à votre retour, vous constatez qu’ils sont bloqués depuis longtemps — très frustrant.
Il voulait un moyen de consulter à tout moment l’état de son ordinateur depuis son téléphone. Mais il ne s’y est pas attaqué immédiatement, car cela lui semblait tellement évident qu’il était convaincu qu’une grande entreprise le ferait forcément.
« En novembre dernier, constatant que personne ne l’avait encore fait, j’ai finalement décidé : bon, je m’en occupe moi-même. »
La première version était extrêmement simple : connecter WhatsApp à Claude Code. Envoyez un message, l’IA exécute une tâche, puis renvoie le résultat. Tout a été mis en place en une heure.
Ensuite, le projet a pris vie. Aujourd’hui, Clawbot compte environ 300 000 lignes de code et prend en charge presque toutes les plateformes de messagerie populaires.
« Je pense que c’est là que va l’avenir. Chacun aura bientôt un assistant IA d’une puissance exceptionnelle, qui l’accompagnera toute sa vie. »
Il affirme : « Une fois que vous accordez à l’IA l’autorisation d’accéder à votre ordinateur, elle peut fondamentalement accomplir tout ce que vous êtes capable de faire. »

Un matin au Maroc
Peter Yang remarque que désormais, vous n’avez plus besoin de rester assis devant votre ordinateur à surveiller l’IA — il suffit de lui donner des instructions.
Peter Steinberger acquiesce, mais souhaite parler d’autre chose.
Une fois, lors d’un voyage au Maroc pour l’anniversaire d’un ami, il s’est rendu compte qu’il utilisait sans cesse Clawbot : demander son chemin, obtenir des recommandations de restaurants — autant de petites choses. Ce qui l’a véritablement surpris, ce fut ce matin-là : quelqu’un avait publié sur Twitter un tweet signalant un bogue dans l’une de ses bibliothèques open source.
« J’ai pris une photo du tweet et l’ai envoyée sur WhatsApp. »
L’IA a compris le contenu du tweet, identifié qu’il s’agissait d’un rapport de bogue, effectué un checkout du dépôt Git correspondant, corrigé le problème, soumis le correctif, puis répondu sur Twitter à l’auteur du tweet en indiquant que le problème était résolu.
« À ce moment-là, je me suis dit : ça marche vraiment ? »
Une autre fois, encore plus incroyable : il marchait dans la rue, trop paresseux pour taper un message, et envoya donc un message vocal. Or, il n’avait jamais implémenté de support pour les messages vocaux dans Clawbot.
« J’ai vu apparaître l’indication “en train de taper” et j’ai pensé : c’est foutu. Et pourtant, elle m’a répondu normalement. »
Plus tard, il a demandé à l’IA comment elle avait procédé. Elle a répondu : « J’ai reçu un fichier sans extension. J’ai donc examiné son en-tête et identifié le format Ogg Opus. Votre ordinateur dispose de ffmpeg, alors je l’ai utilisé pour convertir le fichier en WAV. Ensuite, j’ai cherché whisper.cpp, mais vous ne l’avez pas installé. J’ai toutefois trouvé votre clé API OpenAI (key) et utilisé curl pour envoyer l’audio et obtenir la transcription. »
Peter Yang, après avoir entendu cela, commente : « Ces outils sont vraiment ingénieux — même si cela fait un peu peur. »
« C’est bien plus puissant que la version web de ChatGPT — on dirait un ChatGPT libéré de ses chaînes. Beaucoup ne réalisent pas que des outils comme Claude Code ne se distinguent pas seulement par leur capacité à programmer : ils font preuve d’une grande ingéniosité face à n’importe quel type de problème. »

L’armée des outils CLI
Peter Yang demande comment sont construits ces outils d’automatisation : les écrit-il lui-même, ou laisse-t-il l’IA les créer ?
Peter Steinberger sourit.
Ces derniers mois, il a considérablement étoffé son « armée CLI ». Quelle est la spécialité des agents IA ? Lancer des outils en ligne de commande — car leurs données d’entraînement en regorgent.
Il a ainsi créé une interface CLI permettant d’accéder à l’ensemble des services Google, y compris Places API. Il a développé un outil spécialisé dans la recherche de mèmes et de GIFs, afin que l’IA puisse insérer des mèmes dans ses réponses. Il a même conçu un outil de visualisation sonore, pour permettre à l’IA de « ressentir » la musique.
« J’ai aussi piraté l’API locale de la plateforme de livraison de repas ; aujourd’hui, l’IA peut me dire combien de temps il reste avant que mon plat arrive. J’ai également inversé l’API d’Eight Sleep pour pouvoir régler la température de mon lit. »
[Note : Eight Sleep est un matelas intelligent permettant de régler la température de la surface du lit ; son API n’est pas officiellement ouverte.]
Peter Yang insiste : « Ce sont tous des outils que vous avez demandé à l’IA de créer ? »
« Ce qui est le plus intéressant, c’est que j’ai passé 20 ans chez PSPDFKit à développer dans l’écosystème Apple, avec Swift et Objective-C — une expertise très pointue. Mais à mon retour, j’ai décidé de changer de domaine, car j’en avais assez que tout soit contrôlé par Apple, et parce que le marché des applications Mac est trop restreint. »
Le problème ? Passer d’une pile technologique maîtrisée à une autre est extrêmement pénible. Vous comprenez tous les concepts, mais ignorez la syntaxe. Qu’est-ce qu’une « prop » ? Comment diviser un tableau ? Chaque petite question nécessite une recherche, et vous avez l’impression d’être un parfait débutant.
« Puis est arrivée l’IA, et tout cela a disparu. Votre pensée système, vos compétences architecturales, votre sens du goût, votre capacité à juger les dépendances — voilà ce qui est véritablement précieux. Et aujourd’hui, ces compétences peuvent facilement être transférées à n’importe quel domaine. »
Il marque une pause :
« Soudain, j’ai eu l’impression que je pouvais construire n’importe quoi. Le langage n’a plus d’importance : ce qui compte, c’est ma pensée d’ingénieur. »

Contrôler le monde réel
Peter Steinberger commence à démontrer sa configuration. La liste des autorisations accordées à l’IA est impressionnante :
Courriels, calendrier, tous les fichiers, éclairage Philips Hue, enceintes Sonos. Il peut demander à l’IA de le réveiller le matin en augmentant progressivement le volume. L’IA peut aussi accéder à ses caméras de sécurité.
« Une fois, je lui ai demandé de surveiller s’il y avait des inconnus. Le lendemain matin, elle m’a dit : “Peter, il y a quelqu’un.” J’ai regardé l’enregistrement vidéo : toute la nuit, elle avait pris des captures d’écran de mon canapé, car la qualité de la caméra était médiocre, et le canapé ressemblait à une personne assise. »
Dans son appartement viennois, l’IA contrôle également le système domotique KNX.
« Elle pourrait vraiment me verrouiller dehors. »
Peter Yang demande : « Comment ces intégrations ont-elles été réalisées ? »
« Je le lui dis simplement. Ces outils sont très ingénieux : ils trouvent eux-mêmes les API, font des recherches sur Google, explorent votre système à la recherche de clés d’API. »
Les utilisateurs vont encore plus loin :
- Certains lui demandent de passer des commandes sur le site Tesco
- D’autres l’utilisent pour commander sur Amazon
- D’autres encore lui confient la gestion automatique de toutes leurs notifications
- D’autres encore l’ajoutent à leur groupe familial sur les réseaux sociaux comme un « membre de la famille »
« Je lui ai demandé de m’effectuer le check-in sur le site de British Airways. C’est presque un test de Turing : piloter un navigateur sur le site d’une compagnie aérienne, dont l’interface est notoirement contre-intuitive. »
La première tentative a duré près de 20 minutes, car le système était encore très rudimentaire. L’IA devait retrouver son passeport dans Dropbox, en extraire les informations, remplir le formulaire et passer la vérification CAPTCHA.
« Aujourd’hui, cela ne prend plus que quelques minutes. Elle clique sur le bouton “Je suis humain”, car elle contrôle un vrai navigateur, avec un comportement indiscernable de celui d’un humain. »

80 % des applications disparaîtront
Peter Yang demande : « Pour un utilisateur lambda qui vient juste d’installer l’application, quelles sont des utilisations sûres pour commencer ? »
Peter Steinberger répond que chaque parcours est différent. Certains utilisent immédiatement l’outil pour écrire des applications iOS, d’autres se lancent directement dans la gestion de Cloudflare. Un utilisateur l’a installé la première semaine pour lui-même, la deuxième semaine pour sa famille, et la troisième semaine pour déployer une version entreprise dans son entreprise.
« Après l’avoir installé chez un ami non technique, celui-ci a commencé à m’envoyer des pull request. Il n’en avait jamais envoyé une de sa vie. »
Mais ce qu’il veut vraiment souligner, c’est la vision d’ensemble :
« Si vous y réfléchissez, cet outil pourrait remplacer 80 % des applications installées sur votre smartphone. »
Pourquoi utiliser MyFitnessPal pour suivre votre alimentation ?
« J’ai un assistant infiniment ingénieux, qui sait déjà que j’ai fait un mauvais choix au Kentucky Fried Chicken. Je lui envoie une photo, et il l’enregistre dans la base de données, calcule les calories et me rappelle d’aller à la salle de sport. »
Pourquoi utiliser une application pour régler la température d’Eight Sleep ? L’IA dispose déjà des autorisations API, elle le fait directement. Pourquoi utiliser une application de gestion des tâches ? L’IA s’en charge. Pourquoi utiliser une application pour effectuer le check-in d’un vol ? L’IA s’en charge. Pourquoi utiliser une application d’achats en ligne ? L’IA peut vous recommander, commander et suivre la livraison.
« Une couche entière d’applications va progressivement disparaître, car dès lors qu’elles disposent d’une API, elles ne sont plus que des services appelés par votre IA. »
Il prédit que 2026 sera l’année où de nombreuses personnes commenceront à explorer les assistants IA personnels, et où les grandes entreprises entreront également sur ce marché.
« Clawbot n’est pas nécessairement le gagnant final, mais la direction prise est la bonne. »

Just Talk to It
La discussion aborde désormais la méthodologie de programmation IA. Peter Yang mentionne un article très populaire qu’il a rédigé, intitulé « Just Talk to It », et demande à Peter Steinberger de l’approfondir.
Le point central de Peter Steinberger est le suivant : évitez le « piège de l’agent » (agentic trap).
« J’ai vu sur Twitter trop de gens découvrir à quel point les agents sont puissants, puis vouloir les rendre encore plus performants, et finalement tomber dans un terrier de lapin. Ils construisent des outils de plus en plus complexes pour accélérer leurs flux de travail, mais ils ne font que créer des outils — pas des choses réellement utiles. »
Lui-même y est tombé. Au début, il a passé deux mois à mettre en place un tunnel VPN, uniquement pour pouvoir accéder à son terminal depuis son téléphone. Il a tellement bien réussi que, lors d’un déjeuner avec des amis au restaurant, il a passé tout le repas à coder depuis son téléphone, au lieu de participer à la conversation.
« J’ai dû arrêter, principalement pour préserver ma santé mentale. »

Slop Town
Récemment, ce qui l’a le plus agacé est un système d’orchestration nommé Gastown.
« Un orchestrateur incroyablement complexe, faisant tourner simultanément une dizaine ou une vingtaine d’agents qui communiquent entre eux et se répartissent les tâches. Il y a des observateurs (watcher), des superviseurs (overseer), un maire (mayor), des pcats (probablement des rôles bidons, comme “citoyens” ou “chats domestiques”), je ne sais même plus quoi d’autre. »
Peter Yang : « Attendez, il y a aussi un maire ? »
« Oui, le projet Gastown comporte un maire. J’appelle ce projet “Slop Town” (la ville de la bouillie). »
Il y a aussi le mode RALPH (un cycle mono-tâche « jetable », où l’on confie une petite tâche à l’IA, puis on supprime complètement tout contexte après exécution, pour recommencer à zéro — en boucle infinie)…
« C’est la machine ultime de combustion de tokens. Vous la faites tourner toute la nuit, et au matin, vous obtenez la bouillie ultime (slop). »
Le cœur du problème est que ces agents ne possèdent pas encore de « goût ». Ils sont d’une intelligence stupéfiante dans certains domaines, mais si vous ne les guidez pas, si vous ne leur précisez pas ce que vous attendez, le résultat est de la bouillie.
« Je ne sais pas comment travaillent les autres, mais quand je lance un projet, je n’ai qu’une idée floue. Au fur et à mesure de la construction, des expérimentations, des découvertes intuitives, ma vision se précise progressivement. J’essaie certaines choses, certaines ne fonctionnent pas, et mes idées évoluent jusqu’à atteindre leur forme finale. Mon prochain prompt dépend de ce que je vois, ressens et pense à cet instant précis. »
Si vous tentez de tout formaliser dans une spécification initiale, vous manquez cette boucle homme-machine.
« Je ne vois pas comment on pourrait concevoir quelque chose de bon sans implication sensorielle ni sens du goût. »
Quelqu’un a vanté sur Twitter une application de prise de notes entièrement générée en mode RALPH. Peter a répondu : « Oui, elle ressemble effectivement à une application générée en mode RALPH — aucun être humain ne la concevrait ainsi. »
Peter Yang résume : « Beaucoup font tourner une IA 24 heures non pas pour créer une application, mais pour prouver qu’ils peuvent la faire tourner 24 heures. »
« C’est comme une compétition de taille sans point de comparaison. J’ai moi-même fait tourner une boucle pendant 26 heures, et j’en étais fier sur le moment. Mais c’est un indicateur de vanité, totalement dénué de sens. Pouvoir construire n’importe quoi ne signifie pas qu’on devrait tout construire — ni que ce sera forcément bien. »

Le mode Plan est un « bricolage »
Peter Yang demande comment il gère le contexte. Lorsque la conversation s’allonge, l’IA perd le fil : faut-il résumer manuellement ou compresser le contexte ?
Peter Steinberger explique que c’est un problème hérité des anciens modèles.
« Claude Code souffre encore de ce problème, mais Codex est bien meilleur. Sur le papier, le contexte disponible n’est augmenté que de 30 %, mais la différence perçue est de 2 à 3 fois. Je pense que cela tient à ses mécanismes internes de raisonnement. Aujourd’hui, la plupart de mes développements fonctionnels s’effectuent dans une seule fenêtre de contexte, où discussion et construction se déroulent simultanément. »
Il n’utilise pas de worktrees, car ce serait « une complexité inutile ». Il se contente de cloner plusieurs copies du dépôt : clawbot-1, clawbot-2, clawbot-3, clawbot-4, clawbot-5. Il utilise celle qui est libre, teste, pousse vers la branche principale (main), puis synchronise.
« C’est un peu comme une usine : si toutes sont occupées, on attend. Mais si vous n’en activez qu’une, les délais d’attente sont trop longs pour entrer dans un état de concentration optimale (flow). »
Peter Yang compare cela à un jeu de stratégie en temps réel, où vous commandez une armée et devez la gérer et la surveiller.
Concernant le mode Plan, Peter Steinberger défend une opinion controversée :
« Le mode Plan est un bricolage qu’Anthropic a dû ajouter, car le modèle est trop impulsif : il se précipite directement vers l’écriture de code. Avec les modèles les plus récents, comme GPT 5.2, vous dialoguez simplement avec lui : “Je veux créer cette fonctionnalité, elle devrait fonctionner ainsi, j’aime ce style de conception — propose-moi plusieurs solutions, discutons-en d’abord.” Il formule alors des propositions, vous en débattez, parvenez à un consensus, puis vous passez à la phase de réalisation. »
Il ne tape pas : il parle.
« Je parle presque toujours avec lui. »

Développement piloté par Discord
Peter Yang demande quelle est sa méthode pour développer de nouvelles fonctionnalités : exploration préalable du problème ? Planification préalable ?
Peter Steinberger raconte qu’il a fait « probablement la chose la plus folle qu’il ait jamais faite » : il a connecté son Clawbot à un serveur Discord public, permettant à n’importe qui de dialoguer avec son IA personnelle, dotée de sa mémoire privée, en pleine vue de tous.
« Ce projet est difficile à décrire en mots. C’est un mélange entre Jarvis (l’assistant IA d’Iron Man) et le film *Her*. Toute personne à qui je le montre en personne est enthousiasmée, mais lorsque je publie des captures d’écran sur Twitter avec une légende, cela ne décolle pas. J’ai donc décidé de laisser les gens l’expérimenter eux-mêmes. »
Les utilisateurs posent des questions, signalent des bogues ou proposent des fonctionnalités sur Discord. Son processus de développement actuel consiste à capturer une conversation sur Discord, glisser l’image dans le terminal, puis dire à l’IA : « Parlons de cela. »
« Je suis trop fainéant pour taper. Quand quelqu’un demande : “Prenez-vous en charge ceci ou cela ?”, je demande à l’IA de lire le code et de rédiger une FAQ. »
Il a également développé un robot qui scanne quotidiennement, au moins une fois par jour, le canal d’aide de Discord, pour que l’IA en résume les principaux points de friction — qu’ils corrigent ensuite.

Pas de MCP, pas d’orchestration complexe
Peter Yang demande : « Utilisez-vous ces technologies sophistiquées ? Agents multiples, compétences complexes, MCP (Model Context Protocol), etc. ? »
« La plupart de mes compétences sont des compétences de la vie quotidienne : suivre son alimentation, faire les courses, ce genre de choses. Très peu concernent la programmation, car ce n’est pas nécessaire. Je n’utilise pas MCP, ni aucun de ces outils. »
Il ne croit pas aux systèmes d’orchestration complexes.
« Je reste dans la boucle, et je peux ainsi créer des produits qui me semblent meilleurs. Peut-être existe-t-il des méthodes plus rapides, mais je suis déjà si rapide que la limite n’est plus l’IA : c’est surtout ma propre vitesse de réflexion, et parfois le temps d’attente pour Codex. »
Son ancien cofondateur de PSPDFKit, un ancien avocat, lui envoie désormais aussi des PR (pull request, demandes de fusion de code).
« L’IA permet à des personnes sans formation technique de créer des choses — c’est magique. Je sais que certains s’y opposent, arguant que ce code n’est pas parfait. Mais je considère les pull request comme des “prompt request” : elles expriment une intention. La plupart des gens ne possèdent pas la même compréhension systémique, et ne peuvent donc pas guider le modèle vers le résultat optimal. Je préfère donc recevoir l’intention, puis la traduire moi-même — ou réécrire le code à partir de leur PR. »
Il les crédite en tant que co-auteurs, mais fusionne rarement directement leur code.

Trouvez votre propre voie
Peter Yang conclut : « Le point essentiel est donc de ne pas utiliser de générateurs de slop, et de garder l’humain dans la boucle — car le cerveau humain et le sens du goût sont irremplaçables. »
Peter Steinberger ajoute :
« Ou plutôt : trouvez votre propre voie. Beaucoup me demandent “Comment faites-vous ?”. Ma réponse est : vous devez l’explorer vous-même. Apprendre ces compétences demande du temps, et nécessite de commettre ses propres erreurs. C’est comme apprendre n’importe quoi d’autre — sauf que ce domaine évolue particulièrement vite. »
Clawdbot est disponible sur clawd.bot et sur GitHub. « Clad » s’écrit avec un W : C-L-A-W-D-B-O-T, comme la pince d’un homard.
(Note : ClawdBot a été rebaptisé OpenClaw)
Peter Yang dit qu’il va lui aussi l’essayer. Il ne veut pas rester assis devant son ordinateur pour discuter avec l’IA, mais pouvoir lui donner des instructions à tout moment, même en sortant avec ses enfants.
« Je pense que vous allez l’adorer », dit Peter Steinberger.

Le point de vue central de Peter Steinberger peut se résumer en deux phrases :
- L’IA est désormais assez puissante pour remplacer 80 % des applications installées sur votre smartphone
- Mais sans le jugement humain et le sens du goût présents dans la boucle, le résultat n’est que de la bouillie
Ces deux affirmations, en apparence contradictoires, convergent vers une même conclusion : l’IA est un levier, pas un remplacement. Ce qu’elle amplifie, ce sont vos qualités intrinsèques : votre pensée systémique, vos compétences architecturales, votre intuition du bon produit. Si vous ne les possédez pas, faire tourner des dizaines d’agents en parallèle pendant 24 heures ne produira qu’une usine à bouillie.

Sa pratique est la meilleure démonstration possible : un développeur iOS chevronné de 20 ans a construit, en quelques mois, un projet de 300 000 lignes de code en TypeScript — non pas grâce à une maîtrise soudaine de la syntaxe d’un nouveau langage, mais grâce à des compétences indépendantes du langage.
« Les langages de programmation ne comptent plus. Ce qui compte, c’est ma pensée d’ingénieur. »
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News













