
La prochaine étape des robots
TechFlow SélectionTechFlow Sélection

La prochaine étape des robots
Le moment ChatGPT des robots ?
Rédaction : Henry
Les progrès récents en robotique sont-ils si importants ?
Ces derniers temps, les recherches sur les robots intelligents progressent à un rythme effréné, avec de nouvelles démonstrations qui apparaissent sans cesse.
À la mi-décembre, Tesla a dévoilé sa deuxième génération d'Optimus. Ce robot n'est pas un produit industriel, mais un prototype pur, bien que très abouti. Dans la vidéo de démonstration, cet Optimus au design d'astronaute montre des capacités motrices impressionnantes. Musk explique qu'il a été conçu à la taille et à la forme humaines afin de pouvoir remplacer parfaitement la main-d'œuvre humaine pour effectuer toutes les tâches que personne ne souhaite faire.

Le robot de Tesla dégage un fort style industriel de science-fiction, visiblement coûteux, ce qui suscite peut-être l'attente implicite qu’il « va de soi ». En réalité, Tesla n’a montré que peu d’applications concrètes, et la réaction du public s’est limitée à un simple « oh ». Mais deux autres robots annoncés début janvier ont fait pousser à beaucoup un sincère « ah ? »
Tout d’abord, le projet Mobile Aloha, présenté par une équipe de recherche de l’université Stanford. Ce projet suscite un vif intérêt probablement parce qu’il met en scène des applications pratiques : cuisiner, jouer avec un chat, faire la lessive. L’innovation principale du projet réside dans l’utilisation de composants peu coûteux (environ 30 000 dollars, encore cher pour un usage domestique) pour créer un robot autonome capable de se déplacer et d’effectuer des manipulations avec deux bras (bien qu’il ne ressemble pas vraiment à un humain), et surtout capable d’apprendre des compétences humaines. Le processus d’apprentissage semble un peu geek : prenons l’exemple de la cuisine, vous devez d’abord lui montrer comment préparer un plat ; ensuite, il retient approximativement les gestes. Il ne tiendra pas la poêle fermement dès le départ, mais ce qui est fascinant, c’est qu’il peut ensuite s’entraîner seul une cinquantaine de fois via les caméras intégrées à ses bras pour finalement réussir parfaitement.

Peu après, la société Figure a publié une vidéo montrant son robot humanoïde Figure 01 préparer un café. À la suite d’une instruction vocale « prépare-moi un café », le robot utilise habilement une machine à café à capsules pour produire une tasse. Figure qualifie cette réalisation de « moment ChatGPT pour les robots humanoïdes ». Non pas parce qu’il utilise un grand modèle linguistique pour comprendre l’instruction vocale, mais parce que cette compétence a été acquise uniquement par observation et imitation des gestes humains — un exploit dont l’impact émotionnel rappelle celui de ChatGPT. Figure 01 observe visuellement les actions humaines avec la machine à café, construit une compréhension de la tâche, puis perfectionne cette compétence par plusieurs cycles d’entraînement autonome avec correction d’erreurs. Cela illustre pleinement les perspectives prometteuses des robots humanoïdes universels pilotés par l’IA.

La vision de Bill Gates : un robot dans chaque foyer
Dans le premier numéro de 2007 du magazine Scientific American, un article signé par Bill Gates était publié en couverture. Son titre : « A robot in every home ».

Dans cet article, Bill Gates exprime un grand enthousiasme face aux opportunités offertes par l’industrie robotique, comparables à celles qu’il avait rencontrées il y a trente ans lorsqu’il a fondé Microsoft : une technologie de rupture émergeait, mais les machines commerciales professionnelles restaient monopolisées par quelques grandes entreprises. Les startups et les passionnés créaient certes des objets intéressants, mais de manière très fragmentée, sans standard ni outil de développement universel. Bill Gates prédit donc audacieusement que, dès que ce problème sera résolu, les robots envahiront tous les foyers.
Microsoft décide alors d’investir massivement dans ce domaine, crée un département Robotics et lance Microsoft Robotics Studio, dans l’espoir de reproduire le succès remporté dans l’ère du PC.
Bill Gates cite dans l’article le célèbre DARPA Grand Challenge 2004. Oui, ce DARPA légendaire qui a inventé Internet, dont l’objectif était de faire traverser 140 miles de désert de Mojave à des véhicules entièrement autonomes. Lors de la première édition, le meilleur participant a peiné à parcourir seulement 7 miles. L’année suivante, cinq véhicules ont réussi l’épreuve, franchissant le parcours presque à vive allure. Cette compétition illustre parfaitement la vitesse fulgurante de l’évolution des technologies robotiques — voilà d’où venait la confiance de Bill Gates.
L’effort de Microsoft portait essentiellement sur les outils de développement. Les capteurs, moteurs et servomoteurs voyaient leurs performances exploser et leurs prix chuter, mais au niveau du développement, il fallait encore écrire un programme spécifique pour chaque composant matériel. De plus, il était difficile de faire traiter en temps réel les données de multiples capteurs par des processeurs encore faibles. La solution de Microsoft consistait à normaliser les pilotes et à fournir des capacités multithread. Microsoft alla même jusqu’à développer .NET Micro Framework. Ceux qui connaissent la technologie .NET peuvent imaginer l’effet dévastateur d’introduire un tel outil dans le domaine de la robotique : une véritable attaque en règle. Les développeurs n’avaient plus à se soucier de la gestion de la mémoire ou des threads, ils pouvaient directement coder la logique applicative.

Mais comme nous le savons aujourd’hui, les efforts de Microsoft dans la robotique n’ont pas abouti, et tout le département Robotics a été dissous lors d’une réorganisation en 2014. D’après mes propres observations éparses, les principales raisons semblent être le coût et le manque d’applications concrètes. Même aujourd’hui, assembler un bras robotique à la maison reste coûteux, et on ne sait toujours pas trop à quoi l’utiliser.
Le « moment ChatGPT » pour les robots ?
Revenons à aujourd’hui. Que ce soit Mobile Aloha ou Figure 01, ces robots montrent tous deux une capacité similaire : apprendre un geste grâce à des capteurs (caméras ou articulations contrôlées à distance), puis le maîtriser réellement par un entraînement autonome avec retour d’expérience. En outre, cette action peut être transformée en une compétence réutilisable, invoquée par dialogue naturel. Une telle compétence peut être copiée instantanément sur tout robot similaire, sans aucun besoin de programmation.
Il semble bien que les capacités des robots aient atteint un nouveau niveau. Beaucoup s’exclament donc spontanément : « Serions-nous en train d’assister au moment ChatGPT pour les robots ? »
Comparé à l’époque où Bill Gates lançait son appel, la robotique dispose désormais de plusieurs avancées majeures :
1. Plus grande universalité. Pour Bill Gates, un robot pouvait avoir n’importe quelle forme, tant qu’il accomplissait une tâche. Quand j’allais traîner aux réunions du groupe Robotics, leurs démonstrations se limitaient souvent à des robots capables de marcher ou ramper. Aujourd’hui, les robots acquièrent des compétences applicables à la vie domestique, compétences reproductibles et transférables. Leur conception tend aussi davantage vers la forme humaine, précisément pour remplacer l’humain dans diverses tâches universelles.
2. Interaction naturelle. Grâce aux grands modèles linguistiques multimodaux (LLM), les robots actuels comprennent les instructions vocales humaines et apprennent à partir d’entrées comme les caméras. C’est un progrès considérable en apprentissage automatique, qui réduit fortement la difficulté de développement et d’utilisation.
3. Coût en baisse continue. Bien que le coût matériel annoncé pour Mobile Aloha dépasse encore 30 000 dollars, cela inclut une base mobile. Si l’on ne compte que le bras robotique, on approche presque le prix d’un appareil électroménager haut de gamme. La base mobile pourrait devenir l’un des prochains points chauds — certains investisseurs justifient leur pari sur Tesla par l’idée que « ce n’est pas une voiture électrique, c’est la future plateforme universelle de mobilité ».
Jim Fan est l’un des principaux influenceurs du domaine. Scientifique principal chez NVIDIA et ancien premier stagiaire d’OpenAI, il a récemment publié un tweet expliquant pourquoi il pense que la robotique sera le phénomène majeur de 2024.

Pourtant, même dans ce tweet enthousiaste, Jim Fan estime qu’il faudra encore environ trois ans avant d’atteindre « le robot IA physique universel ».
Sur ce point, je reste prudemment optimiste : optimiste face aux progrès spectaculaires, mais prudent à cause de l’échec antérieur de Microsoft.
Une chose est sûre : c’est profondément stimulant.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News










