
L’IA, pourquoi doit-elle aussi dormir ?
TechFlow SélectionTechFlow Sélection

L’IA, pourquoi doit-elle aussi dormir ?
Les personnes intelligentes savent quand elles doivent se reposer.
Rédaction : Tang Yitao
Édition : Jing Yu
Source : GeekPark
Le 31 mars 2026, Anthropic a accidentellement divulgué 510 000 lignes de code source de Claude Code dans un dépôt public npm en raison d’une erreur lors de l’empaquetage. Le code a été mis en miroir sur GitHub quelques heures plus tard, rendant toute récupération impossible.
La fuite contenait une grande quantité d’informations, dont les chercheurs en sécurité et les concurrents ont tiré parti selon leurs besoins. Toutefois, parmi les fonctionnalités non publiées, un nom a suscité une large discussion : « autoDream », ou « rêve automatique ».
autoDream fait partie d’un système résident en arrière-plan baptisé KAIROS (mot grec ancien signifiant « le moment opportun »).
KAIROS observe et enregistre continuellement l’utilisateur pendant son travail, tout en maintenant un journal quotidien (un peu à la manière d’une crevette). autoDream, quant à lui, ne s’active qu’après que l’utilisateur a éteint son ordinateur, afin de trier les souvenirs accumulés au cours de la journée, d’éliminer les contradictions et de transformer les observations floues en faits avérés.
Ces deux composants forment un cycle complet : KAIROS est « éveillé », tandis qu’autoDream est « endormi » — les ingénieurs d’Anthropic ont ainsi doté l’IA d’un rythme biologique.
Au cours des deux dernières années, le récit dominant dans le secteur de l’IA a été celui des « agents » : des entités autonomes capables de fonctionner sans interruption, considéré comme l’avantage fondamental de l’IA par rapport aux humains.
Or, précisément la société qui pousse le plus loin les capacités des agents a intégré, dans son propre code, des périodes de repos pour l’IA.
Pourquoi ?
Le coût de la disponibilité permanente
Une IA qui ne s’arrête jamais bute sur un mur infranchissable.
Chaque grand modèle de langage possède une « fenêtre contextuelle » : une limite physique stricte à la quantité d’informations pouvant être traitées simultanément. Lorsqu’un agent fonctionne en continu, l’historique du projet, les préférences de l’utilisateur et les enregistrements de conversation s’accumulent sans cesse ; une fois ce seuil dépassé, le modèle commence à oublier les instructions initiales, à se contredire et à inventer des faits.
La communauté technique désigne ce phénomène sous le terme de « corruption contextuelle ».
De nombreux agents adoptent une réponse très rudimentaire face à ce problème : ils insèrent l’intégralité de l’historique dans la fenêtre contextuelle, espérant que le modèle parviendra seul à distinguer l’essentiel du superflu. Résultat : plus il y a d’informations, plus les performances se dégradent.
Le cerveau humain heurte lui aussi ce même mur.
Toutes les expériences vécues durant la journée sont rapidement stockées dans l’« hippocampe », une zone de mémoire temporaire à capacité limitée, comparable à un tableau blanc. Les souvenirs à long terme sont, quant à eux, stockés dans le « néocortex », une région bien plus spacieuse mais dont le processus d’encodage est lent.
La fonction principale du sommeil chez l’humain consiste justement à vider ce tableau blanc surchargé et à transférer les informations utiles vers le disque dur cortical.
Le laboratoire du neuroscientifique Björn Rasch, du Centre de neurosciences de l’Université de Zurich, a nommé ce processus « consolidation active des systèmes ».
Des expériences répétées de privation totale de sommeil démontrent sans équivoque que le cerveau privé de repos ne devient pas plus efficace : d’abord la mémoire se détériore, puis l’attention, jusqu’à ce que même les fonctions cognitives élémentaires, comme le jugement, soient gravement compromises.
La sélection naturelle élimine impitoyablement les comportements inefficaces, or le sommeil n’a jamais été éliminé. Des mouches à fruits aux baleines, presque tous les animaux dotés d’un système nerveux dorment. Les dauphins ont même évolué vers un « sommeil unihémisphérique », où chaque hémisphère cérébral se repose alternativement — préférant inventer une méthode entièrement nouvelle de sommeil plutôt que d’y renoncer totalement.
Orques, bélugas et grands dauphins au repos au fond d’un bassin | Source : National Library of Medicine (États-Unis)
Les deux systèmes font face aux mêmes contraintes : une capacité de traitement immédiat limitée, confrontée à une accumulation infinie d’expériences passées.
Deux réponses à une même question
En biologie, on parle de « convergence évolutive » lorsqu’un même défi environnemental conduit des espèces sans lien de parenté étroit à développer indépendamment des solutions similaires. L’exemple le plus classique est l’œil.
À la fois la pieuvre et l’humain possèdent un œil dit « caméra », doté d’un cristallin focalisable concentrant la lumière sur la rétine, d’un iris régulant l’intensité lumineuse entrante, et d’une structure quasi identique dans son ensemble.
Comparaison des structures oculaires de la pieuvre et de l’humain | Source : OctoNation
Pourtant, la pieuvre appartient aux mollusques, tandis que l’humain appartient aux vertébrés. Leur dernier ancêtre commun remonte à plus de 500 millions d’années, à une époque où aucun organe visuel complexe n’existait encore sur Terre. Deux voies évolutives totalement indépendantes ont donc abouti à un résultat quasi identique. En effet, la transformation efficace de la lumière en une image nette ne permet, compte tenu des lois physiques, qu’une seule solution viable : l’œil caméra — nécessitant obligatoirement une lentille focalisable, une surface photosensible capable de recevoir l’image, et un diaphragme régulant le flux lumineux.
La relation entre autoDream et le sommeil humain pourrait bien relever de ce type de convergence : sous des contraintes analogues, deux systèmes distincts convergent vers des architectures similaires.
L’obligation d’être hors ligne constitue leur point commun le plus frappant.
autoDream ne peut pas s’exécuter pendant que l’utilisateur travaille. Il démarre de façon autonome en tant que processus fils séparé, complètement isolé du thread principal, avec des autorisations strictement limitées.
Le cerveau humain rencontre le même défi, mais sa solution est encore plus radicale : le transfert des souvenirs depuis l’hippocampe (zone de stockage temporaire) vers le néocortex (zone de stockage à long terme) requiert un ensemble spécifique de rythmes électroencéphalographiques n’apparaissant que pendant le sommeil.
Parmi ceux-ci, les « ondes de rafale hippocampiques » jouent un rôle crucial : elles empaquettent les fragments mnésiques encodés durant la journée et les transmettent séquentiellement au cortex cérébral. Quant aux « oscillations lentes » du cortex et aux « fuseaux » thalamiques, ils assurent une synchronisation précise de l’ensemble du processus.
Ces rythmes ne peuvent se former à l’état de veille ; toute stimulation externe les perturbe. Ainsi, ce n’est pas parce que vous êtes fatigué que vous dormez, mais parce que votre cerveau doit fermer la porte avant d’en ouvrir une autre.
Ou encore, au sein d’une même fenêtre temporelle, l’acquisition d’information et l’organisation structurale des données sont des activités concurrentes, non complémentaires.
Modèle de consolidation active des systèmes pendant le sommeil. A (migration des données) : Pendant le sommeil profond (sommeil à ondes lentes), les souvenirs nouvellement inscrits dans l’« hippocampe » (zone de stockage temporaire) sont rejoués à plusieurs reprises, puis progressivement transférés et consolidés dans le « néocortex » (zone de stockage à long terme). B (protocole de transmission) : Ce transfert dépend d’un « dialogue » hautement synchronisé entre ces deux régions. Le cortex cérébral génère des ondes lentes (ligne rouge) servant de battement directeur. À chaque pic de cette onde, l’hippocampe empaquette les fragments mnésiques sous forme de signaux haute fréquence (ondes de rafale, ligne verte), parfaitement calés sur les « fuseaux » émis par le thalamus (ligne bleue). Cela revient à insérer avec précision les données mnésiques haute fréquence dans les intervalles du canal de transmission, garantissant ainsi leur upload synchrone vers le cortex cérébral. | Source : National Library of Medicine (États-Unis)
Une deuxième similitude concerne la stratégie de mémoire : non pas stocker intégralement, mais éditer activement.
Lorsqu’il s’active, autoDream ne conserve pas l’intégralité des journaux. Il commence par lire la mémoire existante afin de confirmer les connaissances déjà acquises, puis analyse les journaux quotidiens produits par KAIROS, en se concentrant prioritairement sur les éléments discordants avec les connaissances antérieures : les souvenirs qui contredisent ce qui avait été dit la veille, ou qui révèlent une complexité supérieure à celle initialement perçue, sont privilégiés.
Les souvenirs ainsi organisés sont stockés dans une indexation à trois niveaux : une couche légère de pointeurs toujours chargée en mémoire, des fichiers thématiques chargés à la demande, et l’historique complet jamais chargé directement. Par ailleurs, les faits directement accessibles dans le code du projet (par exemple, la définition d’une fonction dans tel fichier) ne sont jamais inscrits dans la mémoire.
Le cerveau humain effectue, pendant le sommeil, presque exactement la même opération.
Une étude menée par Erin J. Wamsley, enseignante à la Harvard Medical School, montre que le sommeil consolide prioritairement les informations inhabituelles — celles qui suscitent la surprise, déclenchent une réaction émotionnelle ou sont liées à des problèmes encore non résolus. En revanche, les détails routiniers, répétitifs et dépourvus de caractéristiques marquantes sont largement éliminés, ne laissant subsister que des schémas abstraits — vous ne vous souvenez probablement pas précisément de ce que vous avez vu sur votre trajet vers le bureau hier, mais vous savez parfaitement comment y aller.
Il existe toutefois une différence notable entre les deux systèmes. Dans le code, les souvenirs produits par autoDream sont explicitement étiquetés comme des « hints » (indices), et non comme des « truths » (vérités). Chaque fois qu’un agent les utilise, il doit les vérifier à nouveau pour s’assurer qu’ils restent valides — car autoDream sait pertinemment que ses propres synthèses peuvent être erronées.
Le cerveau humain ne dispose pas d’un tel mécanisme. C’est pourquoi les témoins oculaires devant les tribunaux donnent si souvent des déclarations inexactes : ils ne mentent pas délibérément, mais reconstruisent leurs souvenirs à partir de fragments épars du cerveau — et l’erreur est alors la norme.
L’évolution n’a probablement jamais eu besoin d’équiper le cerveau humain d’une étiquette d’incertitude. Dans un environnement primitif exigeant des réactions corporelles rapides, croire aveuglément à ses souvenirs permettait d’agir immédiatement, tandis que les douter entraînait une hésitation — et l’hésitation signifiait la défaite.
Mais pour une IA prenant constamment des décisions fondées sur la connaissance, le coût de la vérification est faible, tandis que la confiance aveugle est dangereuse.
Deux contextes différents conduisent donc à deux réponses différentes.
Une paresse plus intelligente
En biologie évolutive, la convergence évolutive signifie que deux trajectoires indépendantes, sans échange direct d’informations, aboutissent au même résultat. Dans la nature, il n’y a pas de plagiat, mais les ingénieurs, eux, peuvent lire les articles scientifiques.
Lorsqu’Anthropic a conçu ce mécanisme de « sommeil », s’agissait-il simplement d’une réponse contrainte par les mêmes limites physiques que celles auxquelles le cerveau humain est confronté, ou ont-ils sciemment puisé leur inspiration dans les neurosciences ?
Aucune référence à la littérature en neurosciences n’apparaît dans le code divulgué, et le nom « autoDream » ressemble davantage à une plaisanterie de développeur. La motivation la plus forte semble bel et bien la contrainte technique elle-même : la fenêtre contextuelle impose une limite stricte, le fonctionnement prolongé engendre une accumulation de bruit, et le tri en temps réel risque de polluer le raisonnement du thread principal. Ils résolvaient un problème d’ingénierie, la biomimétique n’étant jamais leur objectif premier.
Ce qui façonne véritablement la réponse, c’est la pression exercée par les contraintes elles-mêmes.
Au cours des deux dernières années, la définition de « l’intelligence accrue » dans le secteur de l’IA a presque toujours suivi une seule direction : modèles plus vastes, fenêtres contextuelles plus longues, inférence plus rapide, disponibilité continue 7×24. La tendance est toujours à « davantage ».
L’existence d’autoDream suggère pourtant une proposition différente : l’intelligence la plus performante pourrait bien être la plus paresseuse.
Un agent intelligent qui ne prend jamais le temps de s’organiser ne devient pas plus intelligent, il devient seulement plus chaotique.
Au fil de centaines de millions d’années d’évolution, le cerveau humain est arrivé à une conclusion apparemment maladroite : l’intelligence doit obéir à un rythme. La veille sert à percevoir le monde ; le sommeil, à le comprendre. Lorsqu’une entreprise spécialisée en IA, en résolvant un problème d’ingénierie, aboutit indépendamment à la même conclusion, cela pourrait signifier ceci :
L’intelligence comporte certaines dépenses fondamentales incontournables.
Peut-être qu’une IA qui ne dort jamais n’est pas une IA plus puissante. Elle est simplement une IA qui n’a pas encore pris conscience qu’elle a besoin de dormir.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News














