
Pourquoi Baidu part-il du « système d'exploitation » pour créer une IA « omnipotente et omniprésente » ?
TechFlow SélectionTechFlow Sélection

Pourquoi Baidu part-il du « système d'exploitation » pour créer une IA « omnipotente et omniprésente » ?
Un super-productivité intelligente et compétente.
Auteur : Lafeng le Géek

Un grand modèle peut reconstituer tout ce qui s'est produit en Chine au cours des cinq mille dernières années, mais il est incapable de dire quelle heure il est ; il peut expliquer clairement ce qu'est la mécanique quantique, mais peine à créer un diaporama professionnel illustré.
Pourquoi les grands modèles semblent-ils tout-puissants en théorie, mais décevants lorsqu’on les utilise concrètement ?
La raison est simple : être intelligent et érudit ne signifie pas nécessairement savoir agir efficacement.
Être intelligent exige que le modèle acquière, grâce à un entraînement massif sur une vaste connaissance, un « cerveau » performant capable de bien répondre à une question.
Mais pour réunir à la fois intelligence et efficacité, il faut doter ce cerveau intelligent de « membres » souples, réalisant ainsi une combinaison de « réflexion approfondie + livraison approfondie ».
C’est pourquoi faire évoluer les grands modèles d’une simple réflexion intelligente vers une capacité combinée d’intelligence et d’action devient le facteur décisif permettant de déterminer si cette vague actuelle autour des grands modèles sera éphémère ou historiquement transformatrice.
Baidu a donné l’exemple.
Le 25 avril, lors de la conférence annuelle Create 2025 dédiée à l'IA de Baidu, Li Yanhong, fondateur de Baidu, a présenté Cangzhou OS, le premier système d'exploitation au monde dédié au domaine du contenu, développé conjointement par Wenku (bibliothèque) et Wangpan (disque en nuage) de Baidu.
Fondé sur une intégration complète des technologies, capacités et données accumulées par Baidu Wenku et Baidu Wangpan, Cangzhou OS s’infiltre comme de l’eau dans divers scénarios, offrant une livraison de bout en bout, accessible et de haute qualité, via des formats adaptés et des interfaces utilisateur pratiques.
Grâce à Cangzhou OS, la vision de Baidu Wenku et Baidu Wangpan pour l’intelligence artificielle consiste à réaliser, à tout moment, en tout lieu et sur n’importe quel appareil terminal, une livraison véritablement intégrée et complète, rendant l’IA « omnipotente et omniprésente ».
01
Cangzhou OS : vers l’évolution de l’IA à l’échelle d’un système d’exploitation
Dans l’industrie technologique, il existe un consensus : toute technologie met du temps à passer du laboratoire aux foyers, suivant une courbe de Gartner longue et progressive.

Dans cette courbe, la première phase de croissance repose principalement sur l’enthousiasme spéculatif généré par les progrès technologiques. Mais lorsque les résultats concrets se font attendre, cette croissance plonge rapidement dans la désillusion, jusqu’à ce que les conditions nécessaires à son déploiement soient réunies. Ce n’est qu’alors, quand la technologie devient une infrastructure quasi transparente, universellement accessible, omnipotente et omniprésente, que commence la deuxième phase : l’explosion écologique.
L’un des signes marquant le début de cette deuxième phase dans le secteur logiciel est souvent l’apparition d’un système d’exploitation mature — comme Windows pour l’informatique ou iOS pour les téléphones portables.
Comment définir alors un système d’exploitation mature ? Il y a environ 15 ans, l’industrie technologique mondiale s’est interrogée : pourquoi l’iPhone, malgré ses similitudes superficielles avec les téléphones fonctionnels (écran tactile, grand écran, appels, photos, musique, SMS), représentait-il une espèce complètement différente ?
L’une des raisons principales est qu’iOS a hérité du noyau stable et multitâche de Mac OS, transformant cette base technique en une plateforme ouverte. Les développeurs pouvaient librement intégrer ces capacités fondamentales d’Apple pour créer leurs propres applications innovantes. Ainsi, définir un téléphone n’était plus l’affaire exclusive de quelques géants comme Motorola ou Nokia, mais devenait une entreprise collective, infiniment créative, ouvrant la voie à plus de dix ans d’internet mobile.
La technologie avance, mais les histoires commerciales suivent souvent des rythmes similaires. La logique fondamentale validée par les systèmes d’exploitation mobiles reste pertinente aujourd’hui dans la construction d’un OS pour l’ère des grands modèles.
En résumé, trois éléments sont essentiels : des capacités fondamentales complètes, une orchestration centrale souple, et un écosystème d’applications florissant. Ces trois composantes correspondent exactement aux trois couches architecturales de Cangzhou OS : infrastructure de base, système central et services applicatifs. La seule différence notable est que le pont entre applications, cœur et base, autrefois constitué d’API, est désormais remplacé par des MCP standardisés et accessibles.

Dans la couche d’infrastructure (MCP Server), le composant central est Chatfile Plus, qui utilise un cadre de connaissances pour analyser et traiter à un niveau élémentaire différents types de contenus multimodaux, sous divers formats. Il inclut également des outils spécialisés pour la compréhension multimodale, la recherche multimodale, la conversion et l’analyse de fichiers.
Par ailleurs, Baidu Wenku et Wangpan ont construit « trois bases de données » : la base de connaissances publiques (données publiques accumulées par Baidu Wenku), la base de connaissances privées (données personnelles autorisées par les utilisateurs du disque en nuage), et la base de mémoire (historique des commandes, habitudes d’utilisation et contenus générés précédemment dans Wenku ou Wangpan).
Ces données existent sous différentes modalités, formes et formats. La base publique fournit des connaissances générales, tandis que les bases privées et de mémoire conservent les données personnalisées des utilisateurs.
Dans ce cadre de connaissance, Cangzhou OS vectorise et étiquette les contenus multimodaux des « trois bases », transformant ainsi des données non structurées (images, textes, vidéos, sons, documents) en vecteurs multidimensionnels compréhensibles par les ordinateurs — autrement dit, en séquences de tokens — à l’aide de modèles spécialisés.
Au niveau du système central, Baidu Wenku et Wangpan ont développé en interne « trois outils » : un éditeur fusionné (pour modifier documents et présentations), un lecteur (pour consulter documents et PPT), et un lecteur multimédia (pour lire audio et vidéo).
De plus, grâce à un « centre de coordination », Cangzhou OS utilise des composants d’interaction, un modèle d’intention et des infrastructures de transmission. En croisant la mémoire utilisateur et les profils, il comprend les intentions des utilisateurs via des modèles, puis attribue efficacement des agents (Agent).
Enfin, au sommet de l’architecture, se trouvent divers agents IA. Cangzhou OS intègre des centaines d’agents IA provenant de Wenku et Wangpan : PPT, livres illustrés IA, cartes mentales IA, affiches IA, notes IA, scan IA, prise de notes audio IA, etc. Leurs modes de génération couvrent texte, image, vidéo, son, s’adaptant à tous les scénarios, du travail et apprentissage aux loisirs. Appuyés par les capacités d’édition, de modification et de réglage fin de l’éditeur fusionné, ils améliorent significativement la qualité de la recherche et de la création de contenu, mieux alignées sur les tâches personnalisées réelles.
02
Sur Cangzhou OS,
développer davantage d’agents « intelligents et efficaces »
Au niveau des services applicatifs, Baidu Wenku & Baidu Wangpan proposent non seulement des centaines d’agents IA éprouvés par des centaines de millions d'utilisateurs, mais intègrent aussi de nombreux agents professionnels tiers afin d’enrichir l’écosystème.
En tant que « plateforme unique d’accès et de création de contenu alimentée par l’IA », Baidu Wenku compte déjà plus de 40 millions d’utilisateurs payants, et atteint 97 millions d’utilisateurs mensuels actifs sur ses fonctionnalités IA. Baidu Wangpan s’est transformé en « plateforme unique de services de contenu », desservant plus de 1 milliard d’utilisateurs, avec un espace total utilisé dépassant 100 milliards de Go, et plus de 80 millions d’utilisateurs mensuels actifs IA. Ensemble, Baidu Wenku et Baidu Wangpan sont devenus une véritable « super-productivité » à l’ère des grands modèles.
Lors de la conférence, Baidu Wenku et Baidu Wangpan ont dévoilé deux nouvelles fonctionnalités basées sur Cangzhou OS : « GenFlow Super Partenaire » et « Notes IA ».
GenFlow Super Partenaire est une fonctionnalité de collaboration multi-agents introduite dans l’application Baidu Wenku. Grâce à Cangzhou OS, la génération de contenu peut désormais s’exécuter en parallèle sur plusieurs tâches, exploitant à la fois des informations en ligne complètes et précises, ainsi que les préférences et habitudes personnelles de l’utilisateur, pour livrer efficacement chaque mission.
Par exemple, un utilisateur souhaite organiser un mariage en plein air à Hainan pendant la fête du Travail, et demande simplement : « Aide-moi à préparer le plan de mariage et les invitations. »
La demande semble simple, presque triviale — on pourrait penser qu’un simple remplissage de modèle suffirait. Mais pour satisfaire pleinement l’utilisateur, il faut connaître ses goûts esthétiques, son budget, ses préférences en matière de protocole, vérifier la météo, l’affluence touristique et la disponibilité des lieux à Hainan durant cette période. Ensuite, il faut assembler toutes ces informations textuelles et visuelles via un outil de présentation pour produire un plan complet, puis concevoir une affiche d’invitation cohérente avec ce thème.
Pour réaliser cela, il faut mobiliser diverses ressources : historiques de conversations, parcours de navigation, reconnaissance des intentions, recherche complète sur le web, outils de PPT… Analyser l’intention de l’utilisateur, comprendre ses préférences, combiner librement les outils, et finalement fournir un plan détaillé comprenant processus, dates, lieux, budget, thème, détails d’exécution, style et organisation du personnel.
En outre, le plan de mariage et l’affiche doivent être parfaitement synchronisés, nécessitant une cohérence totale des informations et une production parallèle via un même système d’exploitation.
Bien sûr, l’IA ne peut pas toujours produire un résultat parfait du premier coup. C’est pourquoi tant le plan que l’affiche doivent rester modifiables — une fonctionnalité permise par l’« éditeur fusionné » de Cangzhou OS.
On constate ainsi que GenFlow Super Partenaire constitue presque le seul produit « collaboration multi-agents » véritablement opérationnel disponible sur le marché. Non seulement il résout les problèmes habituels de ce type de produits — coût élevé, temps de génération long, faible efficacité, livraison instable, impossibilité d’optimisation par dialogue itératif — mais il est directement intégré à un produit mature et connecté aux données privées autorisées par l’utilisateur, donnant enfin à l’IA une chance réaliste d’atteindre son objectif d’« omnipotence et omniprésence ».
Les « Notes IA » de Baidu Wangpan constituent quant à elles un allié indispensable pour les employés de bureau, étudiants préparant les concours administratifs ou examens universitaires.
Il s’agit du premier carnet de notes IA multimodal du secteur, capable d’intégrer dans une même interface les vidéos pédagogiques et les pages de notes stockées par l’utilisateur dans Baidu Wangpan, assurant une interaction fluide. Vidéo et notes sont fortement interconnectées : du visionnage à la génération automatique de notes IA, puis à la synthèse en carte mentale IA, et enfin à la création de questions d’auto-évaluation, couvrant l’ensemble du cycle d’apprentissage.
Par exemple, la difficulté de l’anglais au concours d’entrée en master est devenue un sujet brûlant. Un utilisateur souhaite se concentrer sur sa révision. Les « Notes IA » commencent par rechercher dans son espace Wangpan les documents pertinents, tout en consultant les sujets officiellement identifiés sur le web pour les organiser. Mais le processus ne s’arrête pas là : en croisant les annales, les « Notes IA » valident les sujets générés. Seuls les sujets validés serviront ensuite à produire des cartes mentales et des prévisions de questions, accélérant ainsi nettement la progression de l’apprenant.
Or, les outils requis dans ce processus ne sont pas moins nombreux que ceux nécessaires à l’organisation d’un mariage. Par exemple, trouver les sujets et annales requiert une capacité de recherche globale. Or, ces annales prennent souvent la forme de PDF ou même d’images, tandis que les analyses d’enseignants experts sont en vidéo — d’où la nécessité d’une analyse multimodale. Pour générer les cartes mentales et prévoir les questions, il faut recourir au raisonnement du grand modèle, à la génération multimodale et à la capacité de mise en relation entre différents contenus, tout en garantissant une précision absolue.
Tout cela repose sur l’empowerment de Cangzhou OS.
Bien entendu, Baidu encourage pleinement les développeurs à adopter le protocole MCP. Ainsi, Cangzhou OS ne dessert pas uniquement l’écosystème interne de Baidu. L’un des éléments clés du développement d’un système d’exploitation réside dans son ouverture, stimulant l’innovation des développeurs.
Pour maximiser la valeur de l’écosystème et des applications, Baidu Wenku et Baidu Wangpan ont été les premiers à appliquer largement le MCP dans le lien entre produits et écosystème, construisant une architecture en trois couches : MCP Server - Client - Host. Ils exposent ainsi les capacités de Wenku et Wangpan via des serveurs MCP, permettant aux entreprises, développeurs et applications d’agents (MCP Host) de s’y connecter facilement via un SDK client (MCP Client SDK).

Le cas le plus emblématique est celui de Samsung. Le fabricant coréen intègre actuellement plusieurs serveurs MCP de Baidu Wenku et Wangpan, notamment pour le téléchargement, le partage, la recherche et la compréhension de contenu.
D’un côté, depuis l’interface vocale de leur smartphone, les utilisateurs peuvent directement commander l’envoi de fichiers vers le cloud, partager des documents, résumer un texte ou poser des questions sur son contenu.
D’un autre côté, ces serveurs enrichissent les capacités de stockage cloud du système Samsung, résolvant le problème de sauvegarde et de partage groupé de gros ou nombreux fichiers.
Par exemple, dans l’application photo, un utilisateur active son assistant vocal et dit : « Sauvegarde hier les photos prises à l’Olympic Forest Park sur mon Baidu Wangpan, et envoie celles de Xiao Ming à ce dernier. » Les photos correspondantes seront alors transférées vers le compte Wangpan autorisé, un lien de partage sera généré, puis envoyé automatiquement par SMS via le carnet d’adresses. En cliquant sur le lien, le destinataire peut immédiatement visualiser ou sauvegarder les photos directement depuis Baidu Wangpan.
Sans aucun doute, la fiabilité d’un système d’exploitation ne se mesure pas au nombre d’outils empilés ou de technologies spectaculaires. La meilleure preuve de sa puissance réside dans la richesse, la facilité d’usage et la maturité de son écosystème d’applications de haut niveau.
03
L’histoire de l’OS n’a pas de fin
Dans le monde de la finance, les investisseurs apprécient particulièrement un certain type d’entreprise : les « amis du temps ».
Un « ami du temps » est une entreprise qui, une fois qu’elle a trouvé la bonne voie, continue simplement sur sa lancée, générant ainsi une croissance quasi perpétuelle, dont profitent durablement les développeurs de l’écosystème.
Un système d’exploitation est justement un marché de ce type. Tant que les marchés des ordinateurs et des smartphones existeront, l’histoire de Microsoft, Apple ou Google n’aura pas de fin.
Il en va de même pour les grands modèles. Lorsque « réflexion approfondie + livraison approfondie + données publiques/privées + écosystème MCP » seront réunis, l’IA deviendra progressivement omnipotente et omniprésente. Une explosion de nouvelles espèces, comparable à celle du Cambrien, naîtra alors sans interruption.
Dans ce processus, regarder vers le bas signifie que Baidu Wenku, Baidu Wangpan, etc., ouvrent leurs propres capacités. En embrassant activement l’écosystème, ils deviennent les créateurs et les régulateurs de nouvelles espèces dans l’ère des grands modèles.
Regarder vers le haut, c’est voir d’innombrables nouveaux agents créés et découverts grâce à Cangzhou OS, formant un écosystème dynamique et foisonnant de nouveaux services.
Mais pour l’instant, toutes ces histoires ne font que commencer.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News










