
Construire des modèles pour cent pays : les ambitions du controversé PDG de Stability.AI
TechFlow SélectionTechFlow Sélection

Construire des modèles pour cent pays : les ambitions du controversé PDG de Stability.AI
Chaque pays, chaque secteur, chaque culture devrait posséder son propre modèle d'IA représentant ses spécificités.
Par Wang Chao
Le 23 mars, Emad Mostaque, le PDG controversé de Stability AI, a annoncé sa démission, affirmant qu’il se consacrerait désormais entièrement à l’intelligence artificielle décentralisée. Cette annonce a provoqué une vive réaction sur les marchés.
D’un côté, Stability.AI a longtemps porté seul l’étendard de l’IA open source et a apporté une contribution majeure à ce domaine ; d’un autre côté, elle est régulièrement accusée de s’approprier les réalisations d’autres équipes de recherche. La réputation du PDG Emad a été davantage entachée par la révélation de ses diplômes falsifiés et ses déclarations exagérées fréquentes sur les réseaux sociaux. Bien que Stability.AI ait bénéficié auparavant de soutiens prestigieux et de financements massifs, elle est depuis longtemps plongée dans des difficultés financières, au bord du gouffre.
Après sa démission, Emad a révélé qu’il conservait encore la majorité des actions de Stability.AI, suffisantes pour contrôler son conseil d’administration. Il n’a donc pas été forcé de partir, mais a choisi de démissionner parce qu’il pense que dans le domaine de l’IA, une concentration excessive du pouvoir nuit à tout le monde, espérant ainsi favoriser un changement au sein de Stability.AI. Toutefois, étant donné son passé fait d’exagérations peu glorieuses, la plupart des gens pensent que l’histoire ne s’arrête pas là. Mais plutôt que de m’attarder sur Stability.AI, je préfère explorer ici l’IA décentralisée vers laquelle Emad souhaite désormais s’engager.
Il y a quelques semaines, j’ai participé avec Emad à une discussion sur l’IA décentralisée. J’ai ensuite compilé plusieurs de ses anciennes déclarations sur ce sujet, esquissant ainsi grossièrement sa vision.
Celui qui contrôle le modèle contrôle la pensée
Si les actions humaines sont pilotées par un système d’exploitation, l’IA devient rapidement un composant central externe de ce système. En effet, les êtres humains ont progressivement tendance à externaliser leur charge cognitive vers l’IA, qui devient ainsi partie intégrante de notre manière de penser. Pourtant, les avantages et pouvoirs offerts par l’IA s’accompagnent de risques importants : celui qui contrôle les modèles d’IA exerce, dans une certaine mesure, un contrôle sur la pensée du monde.
Si le grand public ignore le fonctionnement et les réglages par défaut de ces outils intelligents, nos décisions et opinions peuvent être influencées en silence. Les détenteurs des modèles d’IA peuvent orienter subtilement les choix, les opinions et les comportements des utilisateurs en définissant certains paramètres par défaut. L’IA, en tant qu’infrastructure de la prochaine ère, pourrait avoir des conséquences désastreuses si elle restait entre les mains d’un petit groupe commercial. C’est précisément ce que souligne Emad pour justifier l’importance et l’urgence de l’IA décentralisée.
Chaque pays doit avoir son propre modèle
Alors qu’OpenAI consacre d’énormes ressources au projet SuperAlignment (super-alignement), qui veillera sur OpenAI lui-même, et sur l’alignement de chaque pays, secteur et culture du monde ?
Personne.
OpenAI fournit des efforts considérables en matière de sécurité fondamentale et d’éthique humaine commune via son projet Super Alignment, mais face à la diversité des nations et cultures, ces efforts sont-ils suffisants ? Les valeurs des différentes ethnies et cultures diffèrent souvent profondément de celles de l’élite de la Silicon Valley. Ces multiples visions du monde peuvent-elles être équitablement reflétées dans les modèles d’IA ? Quand les élèves du Kenya commencent massivement à utiliser l’IA de la Silicon Valley pour apprendre, leurs spécificités culturelles nationales risquent-elles de s’estomper progressivement ?
La réponse semble peu optimiste. C’est pourquoi Emad affirme que chaque pays, secteur ou culture devrait posséder son propre modèle d’IA, représentatif de ses particularités. Ces modèles doivent être profondément enracinés localement, absorbant pleinement la sagesse collective de cette nation, de ce secteur ou de cette culture. Ce concept n’est pas nouveau : il y a deux mois, NVIDIA a également présenté à plusieurs reprises son idée d’une IA souveraine, essentiellement similaire. Toutefois, Emad parlait déjà de cela depuis un à deux ans, bien avant NVIDIA.
La grande majorité des pays du monde n’ont tout simplement pas les moyens techniques de créer leurs propres modèles d’IA — c’est précisément ce marché qu’Emad vise. Il souhaite construire une pile technologique de base capable de soutenir la création de modèles d’IA par chaque pays, peuple ou secteur, puis développer ces modèles grâce à une collaboration collective décentralisée.
Emad a indiqué qu’il pourrait lancer ou incuber une série de sociétés, chacune rassemblant des experts spécialisés dans des domaines clés comme l’éducation, la santé, la finance, ou bien sûr les modèles d’IA adaptés à différents pays. Dans le cadre de l’IA décentralisée, ces entreprises joueraient surtout un rôle de catalyseur. En fournissant des modèles de base et des cadres standardisés, elles permettraient aux communautés de contribuer activement. Si elles attirent suffisamment de talents qualifiés d’un même pays, toute cette intelligence collective pourrait converger vers un excellent modèle national.
Le cœur, c’est la donnée
Pour faire simple, la recette d’un modèle d’IA repose sur des algorithmes et des données, mélangés ensemble grâce à une certaine puissance de calcul. Plus il y a de données, plus il faut de puissance pour les traiter. Actuellement, la plupart des équipes cherchent à améliorer leurs algorithmes, à collecter davantage de données et à y appliquer toujours plus de puissance de calcul. Or, la pratique a montré que, avec des données de haute qualité, on peut obtenir d’excellents résultats même avec moins de données. Autrement dit, beaucoup accumulent de la puissance de calcul pour compenser la faible qualité de leurs données.
Ceci constitue justement un avantage clé du système d’IA décentralisée prôné par Emad. Il croit que si l’on parvient à structurer une participation collective des meilleurs talents d’un pays, on peut rassembler un jeu de données national de haute qualité, vérifiable, dont la propriété est clairement définie, et concevoir ainsi des mécanismes incitatifs autour des données.
Grâce à cette approche, nous pourrions collecter des données auparavant inaccessibles, non seulement de meilleure qualité, mais aussi plus fidèles et justes aux voix et besoins du grand public.
Clusters de petits modèles vs un seul grand modèle
Dans le domaine de l’IA, les lois d’échelle (Scaling laws) sont presque devenues une règle absolue : que nous choisissions ou non de les suivre, nous ne pouvons pas les ignorer.
Il est évident que réaliser une intelligence artificielle générale (AGI) via une organisation décentralisée des ressources, selon les lois d’échelle, n’est pas réaliste à court terme. Pendant longtemps encore, les modèles d’IA orientés communauté auront du mal à rivaliser avec des géants comme OpenAI pour remporter la couronne du modèle le plus puissant.
Pourtant, chercher l’AGI et créer une IA largement applicable sont deux choses différentes. Avec les progrès technologiques, les modèles moyens et petits pilotés par la communauté gagnent rapidement en capacité. D’ici un à deux ans, ils devraient suffire à accomplir la majorité des tâches quotidiennes. Peut-être ne seront-ils pas les plus puissants, mais ils seront suffisamment pratiques et à coût assez bas pour ouvrir de vastes scénarios d’utilisation. Comme pour nos achats en ligne où nous n’avons pas besoin systématiquement de la livraison express de SF Express, l’usage mixte des modèles va progressivement devenir la norme.
Cela entraîne un changement crucial : lorsque des modèles alimentés par l’intelligence collective sont largement adoptés, ils réduisent fortement les risques potentiels liés au contrôle d’un unique grand modèle par une seule institution. Si les données d’un grand modèle sont contaminées, ces modèles basés sur l’intelligence collective peuvent facilement jouer le rôle de correcteurs, assurant les ajustements nécessaires. Il ne s’agit pas seulement d’efficacité et d’économies, mais d’un véritable bras de fer entre l’intelligence collective et l’« IA-Dieu ».
Du point de vue technique, les petits modèles ne sont pas uniquement désavantagés. Leur petite taille les rend plus faciles à entraîner spécifiquement pour des domaines verticaux. Même s’ils sont moins performants globalement que les grands modèles, ils peuvent exceller en tant qu’outils experts dans leur domaine. Un cluster constitué de nombreux modèles experts pourrait très bien, face à un unique grand modèle, ne pas perdre la bataille.
Plus important encore, la petite taille des modèles favorise efficacement une décentralisation du déploiement. Lorsqu’on parle de décentralisation, il ne s’agit pas seulement de la construction du modèle ou de la provenance des données, mais aussi de la gouvernance et du déploiement. Si les modèles open source peuvent être facilement déployés sur un ordinateur portable ou même un téléphone, cela crée une forme d’équité en IA. Même si un fournisseur de service centralisé ferme son accès, les utilisateurs peuvent continuer à fonctionner grâce à une IA locale. Permettre un usage large et sans entraves de l’IA est un objectif fondamental de l’IA décentralisée.
IA + Web3 – Arnaque ou avenir ?
Sans aucun doute, le projet d’IA décentralisée qu’Emad promeut activement est étroitement lié aux technologies cryptographiques. Il a clairement exprimé son intention de concevoir un protocole Web3 pour intégrer et concrétiser ses idées. En effet, l’IA manque actuellement de plusieurs éléments clés — la vérifiabilité des données, la propriété des données, les mécanismes de coordination et d’incitation à grande échelle, ainsi que la capacité de gouvernance collective — qui sont justement les points forts des technologies Web3.
Je tiens ici à insister particulièrement sur la gouvernance. Jamais une technologie n’a été aussi puissante qu’aujourd’hui l’IA, et jamais elle n’a eu un impact aussi large et profond sur tous les coins du monde. Qui devrait décider de l’orientation future de cette technologie ? Qui peut effectivement la maîtriser ? Une gouvernance de l’IA par un petit nombre de conseils d’administration d’entreprises comme OpenAI n’est certainement pas la solution la plus efficace. Simplement imposer des contraintes rigides par la régulation ne suffira probablement pas non plus. La gouvernance collective pourrait bien être la véritable réponse.
Dans le domaine du Web3, les expériences de gouvernance collective sont florissantes, couvrant la gouvernance des données, des applications, des réseaux et des organisations. Bien que la plupart de ces tentatives en soient encore au stade exploratoire et aient connu plusieurs échecs, c’est ici que se situe la pointe avancée du développement humain en matière de gouvernance.
Au cours des cinq dernières années, dans l’univers crypto, notamment autour des organisations autonomes décentralisées (DAO), on a presque testé tous les modèles de gouvernance existant dans l’histoire humaine. La structure innovante d’OpenAI, où une fondation à but non lucratif contrôle une entreprise lucrative, était déjà largement expérimentée dans les DAO. À mes yeux, les acteurs du Web3 ont, ces dernières années, joué une sorte de « speedrun » de la gouvernance. En quelques années seulement, ils ont revécu l’évolution de milliers d’années de gouvernance humaine.
Une critique fréquente est que la plupart des gouvernances Web3 ne font que reproduire d’anciens modèles humains, ajoutant simplement un vote sur chaîne. Mais l’histoire nous enseigne que, doté d’une vitesse de croissance élevée et d’une forte densité de talents, ce genre de système évolue rapidement vers des formes entièrement nouvelles.
Un exemple imparfait mais parlant est celui de la publicité sur Internet. Au début de l’essor d’Internet, en ouvrant un site d’actualité, une gigantesque publicité plein écran apparaissait lentement avant de disparaître, tandis que la page regorgeait de blocs publicitaires serrés — ce fut le souvenir emblématique du web précoce. À l’époque, on ignorait comment promouvoir efficacement sur Internet, alors on avait simplement transposé les méthodes traditionnelles des médias classiques. Mais avec l’évolution des usages et une compréhension accrue des technologies et de la culture numériques, des modes de promotion inédits dans l’histoire humaine ont rapidement émergé, supplantant vite la publicité traditionnelle sur le web.
À mon sens, la gouvernance des technologies suivra un chemin similaire. La technologie blockchain offre des capacités de coordination et de gouvernance radicalement renforcées. Des solutions de gouvernance collective inédites dans l’histoire humaine vont naître de ce terreau. Et j’en suis convaincu.
Pour conclure
Aujourd’hui, il est difficile de prédire l’avenir de l’ère de l’IA ou de juger pleinement la vision d’Emad. Évidemment, son projet fait face à d’énormes défis sur de nombreux fronts. Ajoutons à cela que, par le passé, Emad a souvent exagéré, ce qui rend difficile de distinguer ce qui relève du sérieux et ce qui n’est que propos en l’air.
Néanmoins, réfléchir à la structure du pouvoir en IA est un sujet à la fois précoce, extrêmement complexe et vital. Emad et ses pairs qui œuvrent pour une IA décentralisée, leurs réflexions et leurs tentatives, même s’ils sont loin d’avoir trouvé la réponse finale, méritent respect et attention. Ces explorations, bien que difficiles, sont des essais courageux pour façonner l’avenir. Quel que soit leur résultat, ces efforts deviendront un chapitre de l’épopée historique.
Peut-être un jour, le monde remerciera-t-il des personnes comme Emad.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News










