
Pourquoi CZ mise-t-il sur Vana pour créer une meilleure IA ?
TechFlow SélectionTechFlow Sélection

Pourquoi CZ mise-t-il sur Vana pour créer une meilleure IA ?
Montrer comment Vana devient une infrastructure clé pour l'écosystème de l'IA.
Auteur : Jesse, contributeur principal de Biteye
Éditeur : Crush, contributeur principal de Biteye
* Environ 6000 caractères, lecture prévue en 12 minutes
Il y a un mois, YZi Labs a annoncé son investissement dans Vana, avec CZ, fondateur de Binance, rejoignant comme conseiller, confirmant ainsi le statut de leader de Vana dans le secteur des données pour l’IA. Quatre jours plus tard, lors d’un AMA avec Vana, CZ a déclaré que les données sont le carburant fondamental de l’IA, que les données publiques sont épuisées tandis que les données privées restent inexploitées, et a exprimé sa confiance dans l’adéquation produit-marché (PMF) et la croissance utilisateur de Vana.
Pourquoi YZi Labs, Coinbase Ventures et Paradigm investissent-ils massivement dans Vana ? Pourquoi CZ est-il convaincu par le potentiel de Vana ?
Ce rapport analyse systématiquement les difficultés auxquelles l’IA fait face en matière de données, la proposition de valeur fondamentale de Vana, ses cas d’utilisation concrets et sa trajectoire de croissance future, révélant comment Vana devient une infrastructure clé de l’écosystème IA.

01 IA et crise des données : briser les barrières fermées
Selon Pitchbook, le secteur américain de l’IA a attiré près de 20 milliards de dollars d’investissements au premier trimestre 2025. À fin 2024, les startups IA représentaient un tiers du capital-risque mondial, soit 131,5 milliards de dollars cumulés, dont près d’un quart des nouvelles entreprises se concentrant sur l’IA. Les données de Statista confirment cette croissance explosive : les investissements en capital-risque dans l’IA et l’apprentissage automatique sont passés de 670 millions de dollars en 2011 à 36 milliards en 2020, soit une multiplication par plus de 50. Ce phénomène montre clairement que l’IA est devenue le choix privilégié du capital intelligent et des meilleurs entrepreneurs.
Cependant, l’architecture fondamentale de l’IA — « données + modèle + puissance de calcul » — rencontre un goulot structurel. Le moteur principal des performances des modèles IA n’est ni la supériorité en puissance de calcul ni la percée algorithmique, mais bien la qualité et l’échelle des jeux de données d’entraînement. Actuellement, les grands modèles linguistiques atteignent un point critique où les données d’entraînement s’épuisent. Llama 3 de Meta a été entraîné sur environ 15 billions de tokens, une quantité qui a presque épuisé toutes les ressources de données publiques de haute qualité disponibles sur Internet. Bien que le volume de données publiques soit important, il ne représente qu’une infime partie. Un fait clé souvent ignoré : les données à haute valeur ajoutée sont majoritairement verrouillées dans des systèmes privés nécessitant une autorisation d’accès. Les données publiques représentent moins de 0,1 % de l’ensemble des données mondiales. Ce problème dépasse la capacité de résolution du seul secteur de l’IA et nécessite l’apport de la technologie blockchain pour reconstruire les relations de production des données, instaurer de nouveaux mécanismes incitatifs et catalyser l’émergence massive de données de qualité.
D’un autre côté, la grande majorité des données aujourd’hui sont contrôlées par les grandes entreprises technologiques Web2 dans leurs écosystèmes fermés. Le développement de l’IA fait face au défi des « murs de données », dont l’existence même découle de la reconnaissance par ces entreprises de la valeur considérable des données. Les modèles IA de haute qualité offrent des retours économiques très élevés ; par exemple, OpenAI génère un chiffre d’affaires annuel d’environ 3,4 milliards de dollars. Construire d’excellents modèles IA exige donc d’importantes bases de données, dont l’acquisition coûte cher.
Par exemple, Reddit gagne environ 200 millions de dollars par an grâce à la vente de données, chaque image de PhotoBucket se vend entre 1 et 2 dollars, et les transactions sur les données d’actualités d’Apple atteignent jusqu’à 50 millions de dollars. La propriété des données est désormais passée d’une simple préférence en matière de confidentialité à une question économique majeure. Dans un monde où l’économie sera largement pilotée par des modèles IA, détenir la propriété des données équivaut à détenir des actions des futurs modèles IA.
Avec la commercialisation croissante des données, leur accès devient de plus en plus difficile. De nombreuses plateformes ajustent leurs conditions d’utilisation et politiques API afin de limiter l’accès des développeurs externes. Par exemple, Reddit et Stack Overflow ont modifié leurs règles API, rendant l’accès aux données plus compliqué. Cette tendance s’étend : les plateformes détenant des données critiques s’enferment progressivement.
Pourtant, un groupe conserve un accès libre à ces données : les utilisateurs eux-mêmes. Beaucoup ignorent que, juridiquement, ils possèdent pleinement leurs propres données. Comme une voiture garée dans un parking, dont le parking n’a pas le droit de disposer librement, les données stockées par les utilisateurs sur les plateformes sociales leur appartiennent toujours.
Lors de l’inscription, les utilisateurs cochent généralement l’option « autoriser la plateforme à utiliser mes données ». Cela constitue simplement une licence accordée à la plateforme pour exploiter les données afin de faire fonctionner ses services, mais cela ne signifie pas que l’utilisateur perd la propriété de ses données.
En réalité, tout utilisateur peut demander à tout moment l’exportation de ses données. Même si les plateformes limitent strictement l’accès API pour les développeurs, les utilisateurs individuels peuvent légalement récupérer leurs propres données. Par exemple, Instagram permet à ses utilisateurs d’exporter leurs données de compte, incluant non seulement les photos publiées et les commentaires, mais aussi les balises marketing générées par IA. Sur la plateforme 23andMe, les utilisateurs peuvent demander l’exportation de leurs données génétiques, bien que la plateforme ne le mentionne pas activement et que le processus puisse être peu intuitif.
À l’échelle mondiale, les réglementations se renforcent pour garantir aux utilisateurs un accès facilité à leurs propres données. Alors que la valeur des données devient de plus en plus évidente, les utilisateurs doivent prendre conscience de leur droit de propriété sur leurs données personnelles et exercer activement ce droit.
02 Concepts fondamentaux de VANA
Les entreprises technologiques protègent leurs précieuses données en construisant des systèmes fermés. La mission centrale de VANA est de libérer les données enfermées dans ces écosystèmes et de les restituer aux utilisateurs, leur redonnant ainsi la souveraineté sur leurs données.
Autrement dit, chaque utilisateur peut extraire ses propres données depuis différentes plateformes et reconstruire un jeu de données plus riche, plus personnalisé et de meilleure qualité que ceux de toute plateforme existante.
Le cadre VANA repose sur deux concepts fondamentaux :
-
Données non détenues (Non-Custodial Data) : ce concept signifie que les utilisateurs peuvent contrôler l’accès à leurs données comme ils gèrent leurs fonds personnels. De la même manière qu’un portefeuille numérique permet de gérer des actifs cryptographiques, dans l’écosystème VANA, les utilisateurs utilisent un portefeuille pour contrôler l’utilisation de leurs données. En signant des transactions, ils peuvent autoriser certaines applications à accéder à leurs données et décider de leur usage, assurant ainsi autonomie et sécurité.
-
Preuve de contribution (Proof of Contribution) : bien qu’un point de données isolé ait peu de valeur, l’agrégation de données provenant de nombreux utilisateurs multiplie exponentiellement leur valeur globale. Ce mécanisme vise à maintenir une norme élevée de qualité dans le pool de données tout en créant une voie de rémunération pour les fournisseurs de données.
Lorsque des développeurs paient pour accéder aux données, les contributeurs reçoivent des jetons de gouvernance proportionnellement à leur contribution. Ce mécanisme permet non seulement aux contributeurs de tirer un bénéfice économique continu de l’utilisation de leurs données, mais leur confère également un pouvoir de gouvernance effectif, leur permettant de participer directement à l’élaboration des règles d’utilisation des données.
En incitant à la contribution de données de haute qualité, ce système transforme les modèles de tarification et l’efficacité des marchés de données, posant les bases d’une économie décentralisée de la donnée.
03 Applications dans l’écosystème VANA
3.1 DataDAO
DataDAO est le marché décentralisé des données au sein de l’écosystème VANA, permettant aux utilisateurs de contribuer, de tokeniser et d’utiliser des données. Les utilisateurs peuvent choisir des pools de minage adaptés selon le type de données (données de fitness, données de recherche, etc.). Les données contribuées sont validées via le mécanisme Proof of Contribution de Vana, garantissant qualité et valeur, et assurant une compensation équitable aux contributeurs.
Une fois vérifiées, les données sont tokenisées en actifs numériques pouvant servir à des transactions ou à l’entraînement d’IA, tandis que les contributeurs conservent le contrôle d’utilisation. Chaque utilisation des données génère une récompense en jetons et des droits de gouvernance pour les contributeurs, leur permettant de bénéficier économiquement et d’influencer l’évolution du pool. En agrégeant des données multiples, DataDAO crée un marché liquide, assurant une circulation sécurisée et efficace des données dans l’écosystème Vana.
Le cœur de DataDAO est le pool de liquidité des données (DLP), un ensemble de données validées liées à un jeton. Les DLP sont gérés et contrôlés par les membres du DataDAO. Chaque DLP définit clairement sa structure de données et ses critères de contribution : par exemple, Sleep.com, en tant que DAO de données de sommeil, a établi un schéma de données précis, garantissant que toutes les données enregistrées sur la chaîne soient structurées et exploitables. La valeur des données réside autant dans leur structure et leur accessibilité que dans leur volume.
DataDAO accorde une grande importance à l’authenticité et à la validité des données. La plupart des DataDAO utilisent actuellement des environnements d’exécution fiables (TEE) pour exécuter du code Python et valider les données, préservant la confidentialité tout en assurant la qualité. Par exemple, Amazon DataDAO utilise une extension de navigateur pour générer des preuves de qualité des données. Tous les DataDAO rendent publiques leurs preuves de contribution, permettant aux utilisateurs de comprendre clairement les garanties de qualité appliquées.
Les 16 premiers DLP de l’écosystème VANA reçoivent des incitations supplémentaires, permettant aux utilisateurs de générer des revenus en fournissant des données de qualité. Les récompenses sont distribuées selon des indicateurs tels que le volume d’accès, la qualité et les coûts évités. À ce jour, Reddit DataDAO est le plus grand, ayant attiré environ 140 000 utilisateurs et formé avec succès un modèle IA commun. DLPLabs propose un DataDAO permettant aux conducteurs de connecter leur compte DIMO_Network et d’être récompensés pour avoir partagé des données, stimulant l’innovation IA dans l’automobile. 23andWE vise à acquérir 23andMe afin d’empêcher la vente de données génétiques.
DataDAO représente une nouvelle manière de gérer les données, permettant aux utilisateurs individuels de reprendre le contrôle sur leurs données et d’en tirer profit via la tokenisation. Cet écosystème évolue rapidement, ouvrant la voie à une gouvernance des données et à un entraînement d’IA plus ouverts et démocratiques.
3.2 DataFi
Sur la base des pools de liquidité des données, la DeFi commence à s’étendre au domaine des jetons de données. Ces pools constituent la couche fondamentale de l’écosystème, sur laquelle peuvent s’appuyer diverses applications DeFi basées sur les jetons de données.
Déjà, quelques applications pionnières émergent dans l’écosystème Data DeFi. Par exemple, les bourses décentralisées @VanaDataDex et @flur_protocol permettent aux utilisateurs d’échanger des jetons de données et de suivre la dynamique du marché pour certains jetons spécifiques. L’apparition de ces plateformes favorise la libre circulation des actifs de données et dynamise davantage le marché.
À noter que, pour la plupart des DLP actuels, les mécanismes de récompense consistent principalement à verser les gains dans la trésorerie du DLP, sans brûler directement les jetons de données ni influencer leur offre-demande. Toutefois, avec la mise à jour VRC-13, ce mécanisme évolue. Le nouveau modèle introduit une approche plus orientée marché : récompenser en VANA pour encourager la tokenisation des données, puis injecter ces jetons dans les pools de DEX afin de stimuler les échanges et relancer l’écosystème DeFi.
On peut anticiper que les fonctionnalités actuelles de la DeFi — prêt, staking, minage de liquidité, voire assurance — seront progressivement intégrées au marché des jetons de données, ouvrant des scénarios d’application inédits.
Depuis la perspective des industries Web2 traditionnelles, de la même manière que les entreprises achètent des contrats à terme sur le pétrole pour se prémunir contre la volatilité des prix, le marché des données pourrait développer des produits dérivés similaires, permettant aux utilisateurs de fixer à l’avance le prix futur d’un jeu de données et ainsi réduire l’incertitude des coûts d’acquisition.
Certains fonds spéculatifs traitent déjà les données comme une nouvelle classe d’actifs, étudiant des méthodes d’évaluation de leur valeur marchande, comme l’évaluation du prix d’un jeton spécifique, la probabilité d’utilisation ou encore le cycle de vie des données. Ces facteurs influencent directement le prix et la liquidité des jetons de données, laissant une large place à l’innovation.
3.3 Un accès simplifié aux données
Actuellement, l’accès aux jeux de données sur la blockchain principale reste relativement complexe : l’utilisateur doit soumettre une demande détaillée indiquant ses besoins, le montant offert et le code prévu, puis attendre une approbation avant d’obtenir l’accès. Bien que cela assure transparence et conformité, cela augmente la friction opérationnelle.
Pour améliorer l’efficacité, Vana développe des méthodes d’accès plus rapides, permettant un accès API automatisé et direct à plusieurs DataDAO. Par exemple, à l’avenir, un utilisateur pourra combiner des données de sommeil avec des données de transaction de Coinbase ou Binance pour analyser le sommeil des détenteurs d’un projet spécifique, révélant ainsi de nouvelles perspectives de marché.
De plus, Vana étudie une nouvelle proposition visant à brûler des jetons de données et du VANA selon un ratio standard de 80-20 pour obtenir un accès aux données.
Vana développe également une nouvelle interface de requête de données, simplifiant considérablement le processus d’accès. L’utilisateur peut se connecter via son portefeuille, s’authentifier et générer une signature numérique prouvant son droit d’accès. Puisque les pools de liquidité des données enregistrent le format des données, l’utilisateur connaît clairement la structure disponible et peut utiliser des requêtes SQL pour extraire les informations nécessaires. Pendant ce processus, il peut d’abord recevoir des données synthétiques pour tester sa requête et en vérifier la justesse. Lorsqu’il s’agit de données réelles, tous les calculs sont exécutés dans un environnement TEE pour garantir la sécurité. Ce mécanisme empêche efficacement le « double usage des données » (c’est-à-dire la revente illégale après achat), protégeant ainsi la valeur économique des données et assurant la durabilité du marché.
04 Analyse de la valeur de Vana
Les données deviennent rapidement l’actif central de l’ère numérique. Bien que les technologies de collecte et de stockage soient matures, le véritable défi réside dans l’évaluation de la qualité des données, la maximisation de leur valeur et la protection de la vie privée. Vana résout ingénieusement ce dilemme grâce à des mécanismes incitatifs innovants : les utilisateurs peuvent miser des jetons Vana pour soutenir des DataDAO à forte valeur et recevoir des récompenses en retour, créant ainsi un cercle vertueux.
4.1 Franchir la barrière des « murs de données »
Le développement de l’IA bute désormais sur un « mur de données » : les ressources de données publiques de haute qualité s’épuisent. Les prochaines percées en IA dépendront de la capacité à collecter et exploiter efficacement des données privées de qualité, telles que les dossiers médicaux personnels, les données d’utilisation des objets connectés ou encore les vidéos de conduite Tesla, autant de ressources d’entraînement potentielles.
La valeur des données suit un paradoxe : elle provient souvent de leur caractère privé, mais perd de sa valeur dès qu’elle devient largement accessible. Tout comme les modèles IA subissent un processus de marchandisation, l’avantage concurrentiel durable viendra du contrôle de jeux de données uniques, permettant à un modèle de surpasser les autres dans un domaine spécifique. Une fois les données publiées, la concurrence sur les prix survient immédiatement et leur valeur chute rapidement.
Grâce aux TEE, les DataDAO de Vana parviennent à transférer la valeur des données privées tout en protégeant la confidentialité. Cette percée élargit le champ des actifs de données précieux, passant des données publiques limitées aux vastes domaines des données privées, ouvrant ainsi de nouvelles voies au développement de l’IA.
4.2 La courbe singulière de la valeur des données
La valeur des données suit une courbe particulière : un point de données isolé a une valeur quasi nulle, mais quand le volume atteint une masse critique, la valeur explose exponentiellement. Cette particularité rend la financiarisation des données extrêmement difficile — car seule la constitution collective des données permet de générer des retours significatifs pour tous les participants.
Le mécanisme DataDAO de Vana propose une solution innovante à ce problème. En regroupant des données similaires, il donne aux contributeurs une force de négociation collective. Prenons l’exemple des propriétaires Tesla : s’ils rassemblent collectivement leurs données de conduite via un DataDAO, ils obtiennent un pouvoir de fixation des prix considérable face à tout demandeur. En revanche, si chaque propriétaire diffuse ses données individuellement contre paiement, une guerre des prix s’ensuit, et l’acheteur n’a besoin que d’acheter un échantillon auprès des vendeurs les moins exigeants.
Des jeux de données structurés, validés et de haute qualité (comme des données de conduite Tesla vérifiées) ont une grande valeur sur le marché. Le cadre proposé par Vana permet de réaliser pleinement cette valeur.
4.3 La percée de l’agrégation interplateformes
La force principale des DataDAO réside dans leur capacité à agréger des données provenant de plusieurs plateformes — une possibilité quasi impossible dans les écosystèmes fermés actuels. Imaginons un chercheur souhaitant accéder aux messages Facebook, aux conversations iMessage et aux documents Google d’un même utilisateur. Traditionnellement, cela nécessiterait une coopération entre Facebook, Apple et Google. Or, ces plateformes n’ont ni intérêt à intégrer les données utilisateur (ce qui affaiblirait leurs murs de données), ni la liberté réglementaire pour le faire.
Grâce au modèle d’intégration piloté par l’utilisateur, les DataDAO contournent astucieusement cet obstacle, libérant la valeur des données interplateformes et ouvrant des possibilités inédites pour l’entraînement et la recherche en IA.
4.4 Un nouveau mode de participation économique
La vision de Vana va bien au-delà de l’innovation technique : elle crée un nouveau mode de participation économique. Dans ce modèle, l’utilisateur peut entrer dans l’économie numérique sans capital traditionnel — il possède déjà la ressource la plus précieuse : ses données personnelles. Il n’a pas besoin d’apporter de l’argent, seulement de partager ses données. Voilà son capital. DataDAO offre aux utilisateurs Web3 une source de revenus passifs basée sur leurs données uniques, abaissant ainsi l’accès à l’économie numérique.
4.5 Réinventer la répartition des bénéfices de l’IA
Ce modèle pourrait radicalement transformer la répartition des bénéfices issus du progrès de l’IA. Plutôt que de voir la valeur s’accumuler chez les grandes entreprises technologiques, Vana permet une participation large à l’économie de l’IA grâce à la propriété des données et aux mécanismes de gouvernance. Les premiers signes sont encourageants : plus de 300 DataDAO sont en développement sur le réseau test.
Dans les 3 à 5 ans à venir, nous pourrions assister à l’émergence d’un modèle IA entièrement contrôlé par les utilisateurs, alimenté par les données d’un milliard d’utilisateurs, dont les performances dépasseraient celles des modèles IA centralisés actuels. Un tel modèle appartiendrait totalement aux utilisateurs, susciterait un fort sentiment d’appartenance et permettrait des interactions plus profondes. La souveraineté des données permettrait aux utilisateurs de choisir volontairement de soutenir des modèles éthiques, et de refuser que leurs données soient utilisées par des entreprises non éthiques.
L’IA décentralisée offre un cadre plus démocratique, permettant à la société dans son ensemble de décider ce que l’IA doit apprendre et croire, plutôt que de laisser ce pouvoir à quelques entreprises. La propriété des données par les utilisateurs implique non seulement des droits économiques, mais aussi un contrôle effectif sur le comportement des modèles IA, notamment sur des questions cruciales comme la censure.
05 Conclusion
Sur le plan commercial, Vana vise à construire une chaîne de valeur complète des données, couvrant l’agrégation, l’entraînement de modèles IA et la vente de données. Le marché actuel, dominé par quelques plateformes et courtiers de données, souffre d’inefficacité. Vana cherche à corriger cela en créant un écosystème d’échange plus juste.
Vana n’est pas simplement une nouvelle plateforme : elle incarne une transformation fondamentale de la propriété des données et de la manière dont l’IA évolue. En permettant aux utilisateurs de créer collectivement de la valeur tout en gardant la souveraineté sur leurs données, Vana pose les bases d’un avenir IA plus équitable et innovant.
Dans un marché de l’IA saturé de spéculations conceptuelles, Vana, grâce à ses mécanismes innovants centrés sur les véritables problèmes du secteur, pourrait devenir une force clé dans la configuration de l’avenir de l’IA.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News














