
Comprendre KIP Protocol, protocole de base Web3 décentralisé axé sur l'IA (2)
TechFlow SélectionTechFlow Sélection

Comprendre KIP Protocol, protocole de base Web3 décentralisé axé sur l'IA (2)
RAG est une technologie innovante utilisée dans l'IA générative, impliquant trois acteurs clés de création de valeur dans le domaine de l'IA : les développeurs d'applications, les créateurs de modèles et les propriétaires de données.
Auteur : KIP Protocol
KIP Protocol est le premier protocole au monde à prendre en charge le RAG décentralisé, offrant en substance un cadre fondamental permettant de décentraliser toute l'IA. C'est la première étape vers l'émancipation du monopole des géants de l'intelligence artificielle.
1) Présentation du RAG
Les modèles d’IA sont formés en ingérant d'importantes quantités de données. Ils apprennent à partir de ces données en ajustant leurs poids internes afin d’identifier des motifs, leur permettant ainsi de faire des prédictions ou de prendre des décisions face à de nouvelles données. Le modèle peut alors répondre aux questions des utilisateurs selon les connaissances brutes qu’il a acquises.
Toutefois, ce processus d'apprentissage nécessite d'exposer l’intégralité du jeu de données au modèle, ce qui revient essentiellement à « absorber » ces données dans le modèle. Si les données contiennent des informations confidentielles ou protégées par des droits d’auteur, il se pourrait que le modèle les restitue mot pour mot à un moment donné.
Et si vous ne souhaitez pas exposer vos données à un tel risque ?
C’est précisément ici qu’intervient le RAG (Retrieval-Augmented Generation).
Le RAG est une technologie sophistiquée permettant à un modèle d’IA de générer des réponses à des questions auxquelles il n’aurait pas pu répondre initialement, en extrayant des données et informations provenant de bases de connaissances ou de bases de données externes.
C’est comme un assistant intelligent qui, bien qu’il ignore la réponse à votre question, saura trouver efficacement l’information souhaitée dans des sources externes.

1. Saisie de la requête utilisateur :
Dans un premier temps, l’utilisateur pose une question à un chatbot fonctionnant sur un système RAG.
Par exemple : « Quels sont les symptômes du COVID-19 ? »
2. Recherche dans une base de données externe :
Le modèle lance une phase de recherche en explorant des bases de connaissances et des bases de données externes connectées — tels que des revues médicales, des sites de santé ou des bases cliniques — afin d’extraire uniquement les données et informations pertinentes par rapport à la requête de l'utilisateur.
3. Traitement, filtrage et génération :
Les données récupérées sont traitées et filtrées afin d’en extraire les informations clés et d’éliminer celles qui sont superflues. Le modèle d’IA intègre ensuite ces données avec le contexte de la requête de l’utilisateur pour générer une réponse.
Dans le cas de la requête sur les symptômes du COVID-19, le RAG pourrait produire une réponse listant des symptômes courants tels que la fièvre, la toux ou l’essoufflement, mais inclure aussi des découvertes issues de recherches médicales récentes non présentes lors de l’entraînement initial du modèle — offrant ainsi une réponse de meilleure qualité.
4. Envoi de la réponse :
La réponse générée est transmise à l’utilisateur via l’interface du chatbot.
Le RAG permet donc de répondre aux requêtes d’IA en utilisant des données externes, sans que le modèle doive d’abord « absorber » ces données via un processus d’entraînement.
La technologie RAG devient de plus en plus mature. Dans notre article scientifique, nous démontrons que la qualité des réponses fournies par le RAG peut surpasser celle des modèles traditionnellement entraînés. https://arxiv.org/pdf/2311.05903.pdf
2) Importance du RAG
Le RAG va devenir de plus en plus important car :
-
L'entraînement des modèles est une opération technique et spécialisée, souvent coûteuse — toutes les personnes ne disposent pas des compétences ni des ressources nécessaires.
-
Les propriétaires de nombreuses données (données confidentielles, données propriétaires, etc.) peuvent hésiter à exposer leurs données à des modèles qu'ils ne possèdent pas entièrement ou qu'ils ne contrôlent pas.
Vous avez peut-être également remarqué un point crucial :
Dans le cadre du RAG, les développeurs d’applications, les créateurs de modèles et les détenteurs de données peuvent collaborer, chacun contribuant à répondre à la requête de l’utilisateur.
Ainsi, dans un environnement équitable, chaque partie devrait être justement rémunérée pour sa contribution.

Or, actuellement, aucune méthode simple n’existe pour y parvenir sans compromettre l’indépendance ou la propriété de chacun. (C’est d’ailleurs cette problématique qui nous a motivés à lancer KIP il y a plus d’un an.)
C’est ce qu’on appelle le « problème de la rémunération ».
3) Le « problème de la rémunération » du RAG dans l’IA centralisée
Imaginons un scénario où une seule entité possède les trois composantes clés de la création de valeur en IA : aucun besoin de redistribuer les paiements collectés auprès des utilisateurs entre différentes parties, puisque tout peut être géré en interne.
Inversement, si nous refusons qu’une seule entité contrôle les trois éléments fondateurs de la valeur en IA (développeurs d’applications, créateurs de modèles, détenteurs de données), alors nous devons résoudre la question de la répartition des revenus entre ces différents rôles dans l’écosystème de l’IA.
Sans solution au « problème de la rémunération », les développeurs d’applications, les créateurs de modèles et les détenteurs de données ne peuvent conserver leur indépendance ni leur liberté d’échange.
Pourtant, le monopole dans le secteur de l’IA a déjà commencé.
Voici notre analyse du monopole d’OpenAI :
-
OpenAI possède clairement certains des modèles les plus puissants — des modèles fermés comme GPT-4, entraînés à partir des connaissances et contenus que nous avons publiés sur Internet au fil des ans. Cela alimente leurs applications (comme ChatGPT) et les GPT personnalisés par les utilisateurs.
-
Grâce à leurs mesures de protection des droits d’auteur (notamment leur engagement à couvrir les frais juridiques pour toute personne trouvant ses données protégées par le droit d’auteur sur leur plateforme), ils encouragent les utilisateurs à téléverser librement leurs données sur leur plateforme fermée, sans craindre de conséquences légales.
-
Étant donné qu’OpenAI est une plateforme web2 centralisée et fermée, nous devrions nous demander : les données téléchargées par les utilisateurs (que ce soit sur ChatGPT ou via les applications GPT) leur appartiennent-elles encore ?
-
Ainsi, compte tenu de leurs modèles existants, de leur collecte massive et sans restriction de données, de leurs protections juridiques et de leurs importantes réserves financières, OpenAI apparaît comme l’aspirateur de données le plus vorace jamais vu, absorbant continuellement données et ressources pour alimenter ses modèles.
En rassemblant tous ces facteurs (ainsi que les 7 milliards de dollars levés pour le matériel), on comprend aisément que, sans action contraire, le monopole total du secteur de l’IA par une ou quelques entreprises est inévitable.
Compte tenu des raisons exposées ci-dessus, nous sommes convaincus que le monopole de l’IA nuit à l’humanité. Nous allons donc proposer activement des solutions pour s’en affranchir.
4) L’importance du RAG décentralisé
Le RAG implique les trois facteurs fondamentaux de la création de valeur en IA : les développeurs d’applications, les créateurs de modèles et les détenteurs de données.
En construisant un cadre de RAG décentralisé, KIP établit donc en réalité un cadre permettant de décentraliser le contrôle de la création de valeur en IA, offrant ainsi un terrain de jeu équitable à tous les contributeurs et permettant de sortir du monopole de l’IA.
Nous permettons à l’IA de fonctionner efficacement comme le fruit collectif de millions de créateurs, petits et grands, sans qu’aucune grande entreprise n’ait à contrôler chaque fonctionnalité centrale.
Pour cela, nous allons d’abord résoudre trois problèmes fondamentaux qui entravent la décentralisation du RAG :
1. Propriété :
Garantir que (développeurs d’applications, créateurs de modèles et détenteurs de données) peuvent publier facilement et en toute sécurité du contenu sur le web3, en créant leurs propres « entités commerciales Web3 » sous forme de jetons semi-fongibles ERC-3525, leur permettant ainsi de prouver leur propriété numérique sur la blockchain.
2. Connexion on-chain / off-chain :
Assurer une interaction fluide entre les mondes hors chaîne et sur chaîne, en offrant aux développeurs d’applications, créateurs de modèles et détenteurs de données un environnement ouvert où ils peuvent facilement et librement interagir.
3. Monétisation :
Fournir un cadre universel permettant d’enregistrer et de comptabiliser les contributions de chaque créateur de valeur en IA, ainsi que de gérer automatiquement le partage des revenus et les retraits.

En rendant le RAG décentralisé (d/RAG), KIP trace la première feuille de route essentielle pour sortir du monopole de l’IA.
Il libère la propriété numérique pour chaque créateur de valeur en IA, permettant à chacun de commercer tout en conservant son indépendance — exactement l’inverse de ce que tentent d’accomplir les grandes entreprises technologiques du web2.
Le protocole KIP fournira aux créateurs de valeur en IA les outils nécessaires pour s’affranchir du monopole de l’IA.
Pour en savoir plus, rejoignez notre communauté officielle en chinois :
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News














