
ZKML : Une technologie de déploiement de modèles combinant l'IA et la blockchain pour assurer la protection de la vie privée
TechFlow SélectionTechFlow Sélection

ZKML : Une technologie de déploiement de modèles combinant l'IA et la blockchain pour assurer la protection de la vie privée
Qu'est-ce que le ZKML, si populaire actuellement ?
Rédaction : Maggie, Foresight Research

ZKML (machine learning à connaissance nulle) est une technologie qui applique les preuves à connaissance nulle au machine learning. ZKML constitue un pont entre l'IA et la blockchain. ZKML peut résoudre les problèmes de protection de la vie privée des modèles ou entrées d'IA et de vérifiabilité du processus d'inférence, permettant ainsi aux petits modèles ou aux preuves d'inférence basées sur des ZKP de monter sur la chaîne. L'intérêt de mettre les modèles ou leurs preuves sur la chaîne réside dans :
-
Permettre à la blockchain de percevoir le monde physique. Par exemple : un modèle de reconnaissance faciale fonctionnant sur la blockchain permettrait à celle-ci de détecter des visages humains ; grâce à un modèle IA intégré, la blockchain pourrait comprendre que ce visage correspond probablement à une femme, d’un certain âge, etc.
-
Permettre aux contrats intelligents de prendre des décisions. Par exemple : un modèle prédisant le prix du WETH sur la chaîne pourrait aider un contrat intelligent à décider ses opérations de trading.
-
Faire fonctionner des modèles IA tout en préservant la confidentialité. Par exemple : une entreprise ayant consacré d’importantes ressources informatiques pour entraîner un modèle souhaite offrir un service d'inférence tout en protégeant sa confidentialité, ou bien garantir la confidentialité des données d'entrée des utilisateurs. Grâce au ZKML, on peut préserver la confidentialité du modèle et des entrées, tout en prouvant aux utilisateurs que l'inférence a été correctement effectuée, réalisant ainsi une inférence sans confiance.
Applications du ZKML
-
IA sur chaîne : déployer des modèles IA ou leurs preuves d'inférence sur la blockchain afin que les contrats intelligents puissent utiliser l'IA pour prendre des décisions. Par exemple, un système de trading sur chaîne servant à guider les décisions d'investissement.
-
Blockchain auto-améliorante : permettre à la blockchain d'utiliser les capacités de l'IA pour continuellement améliorer et ajuster ses stratégies à partir de données historiques. Par exemple, un système de réputation sur chaîne fondé sur l'IA.
-
AIGC sur chaîne : les contenus ou œuvres artistiques générés par AIGC sont frappés en NFT sur la blockchain. Les ZK peuvent prouver la validité du processus, par exemple qu’aucune image protégée par droit d’auteur n’a été utilisée dans le jeu de données.
-
Authentification biométrique de portefeuille (KYC) : la preuve de reconnaissance faciale est mise sur la chaîne, permettant au portefeuille de remplir les exigences KYC.
-
Sécurité IA : utiliser l'IA pour la détection de fraude, la prévention des attaques Sybil, etc.
-
Jeux ZKML sur chaîne : joueur d'échecs IA sur chaîne, personnages NFT pilotés par un réseau neuronal, etc.
Technologie ZKML
-
Objectif : convertir un réseau neuronal en circuit ZK. Difficultés : 1. Les circuits ZK ne supportent pas les nombres flottants. 2. Les réseaux neuronaux trop volumineux sont difficiles à convertir.
-
État actuel : la première bibliothèque ZKML remonte à deux ans, cette technologie étant donc très récente. Actuellement, les bibliothèques ZKML les plus avancées permettent de ZK-ifier certains réseaux neuronaux simples, et de les utiliser sur la blockchain. On peut déjà monter sur la chaîne des modèles basiques de régression linéaire, et divers petits modèles de réseaux neuronaux peuvent être prouvés et mis sur chaîne. Cependant, peu de démonstrations existent : seule une application de reconnaissance de chiffres manuscrits a été publiée. Certains outils affirment pouvoir gérer des modèles de 100M de paramètres, d'autres prétendent même convertir GPT2 en circuit ZK et générer des preuves ZK.
-
Directions futures : Quantification du réseau (Network Quantization), c’est-à-dire convertir les nombres flottants du réseau neuronal en nombres fixes, et alléger le réseau neuronal (rendre compatible avec ZK). Tenter de convertir des réseaux neuronaux à grand nombre de paramètres en circuits ZK et améliorer l'efficacité des preuves (élargir les capacités ZK).
Conclusion
ZKML est un pont entre l'IA et la blockchain. Son importance réside dans la capacité de la blockchain à percevoir le monde physique, à permettre aux contrats intelligents de prendre des décisions, et à exécuter des modèles IA tout en protégeant la vie privée. Il s'agit d'une technologie très prometteuse.
Cette technologie est très récente mais progresse rapidement. Actuellement, certains modèles de réseaux neuronaux simples peuvent déjà être convertis en circuits ZK, permettant de les déployer sur chaîne ou d’y soumettre des preuves d'inférence. Toutefois, les modèles linguistiques restent difficiles : Ddkang/zkml affirme pouvoir produire des versions ZK de GPT2, Bert et Diffusion, mais l'efficacité réelle reste incertaine – ils peuvent fonctionner, mais difficilement être déployés sur chaîne. Nous pensons qu’avec les progrès des techniques de quantification, des technologies ZK et de l’extension de la blockchain, le ZKML pour modèles linguistiques deviendra bientôt utilisable.
1. Contexte
(Si vous connaissez déjà les bases du ZK et du ML, vous pouvez sauter ce chapitre.)
Preuve à connaissance nulle (ZK) : Une preuve à connaissance nulle permet à un prouveur de convaincre un vérificateur qu'une affirmation est vraie, sans lui fournir aucune information utile. Le ZK sert principalement à prouver qu'un calcul a été correctement exécuté et à protéger la confidentialité.
Prouver l'intégrité du calcul : Prenons l'exemple du ZK-rollup. Le fonctionnement du ZK-rollup consiste à regrouper plusieurs transactions, à les publier sur la couche 1 (L1), et simultanément à y publier une preuve (via la technologie ZK) affirmant que ces transactions sont valides. Une fois que la validité est vérifiée sur L1, l'état du zk-rollup est mis à jour.
Protection de la vie privée : Prenons le protocole Aztec comme exemple. Sur zk.money d'Aztec, les actifs existent sous forme de billets, similaires aux UTXO du Bitcoin. Le montant des billets est chiffré. Quand un utilisateur veut transférer, il doit détruire son billet et créer un nouveau billet pour le destinataire ainsi qu’un rendu pour lui-même. La preuve à connaissance nulle sert à prouver de façon confidentielle que les montants des billets détruits et créés sont égaux, et que l'utilisateur possède bien le droit de contrôle du billet.
Machine Learning (ML) : Le machine learning est une branche de l'intelligence artificielle. Sa théorie vise principalement à concevoir et analyser des algorithmes permettant à un ordinateur d’apprendre automatiquement. Ces algorithmes extraient automatiquement des régularités à partir de données, puis utilisent ces régularités pour prédire des données inconnues. Le machine learning est largement utilisé dans divers domaines tels que la vision par ordinateur, le traitement du langage naturel, la reconnaissance biométrique, les moteurs de recherche, le diagnostic médical, la détection de fraude bancaire, l’analyse des marchés financiers, le séquençage ADN, la reconnaissance vocale et manuscrite, les jeux et la robotique.
2. Quels problèmes ZKML résout-il ?
ZKML est un domaine de recherche et de développement qui fait sensation dans la communauté cryptographique depuis deux ans. Appliquer les preuves à connaissance nulle au machine learning, cette technologie vise principalement à résoudre via les ZK les problèmes de confidentialité et de vérifiabilité dans le machine learning. Cela permet aux petits modèles ou aux preuves d'inférence ZKP de monter sur la chaîne, formant ainsi un pont entre l'IA et la blockchain :
-
Modèle sur chaîne : Convertir un modèle ML en circuit ZK et stocker un petit modèle ZKML dans un contrat intelligent sur la blockchain. Les utilisateurs peuvent alors appeler le contrat pour utiliser le modèle. Par exemple, Modulus Labs a créé RockyBot, un modèle IA sur chaîne qui prédit le prix du WETH pour guider les décisions de trading.
-
Preuve d'inférence du modèle sur chaîne : Convertir un modèle ML en circuit ZK, effectuer l'inférence hors chaîne et générer une preuve ZK. Cette preuve atteste que le processus d'inférence a été correctement exécuté. Le résultat de l'inférence et la preuve ZK sont envoyés sur la chaîne, disponibles pour consultation ou vérification par les contrats intelligents.
Quel est l’intérêt de mettre les modèles ou leurs preuves d’inférence sur la chaîne ?
-
Permettre à la blockchain de percevoir le monde physique. Par exemple : un modèle de reconnaissance faciale fonctionnant sur la blockchain permettrait à celle-ci de détecter des visages humains ; grâce à un modèle IA intégré, la blockchain pourrait comprendre que ce visage correspond probablement à une femme, d’un certain âge, etc.
-
Permettre aux contrats intelligents de prendre des décisions. Par exemple : un modèle prédisant le prix du WETH sur la chaîne pourrait aider un contrat intelligent à décider ses opérations de trading.
-
Faire fonctionner des modèles IA tout en préservant la confidentialité. Par exemple : une entreprise ayant consacré d’importantes ressources informatiques pour entraîner un modèle souhaite offrir un service d'inférence tout en protégeant sa confidentialité, ou bien garantir la confidentialité des données d'entrée des utilisateurs. Grâce au ZKML, on peut préserver la confidentialité du modèle et des entrées, tout en prouvant aux utilisateurs que l'inférence a été correctement effectuée, réalisant ainsi une inférence sans confiance.
Rôle des preuves à connaissance nulle dans ZKML :
1. Protection de la vie privée : Protéger la confidentialité du modèle ML ou des données d'entrée durant l'inférence.
-
Confidentialité des données (modèle public + données privées) : J'ai des données sensibles, par exemple des données médicales ou des images faciales. Je peux utiliser ZKML pour protéger la confidentialité de mes données d'entrée, exécuter un modèle de réseau neuronal public sur ces données et obtenir un résultat. Par exemple, un modèle de reconnaissance faciale.
-
Confidentialité du modèle (modèle privé + données publiques) : Par exemple, j'ai investi beaucoup de ressources pour entraîner un modèle que je ne veux pas exposer. Je dois donc protéger sa confidentialité. Avec ZKML, je peux exécuter un modèle de réseau neuronal privé confidentiel, capable d'inférer à partir d'entrées publiques pour produire un résultat.
2. Vérifiabilité : Utiliser les preuves ZK pour attester de l’exécution correcte du processus d’inférence ML, rendant ainsi le processus du machine learning vérifiable.
-
Supposons que l'exécution du modèle n'ait pas lieu sur mon serveur, mais que j'aie besoin de m'assurer que l'inférence a été correctement effectuée. Je peux utiliser ZKML pour réaliser une inférence sur une entrée donnée avec un modèle, produisant un résultat. La preuve ZK atteste que ce processus a été correctement exécuté. Même si l’exécution ne s’est pas faite sur mon propre ordinateur, je peux valider la preuve ZK pour savoir si l’inférence a bien été effectuée, et ainsi faire confiance au résultat.
3. Cas d'utilisation de ZKML
-
Intégrité du calcul
-
IA sur chaîne (On-chain AI) : Déployer des modèles IA sur la blockchain, permettant aux contrats intelligents d'avoir des capacités décisionnelles via des modèles IA.
-
Modulus Labs : RockyBot, bot de trading ML vérifiable sur chaîne.
-
-
Blockchain auto-améliorante : Permettre à la blockchain d’utiliser les capacités de l’IA pour améliorer continuellement ses stratégies à partir de données historiques.
-
Amélioration de l’AMM de Lyra Finance par l’intelligence artificielle.
-
Création d’un système de réputation basé sur l’IA pour Astraly.
-
Création d’une fonctionnalité de conformité basée sur l’IA au niveau du contrat intelligent pour le protocole Aztec.
-
Modulus Labs : Blockchains that self-improve (lien).
-
-
AIGC sur chaîne : Contenus ou œuvres artistiques générés par AIGC, frappés en NFT sur la blockchain. Les ZK peuvent prouver la validité du processus, par exemple qu’aucune image protégée par droit d’auteur n’a été utilisée dans le jeu de données.
-
Transparence du ML en tant que service (MLaaS) (lien)
-
Sécurité IA : Utiliser l’IA pour la détection de fraude, la prévention des attaques Sybil, etc. Entraîner un modèle de détection d’anomalies IA à partir des données du contrat intelligent ; en cas d’anomalie, suspendre le contrat et envoyer la preuve de détection d’anomalie sur chaîne via ZK.
-
Jeux ZKML sur chaîne : Joueur d’échecs IA sur chaîne, personnages NFT pilotés par un réseau neuronal, etc.
-
Tests de référence vérifiables pour modèles IA : Utiliser les ZK pour fournir des preuves de benchmarking des modèles, assurant la vérifiabilité des résultats de performance et d’efficacité.
-
Preuve de l’exactitude de l’entraînement du modèle : L’entraînement des modèles étant très coûteux en ressources, l’utilisation des ZK pour prouver son exactitude n’est pas encore réalisable aujourd’hui. Toutefois, de nombreuses personnes pensent que c’est techniquement possible, et tentent d’utiliser les ZK pour prouver qu’un modèle a utilisé (ou non) certains jeux de données, afin de résoudre les problèmes de droits d’auteur liés à l’AIGC.
-
-
Protection de la vie privée
-
Authentification biométrique / identité numérique du portefeuille
-
WordCoin utilise un dispositif biométrique appelé Orb pour scanner l’iris et fournir aux utilisateurs une identité numérique unique et vérifiable. WordCoin étudie actuellement le zkml, dans l’objectif de mettre à niveau World ID. Après la mise à niveau, les utilisateurs pourront conserver eux-mêmes leurs caractéristiques biométriques signées dans le stockage chiffré de leur appareil mobile, télécharger le modèle ML générant le code d’iris, et créer localement une preuve à connaissance nulle attestant que ce code d’iris a bien été généré à partir de l’image signée par le bon modèle.
-
-
Plateforme de bounty blockchain pour le machine learning
-
Une entreprise lance un appel à projets et fournit des données publiques et privées. Les données publiques servent à entraîner le modèle, les données privées à la prédiction. Certains prestataires IA entraînent un modèle, le convertissent en circuit ZK, chiffrent le modèle et le soumettent au contrat pour vérification. Ils effectuent ensuite la prédiction sur les données privées, obtiennent un résultat, génèrent une preuve ZK, et soumettent cette preuve au contrat pour validation. Une fois toutes ces étapes terminées, le prestataire reçoit la récompense. zkML : Démo de circomlib-ml sur le testnet Goerli.
-
-
Inférence confidentielle : Par exemple, utiliser des données médicales privées pour un diagnostic, puis envoyer le résultat sensible (par exemple, un résultat de détection de cancer) directement au patient. (vCNN paper, page 2/16)
-
4. Écosystème du ZKML
Selon la cartographie du ZKML établie par SevenX Ventures.
-
Accélération matérielle : De nombreuses institutions développent activement des accélérateurs matériels pour les ZKP, ce qui profite également au développement du ZKML. On utilise généralement des FPGA, GPU ou puces ASIC pour accélérer la génération des ZKP. Par exemple : Accseal développe une puce ASIC dédiée à l’accélération matérielle des ZKP ; Ingonyama construit une bibliothèque d’accélération ZK appelée ICIClE, conçue pour les GPU compatibles CUDA ; Supranational se concentre sur l’accélération GPU ; Cysic et Ulvetanna se concentrent sur l’accélération FPGA.
-
Entrées : Pour utiliser des données de la chaîne comme entrées, Axiom, Herodotus, Hyper Oracle et Lagrange améliorent l'accès des utilisateurs aux données blockchain et offrent des vues plus complexes des données sur chaîne. Les données d'entrée pour le ML peuvent ensuite être extraites de ces données historiques importées.
-
Inférence : ModulusLabs développe un nouveau système zkSNARK spécialement conçu pour le ZKML. Cette partie peut être fusionnée avec la section « Outils ZKML », car elle concerne principalement la transformation des modèles en format ZK et les outils nécessaires. Giza est une plateforme ML basée sur StarkNet, axée sur le déploiement entièrement sur chaîne de modèles.
-
Calcul : Se concentre sur la construction de réseaux de calcul décentralisés pour entraîner des modèles d’IA accessibles à tous. Ils permettent aux utilisateurs d’entraîner des modèles d’IA à moindre coût en utilisant des ressources de calcul périphériques.
-
Entraînement décentralisé / puissance de calcul : Construire des réseaux de calcul décentralisés pour entraîner des modèles d’IA accessibles à tous. Ils permettent aux utilisateurs d’entraîner des modèles d’IA à moindre coût en utilisant des ressources de calcul périphériques.
-
Outils ZKML : Voir le chapitre 5 sur l’histoire technique. ZAMA sur le schéma utilise principalement le chiffrement homomorphe complet (FHE) pour la protection de la vie privée en ML. Comparé au ZKML, FHEML assure uniquement la confidentialité, sans vérification sans confiance.
-
Cas d'utilisation : Worldcoin utilise le ZKML pour l’authentification d’identité numérique. Les utilisateurs conservent de manière chiffrée leurs caractéristiques biométriques signées dans leur appareil, un modèle ML de reconnaissance d’iris est transformé en version ZK, et lors de l’identification, le modèle est exécuté pour vérifier la correspondance des traits biométriques. Une preuve ZK atteste de la justesse du processus. Modulus Labs développe un robot de trading IA sur chaîne. EIP7007 de Cathie, norme zkML pour les NFT AIGC. Joueur d’échecs IA sur chaîne, personnages NFT pilotés par un réseau neuronal, etc.

5. Histoire technique du ZKML
Les principaux défis de la conversion d’un réseau neuronal en circuit ZK sont :
-
Les circuits nécessitent des opérations sur des nombres fixes, or les réseaux neuronaux utilisent massivement des nombres flottants.
-
La taille des modèles : la conversion des grands modèles est difficile et produit des circuits volumineux.
Évolution des bibliothèques ZKML :
- 2021 : zk-ml/linear-regression-demo, Peiyuan Liao
Implémentation d’un circuit de régression linéaire. La régression linéaire est un algorithme de prédiction très basique, supposant une relation linéaire entre la variable de sortie et les variables d’entrée. Elle convient aux prévisions de variables numériques et à l’étude des relations entre deux ou plusieurs variables. Exemples : prédire le prix d’une maison selon sa surface et d’autres caractéristiques, ou prédire les ventes futures selon les données historiques.
- 2022 : 0xZKML/zk-mnist, 0xZKML
Création d’un circuit ZK pour un réseau neuronal basé sur le jeu de données MNIST, capable de reconnaître des chiffres manuscrits. Par exemple : écrire à la main le chiffre 2, le système le reconnaît comme 2, et génère une preuve du processus d’inférence. Cette preuve peut être mise sur la chaîne et validée via ethers + snarkjs.
En réalité, la bibliothèque zk-mnist convertit seulement la dernière couche en circuit, pas tout le réseau neuronal.
- 2022 : socathie/zkML, Cathie
Contrairement à zk-mnist, ZKML convertit l’intégralité du réseau neuronal en circuit. Cathie’s zkMachineLearning fournit plusieurs outils ZKML, tels que cirocmlib-ml et keras2circom, aidant les ingénieurs ML à transformer leurs modèles en circuits.
-
Novembre 2022 : zk-ml/uchikoma, Peiyuan Liao
Conversion des opérations flottantes du réseau neuronal en opérations à virgule fixe. Création et publication d’un outil et d’un cadre général permettant de convertir presque tous les algorithmes de machine learning en circuits de preuve à connaissance nulle facilement intégrables à la blockchain.
-
Modèles visuels → AIGC
-
Modèles linguistiques → chatbots, assistants d’écriture
-
Modèles linéaires et arbres de décision → détection de fraude, prévention des attaques Sybil
-
Modèles multimodaux → systèmes de recommandation
Entraînement d’un modèle de génération de contenu ML adapté à la blockchain (AIGC), puis conversion en circuit ZK. Il permet de générer des œuvres d’art, de produire des preuves ZK compactes, puis de frapper ces œuvres en NFT.
-
Juillet 2022, mise à jour en mars 2023 : zkonduit/ezkl
ezkl est une bibliothèque et un outil en ligne de commande permettant d’effectuer des inférences sur des modèles de deep learning et d’autres graphes de calcul dans des zk-snark (ZKML). Il utilise Halo2 comme système de preuve.
Permet de définir un graphe de calcul (ex. : réseau neuronal), puis d’utiliser ezkl pour générer un circuit ZK-SNARK. La preuve ZKP générée pour l’inférence peut être vérifiée par un contrat intelligent.
Il prétend supporter des modèles jusqu’à 100 millions de paramètres, mais cela peut être très gourmand en ressources.
-
Mai 2023 : Ddkang/zkml (Lien)
zkml affirme pouvoir ZK-ifier les modèles GPT2, Bert et Diffusion. Mais cela nécessite probablement une grande mémoire, et il n’est pas clair si la preuve peut être stockée dans un contrat intelligent.
zkml peut vérifier que l’exécution du modèle atteint 92,4 % de précision sur ImageNet, et peut aussi produire en quatre secondes une preuve d’un modèle MNIST avec 99 % de précision.
-
Mai 2023 : zkp-gravity/0g
Réseau neuronal léger, supportant données privées + modèle public.
En résumé, nous pouvons identifier les directions explorées actuellement par la technologie ZKML :
-
Quantification du réseau (Network Quantization) : convertir les nombres flottants du réseau neuronal en nombres fixes, et alléger le réseau (compatible ZK).
-
Tenter de convertir des réseaux neuronaux à grand nombre de paramètres en circuits ZK, tout en améliorant l’efficacité des preuves (élargir les capacités ZK).
6. Conclusion
ZKML est un pont entre l'IA et la blockchain. Son importance réside dans la capacité de la blockchain à percevoir le monde physique, à permettre aux contrats intelligents de prendre des décisions, et à exécuter des modèles IA tout en protégeant la vie privée. Il s'agit d'une technologie très prometteuse.
Le ZKML est très récent mais progresse rapidement. Actuellement, certains modèles de réseaux neuronaux simples peuvent déjà être convertis en circuits ZK, permettant de les déployer sur chaîne ou d’y soumettre des preuves d'inférence. Les modèles linguistiques restent difficiles : Ddkang/zkml affirme pouvoir produire des versions ZK de GPT2, Bert et Diffusion. Nous pensons qu’avec les progrès des techniques de quantification, des technologies ZK et de l’extension de la blockchain, le ZKML pour modèles linguistiques deviendra bientôt utilisable.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News












