Analyse complète du marché de l’inférence IA : comment les projets cryptographiques peuvent-ils se démarquer ?

2026.06.25

Partager vers

TechFlow SélectionTechFlow Sélection

Analyse complète du marché de l’inférence IA : comment les projets cryptographiques peuvent-ils se démarquer ?

L’inférence constitue le champ de bataille ultime de l’IA : géants du cloud traditionnels contre réseaux décentralisés, confidentialité, vérification et économie des agents – qui l’emportera ?

2026.06.25 - 08:21:18

Dédié à des analyses Web3 approfondies

Auteur : 0xSammy (Khala Research)

Traduction : AIdidiaoJP, Foresight News

Le marché actuel de l’inférence IA ne ressemble plus à un simple marché de services cloud, mais plutôt à une partie d’échecs où chaque joueur mise sur le « risque ». Chaque fournisseur s’efforce de conquérir un territoire spécifique : les fournisseurs de cloud hyperscalaires contrôlent le continent des entreprises, les routeurs maîtrisent les corridors commerciaux, tandis que les réseaux décentralisés se battent farouchement sur le front ouvert.

Le cœur du précédent cycle IA était l’entraînement des modèles. Or, il devient de plus en plus évident que l’inférence recèle une valeur économique considérable. Beaucoup entendent pour la première fois le terme « inference » (inférence) ; qu’est-ce donc exactement ?

L’entraînement crée les modèles IA, tandis que l’inférence désigne le processus par lequel un modèle génère une réponse lorsqu’il reçoit une question ou une tâche.

Aperçu du marché de l’inférence IA

L’entraînement occupe la une des médias parce qu’il permet ces sorties impressionnantes. En réalité, c’est toutefois l’inférence qui capte aujourd’hui la majeure partie de la valeur économique — chaque prompt, chaque boucle d’agent, chaque génération d’image, chaque exécution de transaction, chaque appel d’outil et chaque édition de code doivent s’exécuter quelque part.

Les routeurs constituent le véritable goulot d’étranglement

Dans cette partie d’échecs centrée sur le « risque », les territoires les plus précieux sont souvent ces goulots d’étranglement étroits qui déterminent comment les troupes vont se déplacer ensuite. Sur le marché de l’inférence, les routeurs jouent exactement ce rôle. Ils se trouvent entre la demande et l’offre, décident vers où chaque requête est acheminée et quel fournisseur sera rémunéré.

Un exemple typique est OpenRouter, dont le protocole a traité la semaine dernière 4 700 billions de tokens.

Cette activité économique ne montre aucun signe de ralentissement, surtout avec l’arrivée imminente de plusieurs trillions d’agents.

Quels sont donc les éléments indispensables à un marché complet de l’inférence ? Les composants clés sont les suivants :

Le token devient l’unité comptable
OpenRouter devient rapidement la couche centrale d’échange : la semaine dernière, le volume de tokens utilisés via son marché de modèles de langage (LLM) s’élevait déjà à 4 700 billions.
Offre spécialisée : Fireworks, Together, Replicate, Baseten, Groq ainsi que les principaux fournisseurs de cloud hyperscalaires.
Réseaux IA cryptographiques : Chutes, Akash, io.net, Nosana, Targon, Venice, NuNet, etc., construisent activement une version sans autorisation (permissionless) du fondement technique.

Ne considérez pas tous ces fournisseurs comme concurrents sur un même marché — ce n’est pas le cas.

Les fournisseurs traditionnels commercialisent la fiabilité, l’expérience développeur et les processus d’achat d’entreprise.

Les réseaux IA cryptographiques mettent plutôt en avant une offre moins coûteuse, un accès ouvert, la confidentialité, la vérifiabilité et de nouveaux mécanismes d’incitation.

Récemment, l’interdiction par Anthropic de l’utilisation de son modèle Mythos (Fable 5) hors des États-Unis a rappelé à beaucoup les risques d’une dépendance excessive vis-à-vis d’un seul modèle propriétaire de pointe.

Ce qui est intéressant, c’est que les deux mondes commencent à se chevaucher : confidentialité, calcul confidentiel ou paiements natifs aux agents (Venice et Targon se distinguent particulièrement dans ce domaine).

Comment appréhender le marché de la puissance de calcul IA

Une meilleure approche consiste à diviser le marché en deux grands camps : traditionnel et cryptographique :

Le camp traditionnel vend la fiabilité, l’expérience développeur et les achats d’entreprise.

Les réseaux cryptographiques rivalisent principalement sur l’accès ouvert, une offre moins coûteuse, la confidentialité, la vérifiabilité et de nouveaux mécanismes d’incitation permettant une coordination mondiale fluide du capital.

Pourquoi l’inférence constitue le véritable marché IA

La couche des modèles reste importante, mais la qualité des modèles se rapproche désormais à une vitesse supérieure aux attentes. Les modèles open source atteignent déjà 90 à 95 % de la qualité des modèles de pointe, pour seulement 10 % de leur coût (par exemple, GLM-5.2 de Z.ai).

Les modèles open source évoluent continuellement, et les laboratoires chinois font constamment baisser les prix. Les modèles de pointe conservent encore une prime, mais sous eux, la concurrence basée sur les prix en tokens est déjà très vive.

C’est précisément pourquoi la couche de routage devient cruciale : le même modèle open source peut être proposé par cinq fournisseurs différents à cinq prix distincts. Les développeurs ne souhaitent pas coder en dur un point de terminaison unique ; ils ont besoin d’un routeur.

Le routeur peut sélectionner selon divers critères : prix, latence, confidentialité, fiabilité, etc.

Il se situe au-dessus de tous les fournisseurs, transformant un paysage chaotique en une interface propre et unifiée.

C’est justement là que OpenRouter réussit parfaitement, ce qui explique pourquoi des fonds de capital-risque ont investi 113 millions de dollars lors de sa récente levée de série B afin de saisir cette opportunité de routage.

OpenRouter devient rapidement l’interface du marché : une seule clé permet d’accéder à des centaines de modèles provenant de multiples fournisseurs. La vraie valeur ne réside pas dans la simple liste des modèles, mais dans la capacité à acheminer chaque requête vers le fournisseur le mieux adapté à la tâche concernée.

Cela commence à ressembler au marché de l’énergie : les utilisateurs ne se soucient pas de savoir quelle centrale électrique a produit l’électricité, ils ne veulent que que la lumière s’allume, que le prix soit juste et que le système soit stable.

Les utilisateurs IA adopteront de plus en plus cette logique : ils ne se préoccupent pas du cluster GPU qui a servi le token, mais uniquement de la rapidité, du coût, de la confidentialité et de la fiabilité de la réponse.

Fournisseurs traditionnels d’inférence

Le camp traditionnel se divise actuellement en quatre catégories :

i) Fournisseurs de cloud hyperscalaires : AWS, Google, Microsoft

Ils contrôlent les « continents fortifiés ». Leur victoire ne repose pas sur le fait d’être toujours les moins chers, mais sur leur emprise préalable sur les processus d’achat d’entreprise, la conformité, l’identité, la sécurité et la facturation. Attaquer frontalement ce bastion serait extrêmement coûteux.

Ils remportent la partie grâce à la confiance des entreprises. Les grandes sociétés n’achètent pas uniquement des tokens, mais aussi la conformité, la sécurité, la facilité d’achat et la responsabilité en cas de problème.

ii) Marchés de routage : OpenRouter et diverses passerelles IA

Les routeurs se situent au-dessus des fournisseurs de modèles et dirigent chaque requête vers l’option optimale. À mesure que le leadership des modèles change chaque semaine, coder en dur un modèle unique devient de plus en plus fragile. L’IA a besoin d’agrégateurs, tout comme le domaine cryptographique.

iii) Services optimisés de modèles open source : Together, Fireworks, Baseten, Groq

Ils ne sont pas simplement des API bon marché, mais des entreprises d’infrastructures performantes spécialisées dans la vitesse, le traitement par lots, l’extensibilité, le fine-tuning, les points de terminaison personnalisés et le support en production.

iv) Marchés de modèles : Replicate et plateformes similaires à Hugging Face

L’inférence va bien au-delà des conversations. Images, vidéos, voix, embeddings, modèles de robots, simulations et agents multimodaux nécessitent tous l’exécution de modèles. Ces marchés rendent accessibles les demandes de modèles peu courants.

Fournisseurs cryptographiques d’inférence IA

Les réseaux décentralisés constituent les « territoires de guérilla »

Les réseaux cryptographiques d’inférence ne cherchent pas à dépenser davantage que AWS sur son champ de bataille principal. Ils ouvrent de nouveaux fronts : modèles non censurés, offres de GPU moins chères, inférence privée, paiements natifs aux agents et charges de travail ne nécessitant pas la fiabilité des fournisseurs hyperscalaires.

Le côté cryptographique est souvent réduit de façon trop simpliste à « puissance de calcul décentralisée », une formulation trop vague. Il existe au moins cinq orientations différentes :

Réseaux d’inférence serverless
Marchés décentralisés de GPU
Réseaux de calcul confidentiel
Applications et passerelles IA privées
Couches d’orchestration

Ils ne doivent pas être analysés de manière uniforme.

i) Chutes : inférence native cryptographique

@chutes_ai doit être compris avant tout comme une plateforme d’inférence décentralisée, et non comme un simple marché de GPU.

L’enjeu central est le suivant : les développeurs ne veulent pas louer des GPU ni gérer des infrastructures ; ils souhaitent simplement disposer d’un point de terminaison fonctionnel. Chutes fournit des modèles open source via des API familières, en s’appuyant sur une offre décentralisée de GPU.

La question essentielle est de savoir si le volume élevé d’utilisation peut être converti en une demande payante et récurrente. Des tokens bon marché sont utiles, mais seulement si les développeurs font confiance à la disponibilité, à la latence et à la fiabilité du service.

Son revenu par trillion de tokens augmente régulièrement, indiquant un potentiel de rentabilité durable / de faisabilité.

ii) Akash : couche d’enchères de GPU

@akashnet est un marché décentralisé de cloud.

L’utilisateur définit ses besoins en puissance de calcul, les fournisseurs proposent des offres, et les charges de travail s’exécutent selon des contrats de location. Il s’agit davantage d’un marché de puissance de calcul que d’un routeur direct d’inférence.

Il convient particulièrement aux charges de travail sensibles aux coûts, tolérantes aux fluctuations d’infrastructure et ne nécessitant pas une intégration profonde avec AWS/Azure/Google Cloud. Ses frais présentent une certaine corrélation avec le cours du token et tendent à augmenter.

iii) io.net : cloud décentralisé de GPU

@ionet se rapproche davantage d’un fournisseur de cloud décentralisé de GPU.

Son argument principal est l’accès à une offre distribuée de GPU à moindre coût et avec une configuration plus rapide, idéal pour les équipes IA ayant besoin de puissance de calcul sans signer de contrat cloud à long terme ni accepter les tarifs hyperscalaires.

Le défi réside dans l’exécution : validation matérielle, fiabilité, planification, assistance et performances constantes. L’accès direct aux GPU a une valeur intrinsèque, mais les couches les plus rentables restent celles du routage, de la gestion de l’inférence et de l’orchestration.

io.net affiche une performance remarquable ces 30 derniers jours, avec un revenu annuelisé de 12,3 millions de dollars.

iv) Targon : calcul confidentiel

@TargonCompute (développé par @manifoldlabs) se concentre sur le calcul confidentiel pour les charges de travail IA.

Le problème qu’il résout est évident : de nombreux utilisateurs hésitent à exécuter des prompts, des modèles ou des données sensibles sur des infrastructures gérées par des tiers inconnus.

Targon fournit une exécution protégée via des environnements d’exécution fiables (TEE), des machines virtuelles chiffrées, des preuves à distance et une infrastructure GPU confidentielle. Autrement dit, il prouve que la charge de travail s’exécute dans un environnement sécurisé et limite ce que l’opérateur peut observer.

Cela revêt une importance particulière pour l’inférence privée dans les domaines financier, médical et des entreprises IA. Le calcul confidentiel n’est pas magique : il déplace la confiance vers le matériel, le micrologiciel et les systèmes de preuve.

L’an dernier, ce protocole a rapporté un revenu annuel de 10,4 millions de dollars et a co-rédigé avec Intel un article de recherche sur « la puissance de calcul décentralisée sur du matériel non fiable ».

v) Darkbloom : inférence privée sur des Mac inutilisés

Darkbloom (créé par @eigenlabs) adopte une approche différente.

Plutôt que de fragmenter de grands modèles sur des GPU aléatoires, il transforme les Mac Apple Silicon inutilisés en un réseau d’inférence privé. Le modèle s’exécute localement sur le Mac, les requêtes sont chiffrées et acheminées vers des fournisseurs vérifiés.

Son atout principal est la confidentialité et le coût, pas la maximisation des performances des modèles de pointe.

Cela est pertinent, car le fait qu’« aucun nœud ne détienne le modèle complet » ne garantit pas automatiquement la confidentialité des prompts. Darkbloom aborde explicitement la question de la confidentialité, mais doit encore démontrer l’ampleur de son offre, ses performances et la confiance des développeurs.

Actuellement, le réseau compte 300 machines, ayant traité 2 milliards de tokens et 1 million de requêtes.

vi) Venice : inférence privée grand public

@AskVenice occupe une position différente de celle des réseaux comme Akash ou io.net. Il s’agit davantage d’une application IA privée et d’une passerelle d’inférence, plutôt que d’un marché principal de GPU.

Son débit de passerelle atteint déjà 85 milliards de tokens par jour (données de @ErikVoorhees).

La plupart des utilisateurs recherchent un produit IA respectueux de la vie privée, capable d’accéder à de puissants modèles sans collecter massivement leurs données.

Venice empaquette la philosophie d’infrastructure sous forme d’expérience grand public, axée sur les prompts privés, les modèles open source, l’accès non censuré, les fonctionnalités d’API, et la puissance de calcul tokenisée via VVV et DIEM.

Le composant DIEM est particulièrement intéressant, car il renvoie à une vision plus large de l’économie des agents : offrir un accès quotidien à 1 dollar de puissance de calcul. Le marché a récemment attribué à ce concept une valorisation intéressante.

Si les agents nécessitent un accès continu à l’inférence, alors les crédits de puissance de calcul commencent à ressembler à des actifs natifs aux agents, autour desquels tout un marché secondaire peut se développer.

Un agent capable de détenir et de dépenser directement des droits de puissance de calcul est plus pratique qu’un agent dépendant d’un humain qui doit régulièrement payer par carte bancaire.

Cela souligne un argument plus profond sur l’IA cryptographique : les agents auront finalement besoin d’accéder à des fonds, à une identité, à une mémoire et à de la puissance de calcul, et les systèmes cryptographiques fournissent le cadre nécessaire pour programmer ces ressources.

Venice ne cherche pas à concurrencer directement OpenRouter sur la variété des modèles, mais plutôt sur la confidentialité, l’accès et la tokenisation de la puissance de calcul. Il s’agit d’un créneau légitime, mais la question cruciale est de savoir si la demande pour des produits IA privés sera suffisamment forte pour soutenir le modèle tokenisé au-delà du cycle narratif actuel. Mon jugement est que, à mesure que l’IA se généralise, le discours sur la confidentialité ne fera que s’intensifier.

vii) NuNet : orchestration de puissance de calcul distribuée

@nunet_global est souvent classé parmi les projets de puissance de calcul décentralisée, mais un cadre plus utile est celui de l’« orchestration ».

L’orchestration consiste à associer les charges de travail aux ressources de calcul les plus adaptées, et à coordonner leur exécution entre différentes machines, environnements et localisations.

À mesure que l’IA dépasse les infrastructures cloud centralisées, cela devient de plus en plus important.

Les futurs systèmes IA fonctionneront probablement sur des GPU cloud, des dispositifs périphériques (edge), des serveurs locaux, des robots, des téléphones, des capteurs et des réseaux de fournisseurs décentralisés.

Un robot d’entrepôt ne peut pas attendre une réponse d’API transrégionale ; un drone ne peut pas supposer une connexion parfaite en permanence ; un robot en milieu sauvage doit pouvoir effectuer localement l’inférence lorsque le réseau est instable.

L’orchestration devient donc une catégorie autonome et significative.

Le défi de NuNet réside dans sa capacité à transformer ce problème de coordination en un réseau économique fonctionnel, doté d’une offre, d’une demande et d’une adoption développeur suffisantes.

viii) OpenServ : orchestration d’agents, pas seulement inférence

@openservai doit être compris avant tout comme une plateforme d’infrastructure et d’orchestration d’agents, et non comme un réseau d’inférence décentralisé.

Cela est crucial, car les agents constituent l’une des sources de demande d’inférence les plus claires pour l’avenir. Un simple chatbot peut appeler un modèle une seule fois, tandis qu’un agent l’appelle de façon répétée : inférence, utilisation d’outils, vérification de la sortie, appel d’un autre modèle, exécution d’une action, puis boucle.

Cela crée une demande d’inférence considérable, déjà remarquée dans l’écosystème cryptographique.

OpenServ est donc lié au marché de l’inférence du côté de la demande, et non de l’offre. Si cette plateforme devient un lieu utile pour les développeurs afin de construire, déployer et orchestrer des agents, elle deviendra naturellement la couche sous-jacente qui achemine l’inférence vers différents fournisseurs.

La question essentielle est de savoir si OpenServ parviendra à devenir une véritable couche d’exécution d’agents, ou s’il restera simplement un autre marché d’agents accompagné d’un token.

Après plusieurs échanges avec l’équipe, je pense que ses capacités vont au-delà de cette dernière hypothèse, son cadre d’inférence présentant plusieurs résultats de benchmark notables, et sa feuille de route incluant un modèle propriétaire.

Si OpenServ parvient à maîtriser les flux de travail opérationnels liés aux agents, l’inférence devient une entrée du service, et non son produit principal.

Dans un monde dominé par les agents, la couche la plus précieuse sera celle où les agents consacrent le plus de temps et de ressources.

ix) Dolphin AI : inférence décentralisée orientée produit

@dphnAI est intéressant car il part de la demande de modèles, et non du marché des GPU.

La famille de modèles Dolphin jouit déjà d’une réputation de modèles open source non censurés, ce qui donne au réseau une raison d’être plus claire.

Cela est important, car de nombreux projets d’inférence décentralisée adoptent une approche centrée sur l’offre : « Nous disposons de GPU, qui veut les acheter ? »

Dolphin procède à l’inverse : il part d’un ensemble de modèles déjà recherchés par les utilisateurs, puis construit autour de cette demande un réseau d’inférence décentralisé.

Son architecture est souvent qualifiée de « peer-to-pool » : les propriétaires de GPU contribuent leur capacité à des pools spécifiques de modèles, plutôt que chaque acheteur ne loue directement un nœud particulier. Les requêtes sont acheminées vers le pool, et les nœuds disponibles traitent les demandes.

C’est une conception plus adaptée à une offre de consommateurs peu fiables. Si quelqu’un met à disposition un GPU de jeu inutilisé, il ne restera peut-être pas connecté en permanence ; la mutualisation des modèles absorbe plus naturellement ces fluctuations qu’un marché de location un-à-un.

Ce qui est encore plus intéressant, c’est la vérification. Dolphin développe des « preuves de poids en direct » (live-weight proofs). En termes simples, cela consiste à vérifier, pendant le service, si les poids du modèle effectivement chargés correspondent bien au modèle que le nœud prétend exécuter.

Cela est crucial, car la fraude constitue l’un des problèmes les plus difficiles de l’inférence décentralisée. Un nœud pourrait prétendre exécuter un modèle coûteux, tout en servant en secret une version plus petite, moins chère ou quantifiée. Si le réseau ne peut pas détecter cette fraude, toute la crédibilité du marché s’effondrerait.

x) c0mpute : inférence distribuée orientée agents

@c0mputeAI mérite une attention particulière, car il tente de résoudre l’un des problèmes les plus difficiles de l’inférence décentralisée : faire fonctionner de grands modèles sur Internet ouvert, répartis sur des GPU dispersés.

Son moteur Shard divise le modèle sur plusieurs machines, au lieu d’exiger qu’un serveur géant héberge le modèle dans son intégralité. Cela est particulièrement pertinent pour les modèles open source de taille avancée, trop volumineux ou soumis à des restrictions empêchant leur hébergement via des routes traditionnelles.

Le lien avec @virtuals_io représente une perspective essentielle du côté de la demande. Virtuals construit une économie d’agents, et les agents sont des utilisateurs intensifs d’inférence : ils planifient, appellent des outils, effectuent des transactions, vérifient les résultats et bouclent. Cela crée une demande pour une inférence peu coûteuse, ouverte et résistante à la censure.

La réserve à formuler est que cela en est encore à un stade précoce. c0mpute doit prouver ses performances sous charge réelle, la fiabilité des nœuds, la vérification et la confidentialité des prompts.

Mais la direction prise est primordiale : les marchés de GPU vendent un accès à la puissance de calcul ; c0mpute tente de distribuer le modèle lui-même.

Inférence traditionnelle vs inférence cryptographique

Les deux coexisteront, chacune possédant des avantages distincts et clairement identifiables.

Sur quoi porter son attention

Volume de tokens payants

Le marché devrait réduire son intérêt pour les statistiques brutes de traitement de tokens, sauf si ces tokens génèrent des revenus. Les activités gratuites et les usages subventionnés peuvent produire des chiffres impressionnants, mais ne prouvent pas une adéquation réelle entre produit et marché.

La demande d’inférence payante constitue l’indicateur clé — elle est plus durable et peut soutenir la viabilité à long terme.

ii) Revenu par GPU

Les réseaux décentralisés de puissance de calcul ne seront durables que si la valeur générée par chaque GPU au sein du réseau dépasse celle qu’il pourrait générer ailleurs. Si la motivation principale des fournisseurs est la distribution de tokens, l’offre disparaîtra dès que les incitations diminueront. Les fournisseurs de GPU calculent leur coût d’opportunité.

iii) Intégration des routeurs : distribution

La distribution est souvent plus importante que l’infrastructure elle-même.

Les intégrations avec OpenRouter, les agents codés, les portefeuilles, les points de paiement, les outils développeur et les applications grand public constituent toutes des sources potentielles de demande.

Les points de paiement sont des canaux via lesquels un logiciel peut directement payer un service via une API.

iv) Vérification

La fraude sur les GPU, les capacités fictives et les fournisseurs peu fiables demeurent des risques réels.

Les réseaux ont besoin d’une vérification matérielle robuste, de trafic chiffré, de systèmes de réputation et de sanctions significatives contre les comportements fautifs.

v) Garanties de confidentialité

L’inférence privée reste l’une des opportunités les plus fortes de l’IA cryptographique, mais ces garanties doivent être réelles. Vendre la confidentialité est facile ; assurer une exécution sécurisée, adopter une architecture prioritaire locale, appliquer la minimisation des données et mettre en place une infrastructure auditable sont bien plus complexes.

vi) Capture de valeur par le token

Les modèles de token les plus solides lient directement la demande à une utilisation réelle de l’inférence. Cela peut impliquer des rachats, des destructions, des exigences de staking, des droits de puissance de calcul ou des mécanismes liés aux revenus.

Se contenter d’un récit IA vague ne suffira pas à long terme.

Conclusions clés

L’issue finale dépendra du contrôle de la demande

Dans cette partie d’échecs centrée sur le « risque », posséder des territoires épars ne suffit pas. Vous avez besoin de zones connectées, de lignes de ravitaillement et de voies de renfort durables.

Il en va de même sur le marché de l’inférence. Les gagnants contrôleront la demande, le routage, la vérification et le règlement ; posséder uniquement des GPU ne suffit pas.

Le marché de l’inférence fait progressivement ressembler l’IA à un système financier :

Chaque token généré porte un coût,
Chaque point de terminaison génère un profit,
Chaque boucle d’agent crée une demande,
Chaque routeur agit comme un teneur de marché,
Chaque réseau de GPU constitue une source d’offre…

Les fournisseurs traditionnels dominent actuellement l’expérience développeur et la couche de confiance des entreprises.

Les réseaux IA cryptographiques explorent quant à eux une autre frontière : une offre sans autorisation, une inférence privée, une puissance de calcul vérifiable, un accès tokenisé et des paiements natifs aux agents (sans restriction KYC).

À court terme, le vainqueur ne sera probablement pas le réseau le plus décentralisé, mais plutôt celui qui rendra l’inférence décentralisée ordinaire et fiable — grâce à des points de terminaison rapides, une documentation solide, une disponibilité fiable, une tarification transparente, une offre vérifiée et une demande réelle et payante.

Chutes reste l’un des projets les plus prometteurs à surveiller, car il est le plus proche de transformer la puissance de calcul soutenue par Bittensor en un marché d’inférence fonctionnel, plutôt que de se cantonner à une simple narration autour des GPU. « Darkbloom » d’Eigen Labs présente également un intérêt similaire.

Akash et io.net représentent les challengers côté offre, Targon incarne l’argument du calcul confidentiel, Venice représente la couche de demande pour une IA privée, et NuNet illustre l’orchestration pour un avenir de puissance de calcul plus distribué.

L’argument plus global est le suivant :

« Les modèles IA risquent de devenir de plus en plus standardisés, mais le marché de l’inférence ne suivra probablement pas la même trajectoire. »

La plus grande valeur reviendra aux entités qui assurent le routage des tâches, leur vérification, leur règlement et la capture de la demande.

C’est précisément là que pourrait surgir la prochaine opportunité IA cryptographique… du moins tant que l’IA physique ne sera pas pleinement capable d’assumer ses fonctions dans la société.

Bienvenue dans la communauté officielle TechFlow

Groupe Telegram :https://t.me/TechFlowDaily

Compte Twitter officiel :https://x.com/TechFlowPost

Compte Twitter anglais :https://x.com/BlockFlow_News

Lien original

Ajouter aux favoris

Partager sur les réseaux sociaux

Auteur

0xSammy

@0xSammy

Analyse complète du marché de l’inférence IA : comment les projets cryptographiques peuvent-ils se démarquer ?

TechFlow SélectionTechFlow Sélection

Analyse complète du marché de l’inférence IA : comment les projets cryptographiques peuvent-ils se démarquer ?

Aperçu du marché de l’inférence IA

Comment appréhender le marché de la puissance de calcul IA

Pourquoi l’inférence constitue le véritable marché IA

Fournisseurs traditionnels d’inférence

Fournisseurs cryptographiques d’inférence IA

Inférence traditionnelle vs inférence cryptographique

Sur quoi porter son attention

Conclusions clés

Articles connexes

Contenu de l’article

The Economist spécial : les centres de données américains font l’objet d’une opposition généralisée, et l’expansion de la puissance de calcul pour l’IA ralentit

Analyse de rapport de recherche : les revenus liés à l’IA de TSMC doubleront d’ici 2027, mais la capacité de production de CoWoS reste un goulot d’étranglement

Citrini Research : Cinq thèmes d’investissement actuels masqués par le trading alimenté par l’IA

Premier rapport financier de CBRS après son introduction en bourse : les revenus doublent, mais les prévisions de marge brute chutent fortement ; la réalisation du gros contrat avec OpenAI prendra trop de temps

Fonds négocié en bourse (ETF) sur la mémoire DRAM : Samsung, SK Hynix et Micron ont tous dépassé la barre du trillion de dollars ; l’ère de l’IA pour les puces de mémoire ne fait que commencer.

Le PDG d’une société de gestion d’actifs de Wall Street révèle publiquement ses positions : il mise sur l’indice Nasdaq et le BTC ; « la voie du milieu » constitue en réalité le pire choix.

Anthropic publie une mise à jour majeure avec la version évoluée de Claude Tag, « CC » ; Karpathy : « La troisième révolution interactive des LLM est arrivée »

Analyse de rapport de recherche : L’IA déclenche un supercycle des condensateurs céramiques multicouches (MLCC), combien d’années Samsung Electro-Mechanics pourra-t-elle profiter des avantages qui en découlent ?

Le prix de location des GPU a chuté de 30 % en trois semaines, tandis que la chaîne de valeur de l’IA migre progressivement d’NVIDIA vers les puces mémoire.

Des sociétés comme Corning et Ciena : des actions susceptibles de connaître une hausse de 10 fois dans la chaîne de communication optique pour l’IA

TechFlow Sélection
Plus>

Analyse complète du marché de l’inférence IA : comment les projets cryptographiques peuvent-ils se démarquer ?

TechFlow SélectionTechFlow Sélection

Analyse complète du marché de l’inférence IA : comment les projets cryptographiques peuvent-ils se démarquer ?

Aperçu du marché de l’inférence IA

Comment appréhender le marché de la puissance de calcul IA

Pourquoi l’inférence constitue le véritable marché IA

Fournisseurs traditionnels d’inférence

Fournisseurs cryptographiques d’inférence IA

Inférence traditionnelle vs inférence cryptographique

Sur quoi porter son attention

Conclusions clés

Articles connexes

Contenu de l’article

The Economist spécial : les centres de données américains font l’objet d’une opposition généralisée, et l’expansion de la puissance de calcul pour l’IA ralentit

Analyse de rapport de recherche : les revenus liés à l’IA de TSMC doubleront d’ici 2027, mais la capacité de production de CoWoS reste un goulot d’étranglement

Citrini Research : Cinq thèmes d’investissement actuels masqués par le trading alimenté par l’IA

Premier rapport financier de CBRS après son introduction en bourse : les revenus doublent, mais les prévisions de marge brute chutent fortement ; la réalisation du gros contrat avec OpenAI prendra trop de temps

Fonds négocié en bourse (ETF) sur la mémoire DRAM : Samsung, SK Hynix et Micron ont tous dépassé la barre du trillion de dollars ; l’ère de l’IA pour les puces de mémoire ne fait que commencer.

Le PDG d’une société de gestion d’actifs de Wall Street révèle publiquement ses positions : il mise sur l’indice Nasdaq et le BTC ; « la voie du milieu » constitue en réalité le pire choix.

Anthropic publie une mise à jour majeure avec la version évoluée de Claude Tag, « CC » ; Karpathy : « La troisième révolution interactive des LLM est arrivée »

Analyse de rapport de recherche : L’IA déclenche un supercycle des condensateurs céramiques multicouches (MLCC), combien d’années Samsung Electro-Mechanics pourra-t-elle profiter des avantages qui en découlent ?

Le prix de location des GPU a chuté de 30 % en trois semaines, tandis que la chaîne de valeur de l’IA migre progressivement d’NVIDIA vers les puces mémoire.

Des sociétés comme Corning et Ciena : des actions susceptibles de connaître une hausse de 10 fois dans la chaîne de communication optique pour l’IA

TechFlow SélectionPlus>

TechFlow Sélection
Plus>