
Le prix de location des GPU a chuté de 30 % en trois semaines, tandis que la chaîne de valeur de l’IA migre progressivement d’NVIDIA vers les puces mémoire.
TechFlow SélectionTechFlow Sélection

Le prix de location des GPU a chuté de 30 % en trois semaines, tandis que la chaîne de valeur de l’IA migre progressivement d’NVIDIA vers les puces mémoire.
Pour les détenteurs d’actions NVIDIA ou ceux qui envisagent d’investir dans les infrastructures IA, une question clé émerge : l’argent consacré à l’IA ne diminue pas, il change simplement de destination.
Auteur : Claude, TechFlow
Introduction de TechFlow : Le prix de location horaire de la puce NVIDIA B200 est passé de son plus haut niveau du 31 mai, à 6,11 USD, à 4,22 USD, soit une baisse d’environ 30 % en trois semaines. Parallèlement, le secteur des semi-conducteurs connaît une scission inhabituelle : l’ETF semi-conducteurs SMH a grimpé de 15 % au cours du dernier mois, tandis que Micron et SanDisk ont chacun bondi de près de 60 % ; NVIDIA, quant à lui, a reculé de 3 % sur la même période. Pour les détenteurs d’actions NVIDIA ou ceux envisageant un investissement dans les infrastructures IA, une question clé émerge : l’argent consacré à l’IA n’a pas diminué, il a simplement changé de destination.
NVIDIA a toutefois progressé d’environ 12 % cette année, mais l’attention du marché semble désormais ailleurs.
Au cours du dernier mois, l’ETF semi-conducteurs VanEck (SMH) a fortement augmenté de 15 %, tandis que Micron Technology et SanDisk ont chacun grimpé de près de 60 %. NVIDIA, loin de suivre cette tendance, a au contraire reculé d’environ 3 %. Ce qui est encore plus révélateur, c’est que l’indicateur central sous-tendant la valorisation de NVIDIA — le prix de location horaire de la puce B200 dans le cloud — connaît également une dégradation.
Selon les données de la plateforme de tarification GPU Ornn, le prix horaire de location de la B200 a atteint un sommet de trois mois à 6,11 USD le 30 mai, puis a entamé une baisse continue, tombant à 4,22 USD la semaine dernière, soit une chute d’environ 30 %. Rich Privorotsky, chef du desk One-Delta de Goldman Sachs, a directement mis le doigt sur le problème la semaine dernière : le mythe de la « rareté de la puissance de calcul » pour l’IA pourrait bien perdre de sa crédibilité.
Le prix de location de la B200 chute de 30 % en trois semaines : le récit de la « rareté de la puissance de calcul » est mis à mal
La B200 de NVIDIA constitue actuellement la puce centrale de calcul pour les datacenters hyperscalaires, et son prix de location est considéré comme un indicateur fiable de l’équilibre entre offre et demande dans les infrastructures IA. Selon plusieurs plateformes tierces de suivi, la tarification de la B200 se relâche effectivement.
Les données d’Ornn indiquent que le prix horaire de location de la B200 est passé de son pic de 6,11 USD le 30 mai à 4,22 USD la semaine dernière. L’indice mensuel des prix compilé par AIMultiple auprès de 63 fournisseurs cloud affiche une médiane de 6,11 USD/heure pour la B200, mais certains nouveaux fournisseurs cloud (« néocloud ») proposent déjà des offres minimales à 3,44 USD. Les données collectées par GetDeploying auprès de 26 fournisseurs cloud équipés de B200 sont encore plus marquées : un prix moyen de 4,99 USD/heure, avec une offre minimale de seulement 2,25 USD/heure (contrat réservé sur trois ans).

Trois facteurs expliquent cette baisse des prix : l’amélioration du taux de rendement du procédé 4NP de TSMC réduit les coûts de production de la B200 ; l’offre de mémoires HBM3e de SK Hynix et Micron se détend nettement au deuxième trimestre 2026 ; enfin, davantage de nouveaux fournisseurs cloud disposent désormais d’un stock de B200, tels que RunPod, Lambda, Nebius et Spheron, qui commercialisent déjà ces puces en stock, intensifiant ainsi la concurrence et faisant pression à la baisse sur les prix globaux.
La pression s’accentuera encore au second semestre. Lorsque la prochaine génération Blackwell Ultra B300 de NVIDIA entrera progressivement sur le marché au comptant, une partie de la capacité de production de la B200 passera d’un modèle « à la demande » à un modèle aux enchères (« spot »). Des prix « spot » pour la B300 ont déjà été observés à seulement 2,45 USD/heure, inférieurs au prix minimal affiché pour la B200. Des acteurs tels que Spheron et Thunder Compute prévoient que le prix « à la demande » de la B200 pourrait se stabiliser entre 2,50 et 3,00 USD/heure au quatrième trimestre 2026.
Pour les investisseurs détenant des actions NVIDIA, ce relâchement des prix de location signifie une pression accrue sur les marges bénéficiaires de ses clients aval (fournisseurs cloud, plateformes néocloud), dont la volonté d’achat détermine directement le rythme des commandes passées à NVIDIA.
Scission majeure au sein du secteur des semi-conducteurs : l’explosion des mémoires face à l’isolement de NVIDIA
Cette scission produit des chiffres frappants.
NVIDIA a progressé d’environ 12 % depuis le début de l’année 2026, mais a reculé d’environ 3 % au cours du dernier mois. Sur la même période, l’ETF semi-conducteurs SMH a gagné 84 % sur l’année et 15 % sur le dernier mois. Micron a bondi de près de 60 % au cours du dernier mois, atteignant un nouveau record historique d’environ 1 089 USD par action, avec une hausse cumulée annuelle dépassant les 700 % et une capitalisation boursière dépassant 1 200 milliards de dollars. SanDisk a également progressé de près de 60 % au cours du dernier mois, et de plus de 4 400 % sur les 52 dernières semaines.
Le marché ne remet probablement pas en cause l’IA elle-même, mais considère que le goulot d’étranglement de sa chaîne de valeur est en train de changer de position.
L’ancienne logique était la suivante : « rareté des GPU → pouvoir de fixation des prix pour NVIDIA → les fournisseurs en amont réalisent les plus gros profits ». La nouvelle logique devient : l’offre de GPU se détend, mais la demande croissante des modèles IA en mémoire à très grande bande passante (HBM) et en stockage fait de la mémoire le nouveau point critique.
Dans ses derniers résultats (deuxième trimestre 2026), Micron a réalisé un chiffre d’affaires de 23,8 milliards de dollars, soit une progression de près de 200 % par rapport à l’année précédente (8 milliards de dollars). Après sa séparation de Western Digital, SanDisk a généré un chiffre d’affaires de 5,95 milliards de dollars au troisième trimestre de l’exercice 2026, en hausse de 97 %.
Une analyse publiée le 16 juin par TrendForce indique que les prix contractuels des mémoires ont grimpé de plus de 100 % au premier semestre 2026, et que cette pénurie structurelle devrait se prolonger jusqu’au second semestre. Tim Cook, PDG d’Apple, a reconnu la semaine dernière, lors d’un entretien, qu’Apple ne pouvait plus absorber la hausse des coûts liés aux mémoires. Lorsque même un acheteur doté du plus fort pouvoir de négociation comme Apple déclare publiquement qu’il « ne peut plus tenir le choc », cela illustre clairement le pouvoir de fixation des prix dont disposent les fabricants de mémoires.
Micron publiera demain (24 juin) après la clôture ses résultats du troisième trimestre, attendus largement comme records. Ce communiqué constituera un test décisif pour confirmer ou non la pérennité de ce « super-cycle » des mémoires.
Le responsable des opérations chez Goldman Sachs : le prix de location est l’indicateur clé
Rich Privorotsky, chef du desk One-Delta de Goldman Sachs, a présenté la semaine dernière un cadre d’analyse clair :
Si les ressources de calcul étaient véritablement rares, leurs prix de location devraient rester stables voire renforcés, justifiant ainsi les dépenses massives en capital. En revanche, si l’offre augmente et que les prix de location continuent de baisser, alors l’hypothèse fondamentale soutenant l’ensemble de la chaîne de valorisation du matériel IA — celle d’une « pénurie de puissance de calcul » — devra être remise en cause.
Il souligne en outre que cette pression se fera d’abord sentir au niveau du matériel. Les véritables bénéficiaires seront les entreprises vendant des systèmes complets et monétisant leur utilisation, et non celles qui ne vendent que les « pioches et pelles » en amont. Le risque principal réside donc dans les maillons amont de la chaîne matérielle et des infrastructures, car leurs valorisations reposent encore sur l’hypothèse d’une « pénurie persistante ».
Cette analyse vise clairement NVIDIA, dont le modèle économique consiste à vendre des puces (« pioches et pelles »), sans percevoir de revenus liés à leur utilisation. Si les prix de location chutent chez ses clients aval, mais que le prix de vente des puces NVIDIA reste stable, cela crée une compression des marges intermédiaires, qui finira par se traduire par un ralentissement des commandes.
Le rapport récent « Tokenomics » de Citadel Securities va dans le même sens : la contrainte principale à l’adoption de l’IA ne réside plus dans les « capacités des modèles », mais dans les « coûts » et la « rareté de la puissance de calcul », les utilisateurs migreront donc rapidement vers des modèles moins coûteux. L’indice des prix des tokens a enregistré sept baisses consécutives, marquant la plus longue série de repli depuis le début de l’année.
Seoyoung Kim, professeur de finance à l’université de Santa Clara, formule la situation de façon encore plus directe : la plupart des acheteurs ignorent combien de puissance de calcul ils auront besoin l’année prochaine, les fournisseurs ne savent pas combien de GPU commander, et NVIDIA lui-même ne sait pas combien en produire. Les trois parties font des hypothèses, et dès que leurs anticipations basculent simultanément de « pas assez » vers « peut-être trop », les prix subissent une pression à la baisse.
Contrat astronomique SpaceX-Google de 30 milliards de dollars : le marché des contrats à long terme reste dynamique
Si les prix au comptant connaissent une baisse, le marché des contrats à long terme raconte une tout autre histoire.
Conformément à un document déposé le 5 juin auprès de la SEC par SpaceX, Google s’est engagé à verser chaque mois à SpaceX 920 millions de dollars entre octobre 2026 et juin 2029, en échange de la location d’environ 110 000 GPU NVIDIA, accompagnés de processeurs, de mémoires et d’autres composants associés. La valeur totale de ce contrat s’élève à environ 30 milliards de dollars. Déjà en mai, Anthropic avait signé un accord similaire avec SpaceX, s’engageant à verser 1,25 milliard de dollars par mois pour louer l’intégralité de la capacité disponible du datacenter Colossus 1 situé à Memphis, pour une valeur totale approchant les 45 milliards de dollars.
Ces deux contrats s’inscrivent dans le contexte de la fusion, achevée en février 2026, entre SpaceX et xAI. Cette opération a permis à SpaceX de transformer la grille de supercalculateurs Colossus, initialement construite par xAI, en actif commercial destiné à la location, afin de sécuriser des revenus substantiels avant son introduction en bourse (valorisation cible : 1 750 milliards de dollars).
Pour NVIDIA, ce signal est contradictoire. D’un côté, un contrat à long terme portant sur 110 000 GPU atteste que les grands clients continuent de verrouiller massivement des capacités de calcul. RBC Capital Markets, après l’annonce de ce contrat, a jugé que NVIDIA se trouvait « dans la position la plus favorable parmi ses pairs », estimant que ces accords de location de GPU suffisent, à court terme, à dissiper les inquiétudes du marché concernant une possible érosion de sa part de marché par les ASIC.
D’un autre côté, le fait que Google doive louer sa puissance de calcul à SpaceX révèle précisément que ses propres capacités internes ne parviennent pas à suivre la demande. Avec des dépenses en capital prévues entre 180 et 190 milliards de dollars en 2026, le versement mensuel de 920 millions de dollars représente moins de 6 % du budget annuel de Google, constituant essentiellement une solution « temporaire » pour combler un déficit de capacité. Une question demeure toutefois : une fois que les datacenters propriétaires de ces géants — dont les livraisons sont prévues entre 2027 et 2028 — entreront progressivement en service, la demande externe de location pourra-t-elle maintenir son niveau actuel ?
Le contrat comporte également une clause de résiliation anticipée avec un préavis de 90 jours. Ce type de clause ne correspond guère à un contexte de « rareté extrême de la puissance de calcul », mais plutôt à une clause permettant à l’acheteur de garder une porte de sortie.
Le risque pour NVIDIA : il ne réside pas dans la demande, mais dans son pouvoir de fixation des prix
En rassemblant tous ces éléments, on constate que le problème auquel NVIDIA est confronté est une évolution de la répartition des profits au sein de la chaîne de valeur de l’IA.
Sur le front de l’offre de GPU, l’amélioration du taux de rendement du procédé 4NP de TSMC, la multiplication des fournisseurs disposant de stocks de B200, et l’arrivée imminente de la B300 à grande échelle contribuent toutes trois à atténuer la pénurie extrême observée en 2024-2025. Du côté de la demande, les grands clients poursuivent leurs achats massifs, mais leur comportement évolue : ils passent d’une course effrénée à l’acquisition « à tout prix » à une stratégie de comparaison des offres, de verrouillage de volumes via des contrats à long terme, et de préservation d’une possibilité de sortie. Enfin, sur le plan des profits, les prix de location des fournisseurs cloud aval ont déjà commencé à baisser ; si NVIDIA ne parvient pas à ajuster simultanément le prix de vente de ses puces, la compression des marges intermédiaires finira par se répercuter sur le volume des commandes.
L’engouement pour les puces mémoire constitue l’autre face de cette migration de la chaîne de valeur.
Plus les modèles IA grossissent et plus les tâches d’inférence se multiplient, plus la demande de mémoires à très grande bande passante devient impérative. Bien que les GPU puissent améliorer leur efficacité grâce à des évolutions architecturales (par exemple, la précision FP4 de la B200 réduit de moitié le nombre d’octets requis par paramètre), la bande passante mémoire reste une contrainte physique sans solution de contournement. La capacité de production d’HBM de Micron est entièrement réservée pour toute l’année 2026, créant une situation où « l’argent ne suffit pas à acheter », en net contraste avec la baisse des prix de location de la B200.
Le rapport financier de Micron, prévu demain, fournira le prochain indicateur clé. Si les résultats et les perspectives dépassent à nouveau les attentes, le récit selon lequel « la chaîne de valeur de l’IA migre des GPU vers les mémoires » sera renforcé.Pour les investisseurs, il ne s’agit pas de prendre une position baissière sur l’IA, mais de repenser soigneusement qui, au sein de cette chaîne, renforce son pouvoir de fixation des prix — et qui le voit s’affaiblir.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News













