
55 To deviennent 28 To ? Rumeurs et inquiétudes autour de la réduction de moitié de la mémoire Rubin
TechFlow SélectionTechFlow Sélection

55 To deviennent 28 To ? Rumeurs et inquiétudes autour de la réduction de moitié de la mémoire Rubin
La panique est réelle ; la question est de savoir si elle va dans la bonne direction.
Rédaction : TechFlow Research
Dans la nuit du 4 juin, SemiAnalysis, l’un des instituts indépendants de recherche les plus influents du secteur des semi-conducteurs, a publié un bulletin matinal.
L’information centrale tenait en une seule phrase : la capacité totale de mémoire DRAM SOCAMM par rack du supercalculateur IA Vera Rubin NVL72 de NVIDIA pourrait chuter d’environ 55 To à environ 28 To, contre les attentes initiales. La plupart des systèmes Rubin utiliseront des modules SOCAMM de 96 Go, et non pas les modules de 192 Go que le marché anticipait largement.
À la diffusion de cette information, la réaction des marchés fut immédiate et brutale : la demande de mémoire serait divisée par deux — mauvaise nouvelle pour Micron. Le cours de l’action MU a brièvement chuté de plus de 10 % en séance, passant brutalement de son précédent record historique de 1 089 dollars atteint la veille à 971 dollars, soit une érosion de plus de 100 milliards de dollars de capitalisation boursière en une seule journée.
La panique était bien réelle. Mais se dirigeait-elle dans la bonne direction ?
Commençons par faire les comptes
Vera Rubin NVL72 est le prochain supercalculateur IA phare de NVIDIA. Chaque rack intègre 72 GPU Rubin et 36 CPU Vera. Du côté GPU, la mémoire utilisée est de type HBM4, avec 288 Go par puce, soit environ 20,7 To au total par rack — cette partie n’a pas changé. Ce qui change concerne le côté CPU.
Chaque CPU Vera dispose de 8 emplacements SOCAMM, pouvant accueillir des modules de différentes capacités. Selon les spécifications officielles annoncées par NVIDIA au CES 2026, « chaque CPU Vera prend en charge jusqu’à 1,5 To de LPDDR5X », ce qui correspond à une configuration complète avec huit modules de 192 Go. Avec 36 CPU, cela donne un total théorique de 54 To.
Dans son rapport, SemiAnalysis indique que la configuration effectivement livrée ne comportera très probablement pas tous les emplacements remplis. La majorité des systèmes utiliseront des modules de 96 Go, soit 8 × 96 Go = 768 Go par CPU, ou environ 28 To au total pour les 36 CPU.
Passer de 55 To à 28 To représente une réduction de près de moitié — un titre sensationnaliste pourrait facilement parler de « demande de mémoire coupée de moitié ».
Mais sur ce point précis, les marchés ont omis une variable clé dans leurs calculs.
La faille logique de la panique
Premièrement, SOCAMM repose sur un design à fente, et non sur une soudure permanente.
C’est un détail technique trop souvent ignoré dans toute cette affaire. Contrairement aux puces LPDDR intégrées directement sur la carte mère des GPU GB300 Blackwell Ultra, la plateforme Vera Rubin adopte le module SOCAMM2 standardisé par JEDEC, entièrement amovible, remplaçable à chaud et évolutif. Aujourd’hui, on insère des modules de 96 Go ; demain, si les clients en expriment le besoin, il suffit de les retirer pour les remplacer par des modules de 192 Go, voire de 256 Go — aussi simplement qu’on change une barrette de mémoire.
NVIDIA a souligné expressément ce choix architectural lors du CES 2026 : le temps d’assemblage complet du « calcul tray » (plateau de calcul) est passé de deux heures à cinq minutes. Modularité, facilité de maintenance et possibilité d’évolution constituent l’une des principales avancées architecturales de Vera Rubin par rapport à Blackwell.
Réduire la configuration initiale livrée ne signifie pas que la demande disparaît définitivement. Cela ressemble davantage à une stratégie du type « monter dans le train puis acheter le billet plus tard ».
Deuxièmement, la réduction de capacité n’est pas due à un manque de besoin, mais au contraire à un besoin trop élevé — « nous n’avons pas assez de puces LPDDR5X ».
Dylan Patel, fondateur de SemiAnalysis, a tweeté une remarque pleine de sous-entendus : « J’adore quand ceux qui partagent notre rapport en omettent la majeure partie. Cela arrive souvent. »
Les commentaires des lecteurs sur Digg illustrent également bien ce phénomène : 77,8 % d’entre eux jugent que la reprise médiatique de cette actualité constitue un cas classique de « titre trompeur » issu d’une lecture sélective.
Que s’est-il donc fait oublier ? Le contexte.
En 2026, l’offre mondiale de LPDDR5X sera extrêmement tendue. Lors de la conférence Wolfe fin mai, Micron a clairement indiqué que la demande de mémoire dépassait nettement ses capacités d’approvisionnement, situation qui devrait perdurer au-delà de 2026. Toute la capacité annuelle de production mondiale de HBM pour l’exercice 2026 de Micron est déjà entièrement réservée ; le prix moyen du DRAM a augmenté de plus de 110 % en glissement annuel, tandis que sa marge brute a grimpé à 74 %. Samsung et SK Hynix sont également en régime de production maximale et de vente intégrale.
Dans ce contexte, le problème de NVIDIA n’est pas que ses clients ne souhaitent pas plus de mémoire, mais bien qu’« elle ne parvient pas à se procurer suffisamment de puces LPDDR5X pour remplir tous les emplacements ».
La réduction de la configuration par défaut de SOCAMM par rack est donc avant tout une décision d’ingénierie liée à la gestion de la chaîne d’approvisionnement : mieux vaut livrer rapidement des racks avec une configuration réduite, plutôt que retarder l’ensemble de la livraison faute de mémoire.
Ce n’est pas un signal de contraction de la demande — bien au contraire, c’est un signal de demande qui dépasse largement l’offre.
Troisièmement, moins de mémoire ≠ moins de racks.
Les marchés ont effectué une multiplication simpliste : moitié moins de mémoire par rack → demande globale divisée par deux. Or, cette équation comporte une autre variable : le volume des livraisons.
Si la capacité SOCAMM par rack passe de 55 To à 28 To, NVIDIA peut, sous contrainte identique d’approvisionnement en LPDDR5X, assembler davantage de racks. Là où une même quantité de mémoire permettait auparavant d’équiper 100 racks, elle en équipe désormais près de 200.
La consommation globale totale de LPDDR5X n’a donc pas diminué — elle est simplement répartie sur un plus grand nombre de racks. Pour NVIDIA, c’est un choix pragmatique visant à accélérer le déploiement de Rubin sur le marché ; pour les fabricants de mémoire, le volume global des commandes n’est pas nécessairement affecté.
Par ailleurs, la demande de mémoire côté CPU varie fortement selon les scénarios d’inférence. Tous les cas d’usage n’exigent pas obligatoirement 1,5 To de LPDDR5X. L’entraînement de grands modèles exige effectivement beaucoup de mémoire, mais de nombreuses tâches d’inférence — notamment celles liées à l’intelligence artificielle agentic et aux inférences à long contexte — peuvent tirer parti d’un cache KV dynamiquement réparti entre la mémoire HBM et la mémoire LPDDR via NVLink-C2C. Pour bon nombre de clients, 768 Go de mémoire côté CPU suffisent pleinement.
Pourquoi Micron a-t-elle tout de même chuté de 10 % ?
Parce que le rapport de SemiAnalysis n’a été que la deuxième paille venue rompre le dos du chameau.
La première paille était Broadcom. Avant l’ouverture des marchés américains le 4 juin, Broadcom a publié ses résultats du deuxième trimestre. Les chiffres en eux-mêmes étaient solides : chiffre d’affaires de 22,19 milliards de dollars (+48 % en glissement annuel), bénéfice par action hors éléments exceptionnels (Non-GAAP EPS) de 2,44 dollars, supérieur aux attentes. Toutefois, le PDG Hock Tan n’a pas relevé son objectif annuel de revenus issus des puces IA, toujours fixé à 100 milliards de dollars — ce que les marchés ont interprété comme un manque d’ambition. Le cours de l’action Broadcom a chuté de 15 %, entraînant dans sa chute l’ensemble du secteur des semi-conducteurs.
Micron n’a publié aucun élément négatif propre à l’entreprise ce jour-là. Plusieurs médias, dont TipRanks, Motley Fool et 24/7 Wall St., ont explicitement qualifié cette baisse de « contagion sectorielle ». En tant que principal actif de la chaîne d’approvisionnement des mémoires pour l’IA, Micron est étroitement corrélée à l’humeur générale des dépenses en capital dans le domaine de l’IA ; la révision à la baisse des perspectives de Broadcom a incité les investisseurs à réévaluer l’ensemble de la chaîne de valeur des puces IA.
Le rapport de SemiAnalysis, diffusé le même jour, a fourni aux traders déjà à la recherche d’un prétexte à la vente un argument narratif parfait : non seulement le sentiment général autour de l’IA s’assombrit, mais les chiffres concrets de la demande de mémoire rétrécissent également.
Lorsqu’une action valorisée à plus de 1 000 milliards de dollars vient de grimper de 900 % en un an et vient juste d’atteindre un nouveau sommet historique, toute nouvelle négative devient un catalyseur idéal pour réaliser des profits. La panique n’a pas besoin d’être fondée — elle a seulement besoin d’un prétexte.
Analyse TechFlow
Trois conclusions.
Premièrement, le rapport de SemiAnalysis est factuellement exact, mais son interprétation par les marchés est erronée. Il est fort probable que la configuration SOCAMM par défaut du Vera Rubin NVL72 soit effectivement inférieure à la capacité théorique maximale — une décision dictée conjointement par les contraintes de la chaîne d’approvisionnement et par la flexibilité des besoins clients. Toutefois, entre « réduction de la configuration par défaut » et « contraction de la demande de mémoire », il y a tout un monde : celui d’une architecture modulaire entièrement évolutible, et celui d’une réalité industrielle où la demande dépasse largement l’offre.
Deuxièmement, le risque principal pour Micron ne réside pas dans SOCAMM, mais dans HBM4. Déjà en février, SemiAnalysis avait signalé que, concernant les commandes de HBM4 destinées à la plateforme Rubin de NVIDIA, Micron ne détenait aucune part de marché : SK Hynix en détenait 70 %, Samsung 30 %. Bien que Micron ait annoncé en mars le lancement de la production en série de HBM4, sa part de marché est estimée à seulement 18 %. À l’inverse, sa position sur le segment SOCAMM est extrêmement solide : elle a été le premier fabricant à commercialiser des modules SOCAMM2 de 256 Go, et elle est le partenaire stratégique central d’NVIDIA sur la solution SOCAMM depuis cinq ans. L’impact réel sur Micron d’une réduction de la configuration SOCAMM est donc bien moindre que celui résultant de son marginalisation sur le marché de la HBM4.
Troisièmement, la nature de cette baisse est un simple dégonflement de prise de bénéfices après un nouveau record historique pour une capitalisation boursière de 1 000 milliards de dollars, amplifié par deux catalyseurs indépendants. Broadcom a fourni le choc émotionnel ; SemiAnalysis, la munition narrative. Leur combinaison a entraîné un recul de 10 % pour une action ayant multiplié par neuf sa valeur au cours des douze derniers mois. Du point de vue de la pratique transactionnelle, cela ne s’appelle pas « panique » — cela s’appelle « normal ».
Le tweet de Dylan Patel est juste : la plupart de ceux qui ont relayé son rapport ont bel et bien omis sa partie la plus importante.
Dans l’investissement dans les semi-conducteurs, le danger le plus grave n’est pas de se tromper de direction, mais de bien lire le titre… et de mal calculer la formule.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News













