
TSMC confirme que la pénurie de puissance de calcul pour l’IA persistera au moins jusqu’en 2027 ; le loyer des puces H100 a augmenté de 30 % en six mois, et les fournisseurs de services cloud ont tous relevé leurs prix.
TechFlow SélectionTechFlow Sélection

TSMC confirme que la pénurie de puissance de calcul pour l’IA persistera au moins jusqu’en 2027 ; le loyer des puces H100 a augmenté de 30 % en six mois, et les fournisseurs de services cloud ont tous relevé leurs prix.
La pénurie de puissance de calcul n’est plus une prédiction, mais une réalité en cours.
Auteur : Claude, TechFlow
TechFlow – Introduction : Le chiffre d’affaires du premier trimestre de TSMC s’élève à 35,9 milliards de dollars américains, dépassant les attentes ; ses dépenses en capital atteignent le plafond de fourchette prévu de 56 milliards de dollars. Rick Tsai, président-directeur général de TSMC, qualifie la demande liée à l’IA de « particulièrement forte » et affirme que la pénurie d’offre persistera au moins jusqu’en 2027. Parallèlement, selon des données publiées par SemiAnalysis, le loyer annuel d’une unité H100 a bondi de 1,70 dollar/heure en octobre dernier à 2,35 dollars/heure en mars, soit une hausse proche de 40 %. En Chine, le volume quotidien d’appels aux tokens a augmenté de plus de 1 000 fois en deux ans, tandis que Tencent Cloud, Alibaba Cloud et Baidu Intelligent Cloud ont procédé à plusieurs hausses de prix cette année. De la fabrication de puces à la location de GPU, en passant par l’appel aux modèles, l’ensemble de la chaîne d’infrastructures de l’IA entre dans un cycle de hausses de prix.
La pénurie de puissance de calcul n’est plus une simple prédiction : elle est désormais une réalité concrète.
Le 16 avril, lors de sa conférence téléphonique sur les résultats du premier trimestre, TSMC a fourni la ligne temporelle la plus claire à ce jour concernant l’offre : « La pénurie de puces IA persistera au moins jusqu’en 2027. » Ce même jour, le média financier Caixin, citant plusieurs professionnels du secteur de la puissance de calcul, rapportait que le loyer des GPU de la série H100 de NVIDIA avait augmenté d’environ 20 à 30 % depuis octobre dernier, que toute la série H était « en rupture de stock », et que toutes les capacités de production prévues pour les puces Blackwell avant septembre 2026 étaient déjà entièrement réservées.
TSMC : Une demande « particulièrement forte » pour l’IA ; construire une usine prend 2 à 3 ans — il n’y a pas de raccourci
Le chiffre d’affaires de TSMC au premier trimestre, exprimé en dollars américains, s’élève à 35,9 milliards de dollars, soit une croissance annuelle supérieure à 40 %, légèrement au-dessus du plafond de la fourchette prévisionnelle établie par la société. Son activité liée au calcul haute performance (HPC) a progressé de 20 % par rapport au trimestre précédent et représente 61 % du chiffre d’affaires total, constituant ainsi le moteur principal de ses résultats.
Le signal encore plus révélateur provient des dépenses en capital. TSMC a porté son budget annuel 2026 au plafond de la fourchette initialement annoncée (52 à 56 milliards de dollars), soit près de 56 milliards de dollars. Ce montant dépasse de plus de moitié le total des dépenses en capital engagées par la société au cours des trois dernières années (101 milliards de dollars).

Lors de la conférence téléphonique, Rick Tsai, président-directeur général de TSMC, a résumé en une phrase la raison de cette augmentation des dépenses en capital : « La demande est particulièrement forte, notamment pour les applications liées au calcul haute performance et à l’intelligence artificielle. Nous accélérons pleinement nos efforts et anticipons nos achats d’équipements, mais l’offre reste tendue. »
Lors de la même conférence, un analyste de JPMorgan Chase a demandé directement combien de temps durera cette tension sur l’offre. La réponse de Rick Tsai fut tout aussi directe : « Construire une nouvelle usine de fabrication de puces prend 2 à 3 ans, et il faut ensuite encore du temps pour atteindre la pleine capacité de production. Selon le calendrier actuel, cette tension sur l’offre devrait perdurer au moins jusqu’en 2027. » Il a répété à plusieurs reprises une phrase clé : « Il n’y a pas de raccourci. »
Pour répondre à ce déficit d’offre, TSMC a annoncé un plan exceptionnel d’expansion mondiale de sa production en technologie 3 nm. Historiquement, une fois qu’un nœud technologique atteint sa capacité cible, TSMC ne construit généralement pas de nouvelles usines dédiées à ce nœud. Cette fois, toutefois, l’entreprise fait exception : une nouvelle usine 3 nm sera inaugurée dans le parc scientifique de Tainan (mise en production au premier semestre 2027) ; la deuxième usine de TSMC en Arizona (États-Unis) utilisera également la technologie 3 nm (mise en production au second semestre 2027) ; la deuxième usine de TSMC au Japon est également prévue pour produire en 3 nm (mise en production en 2028). En outre, les équipements existants en technologie 5 nm à Taïwan sont en cours de réaménagement afin d’être réutilisés pour la production 3 nm.
Rick Tsai affirme que TSMC « croit fermement » dans la grande tendance de l’IA et anticipe que ses dépenses en capital seront nettement supérieures au cours des trois prochaines années comparées aux trois dernières. L’entreprise prévoit pour 2026 une croissance annuelle de son chiffre d’affaires supérieure à 30 %.
Le loyer des H100 explose en six mois, la série H est entièrement « en rupture de stock »
Le même jour où TSMC confirmait, en amont, les contraintes de capacité, les données du marché de location de GPU en aval venaient corroborer l’intensité réelle de la demande.
L’indice mensuel du loyer annuel des H100 publié ce mois-ci par l’institut de recherche semi-conducteurs SemiAnalysis montre que le prix des contrats annuels pour une unité H100 a grimpé de 1,70 dollar/heure en octobre 2025 à 2,35 dollars/heure en mars 2026, soit une hausse proche de 40 %. Cet indice repose sur une enquête mensuelle menée auprès de plus de 100 acteurs du marché, incluant des fournisseurs de services Neocloud ainsi que des acheteurs et vendeurs de puissance de calcul.

Plusieurs professionnels chinois du secteur de la puissance de calcul interrogés par Caixin indiquent une hausse légèrement inférieure à celle observée globalement par SemiAnalysis, mais dans le même sens : « Le loyer des H100 a augmenté d’environ 20 à 30 %. » En termes de prix concrets, le loyer mensuel d’un H100 avec armoire a rebondi de 40 000 à 50 000 yuans à 80 000 à 90 000 yuans. Et ce n’est pas seulement le cas des H100 : l’ensemble de la série H connaît une hausse généralisée des loyers.
Selon l’enquête de SemiAnalysis, la moitié des fournisseurs de GPU interrogés déclarent que la série H est « en rupture de stock », la plupart indiquent ne disposer d’aucune carte H arrivant à échéance dans un avenir proche pouvant être sous-louée, et certains contrats de renouvellement pour des H100 s’étendent sur quatre ans. Toutes les capacités de production prévues pour la série Blackwell avant août-septembre 2026 sont déjà entièrement réservées.
Les fournisseurs de cloud augmentent collectivement leurs tarifs : la pression sur les coûts remonte toute la chaîne
La conséquence directe de la pénurie de tokens est une hausse collective des prix pratiqués par les fournisseurs de cloud et les éditeurs de modèles.
Le 11 mars, Tencent Cloud a annoncé une hausse des tarifs de sa série de modèles Hunyuan, avec des augmentations moyennes de plus de 400 % sur les coûts d’entrée et de sortie. Le 18 mars, Alibaba Cloud a annoncé des hausses allant jusqu’à 34 % sur ses produits d’IA et de stockage. Le même jour, Baidu Intelligent Cloud a relevé les prix de ses produits de puissance de calcul IA de 5 à 30 %. Zhige a, quant à lui, procédé à trois hausses de prix cette année.
La vague de hausses se poursuit en avril. Tencent Cloud a annoncé le 9 avril une augmentation uniforme de 5 % des tarifs catalogues de ses produits liés à la puissance de calcul IA, effective à compter du 9 mai. Alibaba Cloud a, de son côté, annoncé le 15 avril une hausse de 2 à 7 % sur certains services de modèles de sa plateforme Bailian, entrant en vigueur le 15 mai.
Un professionnel de la chaîne logistique de la puissance de calcul, cité par Caixin, souligne un mécanisme clé de transmission des prix : « Les grands acteurs nationaux, qui louaient auparavant des serveurs, vendent désormais directement des modèles ou des tokens, ce qui entraîne des hausses de prix multipliées par plusieurs facteurs. Ainsi, comparée à ces hausses multiples, une augmentation de 20 à 30 % sur le matériel semble modérée — elle reflète simplement une offre insuffisante et une pénurie sévère. »
700 milliards de dollars de dépenses en capital à la poursuite d’une capacité limitée : un déséquilibre offre-demande difficile à résorber à court terme
En confrontant les contraintes d’offre de TSMC aux données de demande du marché des GPU, l’origine structurelle de la pénurie de puissance de calcul devient limpide : la croissance de la demande dépasse largement celle de la capacité de production, tandis que le délai nécessaire pour livrer de nouvelles capacités s’exprime en années.
Sur le front de la demande, les quatre « super-clouds » (Alphabet, Microsoft, Meta et Amazon) prévoient ensemble des dépenses en capital approchant les 700 milliards de dollars en 2026, soit une augmentation de plus de 60 % par rapport à 2025. NVIDIA détient environ 85 à 90 % de parts de marché sur le segment des GPU, ce qui signifie que la majeure partie de ces dépenses aboutira finalement à l’achat de puces NVIDIA, elles-mêmes quasi exclusivement fabriquées par TSMC.
Sur le front de l’offre, les dépenses en capital de TSMC, à hauteur de 56 milliards de dollars, constituent un record historique. Toutefois, la construction d’une nouvelle usine de fabrication de puces nécessite de 2 à 3 ans entre le début des travaux et la mise en production, puis 1 à 2 ans supplémentaires pour atteindre la pleine capacité. La technologie 2 nm vient juste d’entrer en production au quatrième trimestre 2025, tandis que le plan mondial d’expansion en 3 nm ne commencera à générer des volumes additionnels qu’au premier semestre 2027 au plus tôt.
Ce décalage temporel entre offre et demande implique que, jusqu’en 2027 au moins, le pouvoir de fixation des prix de la puissance de calcul restera solidement entre les mains des fournisseurs. Pour les acteurs en aval, la hausse des loyers de GPU, des services cloud et des coûts d’appel aux modèles ne montre aucun signe de retournement à court terme. Pour les acteurs en amont — TSMC, NVIDIA et les fabricants de mémoires HBM (Samsung, SK Hynix) — cette période constitue une fenêtre de croissance particulièrement fiable.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News












