
Analyse du rapport de recherche de JPMorgan Chase : le volume d'utilisation des LLM bondit de 70 %, les coûts de location des GPU augmentent depuis sept mois consécutifs, la demande de matériel AI n'a pas encore refroidi
TechFlow SélectionTechFlow Sélection

Analyse du rapport de recherche de JPMorgan Chase : le volume d'utilisation des LLM bondit de 70 %, les coûts de location des GPU augmentent depuis sept mois consécutifs, la demande de matériel AI n'a pas encore refroidi
La demande en puissance de calcul pour l'IA est loin d'avoir atteint son sommet.
Rédigé par : Rita
Guide TechFlow
Le rapport d'observation des centres de données publié par J.P. Morgan le 1er juillet suit trois indicateurs clés de la demande d'infrastructure AI : volume et prix des tokens LLM, prix de location des GPU, prix spot des puces de stockage. La conclusion est claire : l'environnement de la demande AI reste positif.
Le volume de tokens LLM sur OpenRouter a explosé de 70 % en juin par rapport au mois précédent et a été multiplié par 20 en glissement annuel. Les loyers des GPU ont augmenté pendant sept mois consécutifs, le prix du B200 étant déjà le double de celui du H100. Le prix spot de la DRAM a augmenté de plus de 8 fois en glissement annuel. La croisement de ces trois données confirme que la demande de puissance de calcul AI est loin d'avoir atteint son sommet.
Utilisation des LLM en hausse de 70 %, prix en baisse de seulement 5 %, faisons les calculs pour les fournisseurs de modèles
Les données de juin sur la plateforme OpenRouter s'accélèrent globalement. Le volume de tokens a augmenté de 70 % par rapport au mois précédent et a été multiplié par 20 en glissement annuel. Le prix par appel unique a légèrement augmenté par rapport au mois précédent et n'a baissé que de 5 % en glissement annuel, tandis que la tarification des modèles locaux américains augmente même en glissement annuel. Le montant total des dépenses a augmenté de 70 % par rapport au mois précédent et a été multiplié par 16 en glissement annuel.
En mettant ces trois ensembles de chiffres ensemble, la conclusion est évidente : la croissance du volume écrase la baisse des prix. Même en supposant que le prix des tokens continue de baisser de 5 % à 10 % par an, tant que le volume maintient un rythme de doublement, les revenus d'inférence des fournisseurs de modèles exploseront toujours. Le jugement de J.P. Morgan est que la direction de l'économie des tokens est favorable aux fournisseurs de modèles.
Les données de part de marché sont encore plus intéressantes. Les modèles américains ne représentent que 35 % du volume, mais captent plus de 85 % du montant des dépenses. Le Claude Opus 4.7 d'Anthropic est le seul modèle à entrer dans le top 5 du volume et du top 5 des dépenses simultanément, le pouvoir de fixation des prix est entre les mains des États-Unis.
Les loyers des GPU en hausse pendant sept mois consécutifs, le prix du B200 est le double de celui du H100
Les prix de location des GPU des fournisseurs de cloud non hyperscale ont augmenté dans l'ensemble en juin par rapport au mois précédent. A100 a augmenté de 6,3 %, en hausse pendant cinq mois consécutifs ; H100 a augmenté de 3,7 %, en hausse pendant sept mois consécutifs ; B200 a augmenté de 2,7 %, en hausse continue depuis son lancement il y a neuf mois.
L'écart de prix entre les trois gammes de GPU se resserre. La prime du H100 par rapport au A100 est passée de 1,77 fois en avril à 1,67 fois en juin, et la prime du B200 par rapport au H100 est passée de 2,58 fois à 1,96 fois. La rareté de la puissance de calcul haut de gamme s'atténue, mais les prix continuent d'augmenter, ce qui indique que la croissance de la demande suit la libération de l'offre.
Le fait que le A100 ait augmenté le plus fortement mérite d'être souligné séparément. Le prix des puces de la génération précédente ne baisse pas mais augmente, ce qui signifie que les clients aux budgets limités se ruent sur la puissance de calcul rentable. Ce n'est pas un signal de suroffre.
La DRAM augmente, la NAND baisse, les deux géants du stockage prennent des directions opposées
Le prix spot de la DRAM a augmenté de 10 % en juin par rapport au mois précédent pour atteindre 43,14 dollars, en hausse de 740 % en glissement annuel, pour le troisième mois consécutif. Le prix spot de la NAND a légèrement baissé de 0,3 % par rapport au mois précédent pour atteindre 27,03 dollars, en baisse légère pour le troisième mois consécutif, mais toujours en hausse de 518 % en glissement annuel.
740 % et 518 %, ces deux chiffres indiquent que le stockage dans son ensemble reste à des niveaux historiques élevés. La divergence de direction est également évidente : la DRAM continue d'augmenter, la NAND commence à se relâcher.
La règle historique est que lorsque le cycle de stockage atteint son sommet, la NAND se relâche en premier, la DRAM ensuite. La NAND qui s'affaiblit pendant trois mois consécutifs est un signal que le cycle entre dans sa phase tardive. J.P. Morgan n'a pas directement porté ce jugement dans le rapport, mais les données elles-mêmes parlent.
Le récit de l'infrastructure AI est toujours là, mais la logique change de vitesse
Utilisation des LLM en hausse de 70 %, loyers des GPU en hausse pendant sept mois consécutifs, DRAM en hausse de 740 % en glissement annuel, trois données pointent vers la même conclusion : la demande d'infrastructure AI est loin d'avoir atteint son sommet.
Mais la structure change. Les modèles américains ont capté 85 % du montant des dépenses, le pouvoir de fixation des prix est aux États-Unis. La prime du B200 par rapport au H100 est passée de 2,58 fois à 1,96 fois, la rareté de la puissance de calcul haut de gamme s'atténue. La NAND commence à se relâcher, le cycle de stockage change de vitesse.
Les nouvelles positives sont continues, la logique est dynamique.
Perspective TechFlow
La plus grande angle mort de ce rapport réside dans le biais de la source de données. OpenRouter s'adresse principalement aux développeurs, aux startups et aux scénarios de programmation d'agents AI, n'inclut pas le trafic API direct d'OpenAI et d'Anthropic, ni le volume déployé en interne par les fournisseurs de cloud hyperscale. Cela signifie que le rapport capture la "demande AI longue traîne", pas la "demande AI totale". Si la longue traîne explose, la tête ne sera que plus chaude, mais il est également possible que la tête se refroidisse tandis que la longue traîne rattrape son retard — les implications d'investissement de ces deux scénarios sont complètement différentes.
Le suivi des prix de location des GPU concerne la capacité tierce des fournisseurs de cloud non hyperscale, n'inclut pas les prix de location officiels d'AWS, d'Azure et de GCP. Le fait que les tiers augmentent tous leurs prix indique que la pénurie de puissance de calcul a débordé de la tête vers la longue traîne, ce qui est positif pour le matériel AI dans la direction, mais il est impossible de juger de l'utilisation des fournisseurs hyperscale eux-mêmes. Si leur puissance de calcul pour usage propre est déjà excédentaire mais simplement non libérée sur le marché de la location, alors la situation réelle de l'offre et de la demande serait plus faible que celle présentée dans le rapport.
Le signal de divergence des prix de stockage mérite d'être décomposé séparément. La NAND s'affaiblit pendant trois mois consécutifs, la DRAM continue d'augmenter, ce qui correspond aux caractéristiques typiques de la phase tardive du cycle de stockage. Si le prix de la NAND continue de baisser, les attentes de revenus des fabricants de puces de stockage seront révisées à la baisse, affectant ainsi les attentes de dépenses en capital pour l'ensemble des équipements semi-conducteurs.

Avis de non-responsabilité
Cet article est un résumé et une interprétation par TechFlow Research d'un rapport de recherche d'un courtier tiers. Les ratings, prix cibles, prévisions de bénéfices et jugements connexes cités dans le texte sont les points de vue des analystes de ce courtier, représentent uniquement la position de leur institution affiliée, ne représentent pas le point de vue de TechFlow Research et ne constituent aucun conseil d'investissement.
Le marché comporte des risques, les décisions doivent être indépendantes. Cet article ne doit pas servir de base pour l'achat ou la vente de titres.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News











