
Discours de Jensen Huang à la conférence GTC Taipei 2026 : « L’ère des agents IA est arrivée — le calcul, c’est le revenu »
TechFlow SélectionTechFlow Sélection

Discours de Jensen Huang à la conférence GTC Taipei 2026 : « L’ère des agents IA est arrivée — le calcul, c’est le revenu »
« Le calcul, c’est le revenu ; le calcul, c’est le profit. En l’absence de revenu et de profit, il y a perte. »
Rédaction et traduction : TechFlow

Invité : Jensen Huang, PDG de NVIDIA
Source du podcast : Bonnie Blockchain
Titre original : Sept points clés de la conférence de Jensen Huang à la GTC Taipei 2026 – Le nouveau plan stratégique de NVIDIA en un coup d’œil ! [Bonnie Blockchain]
Date de diffusion : 2 juin 2026
Synthèse des points essentiels
Dans son discours à la GTC Taipei 2026, Jensen Huang a centré la prochaine phase stratégique de NVIDIA sur un jugement fondamental : l’IA est passée de la génération de contenus à l’ère des agents capables d’agir concrètement ; le « token » n’est plus seulement un indicateur technique, mais une unité de production de revenus, de bénéfices et de PIB. Autour de cette évolution, NVIDIA a lancé Vera Rubin, le processeur CPU Vera, un kit d’outils pour agents professionnels, une nouvelle génération d’ordinateurs personnels développée en collaboration avec Microsoft, ainsi que Cosmos 3, Alpamayo 2 et Isaac GR00T, dédiés à l’IA physique. Jensen Huang souligne que le modèle de calcul des dix prochaines années sera constitué conjointement de modèles, de cadres d’agents, de compétences-outils et de runtime, et qu’il se diffusera progressivement depuis le cloud, les entreprises et les PC locaux vers les robots, les usines, les satellites et les dispositifs périphériques (edge). Pour la chaîne d’approvisionnement taïwanaise, cela signifie que les « usines IA », l’efficacité énergétique, la rapidité de déploiement des infrastructures et la capacité de coordination verticale deviendront les leviers clés de la croissance industrielle suivante.
Résumé des idées marquantes
L’arrivée de l’ère des agents IA
- « Une IA utile est désormais une réalité : l’IA génère aujourd’hui des bénéfices et contribue directement au PIB. Ce changement ne repose pas uniquement sur les grands modèles linguistiques, mais sur un tout nouveau paradigme de calcul : celui des agents. »
- « Un agent combine un grand modèle linguistique et un cadre d’agents, ce dernier jouant un rôle analogue à celui d’un système d’exploitation, en reliant mémoire, outils, raisonnement, planification et action. »
- « La percée dans les systèmes d’agents provient à la fois de la capacité accrue des grands modèles linguistiques à penser, raisonner, planifier et utiliser des outils, et de celle des cadres d’agents à gérer la mémoire, coordonner les processus et orchestrer les outils. »
- « Chaque entreprise deviendra une entreprise d’agents ; chaque entreprise fera fonctionner des agents en interne et aura besoin de son propre système d’exploitation dédié aux agents. »
Tokens, usines IA et économie des infrastructures
- « Le token est désormais une unité génératrice de bénéfices et de revenus. Les entreprises IA souhaitent produire davantage de tokens, ce qui les pousse à construire davantage d’usines IA — c’est précisément pourquoi la demande informatique à Taïwan connaît une hausse spectaculaire. »
- « Le calcul, c’est le revenu. Le calcul, c’est le bénéfice. En l’absence de revenus ou de bénéfices, il y a perte. »
- « Si une usine IA dispose d’une puissance électrique maximale de 1 gigawatt, cette limite ne peut être dépassée. Dans ces conditions, le débit par watt devient synonyme de revenu, car chaque token possède une valeur économique. »
- « Opter pour une architecture inadaptée simplement parce qu’elle utilise des puces moins chères ne génère pas de gains réels : ce qu’il faut garantir, c’est le revenu par watt. Plus vous achetez, plus vous gagnez. »
Vera Rubin et la transformation d’infrastructure de NVIDIA
- « Vera Rubin n’est pas une puce, ni même simplement un GPU : c’est un système complet conçu de bout en bout. »
- « NVIDIA était autrefois une société spécialisée dans les GPU, puis est devenue une société de systèmes ; elle est aujourd’hui en train de se transformer encore davantage en une société d’infrastructures, aidant ses clients à construire leurs propres usines IA. »
- « Vera Rubin représente le projet le plus ambitieux de l’histoire de NVIDIA : les 40 000 ingénieurs de l’entreprise y ont participé, tout comme la chaîne d’approvisionnement taïwanaise, qui a contribué activement à la création de ce système. »
- « Grace Blackwell a été conçue spécifiquement pour traiter l’IA, notamment l’inférence ; Vera Rubin, quant à elle, a été conçue pour exécuter des agents. »
Le processeur CPU Vera et les exigences computationnelles des agents
- « Tous les processeurs CPU existants jusqu’à présent ont été conçus pour les humains ; celui-ci a été conçu spécifiquement pour les agents. »
- « Les agents n’ont aucune patience. Leur monde n’est pas mesuré en secondes, mais en nanosecondes. Lorsqu’ils utilisent des outils, ils attendent une réponse immédiate ; lorsqu’ils accèdent à une base de données, ils veulent obtenir le résultat sans délai. »
- « Le CPU Vera est un processeur conçu pour les agents, mettant l’accent sur les performances monothread, le nombre d’instructions par cycle d’horloge (IPC), la bande passante par cœur et la bande passante globale du système. »
- « Ce marché sera nécessairement plus vaste que le précédent, car le nombre d’agents dépassera largement celui des êtres humains — et les agents sont extrêmement impatients. Voilà le CPU NVIDIA Vera. »
La prochaine génération d’ordinateurs personnels
- « Le nouveau mode de calcul basé sur les agents s’exécutera dans le cloud IA, au sein des entreprises, mais aussi sur votre ordinateur personnel. »
- « Le futur système d’exploitation intégrera le système d’exploitation traditionnel et un grand modèle linguistique ; ce dernier constitue, à bien des égards, la version moderne de DirectX, soit l’extension intelligente de l’ordinateur. »
- « Les applications traditionnelles seront remplacées par des runtimes dédiés aux agents ; toute application moderne deviendra donc un agent. »
- « NVIDIA collabore avec Microsoft pour redéfinir entièrement l’ordinateur personnel, lançant une nouvelle gamme d’appareils Windows couvrant les postes de travail, les ordinateurs portables et les stations de travail. »
L’IA physique, la conduite autonome et la robotique
- « Les modèles linguistiques sont entraînés sur des données issues de la perspective humaine, tandis que les robots doivent comprendre le monde depuis leur propre point de vue. Le principal défi de l’IA physique réside donc dans la disponibilité des données. »
- « Cosmos 3 est le modèle fondamental de pointe pour l’IA physique, capable de comprendre, raisonner, générer, simuler en boucle fermée, voire servir directement de stratégie. »
- « Une fois l’IA mise en œuvre, le calcul lui-même devient une donnée ; Cosmos 3 peut donc servir à entraîner davantage de modèles IA, et être renforcé afin de devenir un modèle propriétaire. »
- « Que ce soit pour les agents dans le cloud, les agents sur PC, les systèmes de conduite autonome ou les robots humanoïdes, le modèle de calcul sous-jacent reste identique : modèle, cadre, compétences-outils et runtime. »
Jensen Huang désigne les spécialités culinaires taïwanaises comme composantes clés de la chaîne d’approvisionnement IA
Jensen Huang :
Le développement de l’écosystème taïwanais jusqu’à sa taille actuelle est tout simplement incroyable. Lorsque la plupart des gens évoquent un écosystème, ils pensent d’abord à notre pile logicielle, à l’écosystème de développeurs bâti au-dessus des systèmes informatiques NVIDIA. Or l’écosystème NVIDIA va bien au-delà : il s’étend vers le haut jusqu’à la chaîne d’approvisionnement taïwanaise — là où tout commence — et vers le bas jusqu’aux centres de données, puis finalement aux utilisateurs finaux.
Aujourd’hui, nous aborderons presque tous les maillons de cet écosystème. Il y a tant de personnes à remercier. J’adore cet écosystème : il compte un très grand nombre d’entreprises, ainsi que de nombreux partenaires dont je suis particulièrement proche. Taïwan dispose d’un écosystème extrêmement riche, considéré comme le meilleur au monde en matière de chaîne d’approvisionnement.
L’ère des agents IA est arrivée
Jensen Huang :
Il y a deux ans, lorsque je me trouvais ici, j’ai commencé à discuter avec vous de la transition de l’IA générative vers la vague suivante : l’IA basée sur les agents. Aujourd’hui, nous pouvons affirmer sans équivoque que l’IA basée sur les agents est une réalité, et qu’une IA véritablement utile est désormais opérationnelle.
D’un point de vue industriel, cela signifie que la demande de tokens connaît une croissance explosive. Car si l’IA peut effectivement accomplir des tâches concrètes, les entreprises chercheront naturellement à produire davantage de cette capacité. Le token est désormais une unité génératrice de bénéfices, une unité créatrice de revenus. Puisqu’il génère des profits, les entreprises IA chercheront à construire davantage de tokens, à en générer davantage, et à bâtir davantage d’usines IA — c’est précisément la raison pour laquelle la demande informatique à Taïwan connaît une hausse spectaculaire.
C’est pourquoi vous êtes tous si occupés et vos résultats commerciaux si remarquables. En effet, cela se reflète même dans le cours boursier de certaines de vos entreprises. Le modèle de calcul a changé — tout a changé.
Premier point clé : une IA utile est désormais une réalité, et l’IA génère aujourd’hui des bénéfices et du PIB. Derrière ce phénomène se cache un tout nouveau paradigme de calcul. Il ne s’agit pas uniquement de grands modèles linguistiques, mais bien d’agents. L’ensemble de nos propos aujourd’hui reposera sur cette base fondamentale.
Laissez-moi prendre un instant pour préciser ce que j’entends par là. Ici se trouve un agent, une application agent. Par le passé, cet espace aurait été occupé par une application classique, par du code s’exécutant sur un système d’exploitation. Aujourd’hui, il s’agit d’un agent, constitué d’un ou plusieurs grands modèles linguistiques, intégré dans un cadre d’agents qui orchestre ses fonctions afin qu’il accomplisse efficacement des tâches productives.
Lorsqu’une entrée atteint le système, l’agent doit comprendre, observer, raisonner, agir et utiliser des outils. Ces outils peuvent être des tableurs, des navigateurs web, des moteurs de traitement de données ou encore des moteurs de bases de données. À chaque transfert d’information — qu’il s’agisse de traiter le contexte, de comprendre ce qui se passe, de déterminer la prochaine étape ou d’élaborer un plan exécutable — un logiciel spécifique doit coordonner l’ensemble.
Ainsi, l’agent est, par essence, un tel système. Il gère à la fois la mémoire à court terme (mémoire de travail) et la mémoire à long terme, tout comme un être humain. Le système de gestion de la mémoire devient dès lors critique. L’ensemble est appelé « agent ». Le grand modèle linguistique assure la réflexion, tandis que le cadre d’agents relie tous les éléments, à l’instar d’un système d’exploitation.
Voilà le nouveau paradigme de calcul, et la raison pour laquelle les agents peuvent accomplir des tâches extraordinaires. C’est une percée majeure : les grands modèles linguistiques sont désormais capables de penser, raisonner, planifier et utiliser des outils avec une grande efficacité ; parallèlement, nous disposons désormais de cadres d’agents capables de gérer la mémoire, de coordonner les processus et d’orchestrer les outils. Nous sommes donc désormais en mesure de réaliser de nombreuses choses qui étaient impossibles auparavant.
Qu’est-ce qu’un token dans une usine IA ?
Jensen Huang :
Token, DSX, GPU, CPU, Vera… Nous avons conçu la prochaine génération de systèmes : Vera Rubin. Vera Rubin n’est pas une puce, ni même simplement un GPU. Elle part du GPU, mais va bien au-delà. Le système complet, de bout en bout, constitue Vera Rubin.
Il intègre des GPU, le NVLink 72 Vera Rubin, et est coordonné par le CPU Vera que je présenterai ultérieurement. Il comprend également un système de stockage Vera révolutionnaire, le CX9, notre pile logicielle DOCA, ainsi qu’un processeur sécurisé intégré. Toutes les données du système — qu’elles soient au repos, en transit ou en cours d’utilisation — sont chiffrées. L’ensemble du système est sécurisé, car les modèles IA sont extrêmement précieux. C’est pourquoi l’ensemble suit strictement les principes du calcul confidentiel.
Chacun de ces composants, pris isolément, serait suffisant pour constituer une révolution complète. Vera Rubin est le projet le plus ambitieux de l’histoire de NVIDIA. Les 40 000 ingénieurs de l’entreprise ont participé à la conception de Vera Rubin, sans compter la contribution essentielle de chacun d’entre vous à la création de ce système. Vera Rubin est véritablement un miracle : ce n’est pas une simple puce, mais un système complexe composé de multiples éléments.
Mais ce n’est pas tout. Il y a longtemps, NVIDIA était une société spécialisée dans les GPU ; ces dernières années, nous nous sommes progressivement transformés en une société de systèmes. Ce que vous voyez aujourd’hui est le système le plus complexe que nous ayons jamais conçu à partir de zéro. Toutefois, nos clients et partenaires ne cherchent pas à acheter un ordinateur : ils veulent construire des usines IA.
C’est pourquoi NVIDIA entreprend une nouvelle transformation. Vous pouvez constater que nombre de nos technologies s’étendent désormais à l’échelle des infrastructures complètes. Nos partenaires opèrent eux-mêmes à cette échelle : centrales électriques, systèmes de refroidissement, fournisseurs de réseau électrique, et nombre d’entreprises industrielles font désormais partie intégrante de notre écosystème. En définitive, nous devons construire une pile technologique complète, tout comme nous l’avons fait pour les GPU, Grace Blackwell ou le NVLink 72 ; aujourd’hui, nous devons concevoir une pile complète permettant à nos clients de construire des infrastructures IA exceptionnelles.
Accomplir cette mission — aider nos clients à construire et déployer des usines IA — est devenu extrêmement important. La raison est simple : le calcul, c’est le revenu. Le calcul, c’est le bénéfice. En l’absence de revenus ou de bénéfices, il y a perte.
Vous devez comprendre ceci : lorsqu’une infrastructure IA entre en service, elle peut être mise en ligne rapidement ou subir de longs retards ; son débit peut être élevé ou faible ; sa flexibilité et sa fiabilité peuvent être excellentes ou médiocres ; sa durée de vie effective peut être longue ou brève. Compte tenu des investissements colossaux impliqués — 50, 60 milliards, voire 100 milliards de dollars — cette courbe revêt une importance capitale.
C’est pourquoi NVIDIA constitue un partenaire privilégié. Nous possédons une capacité d’intégration complète : nous ne nous contentons pas de présenter une diapositive, mais concevons réellement l’infrastructure entière, connectons tous ses composants, et construisons à grande échelle pour garantir un fonctionnement optimal. Ainsi, nos temps de premier token, de première inférence et de démarrage d’entraînement sont plus rapides.
Deuxièmement, notre débit par watt, ou nombre de tokens par watt, est mondial. Cela tient à notre intégration complète de tous les composants, à leur conception intégrée depuis zéro, à la simulation globale du système, et à une conception coopérative poussée à l’extrême. Comme illustré précédemment avec l’armoire Vera Rubin, chaque élément est conçu pour offrir un débit remarquable.
Si votre centre de données ou votre usine dispose d’une puissance électrique de 1 gigawatt, vous ne pourrez pas aller au-delà — c’est votre capacité maximale de production d’énergie. Dans cette limite de 1 gigawatt, le débit par watt équivaut directement au revenu, car chaque token génère un profit, chaque token constitue un revenu.
C’est là l’avenir. Le calcul, c’est le revenu ; les performances par watt, c’est votre revenu. Opter pour une architecture erronée simplement parce qu’elle utilise des puces moins chères ne génère aucun gain réel : ce que vous devez garantir, c’est le revenu par watt. Plus vous achetez, plus vous gagnez.
Je me tiens devant vous aujourd’hui pour vous annoncer que Vera Rubin est désormais pleinement en production. La chaîne d’approvisionnement que nous avons mise en place pour Vera Rubin est deux fois plus importante que celle dédiée à Grace Blackwell. Le montage d’un armoire Grace Blackwell nécessitait auparavant deux heures ; il ne prend désormais que cinq minutes. Ainsi, non seulement la capacité de production est plus élevée, mais le débit de fabrication est également nettement plus rapide — et nous avons besoin de tout cela pour répondre à la demande.
Cet écosystème est exceptionnel. Pour soutenir Grace Blackwell et préparer le lancement de Vera Rubin, des millions de pieds carrés de capacité de production ont déjà été mis en service. Je tiens à vous remercier chaleureusement. Vera Rubin est désormais pleinement en production. Merci à tous.
Présentation du système Vera Rubin
Jensen Huang :
Vera Rubin n’a pas été conçu uniquement pour l’IA. Vera Rubin n’a pas été conçu uniquement pour exécuter de l’IA : il a été conçu pour exécuter des agents. C’est un système basé sur les agents. Imaginez-en la complexité. C’est justement pour cette raison que les agents constituent la dernière grande percée en informatique. Il a fallu de nombreuses années avant que leur potentiel ne soit pleinement réalisé et qu’ils deviennent véritablement utiles. L’ordinateur capable de les faire fonctionner doit donc être le plus avancé au monde.
C’est précisément Vera Rubin. Examinons-le. Veuillez apporter Vera Rubin.
Voici Vera Rubin, avec son NVLink 72 Vera Rubin. Il s’agit d’une partie de la prochaine génération de systèmes ; lors de la prochaine GTC, je vous en parlerai plus en détail. Aujourd’hui, nous avons encore beaucoup à aborder. Voici l’armoire CPU Vera, équipée de 256 processeurs, entièrement refroidis par liquide. Je présenterai Vera plus tard. Voici le système de traitement de stockage Vera BlueField, également un système sécurisé. Bien entendu, nous intégrons également notre réseau Mellanox, le premier réseau CPO (co-packaged optics) au monde. Voici Vera Rubin : une combinaison technologique impressionnante.
Lorsque nous avons conçu Hopper, c’était pour l’entraînement préalable (pre-training). À l’époque, c’était l’application la plus importante, ainsi que la charge de travail la plus critique à laquelle nous étions confrontés. Lorsque nous avons ensuite conçu Grace Blackwell, on nous disait : « Jensen, NVIDIA excelle dans le pre-training, l’inférence est simple. » Vous souvenez-vous ? Beaucoup affirmaient alors : « L’inférence est simple, nous savons aussi la faire. »
Mais vous savez que l’inférence équivaut à de l’argent. Les modèles sont extrêmement complexes, et il est très difficile de concilier haute réactivité, interaction fluide et fort débit. C’est précisément pourquoi nous avons créé le NVLink 72.
Aujourd’hui, le coût du token chez NVIDIA est le plus bas au monde. Pas de 10 %, mais plusieurs fois inférieur, voire d’un ordre de grandeur. Tout cela est rendu possible grâce à notre conception coopérative poussée à l’extrême, à notre compréhension approfondie du modèle de calcul de l’inférence, et à la création du NVLink 72.
Avec Vera Rubin, nous allons désormais au-delà de l’inférence. Il s’agit maintenant de l’inférence au sein d’un système basé sur les agents. Voilà Vera Rubin. Aucun câble, aucun tuyau, aucun ventilateur. Lors de ma précédente démonstration, les câbles étaient partout.
Le CPU VERA : le processeur pour les agents IA
Jensen Huang :
Le CPU Vera est un processeur conçu spécifiquement pour l’ère IA. Jusqu’à présent, tous les processeurs CPU ont été conçus pour les humains. Nous étions des utilisateurs, des locataires. L’humain utilise le CPU dans un monde mesuré en secondes. Nous louons des CPU dans le cloud, et plus il y a de cœurs, plus nous pouvons en louer. Les scénarios d’utilisation et l’économie associés aux anciens CPU sont totalement différents de ceux des agents.
Les agents n’ont aucune patience. Leur monde n’est pas mesuré en secondes, mais en nanosecondes. Lorsqu’ils utilisent des outils, ils attendent une réponse immédiate ; lorsqu’ils accèdent à une base de données, ils veulent obtenir le résultat sans délai. Chaque instant d’attente bloque l’agent dans son cheminement vers l’étape suivante, puis la suivante, puis la suivante. Nous devons donc rendre le CPU aussi peu latence que possible, et aussi interactif que possible.
C’est précisément pourquoi nous avons conçu le CPU Vera pour l’ère IA. Dans notre système, il remplit trois fonctions. Premièrement, il est utilisé pour la réflexion dans Vera Rubin. Dans l’armoire Vera Rubin, deux CPU sont déjà installés. Vous savez que nous fabriquons et vendons des millions d’unités Vera Rubin, tout comme des millions d’unités Grace Blackwell. NVIDIA est aujourd’hui l’un des plus grands fabricants mondiaux de CPU.
Dans l’armoire Vera Rubin, l’un des deux CPU est dédié à la coordination et à la gestion des GPU, à la gestion du cache KV, et à l’exécution des divers logiciels de l’armoire. Nous disposons également de Grace BlueField, dédié à la sécurité et à l’isolation. La partie de calcul Vera est réservée au cadre d’agents, chargé de coordonner les modèles IA, d’utiliser les outils et d’accéder aux bases de données.
Le serveur de stockage ici présent est le Vera BlueField, le serveur de stockage et le système de stockage les plus rapides au monde. Il est crucial, car les agents accèdent à la mémoire à une vitesse extrême. Le serveur de stockage et le CPU sont désormais situés sur le chemin critique le plus coûteux du centre de données.
Le coût élevé de cette zone est parfaitement justifié. L’économie d’une usine IA repose sur le token, et c’est ici que les tokens sont créés. Vous souhaitez donc en produire et en générer le plus possible. La valeur économique est concentrée ici, et le CPU ainsi que le système de stockage ne doivent en aucun cas constituer un goulot d’étranglement.
Ainsi, le CPU Vera impose des contraintes extrêmes à l’architecture des processeurs, ce qui explique pourquoi nous avons conçu une architecture entièrement nouvelle depuis zéro. Il s’agit d’un CPU inédit au monde, que nous appelons Vera. C’est un CPU conçu spécifiquement pour les agents. Tous les processeurs CPU conçus jusqu’à présent l’ont été pour les humains ; celui-ci a été conçu pour les agents.
Premièrement, l’IPC (instructions par cycle) de Vera doit être exceptionnel, car nous devons réduire la latence et le temps de traitement. Nous recherchons des performances monothread, et non simplement un débit brut. Les performances monothread doivent être mondiales, optimales. Ainsi, l’IPC de Vera est exceptionnel, le plus élevé au monde : 10 instructions sont récupérées, décodées et exécutées chaque cycle d’horloge.
Deuxièmement, la bande passante requise pour les transferts de données vers et depuis le CPU doit être mondiale. Cela inclut à la fois la bande passante par cœur et la bande passante globale. J’ai mentionné précédemment que les systèmes basés sur les agents sont fondamentalement décomposés et distribués. Lorsque le calcul est décomposé et déployé de façon distribuée, le réseau devient un enjeu critique. Nous devons donc déplacer les données aussi rapidement que possible entre les cœurs CPU, entre le CPU et le stockage, et entre le CPU et le GPU.
La bande passante autour du système et à l’intérieur des cœurs CPU doit être mondiale, car les cœurs CPU communiquent entre eux à une bande passante extrêmement élevée. Ils ne sont pas loués individuellement, mais travaillent tous ensemble. La bande passante transversale de Vera est tout simplement stupéfiante. C’est le premier système à supporter le PCI Express Gen 6, et le premier à intégrer la mémoire LPDDR5, avec une bande passante atteignant 1,2 à 2 To/s — soit deux à trois fois supérieure à celle des meilleurs CPU hautes performances.
C’est un CPU conçu pour les agents. Ce marché sera nécessairement plus vaste que le précédent, car le nombre d’agents dépassera largement celui des êtres humains, et les agents sont extrêmement impatients. Voilà le CPU NVIDIA Vera.
Le modèle de calcul le plus important des dix prochaines années
Jensen Huang :
Cette diapositive est véritablement la plus importante. Sa conclusion centrale est la suivante : voici le modèle d’application des dix prochaines années, et le modèle de calcul des dix prochaines années. Les agents, les cadres d’agents, et les grands modèles linguistiques coordonnés par ces cadres seront déployés par toutes les entreprises. Chaque entreprise deviendra une entreprise d’agents, chaque entreprise fera fonctionner des agents en interne, et chaque entreprise découvrira que les agents nécessitent leur propre système d’exploitation.
Chaque entreprise nous demande : comment exécuter des agents en toute sécurité ? Comment construire des agents adaptés à ses charges de travail ? C’est pourquoi nous proposons le kit d’outils NVIDIA Enterprise AI Agents. Vous avez d’ailleurs pu me voir le construire publiquement, étape par étape.
Presque tout ce que fait NVIDIA est connu de tous. Si vous revenez sur mes discours à la GTC il y a cinq ou dix ans, vous verrez que je parle depuis des années de ces sujets, car nous nous préparions depuis longtemps à ce moment précis.
Pour construire un service d’agents ou des agents opérationnels, les entreprises ont besoin de quatre éléments. Premièrement, elles ont besoin de modèles. Bien entendu, plus les grands modèles linguistiques sont intelligents, moins chers et rapides, mieux c’est. Deuxièmement, elles ont besoin d’un cadre pour coordonner l’ensemble du système. Troisièmement, ces modèles doivent pouvoir utiliser des outils dotés de compétences. J’ai présenté précédemment les bibliothèques CUDA-X, qui deviendront à l’avenir des outils puissants pour les agents. Quatrièmement, elles ont besoin d’un runtime, c’est-à-dire d’un système d’exploitation qui lie tous ces éléments.
C’est exactement le kit d’outils NVIDIA Agents. Il inclut des modèles modifiables, à savoir nos modèles open source de classe mondiale. Je souhaite encore vous en montrer davantage. Vous pouvez exécuter des agents provenant de n’importe où, y compris des agents puissants comme Claude Code ou Codex. Vous pouvez les intégrer dans un cadre nommé Open Shell, assurant un fonctionnement hautement sécurisé au sein de l’entreprise.
Ce Shell protège l’agent, le maintenant constamment sous le contrôle de politiques de sécurité. La confidentialité est préservée, les autorisations et privilèges sont explicitement définis, et l’identité est protégée. Open Shell est ainsi adopté à l’échelle mondiale. NVIDIA Open Shell est open source, et vous verrez de nombreuses entreprises l’adopter, notamment Red Hat, Canonical et Microsoft. Il sera adopté partout.
Il s’agit d’un runtime essentiel, entièrement optimisé pour la plateforme IA NVIDIA omniprésente. Vous pouvez exécuter Open Shell sur n’importe quel cloud, en local, voire sur des appareils embarqués. Vous disposez désormais d’outils et de bibliothèques utilisables par les agents, de modèles modifiables ou prêts à l’emploi, ainsi que de cadres d’agents. Ces cadres peuvent désormais fonctionner localement ou n’importe où ailleurs.
L’un de mes cas d’usage préférés pour les agents est celui des concepteurs de puces. Il s’agit de l’un des travaux les plus importants de NVIDIA. Nous collaborons donc naturellement avec Cadence pour construire un « super-agent » spécialisé dans la conception de puces. Ce super-agent est coordonné par Codex ou Claude Code, prend en entrée des descriptions RTL, des schémas d’architecture, des schémas électriques ou des spécifications techniques, et vous aide à corriger les éléments nécessitant une correction. Nous avons co-construit plusieurs super-agents, optimisés pour le runtime NVIDIA via Nemotron.
NVIDIA s’engage à construire des modèles ouverts pour le monde entier, afin que vous, et nous tous, puissions créer nos propres agents. Aujourd’hui, nous annonçons Nemotron 3 Ultra, notre prochaine génération de modèles ouverts, extrêmement performants. Les modèles Nemotron ne vous fournissent pas uniquement le modèle, mais aussi l’intégralité des données que nous utilisons pour son entraînement.
Grâce à notre solide alliance de partenaires, vous pouvez voir ici la liste complète de nos collaborateurs. Nous travaillons ensemble et contribuons mutuellement des données. Grâce à ces collaborations exceptionnelles, les modèles, les scripts d’entraînement et les données seront entièrement ouverts à votre disposition. C’est la meilleure forme de modèle ouvert, et la meilleure politique de systèmes de modèles ouverts au monde. L’objectif est simple : vous pouvez tout prendre, y ajouter vos propres améliorations, le rendre meilleur, et en faire votre propre modèle.
Nemotron 3 Ultra est cinq fois plus rapide et coûte 30 % moins cher, tout en étant entièrement ouvert. Nous sommes pleinement engagés sur ce point. Voici Nemotron 3, et nous développons actuellement Nemotron 4. C’est précisément ce kit complet — composé de modèles, de cadres, de compétences-outils et de runtime — qui permet à chaque entreprise du monde entier de créer ses propres agents, tout comme Cadence l’a fait avec ses super-agents.
La nouvelle génération d’ordinateurs personnels NVIDIA
Jensen Huang :
Microsoft et NVIDIA vont redéfinir l’ordinateur personnel. Ce sera le nouvel ordinateur personnel. Demain soir — ou plutôt ce soir, ici même — je discuterai avec Satya de nos travaux menés conjointement au cours des trois dernières années. Microsoft et NVIDIA ont consacré beaucoup de temps à repenser entièrement le fonctionnement des PC, afin de se préparer à ce moment décisif.
Comme je l’ai mentionné précédemment, ce nouveau mode de calcul basé sur les agents s’exécutera dans le cloud IA, au sein des entreprises, mais aussi sur votre PC. Que se passe-t-il lorsqu’un PC dispose d’un agent autonome ? Celui-ci vous aide, vous comprend. Vous pouvez lui parler, il peut vous voir. Vous pouvez lui demander de lire des documents ou de vous aider dans vos recherches. Il peut faire bien plus encore, comme je vous le montrerai ultérieurement.
Le nouveau système d’exploitation sera bien entendu constitué du système d’exploitation traditionnel augmenté d’un grand modèle linguistique. À bien des égards, ce grand modèle linguistique est la version moderne de DirectX. Il dispose d’entrées et de sorties, comprend les prompts, traite la vision par ordinateur, génère des vidéos et des sons. C’est l’extension intelligente moderne du PC, et de l’ordinateur en général.
Au-dessus de ce socle, comme je l’ai indiqué précédemment, les applications traditionnelles seront remplacées par des runtimes dédiés aux agents, et toute application moderne deviendra un agent.
Mesdames et messieurs, voici le nouvel ordinateur portable NVIDIA RTX Spark. Merci. J’ai trop de choses dans mes poches. Voici donc la puce la plus extraordinaire au monde. Il s’agit du N1X, développé en collaboration avec MediaTek. Je crois avoir aperçu Rick tout à l’heure. Voici le N1X, une puce magnifique. Franchement, il a fallu 33 ans pour concevoir cette puce.
La raison en est que 100 % de la pile logicielle NVIDIA peut y fonctionner. Vous souhaitez faire de la biologie numérique ? Pas de problème. Du traitement sismique ? Pas de problème. De l’astrophysique ? Pas de problème. Tout ce qui est lié à CUDA, toute la physique, toute la biologie, toute la génomique, toute l’IA, rien n’est impossible. Tous les graphismes informatiques fonctionnent également.
Chaque application créée par NVIDIA, ainsi que chaque application Windows jamais exécutée, a été soigneusement optimisée par Microsoft et NVIDIA afin que cet ordinateur puisse véritablement exécuter tout ce que le monde a jamais produit. En outre, il peut désormais exécuter des agents. C’est un ordinateur incroyable, dont je suis profondément fier.
Cet ordinateur peut héberger localement le modèle Nemotron 3 Ultra ou le modèle Nemotron 3 Super ; il peut se connecter aux modèles Claude Code, Codex ou autres hébergés dans le cloud ; il peut également accéder aux modèles disponibles sur le Web. Il fonctionnera et accomplira des tâches extraordinaires. RTX Spark est une refonte radicale de l’ordinateur portable, mais en réalité, Microsoft et NVIDIA redéfinissent l’ensemble de l’ordinateur personnel.
Aujourd’hui, nous annonçons une nouvelle gamme de produits : trois machines Windows révolutionnaires, couvrant les postes de travail, les ordinateurs portables et les stations de travail. Elles sont 100 % compatibles avec Windows, 100 % compatibles avec CUDA, et équipées à 100 % des cœurs tensoriels IA NVIDIA. Tout ce que vous pouvez exécuter sur n’importe quelle plateforme NVIDIA dans le monde entier fonctionnera également ici.
Nous avons établi une feuille de route à cet effet. Il s’agit d’une toute nouvelle famille de produits. Chaque génération d’architecture comportera des versions pour poste de travail, ordinateur portable et station de travail ; la génération suivante comportera également ces trois versions. Je suis extrêmement heureux et honoré de constater que l’ensemble de l’industrie mondiale des PC nous a rejoints dans cette initiative visant à redéfinir l’ordinateur personnel. Il s’agit d’une nouvelle gamme de produits, et d’un nouveau départ.
Cosmos 3 : le modèle fondamental pour l’IA physique
Jensen Huang :
Dans le domaine des modèles linguistiques, les données d’entraînement provenant d’internet — en anglais ou dans d’autres langues — sont collectées du point de vue humain. Elles sont écrites et lues par les humains. Toutefois, pour créer des données destinées aux robots IA, il faut partir de la perception et de la perspective du robot lui-même. La majorité des données vidéo dans le monde sont filmées en vue subjective (troisième personne), et non en vue objective (première personne).
Ainsi, pour les systèmes basés sur les agents, les systèmes robotiques et l’IA physique, les données constituent le défi le plus difficile. Vous avez pu observer notre progression progressive le long de cette échelle. Nous avons commencé par la téléopération, qui consiste essentiellement en des démonstrations humaines. Cela ne diffère pas fondamentalement des avancées obtenues en apprentissage par renforcement grâce au feedback humain. Ensuite, nous utilisons la simulation, domaine où Omniverse joue un rôle central. Cela ressemble également aux récompenses vérifiables utilisées en apprentissage par renforcement.
Nous utilisons ces systèmes pour amorcer les modèles IA, notamment les modèles d’IA physique. Enfin, nous sommes capables d’apprendre à partir de vues subjectives (troisième personne) et de les réinjecter sous forme de vues objectives (première personne). Grâce à ce processus d’amorçage, nous disposons finalement d’un modèle fondamental mondial capable de comprendre le monde physique depuis n’importe quelle perspective souhaitée : troisième personne, première personne, extérieure ou intérieure. Il s’agit véritablement d’une percée majeure.
Aujourd’hui, nous annonçons Cosmos 3. Cosmos 3 est à la pointe de l’IA physique. Nous sommes à la pointe des modèles linguistiques, et de nombreux chercheurs travaillent également sur ce sujet. Mais en matière d’IA physique, nous sommes incontestablement les meilleurs au monde. Je suis extrêmement fier de ce que mon équipe a accompli.
Il s’agit du modèle fondamental sur lequel repose l’ensemble de vos travaux. Que vous souhaitiez créer des robots, des robots industriels ou des robots opérant dans une usine, dès qu’il s’agit du monde physique, vous disposez désormais d’un partenaire : Cosmos 3. Il peut comprendre et raisonner, générer, simuler en boucle fermée, voire devenir la stratégie elle-même. Il figure en tête des classements mondiaux. Je suis très fier de Cosmos. Aujourd’hui, nous annonçons Cosmos 3.
Autrefois, les données et le calcul donnaient naissance à l’IA. Aujourd’hui, avec l’IA, le calcul lui-même devient une donnée. Ainsi, utilisez Cosmos 3 pour entraîner une multitude de modèles IA. Cosmos est un excellent système de modèles ouverts, identique à Nemotron. Nous ouvrons les modèles, les données, et même les méthodes d’entraînement, afin que vous puissiez l’adapter à vos besoins et transformer Cosmos en votre propre modèle propriétaire.
Alpamayo 2 : l’inférence pour la conduite autonome
Jensen Huang :
Aujourd’hui, nous annonçons Alpamayo 2, un modèle ouvert dédié aux véhicules autonomes. Nous collaborons avec les principaux constructeurs automobiles mondiaux. Si vous examinez les marques ayant rejoint NVIDIA Hyperion et développant actuellement des véhicules Hyperion, elles représentent environ 80 % de la production automobile mondiale. Autrement dit, ces constructeurs couvrent environ 80 % des voitures produites dans le monde.
Un grand nombre de systèmes NVIDIA Hyperion seront déployés à l’avenir, capables d’exécuter Alpamayo ainsi que n’importe quelle autre pile technologique de conduite autonome. Nous sommes également connectés aux services de mobilité. Environ 97 % des services de mobilité mondiaux sont actuellement reliés à notre plateforme. Ainsi, lorsque nous déployons Alpamayo sur le runtime Hyperion et le système d’exploitation Halos, nous pouvons connecter l’ensemble de ces services mondiaux.
Isaac GR00T : les robots humanoïdes
Jensen Huang :
NVIDIA Isaac GR00T est notre pile technologique dédiée aux robots humanoïdes, comprenant modèles, génération de données, simulation, runtime et système d’exploitation. Elle représente la plateforme GR00T, c’est-à-dire la plateforme Isaac GR00T.
Vous pouvez constater que chacun de nos systèmes suit exactement le même modèle : que ce soit un système d’agents dans le cloud, un système d’agents sur PC, un système robotique pour véhicules autonomes ou un système robotique pour robots humanoïdes, le modèle est identique.
Bien entendu, dans chaque cas, nous construisons intégralement l’ensemble. Nous procédons à une intégration verticale complète, à une intégration poussée, à une conception coopérative et à une conception coopérative poussée à l’extrême, puis nous ouvrons l’ensemble, permettant à chacun d’utiliser les parties qui lui conviennent. Vous pouvez même nous demander de vous aider à les modifier.
Cependant, une chose manque encore : les systèmes robotiques nécessitent une plateforme de référence. Ces systèmes sont extrêmement complexes, comportent de nombreux moteurs et capteurs, et sont très fragiles. Nous devons donc trouver un moyen de livrer ces plateformes de référence. Tout comme nous l’avons fait pour les PC, les systèmes DGX, le cloud et les véhicules autonomes, nous devons désormais le faire pour les robots.
Aujourd’hui, nous annonçons NVIDIA Isaac GR00T, une plateforme de référence complète pour robots humanoïdes. Chaque main comporte 25 degrés de liberté, le corps du robot en comporte 31, sa hauteur est de 6 pieds (environ 1,83 m), et son poids de 150 livres (environ 68 kg). Comme moi, sauf que le premier chiffre est plus petit et le second plus grand — le reste est à peu près identique.
Cette plateforme exécute la nouvelle puce Thor, ainsi que notre pile logicielle complète, notre pile de génération de données, notre pile de simulation de données et notre runtime. L’ensemble est intégré dans une seule plateforme robotique, disponible pour tous. Elle a été conçue pour l’enseignement supérieur et la recherche universitaire, car il est extrêmement difficile pour ces institutions de construire une telle plateforme par elles-mêmes.
Récapitulatif final
Jensen Huang :
Les six derniers mois ont radicalement transformé l’industrie informatique. Cette transformation s’explique par la réalisation effective des agents, combinée aux modèles de pointe les plus récents, permettant désormais à l’IA d’accomplir des tâches réellement utiles.
Ce modèle de calcul se répétera inlassablement : un agent est constitué d’un modèle et d’un cadre, utilise des outils dotés de compétences, et s’exécute sur un runtime. Le runtime dépend de son lieu d’exécution : cloud, environnement d’entreprise local, PC ou robot. Mais le modèle de calcul est entièrement identique.
Vous choisirez différents cadres selon vos préférences, et différents modèles selon vos besoins. Vous les adapterez à vos usages propriétaires. Vous créerez des super-agents que vous louerez à d’autres, afin de les aider à accomplir leurs tâches. Cette plateforme basée sur les agents, ce modèle basé sur les agents, est précisément ce que le kit d’outils NVIDIA Enterprise AI vise à soutenir. Pour vous, c’est une excellente manière de participer à l’IA ; pour nous, c’est une formidable opportunité de croissance.
Vera Rubin est désormais pleinement en production. Grace Blackwell a été conçue pour traiter l’IA, notamment l’inférence ; Vera Rubin a été conçue pour exécuter des agents. Elle est désormais pleinement en production. Elle va bien au-delà d’un simple GPU : c’est un système complet de traitement d’agents, décomposé et distribué.
NVIDIA est devenue une véritable société d’infrastructures. Non plus seulement une société de GPU, ni même seulement une société de systèmes, mais une société d’infrastructures. Notre objectif est de vous aider à générer le revenu et le bénéfice maximum, aussi rapidement que possible.
Dans le monde des agents, ce nouveau mode de calcul implique que le CPU doit lui aussi être conçu pour les agents, et non pour les humains. Un CPU destiné aux agents présente des exigences spécifiques. Notre NVIDIA Vera constitue une révolution. Je suis ravi de constater son adoption rapide et le volume de commandes reçues : il deviendra probablement le lancement de produit le plus rapide et le plus réussi de l’histoire de NVIDIA.
NVIDIA et Microsoft ont créé une nouvelle gamme d’ordinateurs personnels. C’est un nouveau départ. Bien entendu, ce même modèle de traitement basé sur les agents, ce même modèle de calcul basé sur les agents, s’exécutera sur divers appareils. J’ai mentionné le PC, mais à l’avenir, il apparaîtra également dans les robots, les satellites, les stations de base, les usines, le cloud, les environnements locaux et les dispositifs périphériques (edge). Ce système d’IA basé sur les agents et ce modèle de calcul basé sur les agents se reproduiront dans tous les types d’ordinateurs. Notre compréhension même de l’ordinateur personnel risque de changer profondément.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News














