
Dix ans d’investissement dans Cerebras : comment la « puce d’intelligence artificielle de niveau wafer » a-t-elle fait son entrée sur le marché boursier du NASDAQ ?
TechFlow SélectionTechFlow Sélection

Dix ans d’investissement dans Cerebras : comment la « puce d’intelligence artificielle de niveau wafer » a-t-elle fait son entrée sur le marché boursier du NASDAQ ?
La puce 58 fois plus puissante de Cerebras constitue une autre réponse à la course aux capacités d’IA.
Auteur : Steve Vassallo
Traduction : Peggy, BlockBeats
Éditeurial : Le 14 mai, Cerebras a officiellement fait son entrée sur le marché boursier du NASDAQ sous le code boursier CBRS. À la clôture de sa première séance, son cours avait grimpé d’environ 68 % par rapport à son prix d’émission, en devenant l’une des introductions en bourse (IPO) les plus remarquées dans le secteur du matériel IA depuis 2026.
Cet article, rédigé par Steve Vassallo, investisseur précoce de Cerebras, retrace les dix-neuf années de collaboration entre lui et Andrew Feldman, depuis SeaMicro jusqu’à Cerebras. En apparence, il relate une histoire classique de capital-risque — de la feuille de termes (term sheet) à l’IPO — mais en réalité, il documente comment une entreprise pionnière du matériel a osé, à une époque où elle n’était guère soutenue par le consensus, parier sur une refonte fondamentale de l’architecture informatique dédiée à l’IA : depuis les puces « wafer-scale », les goulots d’étranglement liés à la bande passante mémoire, jusqu’aux défis d’alimentation électrique, de dissipation thermique et de continuité électrique, Cerebras n’a pas été confrontée à un simple défi technique isolé, mais bien à la réinvention complète de l’ensemble du système informatique moderne.
Ce qui retient surtout l’attention, ce n’est pas tant le fait que Cerebras ait finalement conçu une puce « wafer-scale » 58 fois plus grande que les puces traditionnelles, mais plutôt le choix initial de la société de s’opposer frontalement aux tendances dominantes du secteur : alors que le GPU était devenu la réponse par défaut pour l’entraînement des modèles d’IA, Cerebras a cherché à redéfinir radicalement la notion même de « calculateur conçu spécifiquement pour l’IA ». Une telle démarche exige non seulement un jugement technique aiguisé et une patience financière exceptionnelle, mais aussi, et surtout, une relation de confiance durable et non transactionnelle entre investisseurs et fondateurs.
Pour la concurrence actuelle dans le domaine du matériel IA, Cerebras constitue un rappel essentiel : la révolution de la puissance de calcul ne se limite pas à empiler davantage de GPU ; elle peut tout autant naître d’une réimagination radicale de l’architecture de calcul elle-même.
Voici le texte original :

Le vendredi 1er avril 2016, j’ai envoyé un courriel à Andrew Feldman pour lui annoncer que je franchirais la clôture arrière de sa propriété afin de lui remettre personnellement notre feuille de termes relative à l’investissement dans Cerebras.
Ce jour-là était le poisson d’avril, mais je ne plaisantais pas.

Strictement parlant, cette démarche ne correspond pas aux procédures standard d’un fonds de capital-risque. Mais à ce moment-là, je connaissais déjà Andrew depuis neuf ans, et nous discutions depuis près de deux ans de sa prochaine entreprise. Je ne pouvais pas laisser échapper cette opportunité à cause d’une seule phrase dans la feuille de termes, encore en cours de révision un samedi après-midi.
J’ai rencontré Andrew pour la première fois en octobre 2007. À l’époque, il venait de fonder SeaMicro avec Gary Lauterbach. Je n’ai pas participé à ce tour de financement, mais nous avons immédiatement sympathisé, notamment grâce à leur approche fondée sur les principes premiers pour résoudre les problèmes. Depuis lors, je les ai suivis avec attention.
Les relations véritablement précieuses exigent du temps pour mûrir. Il en va de même pour les entreprises véritablement précieuses. Aujourd’hui, vu de l’extérieur, Cerebras est une société âgée de dix ans, sur le point de faire son entrée en bourse. Pour ma part, je considère qu’il s’agit d’une relation continue de dix-neuf ans, qui vient enfin d’atteindre son apogée avec la cérémonie de cloche.

En août 2019, Andrew et moi étions présents au congrès Hot Chips organisé sur le campus de Stanford. C’est là que Cerebras a présenté son premier « Wafer-Scale Engine » (moteur à l’échelle d’un wafer).
Une relation profonde, et une ambition déraisonnable
Lorsque AMD a racheté SeaMicro en 2012, j’avais déjà pressenti qu’Andrew ne resterait pas longtemps au sein d’une grande entreprise. Il possède une forte volonté de vaincre et un esprit profondément rebelle. Dès début 2014, il commençait à chercher une issue, et nos rencontres se sont multipliées pour discuter de ce que pourrait être sa prochaine étape.
À l’époque, deux idées étaient loin d’être consensuelles : premièrement, l’IA allait réellement devenir utile ; deuxièmement, le GPU n’était pas l’architecture informatique la mieux adaptée à l’IA.
Concernant la première question, même parmi les personnes intelligentes que je connais, les avis divergeaient fortement. Après l’apparition d’AlexNet en 2012, certaines niches de la communauté de recherche avaient déjà commencé à obtenir des résultats quasi magiques à l’aide de réseaux de neurones convolutifs. Toutefois, dans le secteur logiciel plus large, l’IA demeurait encore à mi-chemin entre mot-clé marketing et projet de recherche académique.
La deuxième question — celle du matériel — n’avait presque pas encore été sérieusement soulevée. Le GPU était devenu le choix par défaut pour l’entraînement des réseaux de neurones, principalement parce que les chercheurs avaient découvert, par hasard, qu’il était « moins mauvais » que le CPU. Concevoir un nouveau système informatique spécifiquement adapté aux charges de travail de l’IA impliquait de remettre en cause l’architecture dominante utilisée par l’ensemble de la communauté mondiale des chercheurs.
Mais Andrew, Gary et leurs cofondateurs Sean, Michael et JP voyaient les choses différemment. Chacun d’eux avait accumulé plusieurs décennies d’expérience dans les domaines des puces et des systèmes : le parcours de Gary remontait aux travaux pionniers des années 1980 sur les architectures à flux de données et l’exécution hors ordre ; Sean s’était spécialisé dans les architectures serveur avancées ; Michael avait la charge des logiciels et des compilateurs ; quant à JP, il était expert en ingénierie matérielle. Ils formaient un groupe extrêmement rare : pris individuellement, chacun d’eux était remarquable ; ensemble, leurs compétences se renforçaient mutuellement de façon exponentielle. Ils étaient capables d’imaginer un ordinateur entièrement nouveau.
Ils étaient convaincus que, si l’IA libérait pleinement son potentiel, le marché qui en résulterait dépasserait largement la somme de tous les formats informatiques existants.
Ils percevaient également clairement la nature intrinsèque du GPU : initialement conçu pour le traitement graphique, il avait simplement été promu, de façon temporaire, au rôle d’outil d’entraînement pour l’IA sur un nouveau champ de bataille. Certes, il offrait de meilleures performances que le CPU en traitement parallèle, mais personne, en concevant un système informatique entièrement dédié aux charges de travail de l’IA, n’aurait jamais imaginé une architecture aussi complexe que celle du GPU. Ce qui limitait réellement les capacités des réseaux de neurones, ce n’était pas la puissance de calcul brute, mais bien la bande passante mémoire. Autrement dit, la puce qu’ils devaient créer devait privilégier non pas l’optimisation isolée des multiplications matricielles au sein des cœurs, mais bien l’efficacité avec laquelle les données circulaient dans toute la structure de calcul.
Au sein de notre fonds, l’investissement dans Cerebras n’était loin d’être une décision consensuelle. Plusieurs de mes associés avaient personnellement assisté à la vague précédente d’investissements dans les semi-conducteurs, qui n’avait presque engendré que des pertes, et ils exprimaient ouvertement leurs inquiétudes. Néanmoins, en tant qu’équipe, nous sommes parvenus à un accord. Ce week-end d’avril 2016, nous avons clairement informé Andrew que nous souhaitions être les premiers à lui remettre une feuille de termes.
Quelques semaines plus tard, Andrew, Gary, Sean, Michael et JP ont emménagé dans notre espace EIR (Entrepreneur-in-Residence) situé au deuxième étage de notre immeuble du 250 Middlefield. J’ai conservé jusqu’à aujourd’hui le plan dessiné par notre gestionnaire d’espaces. Sur ce plan, Cerebras était installée juste à côté d’un fondateur de Foundation, à quelques portes seulement de Bhavin Shah, qui allait plus tard créer Moveworks. C’était un étage particulièrement propice à la croissance d’une startup.

Le premier siège social de Cerebras se trouvait au deuxième étage de notre ancien bureau du 250 Middlefield.
Savoir quelles règles peuvent être contournées, et quelles règles doivent être brisées
Avant Cerebras, la plus grande puce de l’histoire informatique couvrait environ 840 mm², soit à peu près la taille d’un timbre-poste en silicium. La puce développée par Cerebras couvre quant à elle 46 000 mm², soit 58 fois plus grande.
Le choix de la conception « wafer-scale » impliquait automatiquement de relever tous les défis techniques subséquents. Durant près de 80 ans d’histoire informatique, personne n’avait jamais véritablement réussi à réaliser une telle prouesse. Cela signifiait également qu’aucun acteur n’avait jamais résolu de façon systématique ces problèmes : comment alimenter électriquement une puce d’une telle ampleur ? Comment la refroidir efficacement ? Comment garantir la continuité électrique entre des dizaines de milliers de points de connexion ?
Pour rendre possible le calcul à l’échelle d’un wafer, Cerebras a dû presque simultanément réinventer chaque composante de l’informatique moderne : les semi-conducteurs, les systèmes, les structures de données, les logiciels et les algorithmes. Chacune de ces directions aurait suffi, à elle seule, à justifier la création d’une startup. Andrew et son équipe ont choisi de commencer par les problèmes techniques les plus ardus. Grâce à leurs efforts intenses et quasi inlassables, ces difficultés ont été progressivement surmontées, une par une.
Tous les six à huit semaines, nous tenions une réunion du conseil d’administration. Ils nous présentaient alors les tentatives réalisées depuis la dernière réunion : une nouvelle variante de conception système, une nouvelle solution d’alimentation électrique ou encore un ajustement du système de gestion thermique. Ayant constamment affronté de front ces défis systémiques sous tous leurs angles, ils avaient acquis une capacité d’expression claire et précieuse. Ils nous expliquaient précisément ce qu’ils estimaient avoir mal fonctionné, ainsi que les nouvelles pistes qu’ils comptaient explorer.
Nous posions des questions, puis nous avancions conjointement avec l’équipe, mobilisant les personnes, les ressources et les relations nécessaires afin de les aider à identifier de nouvelles percées. Six à huit semaines plus tard, lors de notre réunion suivante, la même dynamique se reproduisait autour d’un autre problème technique : une nouvelle frontière à explorer. Chaque solution mise en œuvre révélait inévitablement un nouveau problème à résoudre.
Leur première puce prototype a fumé dès sa première mise sous tension. L’équipe l’a baptisée un « événement thermique » — une expression souvent utilisée pour désigner un incendie lorsqu’on souhaite éviter d’effrayer le conseil d’administration ou le propriétaire des lieux.
À l’époque, je calculais sans cesse la consommation énergétique par millimètre carré, à la fois par curiosité et parce que ces chiffres semblaient tellement élevés qu’ils paraissaient irréalistes. Nous avons donc fait appel aux ingénieurs d’Exponent, une société spécialisée dans l’analyse des défaillances — dont le nom précédent était d’ailleurs « Failure Analysis ». Ils ont confirmé que ces chiffres de consommation étaient effectivement aussi audacieux qu’ils en avaient l’air, et nous ont aidés à explorer une série de solutions compatibles avec la deuxième loi de la thermodynamique. Après tout, il s’agit d’une loi que même Andrew, suffisamment intelligent pour cela, n’aurait jamais songé à contester.
La discipline de l’ingénieur consiste à savoir quelles règles peuvent être enfreintes, quelles règles peuvent être contournées, et quelles règles doivent impérativement être respectées. Andrew et son équipe disposent d’un jugement éprouvé sur cette distinction. Ils savent quand ils remettent en cause des conventions — ce qu’ils ont précisément l’intention de faire — et quand ils risquent de défier des lois physiques — ce qu’ils ne font pas.
Lorsqu’on construit une technologie de pointe, l’échec est inévitable. La seule manière de traverser l’échec est la discipline, la persévérance, et surtout la confiance : confiance dans la mission, confiance mutuelle, et confiance dans le fait que, même après l’autodestruction du premier prototype, vous retournerez tous ensemble au laboratoire dès le lendemain matin pour entamer la prochaine itération.
Un tel travail n’a pas de version transactionnelle. Il n’existe qu’une version à long terme : rester dans la pièce, même lorsque les solutions ne sont pas encore complètes et que les explications demandent beaucoup de patience. Ainsi, lorsque le succès survient enfin, vous êtes présent pour en être témoin direct.
Ce moment est arrivé en août 2019. Andrew, Sean et leur équipe se tenaient dans le laboratoire, regardant pour la première fois fonctionner un ordinateur entièrement conçu par eux-mêmes. Pour un profane, il ne semblait rien faire de particulièrement intéressant. Selon les mots d’Andrew, l’expérience ressemblait à peu près à regarder sécher de la peinture. Mais cette fois-ci, la différence était que, pour la première fois, un tel « pot de peinture » avait réellement séché. Ils sont restés ensemble à observer pendant trente minutes, puis sont retournés au travail.
Avec qui construire est crucial
Certaines personnes choisissent leurs problèmes en fonction de ce qu’elles savent pouvoir résoudre. Andrew, quant à lui, choisit ses problèmes selon ce qu’il estime digne d’être résolu. Les itérations progressives ne l’enthousiasment pas ; il recherche des sauts d’un facteur mille. Dès le premier jour, il voulait faire de Cerebras une entreprise unique, d’une génération nouvelle.
Cette motivation provient en partie de sa personnalité. Andrew la décrit comme une « pathologie » d’architecte informatique — une obsession persistante pour une idée donnée, durant des décennies. Pour ma part, je la considère plus largement comme une « pathologie » de fondateur. Face à un problème, il se demande d’abord : « Puis-je concevoir quelque chose capable d’apporter une amélioration radicale ? » Puis il se demande : « Si j’y parviens, cela aura-t-il une réelle importance pour quelqu’un ? » Si les réponses aux deux questions sont positives, il y consacre alors les dix années suivantes de sa vie.
Cette motivation trouve également sa source dans son environnement familial. Andrew a grandi entouré de génies, aussi naturellement que la plupart des enfants grandissent en regardant la télévision. Son père était professeur pionnier en biologie évolutionniste, et jouait chaque dimanche au tennis en double avec six personnes. Parmi elles, trois ont ensuite reçu le prix Nobel, et une le prix Fields.
Selon le récit d’Andrew, ces géants prenaient le temps de lui expliquer, dans un langage accessible à un enfant, leurs travaux en physique, en mathématiques et en biologie moléculaire. Il en a tiré une impression profonde de ce à quoi ressemble véritablement l’intelligence, tout en comprenant, comme le disait sa mère, que l’intelligence ne signifie pas nécessairement devenir un individu odieux.
J’ai progressivement pris conscience que c’était l’une des caractéristiques fondamentales d’Andrew, aussi importante que son ambition rebelle et son instinct quasi phototrope pour les problèmes véritablement dignes d’être résolus. Il est profondément convaincu que les personnes les plus remarquables qu’il ait rencontrées sont aussi celles qui font preuve de la plus grande bienveillance.
Cette conviction façonne la manière dont son équipe se rassemble pour accomplir des tâches extrêmement difficiles. Les trente premiers employés recrutés par Cerebras avaient tous déjà travaillé avec lui ; certains le suivent depuis 1996. Aujourd’hui, Cerebras compte environ 700 employés, dont environ 100 l’ont accompagné à travers plusieurs entreprises.

En août 2022, l’équipe fondatrice de Cerebras s’est réunie au Musée de l’histoire de l’informatique. De gauche à droite : Sean Lie, Gary Lauterbach, Michael James, JP Fricker et Andrew Feldman.
Il est important de noter que bienveillance et esprit concurrentiel ne s’excluent pas mutuellement. Andrew aspire intensément à la victoire. Il aime dire qu’il est un « David professionnel » qui affronte Goliath. Or Goliath est lent et toujours en posture défensive face à une attaque frontale, ce qui laisse une marge de manœuvre considérable pour toutes les autres formes de combat. L’avantage de David réside dans sa capacité à apparaître là où Goliath ne peut pas se trouver, et de la manière dont Goliath ne peut pas le faire.
Lors de SeaMicro, le principal partenaire de distribution d’Andrew au Japon était NetOne. Le fournisseur principal de NetOne était Cisco, qui invitait ses partenaires à bord de jets privés et de yachts dont la valeur dépassait celle de la plupart des maisons de Palo Alto. Le budget d’Andrew était nettement plus modeste, aussi a-t-il invité le PDG de NetOne à un barbecue dans son propre jardin. Ce dernier lui a confié par la suite qu’après des décennies de collaboration avec Cisco, il n’avait jamais été invité chez aucun de ses partenaires. Ce geste apparemment anodin, mais profondément humain — une initiative à laquelle Goliath n’aurait jamais pensé — a consolidé durablement leur relation.
De la première feuille de termes à l’IPO

Ce matin, Andrew a actionné la cloche d’ouverture des marchés au NASDAQ. Je me tenais à ses côtés. Dix ans se sont écoulés depuis le début de tout cela dans notre bureau du 250 Middlefield, et 2 600 miles nous séparent désormais.
Aujourd’hui encore, certains fondateurs rares poursuivent ce que faisait Andrew à l’époque : ils dessinent des schémas sur un tableau blanc à trois heures du matin, livrant un combat acharné contre des défis techniques encore non résolus. Ils partagent également une forte volonté de vaincre et un esprit profondément rebelle. Ils cherchent activement un partenaire prêt à les accompagner véritablement : celui qui acceptera de plonger avec eux dans le problème lorsque le premier prototype refuse de s’allumer, et qui restera à leurs côtés jusqu’à ce qu’il fonctionne enfin.
Ce sont précisément ces fondateurs que je souhaite soutenir : ceux qui choisissent des problèmes dignes d’être résolus, imaginent des solutions mille fois supérieures à l’état actuel, et persévèrent inlassablement face aux défis inévitables qui surgissent sur leur chemin.
Pour des fondateurs comme Andrew, Gary, Sean, Michael et JP, je suis prêt à franchir la clôture arrière d’un jardin un samedi après-midi afin de leur remettre personnellement la feuille de termes.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News













