
Magazine People : Enquête sous couverture de 100 heures chez Kimi — une entreprise d’intelligence artificielle qui choisit délibérément de se « plier » en deux dimensions
TechFlow SélectionTechFlow Sélection

Magazine People : Enquête sous couverture de 100 heures chez Kimi — une entreprise d’intelligence artificielle qui choisit délibérément de se « plier » en deux dimensions
Ce reportage spécial révèle l’essence réelle de la startup chinoise spécialisée dans l’IA la plus suivie du pays.
Auteur : Liu Mo (revue Renwu)
Traduction et adaptation : TechFlow
Introduction de TechFlow : Il s’agit l’un des reportages les plus approfondis jamais réalisés à l’intérieur d’une entreprise spécialisée en IA, publiés par la revue Renwu. Le journaliste a obtenu l’autorisation de passer 100 heures au sein de Moonshot AI, documentant de près cette société chinoise spécialisée en intelligence artificielle, évaluée à plus de 120 milliards de yuans et comptant seulement plus de 300 employés. Du bouleversement collectif provoqué par l’arrivée de DeepSeek, à une gestion radicalement plate — sans départements, sans objectifs individuels (KPI), sans niveaux hiérarchiques —, jusqu’à une évolution organisationnelle calquée sur celle d’un « essaim de génies », ce reportage révèle le cœur battant de la startup chinoise en IA la plus suivie.
Le printemps 2026 s’est montré particulièrement bienveillant pour Kimi.
En quelques mois seulement, la société derrière Kimi semble avoir franchi successivement plusieurs étapes décisives — revenus, levées de fonds et valorisation battant tous les records. Une étude menée par un stagiaire lycéen de 17 ans a reçu des éloges venus de la Silicon Valley, notamment d’Elon Musk. Cursor, outil de programmation américain valorisé environ 50 milliards de dollars, est ainsi pointé du doigt par des observateurs chinois comme dépendant largement, sur le plan de l’expérience utilisateur, du modèle de Kimi. Autrement dit, Kimi semble avoir remporté la victoire simultanément sur trois fronts : celui du capital, celui de la technologie et celui de la commercialisation.
Fondée il y a seulement trois ans, la société dépasse déjà une valorisation de 120 milliards de yuans, soit environ 16 milliards de dollars. Dans le récit mondial autour de l’IA, elle ne peut désormais plus être ignorée.
Pourtant, Moonshot AI demeure profondément mystérieuse.
J’ai obtenu l’autorisation d’observer l’entreprise pendant 100 heures. En tant que journaliste indépendant, j’ai pu interviewer tout employé disposé à me parler, assister à toute réunion non confidentielle, et aucun relecteur n’a eu accès à mon texte avant sa publication — ni personne ne m’a versé de rémunération. Ce dispositif correspond parfaitement au style de cette entreprise.
Entrer dans ses bureaux, c’est comme se tenir au centre d’une tempête.
La zone centrale est étrangement silencieuse. Seuls quelques clics de clavier retentissent çà et là, ponctués occasionnellement d’un rire. Mais le bruit extérieur — rumeurs, débats, surenchère médiatique, imitations, commentaires incessants — semble ici ne laisser aucune trace.
L’entreprise compte à peine plus de 300 personnes, dont l’âge moyen est inférieur à 30 ans. Si l’on divise la valorisation par le nombre d’employés, chacun porte sur ses épaules une valeur d’entreprise d’environ 400 millions de yuans.
Environ 80 % des employés correspondent, dans le langage courant d’internet, au profil « I » — introverti, selon la typologie MBTI. Ils sont assis côte à côte, mais se sentent plus à l’aise en tapant qu’en parlant. Ici, l’introversion n’est pas considérée comme un défaut ; elle constitue presque un protocole de fonctionnement.
Je me souviens de ma première visite, en 2024, lors d’une soirée où la tempête commençait tout juste à se former. Cette fois-là, je n’avais pas gardé une très bonne première impression.
« DeepSeek nous a sauvés »

Le 24 décembre 2024, veille de Noël. Pour la plupart des Chinois, ce n’est pas une fête particulière. Mais pour Julian, cela devint l’une des nuits les plus sombres de sa vie.
Âgée de 26 ans, diplômée de l’Université de Pékin depuis seulement deux ans et totalement inexpérimentée dans le secteur professionnel, elle était déjà l’un des premiers employés de Kimi. Ce soir-là, cette jeune femme, déjà qualifiée de « chevronnée » malgré son âge, pleura dans une salle de réunion baptisée « Radiohead », assise à une longue table face à plus de trente collègues.
Elle n’avait pas encore réussi à produire un plan marketing pour les fêtes satisfaisant aux attentes des cofondateurs.
Il ne restait plus qu’un mois avant le Nouvel An lunaire. Le dernier projet avait déjà été retravaillé six fois, et devait maintenant être repensé, voire entièrement remis à zéro. Reconstruire le plan depuis zéro, puis coordonner les équipes produit et ingénierie pour sa mise en œuvre, semblait tout simplement impossible dans les délais impartis. Or, l’entreprise fondait de grands espoirs sur la croissance attendue pour le Nouvel An 2025.
Cette réunion hebdomadaire fut longue et impitoyable.
Vingt jeunes employés tour à tour présentèrent tous les aspects de leur travail : diffusion sur les réseaux sociaux, gestion des utilisateurs, relations publiques nationales, marketing international — rien n’était épargné. Tous participaient aux discussions collectives, tandis que les cofondateurs prenaient les décisions finales.
À cette époque, Kimi ressemblait à un adolescent en pleine puberté : doté de talents et de potentiel, mais incapable encore de maîtriser pleinement ses propres forces. Même avec un budget publicitaire mensuel atteignant plusieurs dizaines de millions de yuans, elle paraissait maladroite face à des concurrents en pleine ascension rapide.
La réunion prit fin vers 4 heures du matin.
Nul ne savait si le plan final de Julian serait couronné de succès. Un mois plus tard, cela n’avait plus aucune importance.
C’est à ce moment précis que le monde entendit pour la première fois le nom de DeepSeek.
Hayley, chargée de la croissance, rentrait à Wenzhou pour les fêtes. Elle constata que parents et amis lui posaient tous la même question : « As-tu entendu parler de DeepSeek ? » Kimi semblait du jour au lendemain devenue une vieille nouvelle.
Elle qualifie ce Nouvel An lunaire de la période la plus difficile de sa vie. Le silence au sein de l’entreprise était assourdissant.
L’assemblée générale annuelle, traditionnellement organisée en mars après les fêtes, permet aux employés de poser directement des questions à la direction. Cette année-là, presque toutes les questions portaient sur DeepSeek.
La plus acérée vint de l’équipe RH. Avec une sincérité totale, ils formulent crûment la question embarrassante :
« Les candidats nous demandent : DeepSeek m’a aussi fait une offre — pourquoi devrais-je choisir Kimi ? Comment répondre ? »
Mais les réactions ne furent pas uniformes.
Alex, membre de l’équipe algorithmique, affirme que, s’il a ressenti une émotion forte durant ce « moment DeepSeek », ce n’était pas la peur, mais l’excitation.
Ce sentiment n’était pas le sien seul. Il reflétait l’état d’esprit de nombreux membres de l’équipe algorithmique. DeepSeek avait démontré l’existence d’une autre voie possible : une stratégie à moindre coût, une démarche ouverte, ainsi qu’un fait que beaucoup n’osaient auparavant croire — une jeune startup chinoise, inconnue jusqu’alors, pouvait gagner le respect mondial dès lors qu’elle possédait une technologie suffisamment solide et un modèle suffisamment performant.
L’équipe produit n’était pas non plus particulièrement anxieuse. Kevin, l’un des premiers employés produit, estime que l’essor de DeepSeek reposait sur son modèle. Dès que Kimi disposerait d’un modèle propre à la hauteur, l’équipe produit aurait davantage de liberté pour développer des fonctionnalités réellement utiles.
Personne à l’extérieur ne sait ce que les cofondateurs ont exactement discuté entre eux. Mais l’entreprise a réagi rapidement : ajustement stratégique, recentrage des priorités, consensus interne quasi total.
Aujourd’hui, si l’on demande à presque n’importe qui au sein de l’entreprise quelle est la priorité absolue, la réponse fuse sans hésitation : le modèle.
Depuis cet épisode, le respect interne envers DeepSeek n’a cessé de croître. Une part relève de l’admiration professionnelle, une autre de quelque chose de plus subtil.
Alex le formule ainsi :
« En un certain sens, DeepSeek nous a sauvés. »
Le goût, c’est tout
« Pourquoi portez-vous ce genre de chaussures ? »
Ezra me posa la question, et je fus plus surpris qu’elle. Dans son étage, presque tous les employés avaient une paire de tongs sous leur bureau. Vêtements et chaussures confortables : on y croit fermement, car ils favorisent la détente, la concentration et la créativité.
C’est là la règle vestimentaire des esprits brillants.
Dans ma vie, j’ai rencontré de nombreux élèves excellents. Mais les « bons élèves » de Kimi constituent une espèce complètement différente.
Ezra, enfant, tenta de percer le mot de passe de l’ordinateur familial parce que ses parents refusaient de le lui révéler. Au collège, elle s’intéressa au bitcoin, alors coté quelques centaines de yuans pièce. Elle demanda de l’argent de poche à sa mère pour investir, mais celle-ci la convainquit qu’il s’agissait d’une escroquerie. Au lycée, lors de son premier trajet en taxi, elle dessina mentalement le prototype d’une application de réservation. Elle affirme que, avec les outils d’IA d’aujourd’hui, elle aurait probablement pu la concrétiser. À l’université, enfin libre de disposer de ses propres revenus, elle investit en bourse sur le marché A, et perdit 90 % de son capital.
Cette expérience cuisante lui fit prendre conscience des limites du jugement humain, et la poussa vers l’IA.
Sa compréhension de l’AGI (intelligence générale artificielle) est simple : créer « N Einstein », capables de résoudre les problèmes les plus complexes de l’humanité. Dès lors, elle prit la ferme décision de rejoindre une entreprise véritablement engagée dans la poussée des frontières de l’AGI — même si, entre-temps, elle avait regagné sur les marchés financiers les sommes perdues.
Grâce à son parcours académique remarquable, elle reçut de nombreuses offres d’emploi. Elle choisit Kimi pour une seule raison : lors de l’entretien, la profondeur technique et l’attention aux détails dont fit preuve le fondateur Yang Zhilin la marquèrent profondément. Elle le sentit authentiquement passionné par les modèles. Il ne manifestait ni l’impatience caractéristique des esprits brillants, ni la logique utilitaire des hommes d’affaires. En fait, elle ne sut qu’à la fin de l’entretien qu’il était l’un des fondateurs.
Karen, lui, a un tempérament différent, mais aboutit au même lieu.
Dès l’enfance, il fut rebelle : disputes avec les enseignants, désobéissance aux parents. Il insista pour étudier à l’étranger, puis, une fois diplômé, pour créer sa propre entreprise. La stabilité et le confort offerts par les grandes entreprises le plongeaient dans le désespoir — il ne voulait pas d’une existence dont le scénario était entièrement prévisible dès le départ.
Je lui demandai : « Si vous deviez choisir entre une note garantie de 60 sur 100, ou une chance de 1 % d’obtenir 100, que choisiriez-vous ? »
Il opta sans hésiter pour la seconde option.
Non pas qu’il ne puisse accepter 60, mais parce qu’il ne supporte pas une trajectoire entièrement déterminée à 100 %.
Cette « ADN de fondateur » constitue la texture fondamentale de l’entreprise. Selon une estimation interne approximative, Moonshot AI compte au moins 50 personnes ayant déjà fondé une entreprise ou rejoint une startup.
On dit parfois que Kimi aime recruter des PDG.
Plus précisément, cette entreprise accueille une communauté de génies itinérants. Le génie n’est pas nécessairement un élève exceptionnel ou un employé modèle. L’essentiel est qu’il puisse, sur une dimension donnée, percevoir au-delà du temps.
Dans une entreprise où environ 80 % des employés proviennent des universités prestigieuses « 985 » ou « 211 », le CV de Yannis n’était pas particulièrement remarquable. Pourtant, dès 2023, il avait anticipé dans la communauté des développeurs l’essor imminent de DeepSeek et de Kimi — alors même que ces sociétés n’avaient pas encore produit le moindre produit. Un autre jeune employé né après 2000, frappé par cette lucidité, le recommanda à l’interne.
Karen affirme que trop de personnes brillantes sont prisonnières du système : d’abord la famille, puis l’école, ensuite le monde du travail. Elles obéissent inconsciemment aux attentes collectives, oubliant progressivement ce qu’elles désirent vraiment. Seuls quelques-uns tentent de s’échapper — souvent sans être remarqués.
L’une des missions de Kimi, dit-il, est justement de les voir.
Sans cette intuition, un lycéen de 17 ans n’aurait jamais pu être recruté comme stagiaire chez Kimi, collaborer avec l’équipe sur une publication scientifique, puis recevoir les éloges d’Elon Musk. Celui qui plaça le nom de ce jeune chercheur en première position sur l’article était Bob, son directeur de thèse, et surtout la première personne à l’avoir repéré.
Entre génie et fou, il n’y a qu’un fil. Lorsqu’un « fou incompris » arrive chez Moonshot AI, il peut soudainement devenir un génie capable de changer le monde. Ou, inversement, certains génies encore inexprimés ne pourront s’épanouir pleinement que dans un tel environnement.
Bob m’expliqua qu’à certains égards, un fort ego n’est pas un problème — voire peut être un atout. Si cet ego traduit une motivation intrinsèque, si une personne croit profondément devoir participer à une mission extraordinaire, alors elle pourrait bien être celle que l’entreprise ne saurait manquer.
Le génie est obsessionnel.
Dans cette équipe, l’entraînement de modèles d’IA de pointe est plaisamment appelé « alchimie » — une expression courante dans la communauté technique chinoise, évoquant le caractère à la fois scientifique et quasi ésotérique de ce processus. En pratique, cette « alchimie » signifie surtout corriger sans cesse des bogues.
Chaque fois qu’un entraînement phare démarre, Bob et ses collègues entrent dans une même routine rituelle. Leur première action chaque matin est de rafraîchir le gigantesque tableau de bord interne de surveillance. Des centaines de milliers d’indicateurs. Même une légère fluctuation anormale d’une seule courbe déclenche immédiatement une alerte mentale : problème d’optimisation ? Défaut d’architecture ? Précision numérique incompatible ?
Leur réactivité atteint presque un niveau animal.
Quelqu’un vérifie même token par token les données d’entraînement, imprime les tokens générant des gradients extrêmes, et les interroge comme des suspects : « Pourquoi avez-vous bondi aussi violemment ? »
Toute personne ayant réellement participé à la « livraison » d’un modèle connaît cette tension sans sommeil. Ce n’est pas de l’anxiété, mais une obsession alimentée par la curiosité. C’est précisément cette vigilance obsessionnelle qui pousse les modèles vers l’excellence.
Les génies s’attirent mutuellement.
Au cours de la dernière année, plus de 100 employés de Kimi ont rejoint l’entreprise via des recommandations internes — ami d’un ami, ami d’un ami d’un ami… L’entreprise surnomme ce phénomène, avec humour, la « transmission virale ».
La confiance, nourrie par ces réseaux denses, devient ainsi un actif organisationnel naturel.
En substance, Kimi déplace la partie la plus difficile de la gestion vers la phase de recrutement. Si une personne est recommandée par un collègue en qui on a confiance, il est plus probable qu’elle partage les mêmes intuitions. C’est pourquoi un mot revient constamment dans l’entreprise :
Le goût (Taste).
Un soir de septembre 2025, plusieurs ingénieurs lancèrent spontanément un petit projet interne baptisé Ensoul. Ils voulaient faire « renaître » les codes endormis dans des fichiers, en les transformant en assistants conversationnels intégrés à la ligne de commande.
Cette sensibilité aux noms n’est pas fortuite.
Ils avaient précédemment développé un cadre nommé YAMAHA, acronyme de « Yet Another Moonshot Agent ». L’infrastructure la plus basique s’appelle Kosong, mot malais signifiant « vide », inspiré du principe bouddhiste « la forme est vide ». Cela évoque une page blanche, sans fonctionnalité préétablie, mais offrant une infinité de possibilités.
Le goût, autrement dit, façonne le produit lui-même.
Lorsque de nombreuses entreprises insèrent une interface de discussion dans la ligne de commande, les ingénieurs de Kimi trouvent cela laid. Un vrai programmeur ouvre un terminal pour exécuter des commandes, pas pour converser. Aussi, l’interface CLI de Kimi est conçue comme un shell intelligent, plutôt que comme une interface conversationnelle. Elle comprend les commandes, sans se forcer à adopter la forme d’une boîte de dialogue.
Cette simplicité se retrouve aussi dans le code. La logique centrale ne compte qu’environ 400 lignes de Python, dépouillée de tout ornement superflu. Les modules sont soigneusement découplés. L’utilisateur peut personnaliser les fonctionnalités à sa guise, ou même démonter Kimi pour le réassembler selon ses besoins spécifiques.
Kimi Agent fut brièvement associé, en interne, à l’expression « OK Computer » — encore une référence à Radiohead — avant d’être renommé, car jugé trop obscur pour un large public. Ceux qui choisissent ces noms ne semblent guère intéressés par la maximisation du trafic. Ils suivent leur propre sens musical et leurs propres critères linguistiques.
On plaisante en disant que, si l’on mesurait les entreprises spécialisées en IA selon la proportion d’employés jouant d’un instrument, Kimi occuperait probablement la première place.
Le goût est devenu le critère de recrutement le plus élevé — et le plus difficile à définir.
Il ne peut être quantifié, mais il est partout présent.
D’abord généraliser, puis évoluer
Vous ne parviendrez probablement jamais à comprendre exactement ce que fait chaque personne chez Kimi.
L’entreprise privilégie le terme « équipe » plutôt que « département ». Vue d’en haut, la direction principale est assez claire : algorithmique, produit et ingénierie, croissance, stratégie, opérations. Mais dès que vous essayez d’approfondir la division réelle en départements ou les responsabilités fixes, tout devient flou.
Car il s’agit d’une organisation sans départements officiels, sans hiérarchie, sans titres, sans objectifs et résultats clés (OKR), et sans indicateurs de performance individuels (KPI). Les rapports hiérarchiques sont si simples qu’ils semblent irréels.
Pour Brandon, cela n’a aucun sens.
Diplômé du Tsinghua, il a occupé des postes de direction dans des géants de la Silicon Valley et dans de grandes entreprises chinoises, aidant une startup valorisée environ un milliard de dollars. Après des années d’expérience dans le secteur, il excelle en gestion technique et a dirigé des équipes proches de 1 000 personnes. Il souhaite entrer dans le domaine de l’IA et y déployer pleinement ses capacités.
Or, le cofondateur Zhang Yutao lui explique que l’entreprise ne fonctionne pas ainsi. S’il rejoint Kimi, il supervisera directement environ deux personnes.
Mais quelque chose, lié à l’avenir, le retient. Il demande un second entretien.
Ainsi, en janvier 2025, à une période où le doute et l’incertitude régnaient au sein de l’entreprise, Brandon rencontra Yang Zhilin — son ancien camarade de promotion au Tsinghua.
À ce moment-là, Brandon ignorait encore que le nom de Yang Zhilin apparaîtrait bientôt, dans un même article, aux côtés d’Elon Musk et de Jensen Huang. Ce qu’il retient le plus clairement, c’est la première phrase prononcée par Yang Zhilin après les politesses d’usage :
« L’apprentissage par renforcement est l’avenir. »
La suite de la conversation ressemblait presque à un monologue de Yang Zhilin. Il était absorbé par ses propres réflexions, et Brandon comprenait à peine ce qu’il disait, bien que tout fût exprimé en chinois.
Mais une chose était limpide : ce fut la première fois de sa vie que Brandon sentit son système de connaissances et ses modèles cognitifs, construits au cours de vingt années, s’effondrer. Son arrogance s’effondrait avec eux.
Je lui demandai pourquoi il avait finalement rejoint l’entreprise. Sa réponse eut un ton presque mystique : Yang Zhilin pourrait devenir un grand prophète, car il allie à la fois une vision lointaine et une pureté rare.
Par la suite, lorsque l’entreprise hésita à définir son rôle dans ce système quasi dépourvu de titres, Brandon répondit avec fermeté :
« Je viendrais même balayer les toilettes, et je les nettoierais mieux que personne. »
Tous les cadres expérimentés ou experts issus des grandes entreprises ne parviennent pas à survivre dans un tel environnement.
Phoebe, née après 2000, passa de l’équipe croissance à l’équipe produit et ingénierie. Elle se moque d’elle-même en se qualifiant de « petite fille qui ne comprend rien », mais souligne un point crucial : dans cette entreprise, une expérience approfondie et un CV brillant peuvent même devenir un fardeau.
L’IA est trop nouvelle, trop instable. Un expert chevronné n’apprend pas forcément plus vite qu’un jeune esprit moins formaté.
Elle a vu au moins trois cadres moyens ou supérieurs, venus des grandes entreprises, échouer lamentablement dans leurs nouvelles fonctions. L’un d’eux quitta même le secteur, affirmant que ses collègues étaient trop jeunes, trop intelligents. Après avoir été dépassé à répétition, il abandonna. Il était convaincu que ce n’était plus son époque, ni son domaine.
Après le choc provoqué par DeepSeek, Phoebe ressentit elle aussi une profonde crise existentielle. Elle décida d’abandonner le travail d’acquisition payante pour soutenir l’entreprise via le produit et l’ingénierie. Elle se mit à étudier intensivement, diffusant même en direct sur Bilibili ses propres sessions d’apprentissage, accumulant des centaines d’heures.
Le plus surprenant pour elle fut que l’entreprise lui offrit immédiatement l’opportunité de changer de poste.
En effet, parmi les 30 employés que j’ai interviewés, plus de la moitié ont changé de responsabilités à plusieurs reprises. Comparé à leur précédent emploi, environ 80 % d’entre eux font aujourd’hui un travail totalement différent.
Kimi recherche des personnes dotées d’une « capacité de généralisation ».
Dans le domaine de l’IA, la généralisation signifie qu’un modèle parvient à performer efficacement dans de nouveaux contextes, hors de ses données d’entraînement. Il ne se contente pas de mémoriser des réponses, mais a compris la structure sous-jacente.
L’entreprise applique ce principe également aux êtres humains.
Des cadres moyens ou supérieurs venus des grandes entreprises ont peut-être trop longtemps optimisé leur comportement dans un système de KPI spécifique, un langage de reporting particulier, ou un jeu politique interne bien rodé. Leur « algorithme » s’est surajusté à un optimum local. Lorsque l’environnement change radicalement, ils risquent de ne plus pouvoir s’adapter.
Si les employés des grandes entreprises ressemblent à des modèles spécialisés, ceux que Moonshot AI recherche ressemblent davantage à des modèles de base. Ils apprennent d’abord les règles fondamentales via un affinage supervisé, puis acquièrent une capacité de transfert transversale grâce à l’apprentissage par renforcement et à des confrontations répétées avec des tâches variées.
James, 26 ans, revenu de la Silicon Valley, affirme que son rêve est de « donner de l’argent aux jeunes ».
En tant que croyant fervent de l’IA, il considère son propre corps comme un capteur d’information pour son agent. Lorsqu’il joue à League of Legends, il enregistre ses parties et collecte des données physiologiques — fréquence cardiaque, pouls — afin d’analyser l’influence des propos de ses coéquipiers sur son état émotionnel et ses performances.
Ses opinions sont tranchées, presque extrêmes. Il affirme que, si une personne commence à apprendre une langue véritablement nouvelle après l’âge de 14 ans, elle ne pourra jamais atteindre un niveau natif. Selon lui, l’IA suit une logique similaire.
Dan, qui a rejoint l’entreprise dès sa sortie de l’université, dit avoir ressenti, pour la première fois de sa vie, une véritable angoisse cognitive.
À l’université, il n’avait entraîné que des « modèles-jouets » — environ 7 milliards de paramètres, entraînés sur 32 GPU pendant quelques jours. Aujourd’hui, il doit gérer des modèles MoE (Mixture of Experts) comptant des centaines de milliards de paramètres, avec des jeux de données mesurés en milliers de milliards de tokens. C’est comme passer d’un petit bassin à l’océan Pacifique.
Pour suivre le rythme, il s’est lancé dans un apprentissage quasi masochiste. Son horaire est totalement désynchronisé : le jour à Pékin devient la nuit à San Francisco, puis inversement. Il a passé des centaines d’heures à surveiller les tableaux d’entraînement, comme un trader scrutant les marchés financiers, sans même cligner des yeux.
Le véritable défi ne réside pas seulement dans la charge de travail, mais dans le fait qu’il doit simultanément assumer trois rôles.
Il agit en tant qu’architecte algorithmique, concevant la solution optimale au milieu d’un labyrinthe de choix de modèles. Il joue le rôle d’ingénieur système, déboguant des problèmes de calcul distribué comme on répare une canalisation traversant la planète. Il est aussi « alchimiste » des données, appliquant la « magie » de l’entraînement sur d’immenses jeux de données afin d’obtenir de bonnes performances sur les benchmarks, tout en assurant une fluidité naturelle dans les dialogues réels.
Cela implique parfois des interventions chirurgicales d’urgence pendant l’entraînement. Une fois, des paramètres critiques stockés en précision bf16 commencèrent à se comporter de façon dangereuse. L’équipe décida immédiatement de passer en précision fp32 au milieu de l’entraînement, uniquement pour stabiliser cette session. Dan explique : « Si vous savez seulement écrire des algorithmes, ou seulement gérer des systèmes, ou seulement nettoyer des données, vous ne parviendrez jamais à créer un modèle de premier plan. Ici, aucune excuse du type “je ne fais que ça” n’est valable. »
L’entreprise attend que vous intégreriez les travaux algorithmique, ingénierie et de traitement des données, naviguant simultanément entre plusieurs mondes. C’est comme exercer plusieurs emplois à la fois. Mais cette formation croisée intensive permet d’acquérir, en très peu de temps, une expérience qui équivaudrait à plusieurs années.
Ainsi, toute personne souhaitant rejoindre Kimi fait face à un test impitoyable.
Pas d’OKR, pas de KPI, pas de politique de bureau, pas de management toxique, pas même de pointage. Mais si vous n’êtes pas natif de l’IA, si vous ne pouvez pas généraliser, si vous ne pouvez pas vous renforcer continuellement et vous adapter, vous risquez de ne pas trouver ici de sens à votre existence.
« Ici, il n’y a pas d’odeur bureaucratique »
La plupart des marques cherchent à raconter une histoire.
Mais presque tous les employés de Kimi me conseillèrent gentiment de ne pas évoquer Pink Floyd, ni le piano placé devant l’entrée du bureau.
Leur raisonnement est le suivant : ceux qui comprennent, comprennent naturellement ; ceux qui ne comprennent pas n’ont pas besoin de comprendre. Les noms « Moonshot » et « Kimi » n’ont aucun lien direct avec l’IA ou la technologie. Mais si l’entreprise insistait trop sur ses liens avec le rock ou l’art, cela semblerait excessivement narcissique, voire affecté. Ils semblent penser que la beauté doit se suffire à elle-même, sans explication.
Win, né après 2000, qui s’est « échappé » d’une grande entreprise, me dit que cet endroit est étrange, car les gens y accomplissent réellement leur travail sans avoir besoin de réunions.
Dans son ancienne entreprise, on tenait des réunions le jour et on travaillait la nuit. Il en avait tiré une leçon simple : si votre énergie est principalement consacrée à coordonner les relations de production, il ne reste presque plus de marge pour améliorer la productivité réelle.
C’est là une facette de l’organisation native de l’IA.
Plus de dix employés m’ont explicitement dit qu’ils préféraient de plus en plus interagir avec l’IA plutôt qu’avec des personnes. L’IA est plus fiable, plus simple. Cette tendance s’accorde parfaitement avec le tempérament globalement introverti de l’entreprise. Certains utilisent un mot plus doux : « timide ».
Dans les discussions de groupe, chacun peut être très vivant, très expressif. En face-à-face, beaucoup se montrent très silencieux. Kimi organise peu d’activités culturelles. Hormis le gala annuel, la dernière activité collective fut un massage organisé dans les locaux.
L’introversion ne signifie pas absence de communication ou de vitalité.
Bien que personne ne m’ait contraint à parler avec eux, personne ne m’a refusé. Dans les chats de groupe, les messages affluent sans cesse, parsemés de toutes sortes d’émoticônes abstraites. Aucun message n’est laissé sans réponse.
Si vous avez besoin de la collaboration d’un collègue pour accomplir une tâche, la procédure est simple : allez le voir directement.
Pas besoin de passer par un supérieur hiérarchique, pas de validation préalable, pas de réunion de coordination, pas de barrières interdépartementales.
Kimi n’a pas de barrières interdépartementales. En un certain sens, elle n’a même pas de départements.
La signature électronique de Yang Zhilin ne comporte que quatre caractères :
Communication directe.
Pourtant, tout le monde reconnaît que l’entreprise évolue constamment depuis sa création.
Certaines modifications sont volontaires, d’autres contraintes, certaines même semblent des revirements complets. L’entreprise est passée d’une stratégie de diffusion massive à une focalisation sur les modèles, d’un engagement strict en faveur du code fermé à une ouverture progressive vers l’open source, d’un produit de chatbot à Kimi Agent, Kimi Code et Kimi Claw, et du marché grand public (C) au marché professionnel (B), puis à nouveau au grand public. Tous ces changements ne sont pas toujours parfaitement justifiables.
Mais pour Ezra, une chose est restée inchangée : le respect des faits.
Elle estime que toutes ces évolutions n’ont eu qu’une seule cause et un seul but : aligner l’entreprise sur la réalité objective.
L’entreprise tolère l’orgueil, mais déteste recruter des personnes qui se placent au-dessus des faits.
Des cofondateurs aux employés, les gens sont relativement faciles à convaincre — à condition que les faits soient suffisamment clairs. Les employés expliquent que cette disposition provient d’un attachement extrême à la vérité, à la réalité, et à « ce qui est réel ». Une personne véritablement intelligente n’est pas blessée par un retour honnête.
Cette franchise repose sur une condition supplémentaire : l’absence de « course à plusieurs » interne, d’opposition à somme nulle, ou de conflits d’intérêts importants au sein de l’entreprise. Les employés partagent volontairement découvertes de recherche et détails techniques, sans attendre de contrepartie ni de reconnaissance. L’entreprise avait sa propre communauté dès ses débuts, et continue aujourd’hui à promouvoir cette culture. Le partage d’informations et de savoirs accélère l’apprentissage de chacun, au bénéfice de tous.
Win affirme que les cultures toxiques sont contagieuses, mais que les bonnes cultures le sont tout autant.
Quelqu’un décrit l’ambiance ici comme une « solidarité » — un mot qui semble presque désuet lorsqu’on le rapporte à une startup. Pourtant, l’environnement dans lequel évolue l’entreprise est extrêmement rude : à l’extérieur, des concurrents de taille gigantesque ; à l’intérieur, la pression exercée par les grandes entreprises ; et des ressources limitées en puissance de calcul. Ces contraintes, loin de diviser, semblent plutôt renforcer la cohésion.
En définitive, les personnes constituent l’actif le plus important — et le seul véritablement essentiel — d’une organisation.
Récemment, Florence a reçu une offre de recrutement d’un concurrent, assortie d’un salaire doublé. Elle l’a immédiatement refusée. Sa raison est simple :
« Ici, il n’y a pas d’odeur bureaucratique. »
Les nouveaux bureaux de l’entreprise.

« Je ne sais pas comment elle a tenu le coup »
Avant le début des entretiens, j’étais extrêmement nerveux. J’allais interviewer certains des professionnels de l’IA les plus brillants au monde, alors que j’ai une formation littéraire, n’ai jamais travaillé dans le secteur technologique, et ne connais que très peu l’IA.
Mais dès que je commençai à discuter avec les jeunes experts des équipes algorithmique, produit et ingénierie, je découvris que c’était eux qui étaient nerveux. Ils craignaient de me perdre avec des termes trop techniques.
Ainsi, ils traduisaient d’abord l’anglais en chinois, puis reformulaient cette traduction en un chinois simplifié, facile à comprendre pour moi.
Cette réaction protectrice était profondément touchante.
Avant le début des entretiens, l’entreprise ne m’avait donné qu’une seule consigne : protéger chacun.
C’est pourquoi j’ai évité soigneusement les questions trop sensibles ou susceptibles de blesser.
Même ainsi, Ty ne parvint pas entièrement à cacher, lors de notre entretien téléphonique, une légère vibration émotionnelle. Lorsqu’il avait rejoint l’entreprise, il traversait une période d’adaptation particulièrement difficile, et avait un moment envisagé de démissionner.
Puis, lors d’une réunion générale hebdomadaire, il vit Annie — une jeune femme diplômée depuis seulement deux ans —, après de multiples échecs et d’innombrables doutes intérieurs, réussir enfin à mener à bien un projet extrêmement complexe. Ce spectacle le convainquit qu’il ne pouvait pas abandonner. Il était plus âgé qu’elle, avait plus d’expérience, mais il se sentait inférieur à elle en termes de résistance pure et de force de volonté.
Il dit :
« Je ne sais pas comment elle a tenu le coup. »
En réalité, ce n’est pas seulement Ty qui a envisagé de partir.
Annie aussi y a pensé.
Pendant longtemps, elle avait bâti, à partir de zéro, la ligne commerciale internationale, sans toutefois parvenir à une percée réelle. Pire encore, des collègues d’autres équipes, dans une intention bienveillante, lui avaient directement conseillé d’abandonner cet effort qu’ils jugeaient totalement dénué de sens.
Elle affirme avoir pleuré plus souvent chez Kimi que dans n’importe quelle autre entreprise, et plus souvent que pour aucun de ses anciens employeurs.
Elle n’était pas sans issue : elle avait déjà reçu une offre mieux rémunérée. Mais elle ne parvenait pas à se convaincre de travailler pour quelqu’un d’autre. Elle voulait une dernière entrevue avec Zhang Yutao.
Après cela, elle décida de rester.
Elle ne m’a pas révélé le contenu de cette conversation. Elle m’a seulement dit : « Yutao est le meilleur patron que j’aie jamais rencontré — le plus rapide à s’adapter, le plus haut dans ses ambitions. Suivre son exemple est la meilleure façon pour moi d’élever mon propre plafond. »
Puis Annie répéta la même phrase :
« Je ne sais pas comment elle a tenu le coup. »
Lorsque vous accumulez suffisamment de matériaux, vous remarquez que certaines phrases reviennent sans cesse. Et celles qui reviennent le plus souvent révèlent souvent la qualité commune la plus profonde d’une équipe.
Bob, ramené en Chine par Yang Zhilin depuis les États-Unis, où il avait renoncé à poursuivre un doctorat, a rejoint l’entreprise dès son premier jour. Si quelqu’un comprend profondément cette entreprise, c’est bien lui.
Lorsque je lui ai posé la question que j’ai posée à tous — quelle est la qualité la plus importante de cette équipe ? — il réfléchit environ deux minutes, puis répondit par un seul mot :
Résilience.
Pour une entreprise âgée de seulement trois ans, parler de résilience peut sembler un luxe. Mais il est sérieux. Il explique que l’intelligence et le courage peuvent parfois s’opposer. Plus une personne est intelligente, plus elle voit clairement les risques, et plus elle est susceptible de choisir de partir. Une persévérance aveugle ne mène pas non plus au succès. Seules les personnes qui voient clairement la vérité, qui calculent la probabilité d’échec, et qui poursuivent malgré tout, méritent d’être qualifiées de résilientes.
Une anecdote circule en interne, appelée « Trois ascensions vers la falaise infranchissable ».
En mai 2023, Freddie et ses collègues reçurent une mission qui semblait impossible : faire en sorte qu’une IA puisse lire et comprendre, d’un seul tenant, un contexte de 128 K — l’équivalent de centaines de pages — alors que la norme de l’industrie tournait encore autour de 4 K.
Il conçut rapidement une solution baptisée MoBA v0.5, mais celle-ci nécessitait une réécriture complète de l’infrastructure d’entraînement au milieu même de l’entraînement principal du modèle. Le coût était trop élevé, et le projet fut mis de côté. Ce fut la première « ascension vers la falaise ».
Six mois plus tard, il revint avec la version v1, conçue pour permettre la poursuite de l’entraînement à partir du modèle existant. Elle fonctionna sur les petits modèles, mais échoua à plusieurs reprises sur les grands modèles, avec des pics de perte répétés. Le projet fut contraint de reculer une deuxième fois, pour six autres mois. Il manqua même la date butoir du jalon produit de 200 000 mots. Pourtant, l’équipe ne fut pas dissoute : l’entreprise lança une « opération de secours saturée », mobilisant des experts techniques provenant de diverses équipes pour une résolution concentrée. Ils réécrivirent la logique centrale, et la version v2 réussit enfin le célèbre test de « recherche d’une aiguille dans une botte de foin » sur des textes longs.
Juste au moment où le lancement semblait imminent, le troisième coup survint. Durant la phase d’affinage supervisé, le modèle se comportait très mal sur les tâches de résumé de longs textes, en raison de la faible densité des signaux d’entraînement. De nombreuses ressources avaient déjà été investies. Les ingénieurs retournèrent une troisième fois « vers la falaise », cherchant une solution, et parvinrent finalement à résoudre le problème en modifiant les mécanismes d’attention des dernières couches.
Trois reculs, trois retours.
À la fin de l’entretien, je demandai à Freddie la question ultime : « Comment décririez-vous cette entreprise ? »
Il répondit par deux mots :
Alunissage.
Pourquoi « Alunissage » ?
Il cite la célèbre phrase de John F. Kennedy :
« Nous avons choisi d’aller sur la Lune dans cette décennie, non pas parce que c’est facile, mais parce que c’est difficile. »
Toutes les salles de réunion portent le nom d’un groupe musical.
L’essaim de génies
En fin de compte, je n’ai pas dérangé ni tenté de creuser auprès des cofondateurs eux-mêmes.
Publiquement, ils sont presque invisibles. Ils détestent les interviews et ne s’intéressent pas du tout à leur propre notoriété. Mais en interne, ils sont omniprésents.
Dans une organisation radicalement plate, il faut un cerveau central surpuissant. Sinon, l’énergie se transforme en chaos. Comme il existe presque zéro niveau intermédiaire de management, chaque cofondateur est directement en contact avec environ 40 à 50 employés, tout en restant en première ligne tant sur le plan technique que sur celui des affaires. C’est ainsi que l’entreprise maintient l’alignement entre décision et exécution.
Les cinq cofondateurs sont tous diplômés du Tsinghua. Mais les limites physiologiques demeurent. La bande passante de l’attention humaine est limitée, tout comme le rayon de gestion. Lorsque la valorisation de l’entreprise dépasse 120 milliards de yuans et que le nombre d’employés dépasse 300, même ces cerveaux surpuissants commencent à subir une pression accrue.
Ce n’est pas seulement le cas des fondateurs.
Il s’agit d’un jeu infini, conduit par la motivation intrinsèque. Si chacun porte effectivement une valorisation de 400 millions de yuans, alors chacun est attendu pour créer une valeur exceptionnelle.
La variable révolutionnaire est l’outil.
Kimi ne fonctionne pas réellement sur la base de travail extrême. Les employés peuvent se lever naturellement, sans obligation de rester au bureau jusqu’au petit matin. Leo, membre de l’équipe produit, affirme qu’il dirige aujourd’hui « une armée » — des agents IA.
Imaginez la scène suivante :
Leo se lève à 10 heures et entre au bureau. Sa tâche consiste à analyser les retours des utilisateurs provenant de cinq marchés mondiaux au cours des 24 dernières heures, puis à déterminer les priorités produit de la semaine. Autrefois, cela nécessitait trois personnes pendant deux jours.
Aujourd’hui, il lance trois agents.
Un agent stratégique analyse 3 000 retours, identifiant les demandes à haute priorité liées aux interruptions dans les textes longs. Un agent traducteur interprète en temps réel les dialectes japonais et les formes honorifiques coréennes, en signalant l’intensité réelle des émotions. Un agent concurrent surveille les mises à jour de Cursor et de ChatGPT, générant une comparaison technique.
Leo n’a lui-même à faire que trois choses : rejeter un commentaire satirique que le système a erronément jugé sincère ; marquer une capture d’écran contenant une interface utilisateur non encore publiée ; confirmer les trois premières demandes recommandées par les agents.
À 11 h 30, le cahier des charges produit est terminé. Parallèlement, un agent de programmation a déjà généré environ 70 % de l’implémentation de base, laissant uniquement les parties les plus créatives — conception d’interfaces, etc. — à discuter avec les ingénieurs humains dans l’après-midi.
Les humains définissent les règles, les systèmes à base de silicium les exécutent. L’organisation devient un conteneur pour
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News













