
人物雜誌臥底 Kimi 100 小時:一家故意把自己“摺疊”成二維的 AI 公司
TechFlow Selected深潮精選

人物雜誌臥底 Kimi 100 小時:一家故意把自己“摺疊”成二維的 AI 公司
這篇特稿揭開了中國最受關注的 AI 創業公司的真實內核。
作者:Liu Mo(人物雜誌)
編譯:深潮 TechFlow
深潮導讀:這是人物雜誌有史以來最深入的 AI 公司內部報道之一,記者獲准在 Moonshot AI 內部待了 100 小時,近距離記錄了這家估值超 1200 億人民幣、僅有 300 多人的 AI 公司。從 DeepSeek 衝擊後的集體震盪,到「沒有部門、沒有 KPI、沒有職級」的極致扁平管理,再到「天才蜂群」式的組織進化——這篇特稿揭開了中國最受關注的 AI 創業公司的真實內核。
2026 年的春天,對 Kimi 格外友好。
短短几個月內,Kimi 背後的公司似乎接連突破里程碑——收入、融資、估值紛紛刷新紀錄。一篇由 17 歲高中實習生參與的研究論文收到了來自硅谷的讚譽,其中包括 Elon Musk。美國估值約 500 億美元的編程工具 Cursor,被中國觀察者指出在產品體驗上大量依賴 Kimi 的模型。換句話說,Kimi 似乎同時在資本、技術和商業化三條戰線上贏了。
這家公司成立才三年,估值已突破 1200 億人民幣,約合 160 億美元。在全球 AI 敘事中,它已經無法被忽視。
但月之暗面(Moonshot AI)依然深度神秘。
我獲准進入公司內部觀察 100 小時。作為獨立撰稿人,我可以採訪任何願意交談的員工,旁聽任何不涉及商業機密的會議,寫完後沒有人會審稿,也沒有人付我稿費。這很符合這家公司的風格。
走進辦公室,像站在風暴眼裡。
中心地帶異常安靜。工位上只有零星的鍵盤聲,偶爾有人笑一下。但外面的噪音——傳言、爭論、炒作、模仿、無休止的評論——在這裡似乎不留痕跡。
公司只有 300 多人,平均年齡不到 30 歲。按估值除以人頭算,每個人肩上扛著將近 4 億人民幣的企業價值。
大約 80% 的員工是網絡語境下的「I 人」——內向型,借用 MBTI 的說法。人們坐在一起,但打字比說話更自在。在這裡,內向不是缺陷,幾乎是一種運行協議。
我回想起 2024 年第一次來訪的那個晚上,當時風暴才剛開始醞釀。那次,我並沒有留下特別好的第一印象。
「DeepSeek 救了我們」

2024 年 12 月 24 日,平安夜。對中國大多數人來說,這不算什麼節日。但對 Julian 來說,這成了她人生中最黑暗的夜晚之一。
她 26 歲,從北大畢業才兩年,沒有任何行業經驗,卻已經是 Kimi 最早期的員工之一。那天晚上,這個非常年輕卻已算「資深」的員工,在一間叫「Radiohead」的會議室裡,坐在長桌前,面對 30 多個同事,哭了。
她還沒能交出一份讓聯合創始人滿意的節日營銷方案。
距離春節只剩一個月。最新方案已經改了六遍,現在又要升級,甚至可能推翻重來。從零開始重建方案,再協調產品和工程團隊執行,時間幾乎不夠。但公司對 2025 年春節的增長寄予厚望。
這很重要,因為上一年春節正是 Kimi 的爆發節點。憑藉「200 萬字長文本輸入」的品牌定位,Kimi 在中國一度刷屏。C 端用戶激增,A 股市場甚至出現了「Kimi 概念股」的說法。
那次週會又長又殘酷。
大約 20 個年輕員工輪流彙報所有事:社交媒體投放、用戶運營、國內公關、海外營銷,事無鉅細。所有人集體討論,聯合創始人拍板。
那時的 Kimi 像一個青春期少年:有天賦,有潛力,但還不能完全掌控自己。即使每月廣告預算高達數千萬人民幣,面對快速崛起的競爭對手,依然顯得笨拙。
會議在凌晨 4 點左右結束。
沒人知道 Julian 最終的方案會不會成功。一個月後,這已經不重要了。
那一刻,全世界第一次聽到了 DeepSeek 的名字。
負責增長的 Hayley 回溫州過年,發現親戚朋友都在問同一個問題:「你聽說過 DeepSeek 嗎?」Kimi 彷彿一夜之間變成了舊聞。
她說那是她人生中最難熬的春節。公司內部的沉默震耳欲聾。
年度全員大會通常在年後三月舉行,員工可以直接向管理層提問。那一年,幾乎每個問題都圍繞 DeepSeek。
最尖銳的問題來自 HR 團隊。他們帶著完全的真誠,把那句不舒服的話說了出來:
「候選人問我們:DeepSeek 也給了我 offer,為什麼要來 Kimi?——我們怎麼回答?」
但並不是所有人的反應都一樣。
算法團隊的 Alex 說,如果在「DeepSeek 時刻」他感受到了什麼強烈的情緒,那不是恐懼,而是興奮。
這種感覺不只是他個人的。它反映了算法團隊中許多人的心態。DeepSeek 證明了另一條路可能存在:更低成本的策略、開源路徑,以及一個很多人之前不敢相信的事實——一家不知名的中國創業公司,只要技術夠強、模型夠好,依然能贏得全球尊重。
產品團隊也沒有特別焦慮。最早期的產品員工 Kevin 認為,DeepSeek 的爆發靠的是模型。一旦 Kimi 自己的模型能力跟上來,產品團隊反而會有更大的空間去構建有價值的功能。
沒有外人知道聯合創始人之間到底討論了什麼。但公司行動很快。調整策略、收窄焦點,在內部達成了接近完全的共識。
現在去問公司裡幾乎任何一個人,最重要的是什麼,他們會毫不猶豫地回答:模型。
從那以後,Kimi 內部對 DeepSeek 的尊重感越來越強。一部分是專業上的敬佩,另一部分是別的東西。
Alex 這樣說:
「某種意義上,DeepSeek 救了我們。」
品味就是一切
「你怎麼穿這種鞋?」
Ezra 問完我之後,我比她更吃驚。在她那層辦公區,幾乎所有人桌下都放著一雙拖鞋。舒適的衣服和鞋子,大家相信,能讓人更放鬆、更專注、更有創造力。
這就是聰明人的著裝準則。
我這輩子見過很多學霸。但這裡的「好學生」是完全不同的物種。
Ezra 小學時試圖破解家裡電腦的密碼,因為父母不肯告訴她。初中時她開始關注比特幣,當時一枚只要幾百塊人民幣。她問媽媽要零花錢去投資,媽媽說那是騙局。高中時,她第一次打車,就在腦子裡畫出了一個打車產品的原型。她說如果當時有今天的 AI 工具,也許她真的能做出來。上了大學終於有了自己的錢,她投進 A 股,虧了 90%。
那次慘痛的經歷讓她認識到人類判斷的侷限性,並將她推向了 AI。
她對 AGI(通用人工智能)的理解很簡單:創造出「N 個愛因斯坦」,用他們去解決人類最難的問題。從那以後,她下定決心要找到一家真正在推動 AGI 極限的公司。儘管那時她已經在股市把虧的錢賺回來了。
因為學術背景出色,她收到了很多公司的 offer。她選擇 Kimi 只有一個原因:面試時,創始人楊植麟對技術的理解和對細節的認真程度深深打動了她。她覺得他是真正在意模型的人。他身上沒有聰明人常見的浮躁,也沒有商人常有的功利。事實上,面試結束時她還不知道他就是創始人。
Karen 的性格不同,但走向了同一個地方。
他從小就叛逆。跟老師吵架,不聽父母的話。讀書時堅持要出國,畢業後堅持要創業。大廠提供的安穩舒適生活讓他絕望——他不想過一種從開頭就能看到結尾的人生。
我問他:如果讓你選,一個是確定拿到 60 分(滿分 100),另一個是 1% 的概率拿到 100 分,你選哪個?
他毫不猶豫選了後者。
不是他不能接受 60 分,而是他受不了那條 100% 確定性的路。
這種「創始人式 DNA」構成了公司的底層質地。據內部粗略統計,月之暗面至少有 50 人此前創過業或加入過創業公司。
有人說,Kimi 喜歡招 CEO。
更準確地說,這家公司收容了一群流動中的天才漂泊者。天才不一定是頂尖學生或模範員工。重要的是,在某個維度上,他們能看穿時間。
在一家約 80% 員工來自 985、211 高校的公司裡,Yannis 的簡歷不算特別亮眼。但早在 2023 年,他就在工程社區裡預判了 DeepSeek 和 Kimi 都會崛起——那時候模型公司連產品都沒有。另一位 00 後員工注意到了他的判斷力,把他內推進了公司。
Karen 說,太多聰明人被系統困住了。先是家庭,然後是學校,再然後是職場。他們不自覺地服從群體期待,忘記了自己真正想要什麼。只有少數人試圖逃脫,而他們往往不被看見。
Kimi 的使命之一,他說,就是看見他們。
如果沒有這種直覺,一個 17 歲的高中生不可能被引進來做 Kimi 的實習生,和團隊合作發表論文,後來還得到 Elon Musk 的稱讚。把那個學生的名字放在論文第一作者位置的人是 Bob,他的導師,也是最先發現他的人。
天才與瘋子之間只有一線之隔。當一個「不被理解的瘋子」來到月之暗面,他可能突然變成一個改變世界的天才。又或者,某些尚未顯露的天才,只有在這樣的地方才能真正綻放。
Bob 告訴我,在某種程度上,自我(ego)大不是問題,甚至可能是好事。如果那個自我是一種內驅力,如果一個人相信自己必須參與一項偉大使命,那他可能正是公司不能錯過的人。
天才是偏執的。
在這個團隊裡,訓練頂級 AI 模型被戲稱為「煉丹」——這是中國技術圈的常見說法,形容模型訓練那種半科學、半玄學的過程。但實際操作中,煉丹意味著不停地修 bug。
每次旗艦訓練跑起來,Bob 和隊友們就進入同一套儀式。每天早上第一件事是刷新公司龐大的內部監控面板。數十萬條指標。哪怕一條曲線異常跳動,腦子裡就響起警報:優化出了問題?架構有缺陷?數值精度不匹配?
他們的反應近乎動物級別的敏感。
有人甚至逐 token 檢查訓練數據,把產生極端梯度的 token 打印出來,像審訊嫌犯一樣拷問:你為什麼跳得這麼劇烈?
每個真正參與過「交付」一個模型的人,都經歷過這種無眠的緊張。這不是焦慮,是好奇心驅動的執念。正是這種偏執的警覺,把模型推向了頂級水平。
天才會聚集。
過去一年,Kimi 有超過 100 名員工是通過內推加入的——朋友的朋友,朋友的朋友的朋友。公司內部戲稱為「人傳人」。
信任,因為這些密集的網絡,變成了一種天然的組織資產。
本質上,Kimi 把管理中最難的部分轉移到了招聘環節。如果人是被信任的同事推薦進來的,他們更可能擁有相同的直覺。這就是為什麼一個詞在公司內部反覆出現:
品味(Taste)。
2025 年 9 月的一個晚上,幾個工程師隨手啟動了一個內部小項目,命名為 Ensoul。他們想讓沉睡在文件裡的代碼「活過來」,變成命令行裡的對話助手。
這種對命名的敏感不是偶然的。
他們曾經有個框架叫 YAMAHA,全稱「Yet Another Moonshot Agent」。最底層的基礎設施叫 Kosong,馬來語裡「空」的意思,靈感來自佛教的「色即是空」。暗示一張白紙,沒有預設功能,但有無限可能。
品味,換句話說,塑造了產品本身。
當很多公司把聊天窗口塞進命令行時,Kimi 的工程師覺得那很醜。真正的程序員打開終端是為了下命令,不是為了聊天。所以 Kimi CLI 被設計得更像一個智能 shell,而不是聊天界面。它理解命令,但不強迫自己變成對話框的樣子。
這種簡潔在代碼裡也可見。核心邏輯只有大約 400 行 Python,剝掉了所有不必要的裝飾。模塊之間乾淨解耦。用戶可以自己定製功能,或者把 Kimi 拆開重組成自己的應用。
Kimi Agent 曾在內部和「OK Computer」這個短語關聯——又一個 Radiohead 的引用——後來改了名,因為對更廣泛的用戶來說太晦澀。選這些名字的人,似乎對最大化流量不太感興趣。他們遵從的是自己的音樂品味和語言標準。
有人開玩笑說,如果按會樂器的員工比例來衡量 AI 公司,Kimi 可能排第一。
品味已經成為最高的招聘標準,也是最難定義的。
它無法量化,但無處不在。
先泛化,再進化
你可能永遠搞不清 Kimi 每個人到底在做什麼。
公司喜歡用「團隊」而不是「部門」。從高層看,主要方向足夠清晰:算法、產品與工程、增長、戰略、運營。但一旦你試圖放大去看實際的部門劃分或固定職責,一切就開始模糊了。
因為這是一個沒有正式部門、沒有層級、沒有 title、沒有 OKR、也沒有 KPI 的組織。彙報關係簡單到像假的。
對 Brandon 來說,這完全不合理。
他畢業於清華,在硅谷巨頭和中國大廠做過管理層,幫助過一家價值約 10 億美元的創業公司。他在行業裡摸爬滾打多年,擅長技術管理,帶過將近 1000 人的團隊。他希望進入 AI 領域,大展拳腳。
結果聯合創始人張宇韜告訴他,這家公司不是這麼運作的。他如果加入,直接管理的人大概有兩個。
但某種關於未來的東西拉住了他,他想再談一次。
於是 2025 年 1 月,在公司內部瀰漫著懷疑和不安的時期,Brandon 見到了楊植麟——他的清華校友。
當時 Brandon 還不知道楊植麟的名字日後會和 Elon Musk、黃仁勳出現在同一篇報道里。他記得最清楚的是,楊植麟在基本寒暄之後說的第一句話:
「強化學習是未來。」
接下來的對話幾乎像楊植麟在自言自語。他沉浸在自己的思路里,Brandon 根本聽不太懂他在說什麼,儘管全程講的都是中文。
但有一件事無比清晰:這是 Brandon 人生中第一次感到自己過去 20 年構建的知識體系和思維模型開始坍塌。一起坍塌的,還有他的自負。
我問他為什麼最終加入,他語氣有點玄:楊植麟可能會成為一個偉大的預言家,因為他既有遠見,又足夠純粹。
後來,公司在這種幾乎沒有 title 的體系裡不知道怎麼定義他的角色時猶豫了,Brandon 堅定地回答:
「就算讓我去掃廁所我也來,而且我會掃得比誰都乾淨。」
不是所有前大廠管理者或專家都能在這種環境裡存活。
00 後 Phoebe 從增長團隊轉到了產品和工程團隊。她自嘲是「一個啥也不懂的小女孩」,但她說了一件重要的事:在這家公司,深厚的經驗和光鮮的履歷反而可能成為負擔。
AI 太新了,變化太快。一個經驗豐富的專家,學習和適應的速度未必比一個假設更少的年輕人快。
她見過至少三個從大廠來的中高層空降失敗。其中一個最終選擇了離開這個行業,說身邊的人實在太年輕、太聰明瞭。被反覆超越之後,他放棄了。他認定,這不再是他的時代,也不再是他的行業。
DeepSeek 衝擊之後,Phoebe 也感受到了深深的危機感。她決定放棄買量工作,轉而通過產品和工程幫助公司。她開始高強度自學,甚至在 B 站上直播自己學習的過程,累計數百小時。
最讓她驚訝的是,公司從一開始就毫不猶豫地給了她換崗的機會。
事實上,我採訪的 30 名員工中,超過一半都換過多次職責。和之前的工作相比,大約 80% 的人現在做的事情完全不同。
Kimi 喜歡有「泛化能力」的人。
在 AI 領域,泛化意味著模型能在訓練數據之外的新場景中表現良好。它不是死記硬背了答案,而是學會了底層結構。
公司把這個理念也用在了人身上。
大廠來的中高層可能在某一套 KPI 體系、某一種彙報語言、某一種內部政治遊戲裡優化了太久。他們的「算法」過擬合到了一個局部最優。當環境徹底改變時,他們可能無法適應。
如果說傳統大廠員工像專用模型,那月之暗面要的人更像基座模型。先通過監督微調學習基本規則,然後通過強化學習和跨任務的反覆自我博弈,獲得跨領域遷移的能力。
從硅谷回來的 James 今年 26 歲,說自己的夢想是「把錢給年輕人」。
作為 AI 的虔誠信徒,他把自己的身體視為 Agent 收集信息的傳感器。打《英雄聯盟》時,他錄音並採集心率、脈搏等生理數據,然後分析哪個隊友的發言影響了他的情緒狀態和遊戲表現。
他的觀點尖銳到近乎極端。他說:一個人如果在 14 歲之後才開始學一門真正的新語言,永遠不可能達到母語水平。他認為 AI 也是類似的道理。
畢業就加入公司的 Dan 說,他人生中第一次感受到了真正的知識焦慮。
在學校,他只訓練過「玩具模型」——大約 70 億參數,32 張 GPU 跑幾天就完。現在他要處理數百億參數的 MoE(混合專家)模型,訓練數據以萬億 token 計。感覺像是直接從一個小水塘跳進了太平洋。
為了跟上節奏,他幾乎進入了自虐式的學習狀態。作息完全崩潰,北京的白天變成硅谷的夜晚,然後又反過來。他盯著訓練面板看了幾百個小時,像股票交易員盯盤一樣,眨眼的空間都沒有。
真正的挑戰不只是工作量,而是他必須同時做三份工作。
他得當算法架構師,在一堆模型選擇的迷宮中設計最優方案。他得當系統工程師,像維修一條橫跨全球的管道一樣調試分佈式計算問題。他得當數據煉丹師,對巨型數據集施展「煉丹術」,讓模型在 benchmark 上跑分好看,同時在實際對話中又自然、柔和。
有時候這意味著在訓練過程中做緊急手術。有一次,存儲在 bf16 精度中的關鍵參數開始出現危險行為。團隊當機立斷,在訓練跑到一半時切換到 fp32 精度,就為了穩住這輪訓練。Dan 說,如果你只會寫算法,或只會搞系統,或只會清洗數據,你永遠做不出頂級模型。在這裡沒有「我只負責這一塊」的藉口。
公司期望你把算法、工程和數據的工作整合在一起,同時穿梭於多個世界。這像是同時打幾份工。但這種高強度的交叉訓練,能在很短的時間內給你帶來數年的成長。
所以,任何想加入 Kimi 的人都面臨著殘酷的考驗。
沒有 OKR,沒有 KPI,沒有辦公室政治,沒有 PUA 式管理,甚至沒有打卡。但如果你不是 AI 原生的,如果你不能泛化,如果你不能持續強化和適應,那你可能很難在這裡找到自己存在的意義。
「這裡沒有官味兒」
多數品牌都想要一個故事。
但幾乎每個 Kimi 員工都溫和地提醒我:別寫 Pink Floyd 的事,也別寫辦公室門口那架鋼琴。
他們的看法是,懂的人自然懂,不懂的人不需要懂。Moonshot 和 Kimi 這兩個名字跟 AI 或技術沒有直接關係。但如果公司太多地談論自己和搖滾樂、藝術的關聯,就會開始顯得自我意識過剩、矯揉造作。他們似乎覺得,美就該是不需要解釋的。
從大廠「逃」出來的 00 後 Win 告訴我,這個地方很奇怪,因為人們真的可以不開會就把事做完。
在他前東家,白天開會,晚上幹活。他學到了一個簡單的道理:如果你的精力主要花在協調生產關係上,那提升實際生產力的空間就所剩無幾。
這就是 AI 原生組織的一部分面貌。
超過十個員工明確告訴我,他們越來越偏好和 AI 打交道,而不是和人。AI 更可靠,更簡單。這種傾向也契合公司整體內向的氣質。有人用了一個更溫和的詞:害羞。
在群聊裡,每個人都可以很活潑、很有表達欲。見了面,很多人卻很安靜。Kimi 不怎麼組織文化活動。除了年會,最近一次集體活動是在辦公室裡做按摩。
內向不代表缺少溝通或活力。
雖然沒有人要求他們跟我說話,但沒有一個人拒絕。在群聊裡,信息不停飛來飛去,夾雜著各種抽象表情包。沒有人的消息會被晾著。
如果你需要別人配合才能完成工作,流程很簡單:直接找他。
不用通過主管,不用審批,不用開協調會,不用打通部門牆。
Kimi 沒有部門牆。某種意義上,它甚至沒有部門。
楊植麟的簽名檔只有四個字:
直接溝通。
儘管如此,所有人都承認,公司自成立以來一直在不斷變化。
有些變化是主動的,有些是被動的,有些甚至看起來像是反轉。公司從大量投放轉向聚焦模型,從堅持閉源到擁抱開源,從聊天機器人產品到 Kimi Agent、Kimi Code 和 Kimi Claw,從 C 端到 B 端再到 C 端。不是每次轉向都經得起完美推敲。
但在 Ezra 看來,有一件事始終沒變:尊重事實。
她認為,所有那些變化,都只有一個原因和一個目的:讓公司更好地對齊客觀現實。
公司容忍自負,但不喜歡招那種把自己放在事實之上的人。
從聯合創始人往下,人們相對容易被說服——只要事實足夠清楚。員工們說,這種意願來自對真相、現實、和「什麼是真實的」的極度執著。真正聰明的人不會被誠實的反饋傷害。
這種坦誠還有一個條件:公司沒有賽馬制,沒有零和競爭,沒有大的內部利益衝突。人們願意無償地分享研究發現和技術細節,不期待回報或署名。公司早期有自己的社區,今天依然倡導社區文化。共享信息和知識加速了每個人的學習,最終對所有人都有好處。
Win 說,有毒的文化會傳染,好的文化也會傳染。
有人用「團結」來形容這裡的氛圍——這個詞用在創業公司身上聽起來幾乎有些老派。但公司所處的環境很嚴酷:外面是巨頭級競爭對手,內部是被大廠擠壓的壓力,算力資源有限。這些約束,如果說有什麼作用的話,似乎反而增強了凝聚力。
歸根結底,人是組織中唯一真正重要的資產。
最近,Florence 被一家競爭對手以雙倍薪資挖角。她當即拒絕。理由很簡單:
「這裡沒有官味兒。」
公司的新辦公室。

「我不知道她怎麼撐過來的」
在採訪開始之前,我非常緊張。我即將採訪一些世界上最聰明的 AI 從業者,而我是文科出身,從沒在科技行業工作過,對 AI 的瞭解有限。
但當我真正開始和算法及產品工程團隊的年輕專家交談時,我發現緊張的是他們。他們擔心如果我聽不懂術語會尷尬。
所以他們先把英文翻譯成中文,然後再把那個中文翻譯成一個更簡單的、我能聽懂的中文。
那種保護的本能令人感動。
採訪開始前,公司只給了我一條指示:保護每一個人。
所以我儘量避免問太敏感或可能傷害人的問題。
即便如此,Ty 在電話採訪中還是沒能完全隱藏住一絲情緒的顫抖。他剛加入公司經歷艱難的適應期時,曾一度覺得撐不下去,甚至想過離職。
然後某一週的全員會上,他看到 Annie——一個才畢業兩年的女生——在經歷無數次挫折和內心懷疑之後,終於把一個艱難的項目推動了下去。看到這一幕,他覺得自己不能放棄。他比她年長,經歷更多,但在純粹的耐力和意志力上,他覺得自己更弱。
他說:
「我不知道她怎麼撐過來的。」
其實,想過離開的不只是 Ty。
Annie 也想過。
很長一段時間裡,她在從零到一搭建海外業務線,但始終沒有真正突破。更糟糕的是,其他團隊的同事出於好意,直接告訴她放棄這項他們認為毫無意義的努力。
她說在 Kimi 哭的次數比在任何公司都多,也比為任何一個前任哭的都多。
並不是她沒有退路。她已經拿到了薪資更高的 offer。但她說,她就是沒辦法說服自己去給別人打工。她想再跟張宇韜談一次。
之後,她決定留下來。
她沒有告訴我那次對話的內容。她只說:宇韜是我見過的最強的老闆,迭代最快,上限最高。跟著她走,是我提高自己上限的方式。
然後 Annie 重複了同一句話:
「我不知道她怎麼撐過來的。」
當你積累了足夠多的素材,你會發現某些句子反覆出現。而最常被重複的話,往往揭示了一個團隊最深層的共同品質。
Bob,被楊植麟從美國拉回中國、放棄了在美國讀博的機會,在公司成立第一天就加入了。如果有人深度理解這家公司,那就是他。
當我問他那個問所有人都問的問題——這個團隊最重要的品質是什麼——他想了大約兩分鐘,回答了一個詞:
韌性。
對一家只有三年曆史的公司來說,談韌性可能聽起來有點奢侈。但他是認真的。他說,聰明和勇敢有時候是對立的。越聰明的人,看到的風險越清楚,就越容易選擇離開。盲目的堅持也不會成功。所以只有那些看清了真相、算出了失敗概率、但依然繼續的人,才配被稱為有韌性。
公司內部流傳著一個故事,叫「三上絕壁」。
2023 年 5 月,Freddie 和同事接到了一個看似不可能的任務:讓 AI 一次性讀取和理解 128K 上下文——相當於數百頁書——而當時業界標準還在 4K 左右。
他很快設計了一個叫 MoBA v0.5 的方案,但這需要在主模型訓練到一半時重寫底層訓練框架。成本太高,方案被擱置。這是第一次「上絕壁」。
半年後他帶著 v1 回來,這一版設計為可以從現有模型繼續訓練。小模型上跑通了,但在大模型上測試時遭遇了 loss spike,反覆失敗。項目被迫第二次退回,又是六個月。甚至錯過了公司 20 萬字產品里程碑的節點。但團隊沒有被解散,公司反而發起了「飽和救援」——從各處調集技術專家集中攻關。他們重寫了核心邏輯,v2 終於通過了經典的長文本「大海撈針」測試。
就在看似即將上線時,第三次打擊來了。在監督微調階段,模型在長文摘要任務上表現很差,因為訓練信號太稀疏。此時已經投入了大量資源。工程師們再次回到「絕壁」,尋找解決方案,最終通過修改最後幾層的注意力機制解決了問題。
三次退回,三次回來。
採訪結束時,我問 Freddie 那個終極問題:你會怎麼形容這家公司?
他回答了兩個字:
登月。
為什麼是登月?
他引用了肯尼迪那句名言:
「我們選擇在這十年內登月,不是因為它容易,而是因為它難。」
公司所有會議室都以樂隊命名。
天才蜂群
最終,我沒有打擾或試圖深挖聯合創始人本人。
對外,他們幾乎隱形。他們不喜歡接受採訪,對個人名聲毫無興趣。但在內部,他們無處不在。
在一個極度扁平的組織裡,你需要中心有超級大腦。否則活力會變成混亂。因為幾乎沒有中層管理,每位聯合創始人直接對接大約 40 到 50 名員工,並保持在技術和業務前線。公司就是這樣讓決策和執行保持對齊的。
五位聯合創始人都來自清華。但生理極限依然存在。人的注意力帶寬有限,管理半徑有限。當公司估值突破 1200 億、員工超過 300 人之後,即使是這些超級大腦也開始承壓。
不僅是創始人。
這是一場由自驅力驅動的無限遊戲。如果每個人實際扛著 4 億估值,那每個人被期望創造的價值也是超常的。
革命性變量是工具。
Kimi 實際上並不靠極端加班運轉。員工可以自然醒,不要求每晚在辦公室待到天亮。產品團隊的 Leo 說,他現在指揮著「一支軍隊」——AI Agent。
想象這樣一個場景:
Leo 早上 10 點醒來走進辦公室。他的任務是分析過去 24 小時來自五個全球市場的用戶反饋,並決定本週的產品優先級。過去,這需要三個人花兩天。
現在他啟動三個 Agent。
一個策略 Agent 掃描 3000 條反饋,篩選出與長文本中斷相關的高優先級需求。一個翻譯 Agent 實時解讀日語方言和韓語敬語,並標註真實的情緒強度。一個競品 Agent 監控 Cursor 和 ChatGPT 的更新,生成技術對比。
Leo 自己只做三件事:否決一條被系統誤判為真誠的諷刺評論;標記一張包含未發佈 UI 的截圖;確認 Agent 推薦的前三項需求。
到上午 11:30,產品需求文檔已經完成。與此同時,一個編程 Agent 已經生成了大約 70% 的基礎實現,只留下更有創造性的設計部分給下午跟人類工程師討論。
人類定規則,硅基系統執行。組織變成了算法的容器。
在一家 AI 原生公司,熟練使用 Agent 並將其深度嵌入工作流,不是加分項,而是基本要求。
模型不僅是目標,也是工具。
無論是直接提升生產力,還是從根本上改變管理結構,AI 的邏輯已經進入了這家公司的骨頭。正如公司在構建 Agent Swarm(智能體蜂群),團隊本身也開始像一個 Genius Swarm(天才蜂群):許多獨立的天才並行運作,無縫協同。
不過,這種扁平結構有內在的脆弱性。
當我問如果公司從 300 人擴大到 3000 人,這種模式還能持續嗎?大多數人的回答都很謹慎。歷史不太樂觀。類似的極致扁平化實驗——如合弄制(holacracy)或海爾的人單合一——往往在超過 500 人左右時遭遇決策瓶頸。信息節點太多,「直接溝通」就會變成信息過載。
更切近的痛點是個人的失重感。
沒有層級來緩衝不確定性,方向上的困惑直接傳導到每個人。一位最終回到大廠的前員工直言:沒有自上而下的 OKR 和 KPI,有些早上你走進辦公室不知道該幹什麼。沒有人一定會告訴你你做得好不好。這種缺乏反饋的狀態製造了不安全感。它會讓人懷念大廠裡清晰的彙報線、考核節點和可量化的產出。
那些繁瑣的結構,畢竟提供了一樣東西:確定性的底線。
目標在哪裡?什麼算完成?績效怎麼評判?在大公司,這些都是可見的。
那個人說,這不是斯德哥爾摩綜合徵,這是基本的組織物理學。
如果說阿里像一條精密校準的晉升傳送帶,字節像一支目標兇猛的戰鬥軍團,騰訊像一所更寬容的職業學院,那月之暗面就像一片原始森林。
天才也許能找到狩獵的路徑。普通人可能只是在霧裡徘徊。
必要的「二向箔」
沒有部門,沒有 title,沒有考評。
這種 AI 原生的組織模式是反官僚的、刻意去結構化的。大公司已經很難轉向這種模式,小公司則往往因為過早擴張為傳統架構而錯過窗口。這是一場不對稱戰爭。
這裡作者引用了《三體》中的經典概念。在那個故事裡,高等文明隨手使用一種叫「二向箔」的武器,將太陽系從三維坍縮為二維。行星、恆星、人類全部變成一張沒有厚度的平面圖像。
作者認為,月之暗面正在主動向自己投擲這樣一塊「二向箔」。
不是為了消滅對手,而是為了把組織壓扁,追求最大效率。
沒有層級的縱深,沒有部門的橫牆,沒有辦公室政治的三維糾纏。只有「模型」和「智能」以最簡潔的形式直接面對彼此。
在 AI 時代,每一家創業公司都在被迫向自己扔出這樣一塊二向箔。一人公司的崛起反映了同樣的 AI 原生人才的代際爆發。如果技術能把組織能力壓縮到個體身上,那管理的中間層就會大量蒸發。組織被壓扁。沒有繞彎的縱深。每個人都被迫直面問題本身。
這或許是商業世界中組織進化的硬規律。
每個人,最終都會被摺疊。
一旦人們暴露在同一個平面上,一個人對五十個人產生輻射影響就不再是管理奇蹟,而成為常態。從中心到邊緣的距離被重新定義。依賴 title 和 OKR 作為座標的人可能瞬間窒息。但天才們在這個暴露的平面上,可以猛烈地拆解智能本身;而「守護者」們則清除噪音和熵增,以並非沒有謙遜的姿態,將自己視為拓寬人類文明邊界的先鋒。
然而從三維到二維的轉變不可逆。
這意味著 Kimi 不能走回頭路。
每一次戰略調整都變成了高風險的混沌迭代。競爭對手還可以在迷宮裡慢慢轉彎,但如果月之暗面試圖魯莽擴張規模,可能會在結構上把自己撕裂。這種自我降維之所以可以接受,只是因為它服務於更激進的目標。
降低組織維度的終點,是升高智能的維度。
只有當模型智能跨過臨界閾值,高到足以逃脫一切碳基組織的引力井,月之暗面才能真正碾碎競爭對手的組織優勢,證明這場不可逆的賭注是正確的。
屆時,關於管理半徑或組織架構的爭論都不再重要。那就像問三體文明到底處於哪個維度——真正的重點是,它的降維武器已經改寫了戰爭的規則。
屆時,「月之暗面」將不再是一個隱喻。
它將成為一個高維光源,照亮智能宇宙的暗面。此前所有的組織陣痛,不過是登月艙穿越大氣層時燒掉的隔熱層。
要麼在上升中封神,
要麼在坍縮中封印。
沒有第三條路。
文中所有英文名均為化名。
歡迎加入深潮 TechFlow 官方社群
Telegram 訂閱群:https://t.me/TechFlowDaily
Twitter 官方帳號:https://x.com/TechFlowPost
Twitter 英文帳號:https://x.com/BlockFlow_News













