
一位西方學者中國 AI 實驗室走訪實錄:謙遜、開放、不談哲學,只想訓練更好的模型
TechFlow Selected深潮精選

一位西方學者中國 AI 實驗室走訪實錄:謙遜、開放、不談哲學,只想訓練更好的模型
整體氛圍與舊金山出奇地相似,研究者們極度在線,在 Twitter 和小紅書上大量閱讀,後者越來越受歡迎。
作者:Florian Brand
編譯:深潮 TechFlow
深潮導讀:這篇文章的背景是 SAIL(一個把 Substack 上頂級 AI 寫手聯合起來的媒體聯盟,成員包括 Nathan Lambert、Sebastian Raschka、ChinaTalk 等)組織了一次中國 AI 實驗室的訪問團,作者 Florian 跟團去了月之暗面、小米、MiniMax、智譜、美團、阿里、螞蟻、魔搭、零一萬物、宇樹等十幾家公司,寫了這篇觀感。
Florian Brand 是德國特里爾大學(Trier University)和德國人工智能研究中心(DFKI)的博士生,研究方向是大語言模型的應用與評估。
算不上「很有名」,但在開源 AI 圈子裡有一定能見度,外國 AI 從業者第一視角看中國 AI 生態也挺有意思的。
正文
過去大約 10 天,我有幸與 SAIL 的夥伴們一起拜訪了中國的 AI 實驗室。作為一個在六個月內首次訪問中國和美國的人,我發現兩地的差異令人著迷,但更令人著迷的是相似之處。
給我留下最深刻印象的是,我遇到的 AI 研究者都非常謙遜。
他們高度評價其他實驗室和同行。DeepSeek 被頻繁提及,可能因為我們訪問前幾天他們剛發佈了一個模型,人們談論 DeepSeek 的論文時帶著真正的欽佩。
許多研究者彼此是親密朋友,來自同一所大學或共享同一個家鄉。他們坦誠地討論自己的工作,研究成果幾個月後會發表成論文。
這是與西方 AI 圈最大的差異之一。在美國,氛圍往往更像零和遊戲。實驗室對定位很謹慎。研究者思考競爭,有些人對自己評價很高。領導者在洩露的備忘錄中互相侮辱和攻擊。這種差異可能可以用事實來解釋:美國領先的實驗室是閉源的,而許多中國實驗室是開源的。中國實驗室對字節跳動的豆包"有所忌憚",豆包是使用最多的聊天機器人,且是閉源的,領先優勢很大。
與此同時,整體氛圍與舊金山出奇地相似。研究者們極度在線,在 Twitter 和小紅書上大量閱讀,後者越來越受歡迎。他們都用 Claude Code 或自己的 CLI 來構建下一個模型。有些人在我們開會時監控訓練運行,觀察獎勵曲線上升。他們在思考進一步擴展規模,抱怨算力不夠。他們對當前基準測試的狀態感到沮喪。
他們的主要關注點是訓練更好的模型。這與舊金山不同,那裡的研究者會思考 AI 的政治或哲學影響。他們不考慮大規模失業、永久底層階級,或者他們的模型是否有意識。他們只想訓練出色的模型。
當聽說你用了他們的模型時,他們的眼睛會發光。他們渴望在下一代模型中修復當前模型的所有缺陷。他們通宵達旦推動模型發佈,之後仍然出現在辦公室。
我遇到的大多數研究者都很年輕,許多人都在 20 歲出頭或 25 歲左右。有些是本科生,但更常見的是在讀博士,同時在業界工作。他們的共識是,相比學術界,業界現在更有趣,這個觀點我非常認同,因為我做過完全相同的事。實驗室非常重視這類人才獲取,積極招聘實習生和研究生;這是西方實驗室不做的。
研究者的樂觀情緒也延伸到普通民眾,他們似乎對技術以及 AI 和機器人的前景更加樂觀。旅途中有人講述他們的父母和祖父母使用豆包和 DeepSeek 做各種事情的故事,包括討論數學定理。這與西方明顯不同,那裡的普通民眾厭惡 AI。
總的來說,這次旅行讓我對這個生態系統有了一點點了解。不可能在幾天內瞭解如此龐大文明的文化。作為開放 AI 生態系統和開放研究的堅定支持者,我對兩者的未來都非常樂觀,希望未來能有大量的國際合作。
我要感謝在月之暗面、小米、MiniMax、智譜、美團、阿里巴巴、螞蟻靈犀、魔搭、零一萬物、宇樹以及其他地方遇到的所有了不起的人。感謝你們的時間和熱情接待。同時感謝 SAIL 組織這次行程,感謝所有參與的作家和記者。我非常感激能在如此短的時間內遇到這麼多傑出而有抱負的人。
歡迎加入深潮 TechFlow 官方社群
Telegram 訂閱群:https://t.me/TechFlowDaily
Twitter 官方帳號:https://x.com/TechFlowPost
Twitter 英文帳號:https://x.com/BlockFlow_News














