
<em>피플</em> 매거진의 김이(Kimi) 100시간 현장 취재: 의도적으로 자신을 ‘2차원’으로 접는 AI 기업
저자: Liu Mo(《인물》지)
번역·편집: TechFlow
TechFlow 서두: 이 기사는 《인물》지 창간 이래 가장 심층적인 AI 기업 내부 보도 중 하나다. 기자는 무언샷 AI(Moonshot AI) 사내에 100시간 동안 머무르며, 시가총액 1200억 위안을 넘어서고 직원 수가 단 300여 명에 불과한 이 중국 AI 스타트업의 실상을 가까이서 기록했다. 딥시크(DeepSeek) 충격 이후 전사적 혼란에서부터 ‘부서 없음, KPI 없음, 직급 없음’이라는 극단적 평면화 관리 체제, 그리고 ‘천재 벌집’ 방식의 조직 진화까지—이 특별기사는 중국에서 가장 주목받는 AI 스타트업의 진짜 내면을 낱낱이 드러낸다.
2026년 봄은 킴이(Kimi)에게 특히 유리했다.
단 몇 달 만에 킴이 뒤에 있는 회사는 수익, 자금 조달, 시가총액 등 모든 면에서 잇따라 새로운 이정표를 세웠다. 17세 고교 인턴이 공동 참여한 연구 논문은 실리콘밸리에서 호평을 받았는데, 그중 엘론 머스크(Elon Musk)도 포함되어 있었다. 미국에서 약 500억 달러로 평가되는 프로그래밍 도구 커서(Cursor)는 중국 관측자들에 의해 제품 사용 경험 측면에서 킴이 모델에 상당 부분 의존하고 있다고 지적되었다. 즉, 킴이는 자본, 기술, 상업화라는 세 개의 전선에서 동시에 승리한 셈이다.
이 회사는 설립된 지 불과 3년밖에 되지 않았지만, 시가총액은 이미 1200억 위안(약 160억 달러)을 돌파했다. 글로벌 AI 서사 속에서 이제 더 이상 무시할 수 없는 존재가 되었다.
그러나 ‘달의 어둠면(Moonshot AI)’은 여전히 깊이 신비롭다.
필자는 회사 내부를 100시간 동안 관찰할 수 있도록 허락받았다. 독립 기자로서, 필자는 대화를 원하는 어떤 직원이든 인터뷰할 수 있었고, 영업 기밀을 다루지 않는 회의라면 어떤 회의라도 참관할 수 있었다. 원고 완성 후에는 누구도 검토하지 않았으며, 아무도 원고료를 지불하지 않았다. 이는 이 회사의 성격에 딱 맞는 방식이었다.
사무실 안으로 들어서자, 마치 폭풍의 눈 속에 선 듯했다.
중심부는 비정상적으로 조용했다. 책상 위에서는 희미한 키보드 소리만 들렸고, 가끔 누군가 웃는 소리가 들릴 뿐이었다. 그러나 바깥의 소음—소문, 논쟁, 과장, 모방, 끝없는 비평—은 여기서는 흔적조차 남지 않았다.
회사 직원은 300여 명뿐이며, 평균 연령은 30세 미만이다. 시가총액을 인원 수로 나누면, 한 사람당 약 4억 위안의 기업 가치를 짊어지고 있는 셈이다.
직원의 약 80%는 온라인 용어로 말하자면 ‘I형 인간’—즉 내향형인데, MBTI 성격 유형 분류를 빌리면 그렇다. 사람들은 함께 앉아 있지만, 말하기보다는 타이핑하는 것을 더 편하게 느낀다. 여기서 내향성은 결함이 아니라 거의 일종의 ‘운영 프로토콜’에 가깝다.
필자는 2024년 처음 방문했던 밤을 떠올렸다. 당시 폭풍은 막 시작되려던 참이었다. 그때 필자는 별다른 좋은 첫인상을 남기지 못했다.
“딥시크가 우리를 구했다”

2024년 12월 24일, 성탄 이브. 중국 대부분의 사람들에게 이날은 별다른 명절이 아니었다. 그러나 줄리안(Julian)에게는 인생 최악의 밤 중 하나가 되었다.
그녀는 26세로, 북경대 졸업 후 겨우 2년밖에 되지 않았고, 업계 경력은 전혀 없었지만, 이미 킴이의 초기 직원 중 한 명이었다. 그날 밤, 매우 젊었지만 이미 ‘숙련자’로 간주되던 이 직원은 ‘라디오헤드(Radiohead)’라는 이름의 회의실에서 긴 테이블 앞에 앉아 30여 명의 동료들을 마주하며 눈물을 흘렸다.
그녀는 공동창립자들이 만족할 만한 성탄절 마케팅 기획서를 아직 제출하지 못했다.
춘절까지는 한 달밖에 남지 않았다. 최신 기획안은 이미 여섯 차례나 수정되었고, 지금 또 다시 업그레이드해야 하며, 심지어 처음부터 다시 짜야 할지도 모른다. 처음부터 기획서를 새로 작성한 후, 제품 및 엔지니어링 팀과 협조해 실행에 옮기려면 시간이 거의 부족하다. 하지만 회사는 2025년 춘절의 성장을 크게 기대하고 있었다.
이것은 중요하다. 왜냐하면 작년 춘절이 바로 킴이의 폭발적 성장의 분기점이었기 때문이다. ‘200만 자 장문 입력’이라는 브랜드 포지셔닝을 바탕으로, 킴이는 중국 전역에서 화제를 모았다. C-엔드 사용자가 급증했고, A주 시장에서는 ‘킴이 관련주’라는 용어까지 등장했다.
그 주간 회의는 길고 잔혹했다.
약 20명의 젊은 직원들이 사회관계망서비스(SNS) 광고, 사용자 운영, 국내 홍보, 해외 마케팅 등 사소한 것까지 모두 보고했다. 모두가 함께 토론하고, 공동창립자가 최종 결정을 내렸다.
당시의 킴이는 사춘기 소년 같았다. 재능과 잠재력은 있었지만, 스스로를 완전히 통제하진 못했다. 월간 광고 예산이 수천만 위안에 달함에도 불구하고, 급부상하는 경쟁사들 앞에서는 여전히 어색해 보였다.
회의는 새벽 4시쯤 끝났다.
줄리안의 최종 기획안이 성공할지 아무도 몰랐다. 한 달 후에는 그것이 더 이상 중요하지 않게 되었다.
그 순간, 전 세계가 처음으로 딥시크의 이름을 들었다.
성장 담당 헤일리(Hayley)는 온저우로 귀향해 설을 보내다가 친척들과 친구들이 모두 같은 질문을 던지는 것을 발견했다. “딥시크 들어봤어?” 킴이는 마치 하룻밤 사이에 구식 뉴스가 된 듯했다.
그녀는 이것이 인생에서 가장 힘들었던 설이라고 말했다. 회사 내부의 침묵은 귀청을 때릴 정도로 컸다.
연례 전사 대회는 일반적으로 설 이후 3월에 열리며, 직원들이 직접 경영진에게 질문할 수 있다. 그해에는 거의 모든 질문이 딥시크를 중심으로 돌아갔다.
가장 날카로운 질문은 HR 팀에서 나왔다. 그들은 진심 어린 태도로, 불편하지만 반드시 말해야 할 한 마디를 꺼냈다.
“지원자들이 우리에게 물어봅니다. ‘딥시크도 제게 오퍼를 줬어요. 그런데 왜 킴이에 오라고 해야 합니까?’ — 우리는 어떻게 답해야 할까요?”
그러나 모든 사람이 같은 반응을 보이지는 않았다.
알고리즘 팀의 알렉스(Alex)는 ‘딥시크 순간’에 강렬한 감정을 느꼈다면, 그것은 두려움이 아니라 흥분이었다고 말했다.
이 감정은 그의 개인적 느낌만이 아니었다. 그것은 알고리즘 팀 내 많은 사람들의 심정을 반영한다. 딥시크는 또 다른 가능성을 입증했다. 즉, 더 낮은 비용 전략, 오픈소스 경로, 그리고 이전까지 많은 이들이 믿지 못했던 사실—기술력과 모델 성능만 충분하다면, 이름도 생소한 중국 스타트업도 전 세계의 존경을 얻을 수 있다는 사실을 입증한 것이다.
제품 팀 역시 특별히 초조해하지는 않았다. 초기 제품 담당 직원 케빈(Kevin)은 딥시크의 폭발적 성장이 모델에 기반한 것이라고 보았다. 일단 킴이의 자체 모델 역량이 따라잡히면, 오히려 제품 팀은 더 큰 공간을 얻어 유의미한 기능을 구축할 수 있을 것이라고 생각했다.
외부인은 공동창립자들이 정확히 무엇을 논의했는지 알지 못한다. 그러나 회사는 행동이 빨랐다. 전략을 조정하고 초점을 좁히며, 내부적으로 거의 완전한 합의에 도달했다.
이제 회사 안에서 거의 누구에게나 ‘가장 중요한 것은 무엇인가?’라고 물으면, 그들은 망설임 없이 이렇게 대답할 것이다: “모델.”
그 이후로 킴이 내부에서 딥시크에 대한 존중감은 점점 커졌다. 일부는 전문적 존경에서 비롯된 것이었고, 또 다른 일부는 다른 무언가에서 비롯된 것이었다.
알렉스는 이렇게 말했다.
“어떤 의미에서, 딥시크는 우리를 구했다.”
취향이 전부다
“어떻게 이런 신발을 신으세요?”
에즈라(Ezra)가 나에게 물어본 후, 나는 그녀보다 더 놀랐다. 그녀가 일하는 층의 사무실에서는 거의 모든 사람이 책상 아래에 슬리퍼를 놓아두고 있었다. 편안한 옷과 신발을 입는 것이 사람을 더 편안하게 하고, 더 집중하게 하며, 더 창의적이게 한다고 믿는 것이다.
이것이 똑똑한 사람들의 복장 규칙이다.
필자는 평생 수많은 ‘학업 우수자’를 봐왔다. 그러나 여기의 ‘좋은 학생’은 완전히 다른 종류이다.
에즈라는 초등학교 때 부모가 알려주지 않자 집 컴퓨터 비밀번호를 해킹하려고 시도했다. 중학교 때는 비트코인에 관심을 갖기 시작했는데, 당시 1개당 수백 위안이었다. 그녀는 어머니에게 투자 자금을 달라고 했지만, 어머니는 그것이 사기라고 답했다. 고등학교 때는 처음 택시를 타면서도 머릿속으로 택시 앱의 프로토타입을 그렸다. 그녀는 만약 당시 오늘날의 AI 도구가 있었다면, 정말로 만들 수 있었을 것이라고 말했다. 대학에 들어가서야 자기 돈을 가지게 되었고, A주에 투자했지만 90%를 잃었다.
그때의 처참한 경험은 그녀에게 인간 판단의 한계를 깨닫게 했고, 그 결과 AI로 향하게 했다.
그녀가 AGI(범용 인공지능)를 이해하는 방식은 간단하다: “N명의 아인슈타인”을 창조하여 인류가 해결하기 가장 어려운 문제들을 풀도록 하는 것이다. 그 이후 그녀는 AGI의 한계를 진정으로 확장시키는 기업을 찾기로 결심했다. 그때는 이미 주식시장에서 잃었던 돈을 되찾았음에도 불구하고 말이다.
학문적 배경이 뛰어나서 여러 기업으로부터 오퍼를 받았지만, 그녀가 킴이를 선택한 이유는 하나뿐이었다. 면접 당시 창업자 양즈린(Yang Zhilin)이 기술에 대한 이해와 세부 사항에 대한 진지함이 그녀를 깊이 감동시켰기 때문이다. 그녀는 그가 진정으로 모델을 중시하는 사람이라고 느꼈다. 그에게는 똑똑한 사람들이 흔히 보이는 부주의함이나 사업가들이 흔히 보이는 공리주의가 없었다. 사실 면접이 끝날 때까지 그가 창업자라는 사실조차 몰랐다고 한다.
카렌(Karen)의 성격은 다르지만, 같은 방향으로 나아갔다.
그는 어릴 때부터 반항적이었다. 선생님과 다투었고, 부모의 말을 듣지 않았다. 대학 시절에는 반드시 해외 유학을 가겠다고 고집했고, 졸업 후에는 반드시 창업하겠다고 고집했다. 대기업이 제공하는 안정적이고 편안한 삶은 그를 절망에 빠뜨렸다—그는 인생의 시작부터 끝까지가 예측 가능한 삶을 살고 싶지 않았다.
필자가 그에게 물었다. “선택할 수 있다면, 하나는 확실히 60점(만점 100점)을 받는 것이고, 다른 하나는 1%의 확률로 100점을 받는 것이다. 어느 쪽을 고르겠습니까?”
그는 망설임 없이 후자를 선택했다.
그가 60점을 받아들이지 못해서가 아니라, 100% 확실한 길을 견디지 못해서였다.
이런 ‘창업자형 DNA’는 회사의 근본적인 질감을 구성한다. 내부의 대략적인 통계에 따르면, 월의 어둠면에는 이전에 창업하거나 스타트업에 근무했던 사람이 최소 50명 이상 있다.
누군가는 “킴이는 CEO를 좋아한다”고 말한다.
더 정확히 말하면, 이 회사는 ‘유랑하는 천재들’의 집합체를 수용하고 있다. 천재란 반드시 최고의 학생이거나 모범 직원일 필요는 없다. 중요한 건, 어떤 차원에서든 그들이 ‘시간을 꿰뚫어보는 능력’을 갖추고 있다는 것이다.
직원의 약 80%가 중국의 985·211 대학 출신인 이 회사에서 야니스(Yannis)의 이력은 특별히 뛰어나지 않다. 그러나 2023년, 그는 아직 모델 기업조차 제품을 내놓지 못한 시점에서 딥시크와 킴이가 모두 부상할 것이라고 엔지니어링 커뮤니티에서 예측했다. 또 다른 00후 직원이 그의 예측력을 눈여겨보고, 내부 추천을 통해 그를 회사에 데려왔다.
카렌은 너무 많은 똑똑한 사람들이 시스템에 갇혀 있다고 말한다. 먼저 가정, 다음은 학교, 그 다음은 직장이다. 그들은 무의식적으로 집단의 기대에 복종하며, 자신이 진정으로 원하는 것이 무엇인지 잊어버린다. 소수만이 탈출을 시도하지만, 그런 사람들은 종종 주목받지 못한다.
그가 말하는 킴이의 사명 중 하나는 바로 그들을 ‘보는 것’이다.
이런 직관이 없었다면, 17세 고교생이 킴이 인턴으로 채용되어 팀과 협력해 논문을 발표하고, 나중에는 엘론 머스크의 칭찬까지 받는 일이 가능하지 않았을 것이다. 그 학생의 이름을 논문 제1저자 위치에 올린 사람은 밥(Bob)으로, 그의 지도교수이자 그를 처음 발굴한 사람이기도 하다.
천재와 광기 사이에는 단지 한 줄의 경계만이 있다. ‘이해되지 않는 광인’이 월의 어둠면에 도착하면, 그는 갑작스럽게 세상을 바꿀 천재가 될 수도 있다. 또는, 아직 드러나지 않은 천재가 바로 이런 곳에서야 비로소 진정으로 빛을 발할 수 있다.
밥은 나에게 말했다. 어느 정도로 보면, ‘자아(ego)’가 크다는 것은 문제가 되지 않을 뿐 아니라 오히려 좋을 수도 있다고. 그 자아가 내재된 동기부여라면, 혹은 한 사람이 자신이 위대한 사명에 반드시 참여해야 한다고 믿는다면, 그는 회사가 놓쳐서는 안 될 인재일 수 있다고 말했다.
천재는 집요하다.
이 팀에서는 최고 수준의 AI 모델을 훈련시키는 일을 ‘단련(煉丹)’이라고 농담처럼 부른다—이는 중국 기술계에서 널리 쓰이는 표현으로, 모델 훈련이 과학과 현학이 반반 섞인 과정임을 암시한다. 그러나 실제 작업에서는 ‘단련’이란 버그를 끊임없이 고치는 것을 의미한다.
매번 주력 훈련이 시작되면, 밥과 동료들은 동일한 일련의 의식에 들어간다. 매일 아침 첫 번째 일은 회사 내 거대한 내부 모니터링 패널을 새로 고치는 것이다. 수십만 개의 지표들. 단 하나의 그래프라도 비정상적으로 요동친다면, 머릿속에 즉각 경고음이 울린다: 최적화에 문제가 있는가? 아키텍처에 결함이 있는가? 수치 정밀도가 불일치하는가?
그들의 반응은 거의 동물 수준의 민감성을 띤다.
어떤 이는 훈련 데이터를 토큰(token) 단위로 일일이 검사하며, 극단적인 그래디언트를 생성하는 토큰을 출력해 ‘용의자 심문’처럼 묻는다: “왜 그렇게 격렬하게 튀어오르는가?”
모델 하나를 실제로 ‘납품’한 적이 있는 사람이라면 누구나 이런 불면의 긴장감을 경험했다. 이것은 불안이 아니라 호기심에서 비롯된 집착이다. 바로 이런 집요한 경계심이 모델을 최고 수준으로 끌어올리는 것이다.
천재는 뭉친다.
지난 1년간 킴이에는 100명 이상의 직원이 내부 추천을 통해 입사했다—친구의 친구, 친구의 친구의 친구… 회사 내에서는 이를 농담처럼 ‘사람 전염병’이라고 부른다.
신뢰는 이러한 밀집된 네트워크 때문에 자연스럽게 조직 자산이 된다.
본질적으로, 킴이는 관리의 가장 어려운 부분을 채용 단계로 옮겼다. 만약 사람이 신뢰할 수 있는 동료에 의해 추천된 사람이라면, 그들은 동일한 직관을 가질 가능성이 높다. 그래서 회사 내부에서 반복해서 등장하는 단어가 하나 있다.
취향(Taste).
2025년 9월 어느 밤, 몇 명의 엔지니어가 임의로 내부 소규모 프로젝트를 시작했는데, 그 이름은 ‘엔솔(Ensoul)’이었다. 그들은 파일 속에 잠들어 있는 코드를 ‘살려내’ 명령어 라인에서 대화형 어시스턴트로 만들고 싶었던 것이다.
이런 명명에 대한 민감성은 우연이 아니다.
그들은 이전에 ‘야마하(YAMAHA)’라는 프레임워크를 가지고 있었는데, 그 전체 이름은 ‘예트 어노더 문샷 에이전트(Yet Another Moonshot Agent)’였다. 가장 하위 계층의 인프라는 ‘코송(Kosong)’이라고 불렀는데, 이는 말레이어로 ‘비어 있음’을 뜻하며, 불교의 ‘색즉시공(色即是空)’에서 영감을 얻은 것이다. 즉, 아무런 사전 기능이 없지만 무한한 가능성을 지닌 백지 상태를 암시한다.
즉, 취향은 제품 자체를 형성한다.
많은 기업들이 채팅 창을 명령어 라인에 밀어넣을 때, 킴이의 엔지니어들은 그것을 ‘못생겼다’고 느꼈다. 진정한 프로그래머가 터미널을 여는 목적은 대화가 아니라 명령을 내리기 위한 것이다. 따라서 킴이 CLI는 채팅 인터페이스가 아니라 지능형 쉘(shell)처럼 설계되었다. 명령을 이해하지만, 대화창의 형태를 강제하지 않는다.
이런 간결함은 코드에서도 드러난다. 핵심 로직은 약 400행의 파이썬(Python)으로 이루어져 있으며, 불필요한 장식은 모두 제거되었다. 모듈 간에는 깔끔하게 분리되어 있고, 사용자는 직접 기능을 커스터마이징하거나 킴이를 분해해 자신만의 애플리케이션으로 재구성할 수 있다.
킴이 에이전트(Kimi Agent)는 이전에 내부에서 ‘OK Computer’라는 단어와 연결되어 있었는데—또 다른 라디오헤드 참조—그러나 나중에 이름을 바꿨다. 더 넓은 사용자층에게는 너무 난해하기 때문이었다. 이런 이름을 선택하는 사람들은 최대 유입량을 추구하는 데 별 관심이 없는 듯하다. 그들은 자신의 음악 취향과 언어 기준을 따를 뿐이다.
누군가는 농담처럼 말하기도 했다. 만약 악기를 다룰 줄 아는 직원의 비율로 AI 기업을 순위 매긴다면, 킴이가 1위일지도 모른다고.
취향은 이제 최고의 채용 기준이자, 가장 정의하기 어려운 기준이 되었다.
그것은 측정할 수 없지만, 어디에나 존재한다.
먼저 일반화하고, 그 다음 진화한다
당신은 아마 킴이의 각 직원이 정확히 무슨 일을 하는지 영원히 알 수 없을 것이다.
회사는 ‘부서’보다는 ‘팀’이라는 표현을 선호한다. 고위층에서 보면 주요 방향은 충분히 명확하다: 알고리즘, 제품 및 엔지니어링, 성장, 전략, 운영. 그러나 실제 부서 구분이나 고정된 책임을 자세히 들여다보려 하면, 모든 게 흐릿해지기 시작한다.
왜냐하면 이 조직은 공식적인 부서도 없고, 계층도 없으며, 직책(title)도 없고, OKR도 없고, KPI도 없기 때문이다. 보고 체계는 거짓말처럼 단순하다.
브랜든(Brandon)에게는 이것이 완전히 말이 안 되는 구조였다.
그는 칭화대학 출신으로, 실리콘밸리의 거대 기업과 중국의 대기업에서 관리직을 지냈으며, 약 10억 달러 가치의 스타트업을 성공적으로 이끈 경험이 있다. 그는 오랜 기간 산업계에서 경험을 쌓으며 기술 관리에 능숙해졌고, 약 1000명의 팀을 이끌어 본 적도 있다. 그는 AI 분야에 진입해 본격적으로 활약하려 했다.
그러나 공동창립자 장위타오(Zhang Yutao)는 그에게 이 회사가 그런 식으로 운영되지 않는다고 말했다. 그가 입사한다면, 직접 관리하는 사람은 약 두 명 정도가 될 것이라고 했다.
그러나 미래에 대한 어떤 막연한 가능성에 끌려, 그는 다시 한번 대화를 요청했다.
그래서 2025년 1월, 회사 내부에 의심과 불안이 만연하던 시점에, 브랜든은 자신의 칭화대학 동문인 양즈린을 만났다.
당시 브랜든은 양즈린의 이름이 나중에 엘론 머스크, 황인쉰과 같은 기사에 함께 실릴 것임을 몰랐다. 그가 기억하는 가장 분명한 건, 기본적인 인사말을 마친 후 양즈린이 한 첫 마디였다.
“강화학습이 미래다.”
그 이후의 대화는 거의 양즈린의 독백 같았다. 그는 자신의 사고 속에 몰입해 있었고, 브랜든은 그가 말하는 내용을 거의 이해하지 못했다. 비록 전부 중국어로 말했음에도 불구하고 말이다.
그러나 한 가지는 분명했다. 이 순간, 브랜든은 지난 20년간 쌓아온 지식 체계와 사고 모델이 무너지는 것을 처음으로 느꼈다. 함께 무너진 건 그의 자만심이기도 했다.
필자가 그가 결국 입사한 이유를 물었을 때, 그는 다소 신비롭게 말했다. 양즈린은 위대한 예언가가 될 수 있을지도 모른다. 왜냐하면 그는 먼 안목을 갖추고 있으면서도 충분히 순수하기 때문이다.
나중에 회사가 이런 거의 직책이 없는 체계 속에서 그의 역할을 어떻게 정의해야 할지 망설이고 있을 때, 브랜든은 단호하게 대답했다.
“화장실 청소라도 시키면 가겠습니다. 그리고 제가 청소하면 누구보다 깨끗할 겁니다.”
모든 전 대기업 관리자나 전문가가 이런 환경에서 살아남을 수 있는 건 아니다.
00후 피비(Phoebe)는 성장 팀에서 제품 및 엔지니어링 팀으로 이동했다. 그녀는 자신을 ‘아무것도 모르는 어린 소녀’라고 자조하지만, 중요한 사실을 하나 말했다. 이 회사에서는 풍부한 경험과 화려한 이력이 오히려 부담이 될 수 있다는 것이다.
AI는 너무 새롭고, 변화가 너무 빠르다. 경험이 풍부한 전문가라도, 가정이 적은 젊은이보다 학습과 적응 속도가 빠를 것이라고 보장할 수 없다.
그녀는 대기업에서 온 중간·고위 관리자 3명이 실패한 사례를 직접 목격했다. 그중 한 명은 결국 이 업계를 떠나기로 결정했는데, 주변 사람들이 너무 젊고 똑똑하다고 말했다. 계속해서 뒤처지다 보니, 자신은 더 이상 이 시대도 아니고 이 업계도 아니라고 단정지었다.
딥시크 충격 이후, 피비 역시 깊은 위기감을 느꼈다. 그녀는 유입 마케팅 업무를 포기하고, 제품 및 엔지니어링을 통해 회사를 돕기로 결심했다. 그녀는 강도 높은 자율 학습을 시작했고, 심지어 Bilibili(B사이트)에서 자신의 학습 과정을 라이브로 방송하기도 했는데, 누적 시청 시간이 수백 시간에 달했다.
그녀를 가장 놀라게 한 건, 회사가 처음부터 망설임 없이 그녀에게 직무 변경 기회를 줬다는 점이었다.
사실, 필자가 인터뷰한 30명의 직원 중 절반 이상이 여러 차례 직무를 바꿨다. 이전의 일과 비교하면, 약 80%의 사람들이 지금 하고 있는 일이 완전히 다르다.
킴이는 ‘일반화 능력(generalization ability)’을 갖춘 사람을 좋아한다.
AI 분야에서 일반화란, 훈련 데이터 외부의 새로운 상황에서도 모델이 잘 작동한다는 것을 의미한다. 그것은 단순히 정답을 암기한 것이 아니라, 근본적인 구조를 배운 것이다.
회사는 이 개념을 사람에게도 적용한다.
대기업 출신의 중간·고위 관리자는 특정 KPI 체계, 특정 보고 언어, 특정 내부 정치 게임에 너무 오랫동안 최적화되어 있다. 그들의 ‘알고리즘’은 지역 최적해(local optimum)에 과적합(overfitting)되어 있다. 환경이 완전히 바뀌면, 그들은 적응하지 못할 수 있다.
전통적인 대기업 직원은 전용 모델(specialized model)이라면, 월의 어둠면이 원하는 사람은 기초 모델(base model)에 더 가깝다. 먼저 감독 학습을 통해 기본 규칙을 배우고, 이후 강화학습과 다양한 과제 간의 반복적 자기 대결을 통해 여러 분야로 이전할 수 있는 능력을 획득한다.
실리콘밸리에서 돌아온 제임스(James)는 26세로, 자신의 꿈이 ‘젊은이들에게 돈을 주는 것’이라고 말한다.
AI의 진정한 신봉자인 그는 자신의 신체를 정보 수집 센서로 간주한다. 리그 오브 레전드(League of Legends)를 할 때는 음성 녹음과 심박수, 맥박 등 생리 데이터를 수집한 후, 어떤 팀원의 발언이 자신의 정서 상태와 게임 성과에 영향을 미쳤는지를 분석한다.
그의 견해는 날카로워서 거의 극단에 가깝다. 그는 사람이 14세 이후에야 진정한 새로운 언어를 배우기 시작한다면, 모국어 수준에 도달할 수 없다고 주장한다. AI 역시 마찬가지라고 생각한다.
졸업하자마자 회사에 입사한 댄(Dan)은, 인생에서 처음으로 진정한 지식 불안을 느꼈다고 말한다.
학교에서는 ‘장난감 모델(toy model)’만 훈련시켜 봤다—약 70억 파라미터, GPU 32장으로 며칠이면 끝나는 수준. 지금은 수백억 파라미터의 MoE(혼합 전문가) 모델을 다뤄야 하고, 훈련 데이터는 트릴리언 토큰 단위다. 마치 작은 연못에서 태평양으로 바로 뛰어든 듯한 느낌이다.
리듬을 따라가기 위해 그는 거의 자해 수준의 학습 상태에 들어갔다. 생활 리듬은 완전히 붕괴되었고, 베이징의 낮은 실리콘밸리의 밤이 되고, 다시 반대로 바뀌었다. 그는 수백 시간 동안 훈련 모니터링 패널을 응시했다. 주식 거래원이 주식 시세판을 응시하듯, 눈 깜빡일 틈조차 없었다.
진정한 도전은 단순한 업무량이 아니라, 그가 동시에 세 가지 일을 해야 한다는 것이다.
그는 알고리즘 아키텍처 설계자여야 한다. 수많은 모델 선택의 미로 속에서 최적의 방안을 설계해야 한다. 그는 시스템 엔지니어여야 한다. 전 세계를 가로지르는 파이프라인을 수리하듯 분산 컴퓨팅 문제를 디버깅해야 한다. 그는 데이터 ‘단련사’여야 한다. 거대한 데이터셋에 ‘단련술’을 펼쳐 벤치마크에서 높은 점수를 받게 하면서도, 실제 대화에서는 자연스럽고 부드럽게 작동하도록 해야 한다.
때로는 훈련 도중 긴급 수술이 필요하기도 한다. 한 번은 bf16 정밀도로 저장된 핵심 파라미터가 위험한 행동을 보이기 시작했다. 팀은 즉시 훈련 중간에 fp32 정밀도로 전환해 이번 훈련을 안정적으로 유지했다. 댄은 말했다. 만약 당신이 알고리즘만 쓸 줄 아는가, 시스템만 다룰 줄 아는가, 데이터만 정제할 줄 아는가—그렇다면 결코 최고 수준의 모델을 만들 수 없다. 여기서는 ‘나는 이 부분만 담당한다’는 변명이 통하지 않는다.
회사는 당신이 알고리즘, 엔지니어링, 데이터 작업을 통합하여 동시에 여러 세계를 오가기를 기대한다. 이는 동시에 여러 직장을 다니는 것과 같다. 그러나 이런 강도 높은 교차 훈련은 짧은 시간 안에 수년간의 성장을 가져다준다.
그러므로 킴이에 입사하려는 누구에게나 잔인한 시험이 기다리고 있다.
OKR도 없고, KPI도 없고, 사내 정치도 없고, PUA식 관리도 없고, 심지어 출근打卡도 없다. 그러나 당신이 AI 토착민이 아니라면, 일반화할 수 없다면, 지속적으로 강화되고 적응할 수 없다면, 당신은 이곳에서 자신의 존재 의미를 찾기 어려울 것이다.
“여기에는 관료적인 냄새가 없다”
대부분의 브랜드는 이야기를 원한다.
그러나 거의 모든 킴이 직원들이 필자에게 부드럽게 조심스럽게 당부했다. 핑크 플로이드(Pink Floyd) 이야기도, 사무실 입구에 놓인 피아노 이야기도 쓰지 말아달라고.
그들의 생각은 이렇다. 알아듣는 사람은 알아듣고, 모르는 사람은 굳이 알아야 할 필요가 없다. 문샷(Moonshot)과 킴이(Kimi)라는 이름은 AI나 기술과 직접적인 관련이 없다. 그러나 회사가 자신과 록 음악, 예술과의 관계를 지나치게 강조한다면, 그것은 오히려 자기의식이 과도하고, 인위적이고, 과장되어 보일 수 있다. 그들은 아름다움은 설명이 필요하지 않다고 느끼는 듯하다.
대기업에서 ‘탈출’한 00후 윈(Win)은 나에게 이곳은 이상하다고 말했다. 사람들이 정말로 회의 없이 일을 끝낼 수 있기 때문이다.
그의 이전 직장에서는 낮에는 회의를 하고, 밤에는 일을 했다. 그는 단순한 교훈을 배웠다. 만약 당신의 에너지가 생산 관계 조정에 주로 쓰인다면, 실제 생산성 향상의 여지는 거의 남지 않는다.
이것이 바로 AI 토착 조직의 일부 모습이다.
10명 이상의 직원이 분명히 말했다. 그들은 점점 더 사람보다는 AI와 소통하는 것을 선호한다. AI는 더 신뢰할 수 있고, 더 단순하다. 이 경향은 회사 전체의 내향적 성격과도 일치한다. 누군가는 좀 더 부드러운 표현을 썼다: ‘수줍음’.
그룹 채팅에서는 누구나 활기차고 표현욕이 강하다. 그러나 실제로 만나면 많은 이들이 조용하다. 킴이는 문화 활동을 거의 조직하지 않는다. 연례 행사인 연말 파티 외에, 최근의 집단 활동은 사무실에서 마사지를 받는 것이었다.
내향적이라는 것이 의사소통이나 활력이 부족하다는 뜻은 아니다.
누구도 필자에게 말하라고 요구하지 않았지만, 한 명도 거절하지 않았다. 그룹 채팅에서는 정보가 끊임없이 오가며, 다양한 추상적인 이모티콘들이 섞여 있다. 누구의 메시지도 방치되지 않는다.
만약 당신이 다른 사람의 협조가 필요해 일을 완료해야 한다면, 절차는 아주 간단하다. 바로 그 사람을 찾아가면 된다.
관리자에게 보고할 필요도 없고, 승인을 받을 필요도 없고, 조정 회의를 열 필요도 없고, 부서 간 장벽을 허물 필요도 없다.
킴이에는 부서 간 장벽이 없다. 어떤 의미에서, 부서조차 없다.
양즈린의 이메일 서명란에는 네 글자만 적혀 있다.
직접 소통.
그럼에도 불구하고, 모두가 인정한다. 회사 설립 이래로 끊임없이 변화해 왔다.
어떤 변화는 능동적이고, 어떤 변화는 수동적이며, 어떤 변화는 심지어 반전처럼 보이기도 한다. 회사는 대규모 광고投放에서 모델 집중으로, 폐쇄형 모델 고집에서 오픈소스 수용으로, 채팅봇 제품에서 킴이 에이전트, 킴이 코드, 킴이 클로우로, C-엔드에서 B-엔드, 다시 C-엔드로 전환했다. 모든 전환이 완벽하게 설명될 수 있는 것은 아니다.
그러나 에즈라는 한 가지는 변하지 않았다고 본다: 사실에 대한 존중.
그녀는 모든 변화는 하나의 원인과 하나의 목적—즉, 회사가 객관적 현실과 더 잘 정렬되도록 하는 것—에서 비롯된 것이라고 생각한다.
회사는 자만심을 용인하지만, 자신을 사실보다 위에 두려는 사람을 좋아하지는 않는다.
공동창립자부터 아래까지, 사람들은 상대적으로 설득되기 쉽다—단, 사실이 충분히 명확하다면 말이다. 직원들은 이러한 태도가 진실, 현실, 그리고 ‘무엇이 진짜인가’에 대한 극도의 집착에서 비롯된다고 말한다. 진정으로 똑똑한 사람은 솔직한 피드백으로 상처받지 않는다.
이런 솔직함에는 또 하나의 조건이 있다. 회사에는 ‘말뚝 경쟁(sea horse race)’ 제도가 없고, 제로섬(zero-sum) 경쟁이 없으며, 큰 내부 이익 충돌도 없다. 사람들은 연구 결과와 기술 세부 사항을 보상이나 저작권 표시 없이 무료로 공유한다. 회사는 초기부터 자체 커뮤니티를 갖고 있었고, 오늘날에도 여전히 커뮤니티 문화를 장려한다. 정보와 지식의 공유는 각자의 학습 속도를 가속화시켜, 궁극적으로 모두에게 이익이 된다.
윈은 독성 있는 문화는 전염되지만, 좋은 문화도 전염된다고 말한다.
누군가는 이곳의 분위기를 ‘단결’이라고 묘사한다—이 단어는 스타트업에 쓰이기에는 다소 고전적으로 들린다. 그러나 회사가 처한 환경은 매우 혹독하다. 바깥에는 거대 기업 경쟁사들이 있고, 내부에는 대기업의 압박이 있으며, 연산 자원도 제한되어 있다. 이런 제약 조건들이 어떤 역할을 한다면, 오히려 응집력을 강화하는 듯하다.
궁극적으로, 사람만이 조직에서 진정으로 중요한 자산이다.
최근 플로렌스(Florence)는 경쟁사로부터 두 배의 연봉을 제시받고 스카우트되었다. 그녀는 즉각 거절했다. 이유는 아주 간단했다.
“여기에는 관료적인 냄새가 없습니다.”
회사의 신사옥.

“그녀가 어떻게 버텨냈는지 모르겠어요”
인터뷰를 시작하기 전, 나는 매우 긴장했다. 나는 세계에서 가장 똑똑한 AI 실무자들 중 일부를 인터뷰하려 했고, 나는 인문학 전공자였으며, 기술 업계에서 일해 본 적도 없었고, AI에 대한 지식도 제한적이었다.
그러나 알고리즘 및 제품·엔지니어링 팀의 젊은 전문가들과 실제로 대화를 시작하자, 오히려 그들이 긴장하고 있었다는 사실을 깨달았다. 그들은 내가 전문 용어를 이해하지 못하면 어색해질까 걱정하고 있었다.
그래서 그들은 먼저 영문을 중국어로 번역한 후, 그 중국어를 내가 이해할 수 있는 더 단순한 중국어로 다시 번역했다.
그런 보호 본능은 감동적이었다.
인터뷰를 시작하기 전, 회사는 나에게 단 하나의 지시만 내렸다: “모든 사람을 보호하세요.”
그래서 나는 너무 민감하거나 사람을 상처 줄 수 있는 질문을 피하려고 최선을 다했다.
그럼에도 불구하고, 타이(Ty)는 전화 인터뷰 중 감정의 떨림을 완전히 숨기지 못했다. 그는 입사 초기 어려운 적응기를 겪으며, 한때 버티지 못할 것 같아 퇴사를 고민하기도 했다.
그러던 어느 주의 전사 대회에서, 그는 졸업한 지 불과 2년 된 여성 애니(Annie)가 수차례의 좌절과 내면의 의심을 견뎌낸 끝에 어렵던 프로젝트를 성공적으로 이끌어내는 모습을 보았다. 이 광경을 본 그는 자신이 포기해서는 안 된다고 생각했다. 그녀보다 나이도 많고, 경험도 더 많지만, 순수한 인내력과 의지력 면에서는 자신이 더 약하다고 느꼈다.
그는 말했다.
“그녀가 어떻게 버텨냈는지 모르겠어요.”
실제로, 떠나고 싶었던 사람은 타이뿐이 아니었다.
애니도 그랬다.
오랫동안 그녀는 해외 사업선을 제로에서 구축했지만, 언제까지나 진전을 이루지 못했다. 더 나쁜 건, 다른 팀 동료들이 선의에서 그녀에게 이 노력은 무의미하다고 직접 말해주었다는 것이다.
그녀는 킴이에서 울었던 횟수가 어느 회사보다 많았고, 이전의 어느 직장에서도 더 많이 울었다고 말했다.
그녀에게 퇴로는 없지 않았다. 그녀는 더 높은 연봉을 제시받은 오퍼를 이미 받았다. 그러나 그녀는 남에게 고용되어 일하는 것을 스스로 납득할 수 없었다. 그녀는 장위타오와 다시 한번 대화해 보고 싶었다.
그 후, 그녀는 남기로 결심했다.
그녀는 그 대화 내용을 나에게 말해주지 않았다. 다만 이렇게 말했다. “위타오는 제가 만난 중 가장 강한 사장님이다. 반복 개선 속도가 가장 빠르고, 한계치도 가장 높다. 그녀를 따라가는 것이 제 한계를 높이는 방식이다.”
그리고 애니는 같은 말을 다시 한번 반복했다.
“그녀가 어떻게 버텨냈는지 모르겠어요.”
충분한 자료를 모으면, 어떤 문장이 반복해서 등장하는지 알 수 있다. 그리고 가장 자주 반복되는 말은, 팀의 가장 깊은 공통된 품질을 드러낸다.
밥은 양즈린이 미국에서 그를 중국으로 데려와 박사 과정을 포기하게 했고, 회사 설립 첫날부터 합류했다. 이 회사를 누구보다 깊이 이해하는 사람이 있다면, 바로 그일 것이다.
필자가 그에게 모든 사람이 물어보는 질문—이 팀의 가장 중요한 품질은 무엇인가—를 물었을 때, 그는 약 2분간 생각한 후 한 단어로 대답했다.
회복탄력성(Resilience).
설립 3년밖에 안 된 회사에게 회복탄력성을 말하는 것은 다소 사치스러워 보일 수 있다. 그러나 그는 진심이었다. 그는 똑똑함과 용기는 때때로 대립한다고 말했다. 더 똑똑할수록 위험을 더 명확히 보게 되고, 더 쉽게 떠나려 할 수 있다. 맹목적인 고집도 성공하지 못한다. 그러므로 진실을 똑바로 보고, 실패 확률을 계산해도 여전히 계속 나아가는 사람만이 진정한 회복탄력성을 가진 사람이라고 말했다.
회사 내부에서는 ‘세 차례의 절벽 도전’이라는 이야기가 전해진다.
2023년 5월, 프레디(Freddie)와 동료들은 보기에는 불가능해 보이는 과제를 맡았다. AI가 128K 토큰의 문맥—수백 페이지 분량의 책—을 한 번에 읽고 이해하게 만드는 것. 당시 업계 기준은 4K 수준이었다.
그는 곧 MoBA v0.5라는 방안을 설계했지만, 이는 주 모델 훈련 중간에 하위 훈련 프레임워크를 다시 작성해야 했다. 비용이 너무 높아 방안은 보류되었다. 이것이 첫 번째 ‘절벽 도전’이었다.
6개월 후, 그는 v1을 들고 돌아왔다. 이번 버전은 기존 모델에서 계속 훈련할 수 있도록 설계되었다. 소규모 모델에서는 성공했지만, 대규모 모델에서 테스트할 때 loss spike가 발생하며 반복적으로 실패했다. 프로젝트는 두 번째로 철회되었고, 또 다시 6개월이 걸렸다. 심지어 회사의 20만 자 제품 이정표를 놓치기도 했다. 그러나 팀은 해체되지 않았고, 회사는 오히려 ‘포화 구조 지원(saturation rescue)’을 발동했다—각 부서에서 기술 전문가를 총동원해 집중 공략했다. 그들은 핵심 로직을 다시 작성했고, v2는 고전적인 장문 ‘바늘찾기(Needle-in-a-Haystack)’ 테스트를 마침내 통과했다.
마치 출시가 임박한 듯 보였을 때, 세 번째 타격이 왔다. 감독 학습 미세조정 단계에서, 모델은 장문 요약 작업에서 매우 부진한 성과를 보였는데, 훈련 신호가 너무 희박했기 때문이다. 이때 이미 막대한 자원이 투입되었다. 엔지니어들은 다시 ‘절벽’으로 돌아가 해결책을 모색했고, 결국 마지막 몇 층의 어텐션 메커니즘을 수정함으로써 문제를 해결했다.
세 차례 철회, 세 차례 재도전.
인터뷰를 마치고, 나는 프레디에게 최종 질문을 던졌다. “당신은 이 회사를 어떻게 묘사하시겠습니까?”
그는 두 글자로 대답했다
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News













