
OpenAI 내부 고발자, 머스크 편에 합류
글: 백교, 형우, 발자국, 오비사
출처: 양자위
방금 OpenAI에서 해고된 정보 유출자가 순식간에 머스크의 품으로 들어갔다.
당사자인 Pavel Izmailov(이하 소피)는 Ilya의 동맹 중 한 명으로, Ilya가 이끄는 슈퍼정렬(Super Alignment) 팀에서 일한 바 있다.
약 반달 전, 소피는 Q* 관련 기밀을 유출한 혐의로 해고되었다. 정확히 어떤 정보를 유출했는지는 모르겠지만, 당시 큰 파장을 일으켰다.
말이 빠르게 돌기도 전에, 지금 그의 트위터 프로필에는 당당하게 이렇게 적혀 있다:
연구원 @xai
역시 머스크의 인재 영입 속도가 빠르다는 말이 틀리지 않았다. 소피 외에도 최근 여러 우수한 인재들이 머스크에게 끌려들어가고 있다.
구경꾼들은 난리가 났다. 칭찬하는 사람도 많고, 잘했다며 극찬한다:

반면 비난하는 사람들도 있는데, 기밀을 유출한 사람을 고용하는 것은 쓰레기를 주워 모은 것과 다름없다고 생각한다.

또한 최근 xai의 행보—Grok 1.5V 출시를 포함해—상당한 존재감을 과시하며 사람들을 감탄하게 만들었다:
xAI는 OpenAI, Anthropic와 어깨를 나란히 하며 게임의 주요 참여자가 될 것이다.

OpenAI에서 해고된 정보 유출자를 고용하다
사건의 개요는 이렇다. 대규모 모델 분야의 최신 소식에 민감한 한 블로거가 놀라운 사실을 발견했다:
머스크 산하의 xAI에 새로 합류한 직원들이 꽤 많지 않나?
그중 몇몇은 OpenAI의 가장 신비로운 Q* 알고리즘과 관련된 연구 방향을 가지고 있으며, 보니 머스크야말로 Q*의 진정한 신봉자였다.

정확히 누구들이 xAI로 옮겨왔는가?
가장 눈에 띄는 인물은 앞서 언급한 소피다.
그는 뉴욕대학교 CILVR 그룹의 일원이며, 본인이 밝히기로는 2025년 가을부터 뉴욕대학교 탠던(CSE), 쿠란트(CS)에서 조교수로 임명될 예정이다.
반달 전만 해도 그의 개인 페이지에는 "OpenAI에서 대규모 모델 추론 작업을 하고 있음"이라고 적혀 있었다.

반달 후, 세상은 변했다.
하지만 소피의 트위터 상단 고정 글은 여전히 변함없이 슈퍼정렬 팀의 첫 번째 논문이며, 소피 자신이 그 논문의 저자다.

슈퍼정렬 팀은 작년 7월 결성되었으며, 다양한 시간 척도에서 발생할 수 있는 대규모 모델의 안전 문제에 대응하기 위해 OpenAI가 설립한 세 가지 안전 팀 중 하나다.
슈퍼정렬 팀은 인간을 능가하는 초지능의 안전성을 확보하기 위한 장기적인 미래를 담당하며, Ilya Sutskever와 Jan Leike가 이끌었다.

참고로 OpenAI는 겉보기에 안전 문제에 매우 신경 쓰는 듯 보이지만, 내부적으로 AI 안전 개발에 대한 의견 차이는 이미 비밀이 아니다.
이러한 갈등은 작년 11월 OpenAI 이사회 내부의 권력 다툼의 주요 원인으로 여겨진다.
인터넷에서는 Ilya Sutskever가 '쿠데타'를 주도한 이유로, 무언가를 목격하고 불안감을 느꼈다고 전해진다.
그리고 Ilya가 이끄는 이 슈퍼정렬 팀의 많은 구성원들도 Ilya 편에 섰으며, 이후 오트먼 지지를 표현하는 하트 이벤트에서도 기본적으로 침묵을 지켰다.
그러나 권력 다툼이 종결된 후, Ilya는 마치 OpenAI에서 증발한 듯 사라졌고, 외부에서는 온갖 소문이 돌았지만, 공개적으로 다시 나타난 적 없으며, 심지어 온라인상에서도 해명이나 부인조차 하지 않았다.
따라서 현재 슈퍼정렬 팀이 어떻게 되었는지는 알 길이 없다.
소피는 슈퍼정렬 팀의 일원이자 Ilya의 부하였으며, 반달 전 OpenAI에서 해고되어 네티즌들 사이에서는 오트먼의 '추후 계산'이라는 추측이 돌았다.

인재야, 그대는 머스크에게로 밤새 달려가다
외부에서는 아직 Q*의 전체 모습을 알 수 없지만, 여러 징후들이 그것이 대규모 모델과 강화학습, 검색 알고리즘 등을 통합하여 AI 추론 능력을 강화하는 데 초점을 맞추고 있음을 시사한다.
가장 화제성이 높은 소피 외에도, 아래 소개할 xAI에 새로 합류한 인재들의 연구 방향도 어느 정도 관련이 있다.
Qian Huang, 현재 스탠포드 대학교의 박사과정 학생이다.
작년 여름부터 Google DeepMind에서 근무했으며, 현재 트위터 프로필에 @xai라고 명시되어 있으나, 어떤 직책인지 알려지지 않았다.
그러나 GitHub 개인 홈페이지를 보면, 그녀의 연구 분야는 기계적 추론과 인간 추론을 통합하는 것으로, 특히 새로운 지식의 타당성, 설명 가능성 및 확장성을 중심으로 한다.

Eric Zelikman, 스탠포드 대학 박사과정 재학 중이며, 트위터에 "@xai 연구 중"이라고 명시했다.
그는 이전에 Google Research와 Microsoft Research에서 일한 경험이 있다.
개인 홈페이지에서 그는 "알고리즘이 의미 있는 표현과 추론을 배우는 방법(또는 가능한지 여부)에 매료되어 있으며, 이를 xAI에서 연구하고 있다"고 밝혔다.

올해 3월, 그가 속한 팀은 Quiet-Star 알고리즘을 발표했는데, 이 역시 Q*이며, 대규모 모델이 스스로 독립적으로 사고하도록 하는 것이 목적이다.

Aman Madaan, 카네기 멜론 대학교 언어기술연구소 박사과정 재학생.
그의 연구 분야는 대규모 언어 모델, 피드백 기반 생성, 코드 생성 및 자연어 추론의 융합 분야이며, 주된 관심사는 추론 시간 컴퓨팅(Inference-Time Compute)을 사용해 추론 능력(Reasoning)을 강화하는 것이다.
박사 과정 중 Aman은 Google Brain과 앨런 인공지능 연구소에서 연구원 및 협력자로 활동했으며, 그 이전에는 Oracle의 주요 기술자였다.

Pavel Izmailov을 포함한 새 직원들 덕분에, 머스크의 기술 인재 구조는 이제(머스크 본인 제외) 34명으로 확장되었으며, 초기 창립팀 12명 대비 약 2배 이상 성장했다.

새롭게 합류한 인원 중 중국계는 총 7명이며, 창립팀의 5명과 합쳐 모두 12명이다.
-
Xiao Sun, 이전에 Meta, IBM에서 근무했으며, 예일 대학에서 박사학위를 받았고, 베이징 대학교 동문.
-
Ting Chen, 이전에 Google DeepMind, Google Brain에서 근무했으며, 북경우정대학에서 학사학위를 받았다.
-
Juntang Zhuang, 이전에 OpenAI에서 근무했으며, DALL-3, GPT-4의 핵심 기여자로, 칭화대학에서 학사학위를, 석·박사는 예일 대학에서 받았다.
-
Xuechen Li, 올해 스탠포드 대학에서 박사학위를 받았으며, 알파카(Alpaca) 시리즈 대규모 모델의 핵심 기여자.
-
Lianmin Zheng, UC 버클리 컴퓨터과학 박사, 빅아카(Vicuna), 챗봇 아레나(Chatbot Arena)의 창시자.
-
Qian Huang, 스탠포드 대학 박사과정 재학생, 천진 난카이 고등학교 졸업.
-
Haotian Liu, 위스콘신 맥디슨 대학교, 절강대학에서 학사학위를 받았으며, LLaVA의 제1저자.
기관별로 보면, 구글, 스탠포드, 메타, OpenAI, 마이크로소프트 등에 집중되어 있으며, 모두 GPT 시리즈, 알파카·빅아카 시리즈, 그리고 구글·메타의 관련 대규모 모델 등 풍부한 대규모 모델 훈련 경험을 갖췄다.
입사 시점으로 보면, 대부분 올해 2~3월에 집중되어 있으며, 평균 5일에 한 명씩 13명이 입사했다. 작년 8~10월 사이에는 단 5명만 합류했다.
Grok의 진전과 연계하면, 머스크의 xAI가 각 단계마다 채용 전략을 어떻게 세웠는지 확인할 수 있다.
예를 들어 올해 3월 29일, 머스크가 갑작스럽게 Grok-1.5를 발표했는데, 문맥 길이가 기존 8192에서 128k로 급증하며 GPT-4와 동등한 수준이 되었다.
시간을 한 달 전으로 되돌리면(올해 2월), OpenAI 전직원 Juntang Zhuang이 xAI에 합류했다. 그는 OpenAI에서 GPT-4 Turbo의 128k 장문 문맥 지원 알고리즘을 개발한 인물이다.
올해 4월 15일에는 Grok-1.5V 다중모달 모델이 발표되었는데, 텍스트 외에도 차트, 스크린샷, 사진 등 다양한 시각 정보를 처리할 수 있다.
그리고 올해 3월에야 비로소 LLaVA의 제1저자 Haotian Liu가 막 합류했다. LLaVA는 엔드투엔드(end-to-end)로 훈련된 다중모달 대규모 모델로서 GPT-4V와 유사한 능력을 보여주었으며, 새 버전인 LLaVA-1.5는 11개 벤치마크에서 SoTA를 달성했다.

이제 과감하게 추측해볼 수 있다. 새 인재 영입을 통해 Grok은 어떤 새로운 업그레이드를 할 수 있을까?

네티즌: 어쨌든, Grok-1.5는 어디 있지?(아직 오픈소스로 공개되지 않았다)

하지만 어찌 됐든, 이전 머스크가 밝힌 인재 기준을 따르면, 이 네티즌이 진실을 꿰뚫었다:
다들 머스크 회사엔 인재뿐이라지만, 사실 머스크는 당신이 재능이 있든 없든 전혀 신경 안 쓴다. 그가 말하기를, 주당 80시간 일을 하면서 붕괴되지 않기만 하면 합류할 수 있다고 했다.

80시간?!
양자위가 계산해보니, 이건 주 7일 매일 11.5시간씩 일한다는 뜻 아닌가…
지능은 차치하고, 이런 일은 체력적으로 도저히 못하겠다.

참고 링크:
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News











