YC 인터뷰: 딥마인드를 설립한 그 사람이 지금 기다리는 AI의 ‘아인슈타인 순간’

2026.04.30

YC 인터뷰: 딥마인드를 설립한 그 사람이 지금 기다리는 AI의 ‘아인슈타인 순간’

“지속적인 학습, 장기 추론, 기억의 일부 측면 등 여러 문제가 아직 해결되지 않았으며, AGI는 이 모든 문제를 해결해야 한다.”

2026.04.30 - 09:17:02

Web3 심층 보도에 집중하고 흐름을 통찰

“지속적인 학습, 장기 추론, 기억의 일부 측면 등 여러 문제가 아직 해결되지 않았으며, AGI는 이 모든 문제를 해결해야 한다.”

정리 및 번역: TechFlow

게스트: 데미스 하사비스(Demis Hassabis, DeepMind 창립자, 2024년 노벨 화학상 수상자, Google DeepMind 책임자)

진행자: 게리 탄(Gary Tan)

팟캐스트 출처: Y Combinator

원제: Demis Hassabis: Agents, AGI & The Next Big Scientific Breakthrough

방송일: 2026년 4월 29일

편집자 서문

Google DeepMind CEO이자 노벨 화학상 수상자인 데미스 하사비스가 Y Combinator에 출연해, AGI(Artificial General Intelligence, 인공 일반 지능) 실현을 위한 핵심 진전 상황, 기업가들이 선두를 유지하기 위해 고려해야 할 전략, 그리고 다음 차례의 중대한 과학적 돌파구가 어디서 발생할지에 대해 논의했다. 심층 기술(Deep Tech) 분야 창업가들에게 가장 실용적인 통찰은 다음과 같다. 오늘날 10년간 진행될 심층 기술 프로젝트를 시작한다면, 반드시 AGI의 등장을 계획에 포함시켜야 한다. 또한 그는 DeepMind에서 분사된 AI 기반 제약회사 이소모픽 랩스(Isomorphic Labs)가 곧 중대한 발표를 예고했다.

핵심 발언 요약

AGI 경로 및 시간표

「현재 존재하는 기술 구성요소들은 거의 확실히 AGI 최종 아키텍처의 일부가 될 것이다.」
「지속 학습(continual learning), 장기 추론(long-term reasoning), 기억의 일부 측면 등 아직 해결되지 않은 문제들이 있으며, AGI는 이 모든 것을 완전히 해결해야 한다.」
「당신의 AGI 실현 시간표가 나와 같아서 약 2030년 정도라면, 오늘 당신이 심층 기술 프로젝트를 시작한다면, 중간 단계에서 AGI가 등장할 가능성도 반드시 고려해야 한다.」

기억과 컨텍스트 윈도우

「컨텍스트 윈도우는 대략 인간의 작업 기억(working memory)에 해당한다. 인간의 작업 기억은 평균적으로 7개의 숫자만 저장할 수 있지만, 우리는 백만 또는 천만 토큰 규모의 컨텍스트 윈도우를 보유하고 있다. 그러나 문제는 중요하지 않거나 오류가 있는 정보까지 모두 무차별적으로 집어넣는 데 있다. 현재 접근 방식은 상당히 거칠다.」
「실시간 영상 스트림을 처리하면서 모든 토큰을 저장하려 한다면, 백만 토큰으로도 약 20분밖에 버티지 못한다.」

추론의 한계

「나는 종종 Gemini로 바둑을 두며 관찰한다. 때때로 시스템은 특정 수가 나쁜 수임을 인지하지만, 더 나은 대안을 찾지 못하고 결국 다시 그 나쁜 수를 두는 경우가 있다. 정확한 추론 시스템이라면 이런 일이 일어나서는 안 된다.」
「한편으로는 국제수학올림피아드(IMO) 금메달 수준의 문제를 풀 수 있지만, 다른 방식으로 질문하면 초등학교 수학 수준의 오류를 범하기도 한다. 자기 사고 과정을 성찰하는 능력 자체가 여전히 부족해 보인다.」

에이전트와 창의성

「AGI에 도달하려면 사용자를 대신해 능동적으로 문제를 해결하는 시스템이 필수적이다. 에이전트가 바로 그 길이며, 우리는 이제 막 걸음마를 뗐다고 생각한다.」
「나는 아직 ‘바이브 코딩(vibe coding)’으로 앱스토어 순위 상위권에 오른 3A급 게임을 개발한 사례를 보지 못했다. 현재 투입되는 노력으로는 충분히 가능해야 하지만, 아직 그런 사례는 없다. 이는 도구나 프로세스 어디엔가 여전히 뭔가 부족하다는 뜻이다.」

지식 증류 및 소형 모델

「우리의 가정은, 최첨단 Pro 모델이 출시된 후 반년에서 1년 내에 그 능력을 매우 작은, 엣지 기기에서 실행 가능한 모델로 압축할 수 있다는 것이다. 현재까지 이론상 정보 밀도의 한계에 도달했다는 증거는 없다.」

과학적 발견 및 ‘아인슈타인 테스트’

「나는 이를 가끔 ‘아인슈타인 테스트’라고 부른다. 즉, 1901년 당시의 지식만으로 시스템을 훈련시킨 후, 그것이 아인슈타인이 1905년에 도출한 특수 상대성 이론을 포함한 모든 성과를 독자적으로 유도해내는지를 확인하는 테스트다. 이 테스트를 통과하게 되면, 그러한 시스템은 완전히 새로운 개념을 창조하는 데 근접하게 된다.」
「밀레니엄 대상 문제(Millennium Prize Problems) 하나를 해결하는 것만으로도 대단한 성과다. 그러나 그보다 더 어려운 것은, 정상급 수학자들이 동일하게 심오하고 평생을 바쳐 연구할 가치가 있다고 인정할 만한 새로운 밀레니엄 대상 문제들을 제시하는 것이다.」

심층 기술 창업 조언

「어려운 문제를 추구하든 쉬운 문제를 추구하든, 사실 별반 차이가 없다. 다만 어려움의 형태가 다를 뿐이다. 인생은 짧고, 시간과 에너지는 한정되어 있으므로, 자신이 하지 않으면 정말 아무도 하지 않을 일을 선택하라.」

AGI 실현 경로

게리 탄: 당신은 아마도 누구보다 오래 AGI를 고민해온 사람일 것이다. 현재의 패러다임을 바탕으로 볼 때, 우리가 이미 확보한 AGI 최종 아키텍처의 비중은 어느 정도이며, 지금 근본적으로 부족한 것은 무엇인가?

데미스 하사비스: 대규모 사전 훈련, RLHF(Reinforcement Learning from Human Feedback), 사고 연쇄(Chain-of-Thought) 등은 분명 AGI 최종 아키텍처의 일부가 될 것이다. 이러한 기술들은 지금까지 너무나 많은 것을 입증해왔다. 나는 2년 뒤에 이 모든 것이 완전히 잘못된 길이라는 결론이 나올 것이라고 상상조차 하기 어렵다. 그것은 말이 되지 않는다. 그러나 기존 기술 위에 아직 한두 가지 중요한 요소가 부족할 수 있다. 지속 학습(continual learning), 장기 추론(long-term reasoning), 기억의 일부 측면 등은 아직 해결되지 않은 문제들이다. AGI는 이 모든 것을 해결해야 한다. 기존 기술에 점진적 혁신을 더하면 충분히 확장될 수도 있지만, 한두 가지 중대한 핵심 돌파구가 여전히 남아 있을 가능성도 있다. 나는 그 수가 두 개를 넘지 않을 것이라고 본다. 그런 미해결 핵심 요소가 존재할지 여부에 대한 내 개인적 판단은 확률적으로 50대 50 정도다. 따라서 Google DeepMind에서는 양쪽 방향 모두를 동시에 추진하고 있다.

게리 탄: 나는 여러 에이전트 시스템을 직접 다뤄보았는데, 가장 놀라운 점은 그 모든 시스템의 기반이 동일한 가중치 집합이라는 것이다. 그래서 지속 학습 개념은 특히 흥미롭다. 현재 우리는 마치 테이프로 임시 고정하듯, ‘야간 몽상 주기(nighttime dreaming cycles)’ 같은 방법을 쓰고 있지 않은가.

데미스 하사비스: 그렇다. 그런 몽상 주기는 꽤 흥미롭다. 우리는 과거부터 상황 기억(situational memory) 통합 문제를 고민해왔다. 내가 박사 과정에서 연구한 주제는 해마체가 어떻게 새 지식을 기존 지식 구조에 우아하게 통합하는가였다. 뇌는 이 일을 놀라울 정도로 잘 수행한다. 특히 수면 중, 특히 빠른 눈 움직임(REM) 수면 단계에서 중요한 경험을 재생해 학습한다. 우리가 처음 개발한 Atari 게임 프로그램 DQN(Deep Q-Network, 2013년 DeepMind에서 발표한 딥 강화학습 기반 Atari 게임 플레이어)이 Atari 게임을 익힐 수 있었던 핵심 기법 중 하나는 ‘경험 재생(experience replay)’이었다. 이는 신경과학에서 영감을 받아, 성공적인 행동 경로를 반복해서 재생하는 방식이었다. 이건 2013년의 이야기인데, AI 분야에서는 거의 고대사에 속하지만, 당시에는 매우 결정적이었다.

당신 말씀에 동의한다. 지금 우리는 정말로 테이프로 임시 고정하고 있다. 모든 것을 컨텍스트 윈도우에 밀어 넣는다. 이건 어색해 보인다. 우리가 만든 것이 생물학적 뇌가 아니라 기계라 하더라도, 이론적으로 백만, 천만 단위의 컨텍스트 윈도우를 가질 수 있고, 기억도 완벽할 수 있지만, 검색 및 조회 비용은 여전히 존재한다. 지금 당장 구체적인 의사결정을 해야 하는 순간에, 모든 정보를 저장할 수 있다 하더라도 실제로 관련 있는 정보를 찾아내는 것은 간단치 않다. 따라서 기억 분야에는 여전히 큰 혁신의 여지가 있다.

게리 탄: 솔직히 말해, 백만 토큰 규모의 컨텍스트 윈도우는 내가 예상했던 것보다 훨씬 크며, 다양한 일을 해낼 수 있다.

데미스 하사비스: 대부분의 적절한 용도에서는 충분히 크다. 하지만 컨텍스트 윈도우는 대략 인간의 작업 기억에 해당한다고 생각해보라. 인간의 작업 기억은 평균적으로 단지 7개의 숫자만 담을 수 있지만, 우리는 백만에서 천만 단위의 컨텍스트 윈도우를 갖는다. 문제는 중요하지 않거나 오류가 있는 정보까지 무차별적으로 모두 집어넣는 데 있다. 현재의 접근 방식은 상당히 거칠다. 그리고 만약 지금 실시간 영상 스트림을 처리하려 한다면, 모든 토큰을 단순히 기록하려 한다면, 백만 토큰은 약 20분 정도밖에 버티지 못한다. 그러나 시스템이 당신의 삶을 한두 달간 이해하도록 하려 한다면, 이는 턱없이 부족하다.

게리 탄: DeepMind는 전통적으로 강화학습과 탐색에 깊이 몰입해 왔으며, 이러한 철학이 현재 Gemini를 구축하는 과정에 얼마나 깊이 내재되어 있는가? 강화학습은 여전히 과소평가되고 있는가?

데미스 하사비스: 아마도 여전히 과소평가되고 있을 것이다. 이 분야에 대한 관심은 오르락내리락 한다. DeepMind가 설립된 첫날부터 우리는 에이전트 시스템을 개발해왔다. Atari와 AlphaGo에서 수행한 모든 작업은 본질적으로 목표 달성, 의사결정, 계획 수립이 가능한 강화학습 기반 에이전트에 해당한다. 물론 당시 우리는 복잡도를 통제할 수 있는 게임 분야를 선택했고, 점차 더 복잡한 게임으로 확장해 나갔다. AlphaGo 이후에는 AlphaStar를 개발했으며, 사실상 가능한 모든 게임을 다 해보았다.

다음 질문은, 이러한 모델을 게임 모델에 국한되지 않고, 세계 모델(world model)이나 언어 모델처럼 보다 일반화된 방향으로 확장할 수 있는가 하는 것이다. 지난 몇 년간 우리는 이 작업을 해왔다. 오늘날 선도적인 모든 모델의 사고 방식과 사고 연쇄 추론은 본질적으로 AlphaGo가 개척한 방식의 회귀라 할 수 있다. 우리가 당시 한 많은 일들이 오늘날과 매우 밀접하게 관련되어 있으며, 우리는 그런 오래된 아이디어들을 다시 들여다보고, 더 큰 규모와 더 보편적인 방식으로 적용하고 있다. 여기에는 몬테카를로 트리 탐색(Monte Carlo tree search)을 포함한 다양한 강화학습 기법들도 포함된다. AlphaGo와 AlphaZero의 아이디어는 오늘날의 기초 모델과 극도로 밀접하게 연결되어 있으며, 향후 몇 년간의 진전 중 상당 부분이 바로 이곳에서 나올 것이라고 생각한다.

지식 증류 및 소형 모델

게리 탄: 지금은 더 똑똑해지려면 더 큰 모델이 필요하지만, 동시에 지식 증류 기술도 발전해 소형 모델도 상당히 빨라지고 있다. 여러분의 Flash 모델은 매우 강력하며, 선두 모델의 95% 수준의 성능을 제공하지만, 비용은 10분의 1에 불과하다. 맞는가?

데미스 하사비스: 이것은 우리 핵심 경쟁력 중 하나라고 생각한다. 우선 최대 규모의 모델을 구축해 최첨단 능력을 확보해야 한다. 우리에게 가장 큰 강점 중 하나는 그런 능력을 빠르게 증류·압축해 점점 더 작은 모델로 만들 수 있다는 것이다. 지식 증류 기법 자체도 우리가 발명한 것으로, 지금도 세계 최고 수준이다. 또한 이 작업을 추진할 강력한 사업적 동기도 있다. 우리는 전 세계에서 가장 큰 AI 애플리케이션 플랫폼을 운영하고 있다. AI 개요(AI Overviews), AI 모드(AI Mode), Gemini 등이 있으며, 현재 Google의 모든 제품—지도, 유튜브 등—이 Gemini 혹은 관련 기술을 통합하고 있다. 이는 수십억 명의 사용자와 십억 명 단위의 사용자 기반을 가진 여러 제품을 아우른다. 따라서 이 제품들은 극도로 빠르고, 효율적이며, 비용이 낮고, 지연 시간이 짧아야 한다. 이 때문에 우리는 Flash와 더 작고 가벼운 Flash-Lite 모델을 극한의 효율성으로 만드는 데 강력한 동기를 부여받고 있으며, 궁극적으로는 사용자의 다양한 작업에도 최적화된 서비스를 제공하고자 한다.

게리 탄: 이런 소형 모델이 과연 어느 수준까지 ‘영리’해질 수 있을지 궁금하다. 지식 증류에는 한계가 있는가? 50B 또는 400B 규모의 모델이 오늘날 최대 규모의 선두 모델만큼 똑똑해질 수 있는가?

데미스 하사비스: 나는 아직 정보 이론적 한계에 도달했다고 보지 않는다. 적어도 지금까지는 누구도 그런 한계에 도달했다고 주장하지 못했다. 언젠가 정보 밀도의 어떤 천장에 도달할 수도 있겠지만, 현재 우리의 가정은, 최첨단 Pro 모델이 출시된 후 반년에서 1년 내에 그 능력을 매우 작고, 거의 엣지 기기에서도 실행 가능한 모델로 압축할 수 있다는 것이다. Gemma 모델에서도 이 점을 확인할 수 있다. 우리의 Gemma 4 모델은 동일한 규모에서 뛰어난 성능을 보인다. 이는 모두 대량의 지식 증류 기술과 소형 모델 효율성 최적화 기술을 활용한 결과다. 따라서 나는 이론적 한계라는 것을 아직 보지 못했고, 그 한계에 도달하기까지는 아직 아주 멀었다고 생각한다.

게리 탄: 지금은 정말 놀라운 현상이 있는데, 바로 엔지니어가 할 수 있는 작업량이 약 6개월 전보다 500~1000배 증가했다는 것이다. 이 방에 있는 일부 사람들은 2000년대의 한 명의 Google 엔지니어가 하던 작업량의 약 1000배를 처리하고 있다. 스티브 예그(Save Yegge)가 이에 대해 언급한 바 있다.

데미스 하사비스: 나는 이 사실에 매우 흥분한다. 소형 모델에는 여러 용도가 있다. 첫째, 비용이 저렴하고, 속도가 빠르다는 점도 큰 장점이다. 코드 작성이나 기타 작업에서, 특히 시스템과 협업할 때 반복 속도가 훨씬 빨라진다. 최첨단 수준이 아니더라도, 예를 들어 최첨단의 90~95% 수준만 되더라도 충분하며, 그 10%의 성능 차이보다 반복 속도에서 얻는 이득이 훨씬 크다.

또 다른 주요 방향은 이러한 모델을 엣지 기기에서 실행하는 것이다. 단순한 효율성 향상뿐 아니라, 프라이버시와 보안 측면에서도 중요하다. 매우 민감한 개인정보를 처리하는 다양한 기기나 로봇을 생각해보라. 가정용 로봇의 경우, 로컬에서 효율적이고 강력한 모델을 실행하되, 특정 상황에서만 클라우드의 대규모 모델에 작업을 위임하는 방식이 이상적이다. 오디오 및 비디오 스트림은 모두 로컬에서 처리되고, 데이터는 로컬에 머무르며, 나는 이것이 궁극적인 이상 상태가 될 것이라고 상상한다.

기억과 추론

게리 탄: 컨텍스트와 기억으로 돌아가자. 현재 모델은 상태를 유지하지 않으며, 지속 학습 능력을 갖추게 되면 개발자 경험은 어떻게 바뀔까? 그런 모델을 어떻게 안내해야 하는가?

데미스 하사비스: 이 질문은 매우 흥미롭다. 지속 학습의 부재는 현재 에이전트가 전체 과제를 완료하지 못하는 핵심 병목 현상이다. 현재의 에이전트는 과제의 일부 구간에서는 유용하지만, 이를 조합해 멋진 일을 할 수는 있어도, 사용자가 처한 구체적인 환경에 적응하지는 못한다. 이것이 바로 에이전트가 아직 ‘발사 후 방치(launch-and-forget)’ 방식으로 작동하지 못하는 이유이며, 사용자의 구체적인 상황을 학습할 수 있어야 한다. 완전한 일반 지능에 도달하려면 반드시 이 문제를 해결해야 한다.

게리 탄: 추론 분야는 어느 정도까지 왔는가? 모델의 사고 연쇄 능력은 매우 강력하지만, 똑똑한 학부생도 범하지 않을 실수를 여전히 저지른다. 구체적으로 어떤 부분을 개선해야 하며, 추론 분야에서 어떤 진전이 예상되는가?

데미스 하사비스: 사고 패러다임 자체에 여전히 엄청난 혁신의 여지가 있다. 우리가 지금 하는 일은 여전히 상당히 거칠고, 상당히 폭력적이다. 사고 연쇄 과정을 모니터링하고, 사고 중간에 개입하는 것과 같은 여러 개선 방향이 있다. 나는 우리 시스템이든 경쟁사의 시스템이든, 어느 정도는 과도하게 사고하며 순환에 빠진다고 자주 느낀다.

나는 종종 Gemini로 바둑을 두며 관찰한다. 모든 선도 기초 모델은 바둑에서 사실상 매우 약하다는 점이 흥미롭다. 바둑은 완전히 이해된 영역이기에, 그 사고 과정을 살펴보는 것이 매우 유용하다. 나는 그 수가 잘못된 방향으로 흐르고 있는지, 추론이 유효한지 빠르게 판단할 수 있다. 우리가 관찰한 바에 따르면, 시스템은 어떤 수가 나쁜 수임을 인지하면서도 더 나은 대안을 찾지 못하고, 결국 원래의 나쁜 수로 돌아가는 경우가 있다. 정확한 추론 시스템이라면 이런 일이 일어나서는 안 된다.

이런 극단적인 격차는 여전히 존재하지만, 이를 해결하기 위해 필요한 조정은 한두 가지에 불과할 수도 있다. 그래서 ‘톱니 모양 지능(jagged intelligence)’이라는 표현이 나오는 것이다. 한편으로는 IMO 금메달 수준의 문제를 풀 수 있지만, 다른 방식으로 질문하면 초등학교 수학 수준의 오류를 범하기도 한다. 자기 사고 과정을 성찰하는 능력 자체가 여전히 부족해 보인다.

에이전트의 실제 능력

게리 탄: 에이전트는 큰 주제다. 누군가는 이를 과장이라고 말한다. 개인적으로는 이제 막 시작 단계라고 생각한다. DeepMind 내부에서 에이전트의 실제 능력에 대한 판단은 외부의 홍보와 얼마나 차이가 나는가?

데미스 하사비스: 당신의 말에 동의한다. 우리는 이제 막 시작한 것이다. AGI에 도달하려면 사용자를 대신해 능동적으로 문제를 해결하는 시스템이 필수적이다. 이는 우리에게 항상 명확했다. 에이전트가 바로 그 길이며, 우리는 이제 막 걸음마를 뗐다고 생각한다. 모두가 에이전트를 더 효과적으로 협업하게 만드는 방법을 탐색하고 있으며, 우리는 개인 실험을 통해 많은 탐구를 해왔다. 이 방에 있는 많은 사람들도 마찬가지일 것이다. 에이전트를 워크플로에 얼마나 자연스럽게 통합할 수 있는가, 단순한 보조 기능이 아니라 근본적인 일을 수행하게 할 수 있는가. 현재 우리는 여전히 실험 단계에 있다. 최근 두세 달 사이에서야 비로소 특별히 가치 있는 시나리오를 진정으로 발견하기 시작했다. 기술도 이제야 그 단계에 도달해, 단순한 데모 수준을 넘어 사용자의 시간과 효율성에 실질적인 가치를 제공하는 단계에 이르렀다.

나는 종종 수십 개의 에이전트를 동시에 실행해 수십 시간 동안 돌리는 사례를 본다. 그러나 그 결과물이 투입에 비해 적절한 수준인지 확신하지는 못하겠다.

우리는 아직 ‘바이브 코딩’으로 앱스토어 순위 상위권에 오른 3A급 게임을 만들어낸 사례를 보지 못했다. 나는 직접 코딩해본 적이 있고, 이 방에 있는 많은 사람들도 훌륭한 소규모 데모를 만들어본 적이 있다. 나는 지금 30분 만에 Theme Park의 프로토타입을 만들 수 있지만, 17살 때는 이걸 만드는 데 6개월이 걸렸다. 나는 온종일 여름을 쏟아부린다면 정말 놀라운 결과물을 만들 수 있을 것이라는 느낌을 받는다. 그러나 여전히 공예적 감각과 인간의 영혼, 취향이 필요하며, 이를 반드시 자신이 만드는 모든 제품에 담아야 한다. 사실 지금까지 어떤 아이도 1,000만 부 이상 판매된 히트 게임을 만들지 못했다. 현재 도구의 투입 수준으로는 충분히 가능해야 하지만, 아직 이루어지지 않았다. 따라서 무언가가 부족한 것이다. 아마도 프로세스 때문일 수도 있고, 도구 때문일 수도 있다. 나는 앞으로 6~12개월 내에 그런 성과를 목격하게 될 것이라고 예측한다.

게리 탄: 그 과정의 어느 정도가 자동화될 것인가? 나는 처음부터 완전 자동화되지는 않을 것이라고 생각한다. 더 현실적인 경로는 이 방에 있는 사람들이 먼저 1,000배의 효율성을 달성하고, 그런 도구를 사용해 베스트셀러 앱이나 베스트셀러 게임을 만든 사람이 나타난 후, 점차 더 많은 단계가 자동화되는 것이다.

데미스 하사비스: 그렇다. 바로 그게 당신이 먼저 보게 될 것이다.

게리 탄: 또 한 가지 이유는, 실제로 그렇게 하고 있는 사람들이 분명히 있지만, 에이전트가 얼마나 큰 도움이 되었는지를 공개하려 하지 않는다는 것이다.

데미스 하사비스: 그럴 수도 있다. 그러나 창의성 문제에 대해 이야기하고 싶다. 나는 자주 AlphaGo의 사례를 든다. 모두가 두 번째 경기의 37수를 알고 있다. 나에게는 그런 순간이 오기를 기다려왔고, 그것이 나타난 후에야 알파폴드(AlphaFold) 같은 과학 프로젝트를 시작했다. 우리는 서울에서 돌아온 다음 날 바로 알파폴드를 시작했는데, 그건 10년 전이다. 이번 한국 방문은 알파고 10주년을 기념하기 위한 것이다.

하지만 단지 37수를 두는 것만으로는 충분하지 않다. 그것은 멋지고 유용하지만, 이 시스템이 바둑 자체를 발명할 수 있는가? 예를 들어 “5분이면 규칙을 배울 수 있지만, 평생을 걸쳐도 정복하기 어려운 게임, 미학적으로 우아하며, 한 오후면 한 판을 끝낼 수 있다”는 상위 수준의 설명을 주고, 시스템이 그 결과로 바둑을 반환해주는가? 오늘날의 시스템은 이를 수행할 수 없다. 문제는 왜 그런가?

게리 탄: 이 방에 있는 누군가가 이미 그것을 해냈을 수도 있다.

데미스 하사비스: 누군가가 이미 해냈다면, 문제는 시스템에 뭔가 부족한 것이 아니라, 우리가 시스템을 사용하는 방식에 문제가 있다는 뜻일 수 있다. 그것이 바로 정답일 수도 있다. 오늘날의 시스템이 이미 그런 능력을 가지고 있을 수도 있고, 다만 충분히 천재적인 창작자가 그것을 이끌고, 프로젝트의 영혼을 제공하며, 도구와 완전히 융합하여 거의 하나가 되어야 한다는 뜻일 수 있다. 만약 당신이 이 도구들에 매몰되어 있고, 깊은 창의력을 갖추고 있다면, 상상할 수 없는 것을 만들어낼 수도 있다.

오픈소스 및 멀티모달 모델

게리 탄: 주제를 바꿔 오픈소스에 대해 이야기해보자. 최근 Gemma의 출시로 매우 강력한 모델을 로컬에서 실행할 수 있게 되었다. 이에 대해 어떻게 생각하는가? AI는 사용자가 직접 통제하는 도구가 되어 클라우드 중심에서 벗어날 것인가? 이는 누가 이 모델을 사용해 제품을 만들 수 있는지를 바꿀 것인가?

데미스 하사비스: 우리는 오픈소스와 개방 과학을 굳건히 지지한다. 당신이 언급한 알파폴드는 전부 무료로 공개했다. 우리의 과학적 연구는 지금까지도 최고 수준의 학술지에 게재되고 있다. Gemma의 경우, 동일한 규모에서 세계 최고 수준의 모델을 만들고자 했다. 현재 Gemma의 다운로드 수는 약 4,000만 건에 달하며, 출시된 지 불과 2주 반밖에 지나지 않았다.

나는 오픈소스 분야에서 서방 기술 스택의 존재가 중요하다고 생각한다. 중국의 오픈소스 모델은 매우 훌륭하며, 현재 오픈소스 분야에서 선두를 달리고 있다. 그러나 우리는 Gemma가 동일한 규모에서 매우 경쟁력이 있다고 본다.

우리에게는 리소스 문제도 있다. 아무도 여유 있는 컴퓨팅 파워를 두 개의 전면적 최첨단 모델 개발에 동시에 쓸 수 없다. 따라서 현재 우리의 결정은 다음과 같다. 엣지 모델은 안드로이드, 안경, 로봇 등에 사용되므로, 일단 기기에 배포되면 본래 노출되기 때문에, 차라리 완전히 개방하는 것이 좋다. 우리는 나노 수준에서 개방 전략을 일관되게 적용하고 있으며, 전략적으로도 타당하다.

게리 탄: 무대에 오르기 전에 내가 만든 AI 운영체제를 보여드렸다. 나는 음성으로 직접 Gemini와 상호작용할 수 있었다. 당신께 보여드리려고 하니 꽤 긴장했지만, 의외로 잘 작동했다. Gemini는 처음부터 멀티모달로 설계되었다. 나는 많은 모델을 사용해봤지만, 음성에서 직접 모델로 이어지는 상호작용과 도구 호출 능력의 깊이, 컨텍스트 이해력 면에서 현재 Gemini와 맞설 수 있는 모델은 없다.

데미스 하사비스: 그렇다. Gemini 시리즈가 아직 충분히 인식되지 않은 강점 중 하나는, 처음부터 멀티모달로 구축되었다는 점이다. 이는 초기 단계에서 텍스트만 다루는 것보다 훨씬 어렵지만, 장기적으로는 이로부터 큰 이익을 얻을 것이라고 믿었고, 이제 그 이익이 실현되기 시작했다. 예를 들어, 세계 모델 분야에서는 Gemini 위에 Genie(DeepMind가 개발한 생성형 상호작용 환경 모델)를 구축했다. 로봇 분야에서도 마찬가지로, Gemini Robotics는 멀티모달 기반 모델 위에 구축될 것이며, 멀티모달 분야에서의 우리의 강점은 경쟁력 있는 보호막이 될 것이다. 우리는 웨이모(Waymo, Alphabet 산하 자율주행 기업)에서도 점차 Gemini를 더 많이 활용하고 있다.

당신의 실제 세계로 따라 들어오는 디지털 어시스턴트를 상상해보라. 아마도 당신의 휴대폰이나 안경 위에 있을 것이다. 그것은 당신 주변의 물리적 세계와 환경을 이해해야 한다. 우리의 시스템은 이 분야에서 매우 강력하다. 우리는 계속해서 이 방향에 투자할 것이며, 이와 같은 문제에서 우리가 갖는 선도적 우위는 매우 크다고 생각한다.

게리 탄: 추론 비용이 급속히 하락하고 있다. 추론이 사실상 무료가 되면 무엇이 가능해질까? 당신 팀의 최적화 방향은 이에 따라 바뀔 것인가?

데미스 하사비스: 나는 추론이 진정으로 무료가 될지는 확신하지 못한다. 제븐스 역설(Jevons' Paradox, 효율성이 향상됨에도 불구하고 총 자원 소비량이 오히려 증가하는 현상)이 존재하기 때문이다. 나는 결국 모든 사람이 가용한 컴퓨팅 파워를 전부 사용하게 될 것이라고 생각한다. 수백만 개의 에이전트가 협업하는 집단을 상상하거나, 소규모 에이전트 그룹이 여러 방향으로 동시에 사고한 후 통합하는 것도 가능하다. 우리는 모두 이러한 방향을 실험하고 있으며, 이 모든 것이 가용한 추론 리소스를 소비할 것이다.

에너지 측면에서는, 우리가 제어 가능한 핵융합, 상온 초전도체, 최적의 배터리 기술 등의 몇 가지 문제를 해결한다면, 나는 재료 과학을 통해 이를 달성할 수 있다고 생각한다. 그러면 에너지 비용은 거의 0에 수렴할 수 있다. 그러나 칩 제조와 같은 물리적 제약은 여전히 존재하며, 적어도 수십 년은 이 문제가 지속될 것이다. 따라서 추론 단계에는 여전히 할당량 제한이 있을 것이며, 효율적인 사용이 여전히 요구될 것이다.

다음 과학적 돌파구

게리 탄: 다행히 소형 모델이 점점 더 영리해지고 있다. 이 방에는 생물학 및 생명공학 분야의 창업가들이 많다. 알파폴드 3(AlphaFold 3)은 단백질을 넘어 더 광범위한 생물 분자로 확장되었다. 완전한 세포 시스템을 모델링하는 데는 얼마나 더 남았는가? 이는 완전히 다른 난이도 수준의 문제인가?

데미스 하사비스: 이소모픽 랩스(Isomorphic Labs)는 매우 좋은 성과를 내고 있다. 알파폴드는 단지 약물 발견 프로세스의 한 단계일 뿐이며, 우리는 인접한 생화학 연구, 적절한 성질을 갖춘 화합물 설계 등도 진행 중이며, 곧 중대한 발표가 있을 것이다.

우리의 궁극적 목표는 완전한 가상 세포(virtual cell)를 만드는 것이다. 이는 외부 자극에 반응할 수 있는 완전 기능의 세포 시뮬레이터로, 그 출력이 실험 결과와 충분히 유사하고 실제적인 용도로 사용 가능해야 한다. 이를 통해 수많은 탐색 단계를 건너뛸 수 있으며, 다른 모델을 훈련시키기 위한 방대한 합성 데이터를 생성해 실제 세포의 행동을 예측할 수 있도록 할 수 있다.

완전한 가상 세포 구현까지는 약 10년이 걸릴 것으로 추정한다. DeepMind 과학팀은 세포핵부터 시작하고 있다. 세포핵은 비교적 독립된 체계이기 때문이다. 이런 문제의 핵심은, 복잡도가 적절한 ‘슬라이스’를 잘라내는 것이다. 즉, 그 슬라이스가 충분히 자율적이어야 하며, 입력과 출력을 합리적으로 근사할 수 있어야 하며, 이 하위 시스템에 집중할 수 있어야 한다. 세포핵은 이 관점에서 매우 적합하다.

또 다른 문제는 데이터 부족이다. 나는 전자현미경 및 기타 영상 기술 분야의 최고 수준의 과학자들과 이야기를 나눈 바 있다. 살아 있는 세포를 죽이지 않고 영상화할 수 있다면, 그것은 혁명적일 것이다. 왜냐하면 그렇게 되면 이 문제를 시각 문제로 전환할 수 있고, 우리는 시각 문제를 어떻게 풀어야 하는지 이미 알고 있기 때문이다. 그러나 현재로서는 나노미터 수준의 해상도에서 살아 있는 동적 세포를 손상시키지 않고 영상화할 수 있는 기술은 존재하지 않는 것으로 안다. 정적 이미지는 이미 매우 정교하게 촬영할 수 있으며, 이는 매우 흥미롭지만, 이를 직접 시각 문제로 전환하기에는 충분하지 않다.

따라서 두 가지 접근 방식이 있다. 하나는 하드웨어 및 데이터 중심의 해결책이고, 다른 하나는 이러한 동역학 시스템을 시뮬레이션할 수 있는 더 나은 학습 가능한 시뮬레이터를 구축하는 것이다.

게리 탄: 당신은 생물학뿐만 아니라, 재료 과학, 약물 발견, 기후 모델링, 수학 등 다양한 분야를 바라보고 있다. 만약 반드시 순위를 매겨야 한다면, 향후 5년 동안 어떤 과학 분야가 가장 근본적으로 변화될 것인가?

데미스 하사비스: 각 분야 모두 흥미롭다. 이것이 바로 내가 지금까지 가장 큰 열정을 갖고, 30년 이상 AI 분야에 몰입해온 이유이기도 하다. 나는 항상 AI가 과학적 이해, 과학적 발견, 의학, 그리고 우리가 우주를 이해하는 방식을 진전시키는 궁극의 도구가 될 것이라고 믿어왔다.

우리가 처음 미션을 표현한 방식은 두 단계로 구성되어 있었다. 첫 번째는 지능을 해결하는 것, 즉 AGI를 구축하는 것이었고, 두 번째는 그것을 이용해 다른 모든 문제를 해결하는 것이었다. 그러나 이후 표현을 조정해야 했는데, 누군가 “정말 모든 문제를 해결한다는 뜻입니까?”라고 물어보았기 때문이다. 우리는 정말로 그 의미로 말한 것이다. 이제 사람들은 이것이 무엇을 의미하는지 점차 이해하고 있다. 구체적으로 말하자면, 나는 ‘근노드 문제(root node problems)’라고 부르는 과학 분야를 가리키는 것이다. 즉, 한 번의 돌파가 새로운 발견의 분기점을 열 수 있는 분야들이다. 알파폴드는 우리가 원하는 바의 전형적인 사례다. 전 세계 300만 명 이상의 연구자 중 거의 모든 생물학 연구자가 지금 알파폴드를 사용하고 있다. 나는 제약사 경영진 친구들로부터, 앞으로 발견되는 거의 모든 약물이 약물 발견 프로세스의 어느 한 단계에서 알파폴드를 사용하게 될 것이라고 들었다. 우리는 이를 자랑스럽게 생각하며, 이것이 바로 우리가 AI를 통해 이루고자 하는 영향력이다. 그러나 이는 단지 시작일 뿐이다.

나는 AI가 도움을 줄 수 없는 과학 또는 공학 분야를 생각해내지 못한다. 당신이 언급한 분야들 역시 ‘알파폴드 1 시대’에 접어들었다고 생각한다. 결과는 이미 매우 유망하지만, 해당 분야의 주요 과제를 완전히 해결하지는 못했다. 향후 2년 동안, 재료 과학에서 수학에 이르기까지 모든 분야에서 많은 진전을 볼 수 있을 것이다.

게리 탄: 이것은 프로메테우스처럼, 인류에게 완전히 새로운 능력을 부여하는 것 같다.

데미스 하사비스: 그렇다. 물론 프로메테우스 이야기의 교훈처럼, 우리는 이 능력이 어떻게 사용되고, 어디에 사용되며, 동일한 도구가 오남용될 위험성에 대해서도 신중하게 대처해야 한다.

성공 경험

게리 탄: 이 방에는 과학 분야에 AI를 적용하려는 창업가들이 많다. 당신의 관점에서, 진정으로 선도적인 연구를 이끄는 창업사와 단지 기초 모델 위에 API 계층을 얹고 ‘AI for Science’라고 자칭하는 창업사의 차이는 무엇인가?

데미스 하사비스: 만약 내가 지금 이 자리에 앉아 Y Combinator에서 프로젝트를 심사한다면 어떻게 할 것인가를 생각해보았다. 하나는 AI 기술의 향방을 예측해야 한다는 점인데, 이 자체가 매우 어렵다. 그러나 나는 AI의 향방을 다른 심층 기술 분야와 결합하는 데 큰 기회가 있다고 확신한다. 이 교차점, 즉 재료, 의학 또는 원자 세계를 다루는 다른 진정으로 어려운 과학 분야는, 예측 가능한 미래 동안 단순한捷徑이 없을 것이다. 이 분야들은 다음 기초 모델 업데이트로 인해 압도당하지 않을 것이다. 그러나 방어력이 강한 방향을 찾고자 한다면, 나는 이를 추천할 것이다.

나는 항상 심층 기술을 선호해왔다. 진정으로 지속 가능하고 가치 있는 것은 결코 쉽지 않다. 나는 항상 심층 기술에 끌렸다. 2010년에 우리가 시작했을 때, AI는 이미 심층 기술이었다—투자자들은 “이건 이미 실패한 기술이라는 걸 우리는 이미 안다”고 말했고, 학계도 이는 1990년대에 시도되었으나 실패한 소수의 분야라고 여겼다. 그러나 당신이 자신의 아이디어에 대한 믿음이 있다면—왜 이번에는 다르고, 당신의 배경은 어떤 독특한 조합을 갖추고 있는가—이상적으로는 당신 스스로가 기계학습과 응용 분야 모두에서 전문가이거나, 그런 창립 팀을 구성할 수 있어야 한다. 이 안에는 거대한 영향력과 가치를 창출할 수 있는 잠재력이 있다.

게리 탄: 이 정보는 매우 중요하다. 어떤 일이 성공한 후에는 당연해 보이지만, 성공하기 전에는 모두가 당신을 반대한다.

데미스 하사비스: 그렇다. 따라서 당신은 반드시 자신이 진정으로 열정을 갖는 일을 해야 한다. 나의 경우, 무슨 일이 있어도 나는 AI를 하겠다고 결심했다. 어릴 때부터 이것이 내가 생각할 수 있는 가장 영향력 있는 일이었다. 실제로도 그랬고, 그렇지 않을 수도 있지만, 어쩌면 우리는 50년을 앞서 간 것일 수도 있다. 또한 이것이 내가 생각할 수 있는 가장 흥미로운 일이다. 설령 지금 우리가 여전히 작은 차고에서 AI를 만들고 있지 않더라도, 나는 계속해서 이를 시도할 것이다. 아마 학계로 돌아갈 수도 있지만, 나는 어떤 방식으로든 계속해나갈 것이다.

게리 탄: 알파폴드는 당신이 한 방향을 추구하고, 그 방향을 제대로 맞췄던 사례다. 어떤 과학 분야가 알파폴드 수준의 돌파구를 낳기에 적합한가? 목표 함수와 같은 규칙이 있는가?

데미스 하사비스: 나는 이 내용을 시간을 내어 정리해야겠다. 알파고와 알파폴드 등 모든 알파(Alpha) 프로젝트에서 얻은 교훈은, 현재의 기술이 다음 세 가지 조건을 만족할 때 가장 잘 작동한다는 것이다. 첫째, 문제는 거대한 조합 탐색 공간을 가져야 하며, 그 공간은 클수록 좋다. 바둑의 수의 공간과 단백질의 구조 공간은 모두 우주에 존재하는 원자 수보다 훨씬 크다. 둘째, 목표 함수를 명확하게 정의할 수 있어야 한다. 예를 들어 단백질의 자유 에너지 최소화나 바둑에서 이기는 것처럼, 시스템이 그래디언트 상승을 수행할 수 있어야 한다. 셋째, 충분한 데이터가 있어야 하거나, 대량의 분포 내 합성 데이터를 생성할 수 있는 시뮬레이터가 있어야 한다.

이 세 가지 조건이 충족된다면, 오늘날의 방법으로도 매우 먼 길을 갈 수 있으며, 방대한 탐색 공간에서 필요한 ‘바늘’을 찾아낼 수 있다. 약물 발견도 동일한 논리다. 물리 법칙이 허용하는 한, 이 질병을 치료하면서 부작용이 없는 어떤 화합물이 반드시 존재한다. 유일한 문제는 그것을 어떻게 효율적이고 실현 가능한 방식으로 찾느냐는 것이다. 알파폴드는 이와 같은 시스템이 방대한 탐색 공간에서 그런 ‘바늘’을 찾을 수 있음을 처음으로 입증했다.

게리 탄: 나는 좀 더 높은 수준으로 올라가고 싶다. 우리는 인간이 이러한 방법을 사용해 알파폴드를 창조했다고 이야기하고 있지만, 또 하나의 메타 수준에서는 인간이 AI를 사용해 가능한 가설 공간을 탐색하고 있다. AI 시스템이 단순한 데이터 기반 패턴 매칭이 아니라 진정한 과학적 추론을 수행할 수 있게 되기까지는 얼마나 더 남았는가?

데미스 하사비스: 나는 이미 매우 가까이 와 있다고 생각한다. 우리는 이러한 일반적 시스템을 개발하고 있다. AI 공동 과학자(AI co-scientist)라는 시스템과, 기초 Gemini보다 더 나아가는 알파에볼브(AlphaEvolve) 같은 알고리즘을 보유하고 있다. 모든 선도 실험실이 이 방향을 탐색하고 있다.

그러나 지금까지 나는 이 시스템들이 진정한 중대한 과학적 발견을 한 사례를 개인적으로 보지 못했다. 그것은 곧 다가올 것이라고 생각한다. 그것은 우리가 앞서 논의한 창의성과 관련이 있을 수 있으며, 기존의 경계를 진정으로 뛰어넘는 돌파구일 수 있다. 그 수준에 도달하면, 이는 더 이상 패턴 매칭이 아니다. 왜냐하면 매칭할 수 있는 패턴 자체가 존재하지 않기 때문이다. 또한 단순한 외삽도 아니며, 어떤 유사성 기반 추론(analogical reasoning)일 수 있는데, 현재 시스템은 이를 갖추지 못했거나, 우리가 아직 올바른 방식으로 이를 사용하지 못하고 있다.

나는 과학 분야에서 자주 말하는 기준 중 하나는, 시스템이 단순히 가설을 검증하는 것이 아니라, 진정으로 흥미로운 가설을 제시할 수 있는가 하는 것이다. 왜냐하면 가설을 검증하는 것 자체도 놀라운 일이 될 수 있기 때문이다. 예를 들어 리만 가설을 증명하거나 어떤 밀레니엄 대상 문제를 해결하는 것처럼 말이다. 그러나 우리는 아마도 그 단계에 도달하기까지 몇 년밖에 남지 않았을 수도 있다.

그보다 더 어려운 것은, 정상급 수학자들이 동일하게 심오하고 평생을 바쳐 연구할 가치가 있다고 인정할 만한 새로운 밀레니엄 대상 문제들을 제시할 수 있는가 하는 것이다. 나는 이것이 또 한 차원 더 어렵다고 생각하며, 우리는 지금까지 이를 어떻게 해야 할지 모른다. 그러나 나는 이것이 어떤 마법 같은 것이 아니라고 믿으며, 이러한 시스템이 결국 이를 해낼 수 있다고 확신한다. 다만 아직 한두 가지가 부족할 뿐이다.

우리가 이를 검증할 수 있는 방법 중 하나는, 내가 가끔 ‘아인슈타인 테스트’라고 부르는 것이다. 즉, 1901년 당시의 지식만으로 시스템을 훈련시킨 후, 그것이 아인슈타인이 1905년에 도출한 특수 상대성 이론을 포함한 모든 성과를 독자적으로 유도해내는지를 확인하는 테스트다. 나는 이 테스트를 실제로 실행해보는 것이 좋다고 생각하며, 반복적으로 시도해 언제쯤 성공할 수 있는지 확인해야 한다. 한 번이라도 성공한다면, 이러한 시스템은 완전히 새로운 것을 발명하는 데 매우 가까워질 것이다.

창업 조언

게리 탄: 마지막 질문이다. 이 방에는 심층 기술 배경을 갖춘 사람들이 많으며, 여러분처럼 규모 있는 일을 해보고 싶어 한다. 여러분은 전 세계 최대 규모의 AI 연구 조직 중 하나다. 당신은 AGI 연구의 최전선에서 걸어온 사람이다. 25살 때 알았더라면 좋았을, 지금 당신이 아는 한 가지는 무엇인가?

데미스 하사비스: 우리는 이미 일부를 이야기했다. 어려운 문제를 추구하든 쉬운 문제를 추구하든, 사실 별반 차이가 없다. 다만 어려움의 형태가 다를 뿐이다. 다른 일들은 각기 다른 어려움을 갖는다. 그러나 인생은 짧고, 에너지는 한정되어 있으므로, 자신이 하지 않으면 정말 아무도 하지 않을 일을 선택하라. 이 기준으로 선택하라.

또 다른 점은, 향후 몇 년간 다학제적 융합이 더욱 보편화될 것이며, AI는 이러한 융합을 더 쉽게 만들 것이라는 점이다.

마지막으로, 이는 당신의 AGI 시간표에 따라 달라진다. 나는 약 2030년 정도로 보고 있다. 만약 당신이 오늘 심층 기술 프로젝트를 시작한다면, 일반적으로 10년간의 여정을 의미한다. 따라서 중간에 AGI가 등장할 가능성을 반드시 계획에 포함시켜야 한다. 이는 무엇을 의미하는가? 반드시 나쁜 일은 아니지만, 반드시 고려해야 한다. 당신의 프로젝트는 AGI를 활용할 수 있는가? AGI 시스템은 당신의 프로젝트와 어떻게 상호작용할 것인가?

앞서 논의한 알파폴드와 일반 AI 시스템의 관계로 돌아가보면, 나는 Gemini, Claude 또는 유사한 일반 시스템이 알파폴드와 같은 전용 시스템을 도구로 호출하는 상황을 예상할 수 있다. 나는 모든 것을 거대한 단일 ‘뇌’에 집어넣는 방식을 채택하지 않을 것이라고 생각한다. 모든 단백질 데이터를 Gemini에 집어넣는다면, 이는 무의미하다. Gemini는 단백질 접힘을 수행할 필요가 없기 때문이다. 앞서 언급한 정보 효율성 측면에서 보면, 그런 단백질 데이터는 분명히 그 언어 능력을 저하시킬 것이다. 더 나은 방식은 매우 강력한 일반 도구 사용 모델을 갖추고, 그것이 전용 도구를 호출하거나 심지어 훈련할 수 있도록 하되, 전용 도구는 독립된 시스템으로 유지하는 것이다.

이 사고방식은 깊이 생각해볼 가치가 있으며, 오늘 당신이 무엇을 구축할지에 영향을 미친다. 당신이 어떤 공장을 건설할지, 어떤 금융 시스템을 구축할지에 대해서도 그렇다. 당신은 AGI 시간표를 진지하게 받아들이고, 그 세상이 어떤 모습일지 상상한 후, 그 세상이 도래했을 때도 여전히 유용한 것을 구축해야 한다.

TechFlow 공식 커뮤니티에 오신 것을 환영합니다

Telegram 구독 그룹:https://t.me/TechFlowDaily

트위터 공식 계정:https://x.com/TechFlowPost

트위터 영어 계정:https://x.com/BlockFlow_News

원문 링크

즐겨찾기 추가

소셜 미디어 공유

작성자

深潮 TechFlow

深潮TechFlow