
오티맨도 좋아요를 누른 구글 제미나이 3 프로, 대체 어디가 강할까?
작성자: 먀오 정
구글은 8개월 동안 잠든 척하다가 뒤돌아서 제미니 3 프로라는 왕패를 내밀었다.
드디어 구글이 제미니 3 프로를 발표했다. 매우 갑작스럽고, 아주 "조용하게" 말이다.
비록 구글이 제미니 3 프로 이전에 이미지 편집 모델 나노 바나나(Nano Banana)를 출시해 존재감을 부각시켰지만, 베이스 모델 측면에서는 구글이 너무 오랫동안 침묵해왔다.
지난 반년 이상 동안 사람들은 모두 오픈AI의 새로운 행보를 떠들썩하게 논하거나 클로드(Claude)가 코드 분야에서 얼마나 강력한지를 감탄했지, 버전 업그레이드 없이 8개월을 보낸 제미니에 대해 언급하는 사람은 아무도 없었다.
비록 구글의 클라우드 사업과 재무제표가 아무리 멋지게 나왔다고 해도, AI 개발자의 핵심 커뮤니티 안에서는 구글의 존재감이 점점 희석되고 있었다.
다행히도 소방(小榜)이 최초로 체험한 결과, 제미니 3 프로는 우리를 실망시키지 않았다.
하지만 아직 결론을 내리기엔 이르다. 현재의 AI 경쟁은 이미 파라미터 수치로 위협하는 단계를 지났으며, 모두 애플리케이션, 상용화, 비용 경쟁에 몰두하고 있다.
구글이 새로운 버전과 환경에 적응할 수 있을지는 여전히 미지수다.
01
나는 제미니 3 프로에게 자신을 한 문장으로 설명해보라고 요청했다. 그 대답은 다음과 같았다.
"세상에 내가 얼마나 똑똑한지 증명하려는 것에 더 이상 급급하지 않고, 어떻게 하면 더 유용해질 수 있는지 고민하기 시작했다." —— 제미니 3 프로
LMArena 순위에서 제미니 3 프로는 1501의 에로 점수(Elo score)로 정상을 차지하며 AI 모델의 종합 능력 평가에서 새로운 기록을 세웠다. 이는 상당히 훌륭한 성적로, 오타마누(奥特曼) 역시 트위터를 통해 축하 인사를 보냈다.
수학 능력 테스트에서 이 모델은 AIME2025(미국 수학 초청 시험)의 코드 실행 모드에서 정확도 100%를 달성했다. GPQADiamond 과학 지식 테스트에서는 정확도 91.9%를 기록했다.
MathArenaApex 수학 경시대회 테스트 결과, 제미니 3 프로는 23.4%의 점수를 얻었으며, 다른 주요 모델들의 점수는 일반적으로 2% 이하였다. 또한 'Humanity's Last Exam'이라는 테스트에서 도구를 사용하지 않고 37.5%의 점수를 획득했다.
이번 업데이트에서 구글은 "vibecoding"이라는 코드 생성 기능을 도입했다. 이 기능을 통해 사용자는 자연어로 요구사항을 설명하면 시스템이 해당 코드와 애플리케이션을 자동 생성한다.
Canvas 프로그래밍 환경의 테스트에서 사용자가 "속도 조절이 가능한 선풍기를 만들어 줘"라고 요청하자, 시스템은 약 30초 만에 회전 애니메이션, 속도 조절 슬라이더, 전원 스위치 버튼을 포함한 완전한 코드를 생성했다.
공식 사례로는 핵융합 과정의 시각적 시뮬레이션도 소개되었다.
인터랙션 방식 측면에서 제미니 3 프로는 "생성형 인터페이스"(GenerativeUI) 기능을 추가했다. 전통적인 AI 어시스턴트가 텍스트 응답만 반환하는 것과 달리, 이 시스템은 질의 내용에 따라 맞춤형 인터페이스 레이아웃을 자동 생성할 수 있다.
예를 들어 사용자가 양자 컴퓨팅 관련 질문을 하면, 시스템은 개념 설명, 동적 차트, 관련 논문 링크를 포함한 인터랙티브 인터페이스를 생성할 수 있다.
같은 질문이라도 대상이 다르면 시스템은 다른 인터페이스 디자인을 생성한다. 간단한 예로, 같은 개념을 어린이와 성인에게 설명할 때 서로 다른 방식을 사용한다. 어린이용은 귀여운 스타일이고, 성인용은 간결하고 명확한 스타일이다.
Google Labs에서 제공하는 Visual Layout 실험 기능은 이러한 인터페이스의 활용을 보여주며, 사용자는 사진, 모듈, 조절 가능한 UI 요소를 포함한 잡지 스타일의 뷰 레이아웃을 얻을 수 있다.
이번 출시에는 제미니 에이전트(Gemini Agent)라는 에이전트 시스템도 포함되어 있으며, 현재 실험 단계이다. 이 시스템은 다단계 작업을 수행할 수 있고 Gmail, Google Calendar, Reminders 등 구글 서비스에 연결된다.
수신함 관리 시나리오에서 시스템은 자동으로 메일을 필터링하고 우선순위를 지정하며 답장 초안을 작성할 수 있다. 여행 계획은 또 다른 활용 사례로, 사용자가 목적지와 대략적인 시간만 제공하면 시스템이 캘린더를 조회하고 항공편 및 호텔 옵션을 검색한 후 일정을 추가한다. 다만 이 기능은 현재 미국 지역의 Google AI Ultra 구독자에게만 공개되어 있다.
멀티모달 처리 측면에서 제미니 3 프로는 희소 혼합 전문가 아키텍처(sparse mixture-of-experts architecture)를 기반으로 하며, 텍스트, 이미지, 오디오, 비디오 입력을 지원한다. 모델의 컨텍스트 윈도우는 100만 토큰으로, 긴 문서나 비디오 콘텐츠를 처리할 수 있다.
캐나다 로리에르 대학교 역사학 교수 마크 험프리스(Mark Humphries)의 테스트에 따르면, 이 모델은 18세기 필기 원고를 식별할 때 문자 오류율이 0.56%에 불과하여 이전 버전보다 50~70% 낮췄다.
구글은 훈련 데이터로 공개 웹 문서, 코드, 이미지, 오디오 및 비디오 콘텐츠를 사용했으며, 사후 훈련 단계에서는 강화 학습 기술을 적용했다고 밝혔다.
또한 구글은 복잡한 추론 작업을 위한 특화된 최적화 버전인 제미니 3 딥싱크(Gemini 3 Deep Think)를 출시했다. 이 모드는 현재 보안 평가 중이며, 향후 몇 주 내에 Google AI Ultra 구독자에게 공개될 예정이다.
Google Search의 AI 모드에서는 사용자가 "thinking" 탭을 클릭해 이 모드의 추론 과정을 확인할 수 있다. 표준 모드와 비교해 딥싱크 모드는 답변 생성 전에 더 많은 분석 단계를 거친다.
공식 자료 외에도 나는 제미니 3 프로와 ChatGPT-5.1을 직접 비교했다.
첫 번째 비교는 이미지 생성이다.
프롬프트: iPhone17 이미지를 생성해줘
ChatGPT-5.1
Gemini 3 Pro
주관적으로 보면 ChatGPT-5.1이 내 요구에 더 부합하므로 이번 라운드는 ChatGPT-5.1의 승리다.
두 번째 비교는 두 모델의 에이전트 수준이다.
프롬프트: 알파벳 방(字母榜)이라는 위챗 공식 계정을 조사해서 이 계정의 수준을 평가해봐
GPT-5.1
Gemini 3 Pro
주관적으로 보면 나 개인은 제미니 3 프로의 해석이 더 마음에 들지만, 지나치게 칭찬하는 느낌이고, GPT-5.1은 소방(小榜)의 부족한 점까지 발견해 더 객관적이고 현실적이다.
마지막은 코드 능력으로, 현재 모든 대규모 모델이 가장 집중하는 영역이다.
내가 선택한 프로젝트는 깃허브에서 최근 별점이 매우 높은 'LightRAG'이다. 이 프로젝트는 그래프 구조를 통합해 컨텍스트 인식과 효율적인 정보 검색을 향상시켜 RAG(Retrieval-Augmented Generation)를 개선하고, 더 높은 정확도와 빠른 응답 시간을 실현했다. 프로젝트 주소: https://github.com/HKUDS/LightRAG
프롬프트: 이 프로젝트에 대해 설명해줘
GPT-5.1
Gemini 3 Pro
동시에 제미니 3 프로는 업계 전문가들로부터도 높은 평가를 받았다.
02
비록 제미니 3 프로의 출시가 매우 조용했지만, 사실 구글은 제미니 3 프로를 위해 오랫동안 예열 작업을 해왔다.
구글 3분기 실적 발표 컨퍼런스 콜에서 구글 CEO 피차이(Pichai)는 이렇게 말했다. "제미니 3 프로는 2025년 안에 출시될 것입니다." 구체적인 날짜도 없고, 더 많은 세부 정보도 없지만, 이 한마디가 곧바로 테크 업계의 마케팅 드라마 서막을 열었다.
구글은 계속해서 신호를 보내며 전체 AI 커뮤니티가 높은 관심을 유지하도록 만들었지만, 언제 출시할지는 끝내 밝히지 않았다.
10월부터 각종 "실수 유출"이 연이어 나타났다. 10월 23일부터 시작해 11월 12일 'Gemini 3 Pro Release'라고 적힌 내부 캘린더 스크린샷이 돌기 시작했다.
눈이 빠른 개발자들은 Vertex AI API 문서에서 'gemini-3-pro-preview-11-2025'라는 문구도 발견했다.
곧이어 Reddit과 X(트위터)에는 다양한 스크린샷들이 등장하기 시작했다. 누군가는 제미니 캔버스 도구에서 새 모델을 목격했다고 주장했고, 누군가는 모바일 앱 일부 버전에서 비정상적인 모델 식별자를 발견했다.
그리고 아래의 테스트 데이터가 소셜 미디어를 통해 퍼지기 시작했다.
이러한 '유출'은 우연처럼 보이지만, 실제로는 정교하게 구성된 예열 작전이었다.
매번 유출은 제미니 3 프로의 핵심 능력 중 하나를 적절히 드러냈고, 매번 논의는 기대감을 새로운 높이로 끌어올렸다. 그러나 구글 공식 계정의 태도는 의미심장했다. 그들은 커뮤니티의 논의를 공유하며 '곧 출시됩니다'라는 표현으로 기대를 자극했고, 심지어 구글 AI 연구소 고위층은 출시일 예측 관련 트윗 아래서 두 개의 '사고 중' 이모티콘을 답글로 달았지만, 정확한 날짜는 끝내 밝히지 않았다.
약 한 달간의 예열 끝에, 구글은 마침내 신선한 제미니 3 프로를 선보였다. 그러나 제미니 3 프로의 성능이 강력하긴 하지만, 구글의 업데이트 주기는 다소 답답하게 느껴진다.
이미 올해 3월 구글은 제미니 2.5 프로의 프리뷰 버전을 출시했고, 이후 제미니 2.5 플래시 프리뷰 버전 등 파생 프리뷰 버전을 계속 출시했다. 제미니 3 프로가 등장할 때까지 제미니 시리즈는 그 사이에 단 한 차례의 버전 번호 업그레이드도 없었다.
하지만 구글의 경쟁자들은 제미니를 기다려주지 않는다.
오픈AI는 8월 7일 GPT-5를 출시하고 11월 12일에는 GPT-5.1로 추가 업그레이드했다. 그리고 이 기간 동안 오픈AI는 자사의 AI 브라우저 애틀러스(Atlas)도 출시하며 구글의 핵심 영역을 직격했다.
Anthropic의 업데이트 속도는 더욱 빈번했다. 2월 24일 클로드 3.7 손넷(Claude 3.7 Sonnet, 최초의 혼합 추론 모델)을 출시했고, 5월 22일 클로드 오퍼스 4와 손넷 4를 출시했으며, 8월 5일 클로드 오퍼스 4.1을, 9월 29일 클로드 손넷 4.5를, 10월 15일에는 클로드 하이쿠 4.5를 출시했다.
이러한 일련의 공세로 인해 구글은 다소 당황했지만, 현재로서는 구글이 버텨냈다.
03
구글이 제미니 3 프로를 업데이트하는 데 8개월이나 걸린 가장 큰 이유는 인사 변동 때문일 가능성이 크다.
2025년 7~8월경 마이크로소프트는 구글을 상대로 맹렬한 인재 유치 공세를 펼쳐 DeepMind의 핵심 전문가와 간부진 20명 이상을 성공적으로 영입했다.
여기에는 DeepMind의 고급 제품 총괄(Director of Product) 데이브 시트론(Dave Citron), 그리고 핵심 AI 제품의 상용화를 담당했던 인물, 그리고 제미니의 엔지니어링 부사장(VP of Engineering) 아마르 수브라마냐(Amar Subramanya)가 포함되는데, 그는 구글의 가장 중요한 모델 제미니의 핵심 엔지니어링 책임자 중 한 명이었다.
다른 한편으로, 나노 바나나(Nano Banana) 팀은 제미니 2.5 프로 출시 후 오랜 기간 동안 AI 이미지 생성 분야에 집착하면서 베이스 모델의 업데이트를 늦췄다고 밝혔다.
구글은 캐릭터 일관성(Character Consistency), 컨텍스트 내 편집(In-context Editing), 텍스트 렌더링(Text Rendering)이라는 이미지 생성 분야의 세 가지 난관을 해결해야만 베이스 모델의 성능이 더 좋아질 수 있다고 생각했다.
나노 바나나 팀은 모델이 단지 '예쁘게 그리는 것'을 넘어 '사람 말을 이해하고', '사람의 통제를 받는 것'이 중요하며, 이를 통해 AI 이미지 생성이 비로소 상용화 단계에 진입할 수 있다고 강조했다.
이제 다시 제미니 3 프로를 돌아보면, 이는 합격점의 답안지지만, 지금처럼 치열한 AI 전장에서는 합격점만으로는 이미 부족하다.
구글이 이 시점에 답안지를 제출하기로 결정했다면, 이미 경쟁 제품에 의해 입맛이 까다로워진 사용자와 개발자라는 가장 엄격한 채점자들을 맞닥뜨릴 각오를 해야 한다. 앞으로의 몇 달은 모델 파라미터의 경쟁이 아니라 생태계 통합 능력의 격투가 될 것이다. 구글이라는 거대한 코끼리는 춤을 추는 법을 배울 뿐 아니라, 누구보다도 더 빨리 춤춰야 하는 상황이다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News














