
Gemini 3 심야 공격: GPT 5.1을 압도하며 대규모 모델의 구글 시대가 도래했다
Gemini 3가 등장하기도 전에 트위터가 먼저 다운됐다.
어느 모델의 출시보다도 Gemini 3에 쏠린 관심은 압도적이었다. 이전까지 Gemini는 3개월 주기로 업데이트해왔고, AI 커뮤니티는 9월부터 이미 Gemini 3를 기다려왔다.
오늘 구글 개발자 관계 책임자이자 Google AI Studio 책임자가 'Gemini'라는 단어만 포함된 트윗을 올리자 수개월간 누적된 기대감이 폭발했고, 관련 해시태그가 순식간에 트위터를 뜨겁게 달궜다.

흥미롭게도, 발표 시점이 가까워지자 트위터는 마치 분위기를 맞추듯 여러 차례 다운됐다. 배후에는 Cloudflare가 있었지만, 그 타이밍이 너무 정확해 누군가 고의로 장난을 쳤다는 의심마저 들게 한다(속삭임: 어쨌든 트위터는 각사 모델들의 홍보 중심 무대니까).
오늘 아침 방금 Grok 4.1을 발표한 머스크가 어떤 생각을 하고 있을지 궁금하지만, 네티즌들의 밈 이미지는 이미 도배된 상태다.

바로 지금, 드디어 Gemini 3가 공식적으로 등장했다. 만인의 시선을 받으며 등장한 이 모델이 과연 얼마나 강력한지 살펴보자.
가장 지능적인 모델
사실 증명하듯, 구글은 기다린 이들을 실망시키지 않았다. Gemini 3가 정식으로 발표되며 다시 한번 SOTA를 정의했고, 오트먼과 머스크도 축하 메시지를 보냈다.


구글은 이를 "AGI로 향한 중요한 한 걸음"이라 정의하며, 현재 세계에서 다중모달 이해 능력이 가장 뛰어나고 상호작용이 가장 깊은 인공지능 에이전트라고 강조했다.
Gemini 3는 기본 추론 능력에서도 SOTA 기준을 갱신했으며, 새롭게 출시한 Google Antigravity 플랫폼과 Deep Think 모드를 통해 개발자 생태계와 AI 보조 경험을 재정의하고자 했다.
전방위 점령한 추론 괴물
Gemini 3 Pro는 공식적으로 "가장 진보된 추론 모델"이라 불리며 거의 모든 주요 AI 벤치마크에서 이전 세대인 Gemini 2.5 Pro를 크게 앞섰고, Claude Sonnet 4.5 및 GPT-5.1 같은 주요 경쟁 제품들 역시 모두 압도했다.
Gemini 3 Pro는 1501 Elo라는 돌파적인 고득점으로 LMArena 리더보드 정상에 올랐으며, Humanity’s Last Exam(도구 사용 없이 37.5% 달성)과 GPQA Diamond(91.9%)에서 최고점을 기록하며 박사급 추론 능력을 입증했다. 또한 수학 분야에서도 새로운 표준을 제시했는데, MathArena Apex에서 23.4%라는 최신 SOTA 수준을 달성했다.
텍스트와 논리뿐 아니라, Gemini 3 Pro는 다중모달 추론의 한계를 다시 정의했다. MMMU-Pro와 Video-MMMU에서 각각 81%, 87.6%의 고득점을 기록한 것은 복잡한 과학 도표 해석이나 동영상 스트림 이해에도 능하다는 의미다.
더욱 주목할 점은 SimpleQA Verified에서 72.1%의 성적을 거두며 사실 정확성 측면에서 큰 진전을 보였다는 것이다—단순히 강력할 뿐 아니라 신뢰도 높다는 의미다.

아첨하지 않는 사고 파트너
Gemini 3 Pro의 진화는 점수 이상이다. 상호작용의 질감 자체가 달라졌다. 기존 AI들이 자주 보이는 진부한 표현과 과도한 아첨을 버리고, 영리하고 간결하며 직접적인 존재가 됐다. 당신이 듣고 싶은 말이 아닌, 들어야 할 말을 전달한다.
생소한 과학 개념을 고해상도 시각화 코드 생성을 통해 번역하거나, 창의적인 브레인스토밍을 수행하는 등, 정보를 이해하고 자신을 표현하는 새로운 방법을 제공하는 진정한 사고 파트너 역할을 한다.
Gemini 3 Deep Think
Gemini 3 Deep Think 모드는 지능의 경계를 더욱 확장하며 추론 및 다중모달 이해 능력에서 중대한 발전을 이뤘고, 더 복잡한 문제 해결을 지원한다.
테스트에서 Gemini 3 Deep Think는 Humanity's Last Exam(도구 미사용 기준 41.0%)과 GPQA Diamond(93.8%)에서 이미 우수한 성적을 낸 Gemini 3 Pro를 넘어서는 성과를 보였다. 또한 ARC-AGI-2(코드 실행, ARC Prize 검증 완료)에서도 전례 없는 45.1%의 점수를 기록하며 완전히 새로운 도전 과제를 해결하는 능력을 입증했다.

Gemini 3 Deep Think 모드는 일부 가장 어려운 AI 벤치마크에서 뛰어난 성과를 보였다.
학습, 개발 및 계획
어떤 것도 학습
Gemini는 처음부터 텍스트, 이미지, 비디오, 오디오, 코드 등 다양한 모달 정보를 원활하게 통합하도록 설계됐다. Gemini 3는 선진화된 추론 능력, 시각·공간 이해력, 최고 수준의 다국어 성능, 백만 토큰 규모의 컨텍스트 윈도우를 결합해 다중모달 추론의 경계를 한층 더 넓히며, 사용자에게 가장 적합한 학습 방식을 제공한다.
예를 들어, 가족 전통 요리를 만들고 싶다면 Gemini 3는 다양한 언어의 손글씨 레시피를 해석하고 번역해 가족과 공유할 수 있는 레시피를 생성할 수 있다.
또는 새로운 주제를 학습하고 싶을 경우, 학술 논문, 긴 강의 또는 튜토리얼을 제공하면 교차형 암기 카드, 시각화, 코드 등을 생성하여 지식 습득을 도울 수 있다.
심지어 피클볼 경기 영상을 분석해 개선할 점을 찾아내고, 전반적인 실력을 향상시킬 수 있도록 훈련 계획을 수립할 수도 있다.
웹상 정보 이해를 돕기 위해, 검색 내 AI 모드는 이제 Gemini 3를 활용해 몰입형 시각 레이아웃, 인터랙티브 도구, 시뮬레이션 등 사용자 쿼리에 따라 즉시 생성되는 새로운 생성형 UI 경험을 제공한다.
어떤 것도 개발
2.5 Pro의 성공을 바탕으로, Gemini 3는 개발자의 아이디어를 현실로 만들어주는 약속을 실현했다. 복잡한 프롬프트와 지시사항을 처리하며 더 풍부하고 상호작용성이 높은 웹 사용자 인터페이스를 렌더링하는 데 탁월한 제로샷 생성 능력을 보여준다.
Gemini 3는 지금까지 구글이 개발한 최고의 Vibe 코딩 및 에이전트 코딩 모델로서, 구글 제품의 자율성을 높이고 개발자 효율성을 크게 향상시켰다. WebDev Arena 리더보드에서 1487 Elo라는 눈부신 점수로 1위를 차지했으며, 터미널을 통해 컴퓨터 조작 능력을 평가하는 Terminal-Bench 2.0 테스트에서는 54.2%의 성적을 기록했다. 또한 코딩 에이전트 성능을 측정하는 SWE-bench Verified 테스트에서도 2.5 Pro 버전(76.2% 점수)을 크게 앞질렀다.
이제 사용자는 Google AI Studio, Vertex AI, Gemini CLI 및 구글의 새로운 에이전트 개발 플랫폼 Google Antigravity 내에서 Gemini 3를 활용해 개발할 수 있다. Cursor, GitHub, JetBrains, Manus, Replit 등 제3자 플랫폼에서도 이용 가능하다.
예를 들어, 시각 효과가 더 풍부하고 상호작용성이 강한 복고풍 3D 우주선 게임을 작성할 수 있다.
또는 더 풍부하고 인터랙티브한 웹 UI와 애플리케이션을 개발할 수 있다.
어떤 것도 계획
Gemini 2 에이전트 이후, Gemini는 장기 과제에서의 계획 능력을 크게 향상시켰다.
Gemini 3의 계획 능력은 Vending-Bench 2 테스트를 통해 추가로 입증됐다. Gemini 3는 가상 자판기 운영 시뮬레이션 테스트에서 리더보드 정상에 올랐으며, 장기적인 계획을 통해 가상 사업 운영을 전 과정 관리했다.
1년간의 전체 시뮬레이션 운영에서 Gemini 3 Pro는 안정적인 도구 호출과 일관된 의사결정을 유지하며, 과제 목표에 집중하면서 더 높은 투자 수익률을 달성했다.

Gemini 3 Pro는 타 첨단 모델들과 비교해 더 뛰어난 장기 계획 능력을 보이며, 더 높은 수익을 창출할 수 있다.
Gemini 에이전트는 Gmail 수신함 정리도 도와줄 수 있다.
Gemini 3는 현재 전면적으로 공개됐다. 오늘부터 일반 사용자와 구독자는 각각 Gemini 앱 및 검색 AI 모드를 통해 새 모델을 사용할 수 있으며, 개발자 및 기업 고객은 AI Studio, Vertex AI 등을 통해 접근할 수 있다. 기대를 모았던 '심층 사고 모드(Deep Think)'는 향후 몇 주 내 Google AI Ultra 구독자에게 독점 제공될 예정이다.
또한, 이전에 유출된 모델 카드에 따르면 주목해야 할 핵심 정보들이 더 있다. 구글은 TPU를 사용해 MoE 방식으로 이 모델을 처음부터 훈련시켰으며, 1M 입력과 64k 토큰 출력을 갖췄다. MoE 방식은 저렴한 비용으로 운영 가능함을 의미한다.

가격 책정 측면에서, Gemini 3.0 Pro는 컨텍스트 길이에 기반한 계층적 가격 체계를 도입했다. 200k 토큰 이하 작업의 경우 입력/출력 가격은 $2.00/$12.00(백만 토큰당); 200k 토큰 초과 시에는 각각 $4.00 및 $18.00이다.

완전히 새로워진 '에이전트 우선' 개발 경험
Google Antigravity는 구글의 새로운 에이전트 개발 플랫폼으로, 개발자가 더 높은 수준의 과제 중심 환경에서 작업할 수 있게 해준다. Gemini 3의 선진화된 추론 능력, 도구 사용 및 에이전트 프로그래밍 능력을 활용해, Google Antigravity는 AI 보조 도구를 개발자 도구함 속 하나의 도구에서 능동적인 파트너로 격상시킨다.
Google Antigravity의 핵심은 익숙한 AI IDE(통합개발환경) 경험에 있지만, 여기서 에이전트는 전용 인터페이스로 격상되었으며, 에디터, 터미널, 브라우저에 직접 접근할 수 있는 권한을 부여받았다. 이제 에이전트는 사용자를 대신해 복잡한 엔드투엔드 소프트웨어 과제를 자율적으로 계획하고 동시에 수행하며, 자신의 코드를 검증할 수 있다.
Gemini 3 Pro 외에도, Google Antigravity는 구글의 최신 브라우저 제어용 Gemini 2.5 Computer Use 모델과 최고 수준의 이미지 편집 모델 Nano Banana(Gemini 2.5 Image)와 긴밀하게 통합돼 있다.
직접 체험
Gemini 3 Pro 프리뷰 버전이 AI Studio 플랫폼에 올라온 만큼, 직접 체험해봤다.
Prompt : NEW YORK SKYLINE SVG 생성. 필요한 라이브러리는 자유롭게 사용하되, 결과물을 단일 HTML 파일에 붙여넣어 크롬에서 바로 열 수 있어야 하며, 흥미롭고 매우 디테일하게, 예상치 못한 디테일을 보여주고, 창의성과 아름다움을 극대화하라. 하나의 코드 블록 안에 완성하라.

Prompt: 시각적으로 놀라운 Space Invaders 게임을 만들어라.

펠리컨이 자전거를 타는 애니메이션은 과거 많은 대규모 모델들을 난처하게 했지만, 이번엔 Gemini 3에게도 시험 삼아 물어봤다. Prompt: An animated SVG of a pelican riding a bicycle.

이전 버전과 비교해 상당한 진보를 보였지만 여전히 버그가 있는데, 자전거 페달이 공중에서 헛돌고 있다.
이번엔 더 명확한 프롬프트로 바꿨다: Create a single, complete, self-contained animated SVG code (no external files or images) of a cute pelican riding a bicycle from a side view. 이번엔 자전거에 페달이 없는 것처럼 보인다.

마무리하며
X 블로거 Chubby가 실시한 '2026년 말까지 가장 뛰어난 LLM을 보유한 회사는?' 투표에서 Google Gemini가 압도적으로 앞서 있다.

이러한 시장 신뢰의 회복은 데이터에서도 확인된다. Alphabet CEO 순다르 피차이가 공식 블로그에서 지난 2년간 Gemini의 성장을 회고했다: AI Overviews의 월간 활성 사용자는 이미 20억 명에 달하며, Gemini 앱의 월간 활성 사용자는 6.5억 명을 돌파했고, 클라우드 고객의 70% 이상과 1300만 명 이상의 개발자가 생성형 모델을 사용하고 있다.
지난 2년을 돌아보면, Bard(Gemini 전신) 출시 당시의 서둘러 대응했던 모습과 주가 급락에서 출발해, 결국 철저한 반성 끝에 Google DeepMind를 통합하고 창립자를 복귀시키며 노벨상을 수상하기까지, 구글은 교과서적인 '코끼리의 회전'을 완성했다.

Transformer를 정의했던 그 거인이 이제 'All in Gemini'를 외치며, 본격적인 반격 준비를 마쳤다.
과연 이것이 '최고의 LLM' 논쟁을 끝낼 수 있을까? 서두르지 말자. 탄환(과 서버)이 날아가는 것을 잠시 더 지켜보자.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News












