
스탠퍼드 HAI 『2025 인공지능 지수 보고서』 핵심 내용
작성자: Stanford HAI(스탠퍼드 인공지능 연구소)
번역: Felix, PANews
스탠퍼드 HAI는 최근 456페이지 분량의 『2025 인공지능 지수 보고서』를 발표했다. 아래는 인공지능 트렌드의 주요 핵심 내용들이다.
1. 인공지능이 생각보다 훨씬 강력해지고 있다
새로운 벤치마크 MMMU, GPQA, SWE-bench에서 인공지능의 성능이 크게 향상되었으며, 점수는 각각 18.8%, 48.9%, 67.3% 상승했다. 벤치마크 외에도 인공지능 시스템은 고품질 동영상 생성 분야에서 중요한 진전을 이루었고, 경우에 따라서는 대규모 언어 모델(LLM)이 제한된 시간 내 프로그래밍 작업에서 인간을 능가하기도 한다.
참고:
MMMU는 대학 수준의 다학제적·다양화된 모달리티 이해 및 추론을 위해 설계된 정교한 새로운 벤치마크로, 기초 모델의 광범위한 작업에서 전문가 수준의 다중 모달리티 이해 능력을 평가하는 것을 목표로 한다.
GPQA는 다양한 분야의 전문가들이 작성한 448개의 고품질 난이도 높은 객관식 문제로 구성된 도전적인 데이터셋이다. 해당 분야에서 박사 학위를 보유하거나 취득 중인 전문가들의 정확률은 단 65%이며, 매우 숙련된 비전문가 검증자들은 평균 30분 이상 소요되고 인터넷 접근 제약 없음에도 불구하고 정확률이 34%에 불과하다.
SWE-bench는 GitHub에서 수집한 실제 소프트웨어 문제를 기반으로 대규모 언어 모델(LLM)의 성능을 평가하는 벤치마크이다.

2. 인공지능은 더 효율적이며, 접근성이 높아지고 경제적으로도 유리해지고 있다
파라미터 수가 적은 소형 인공지능 모델의 능력이 계속 증가하고 있다. 짧은 2년 만에 파라미터 수는 약 100배 줄었지만, 대규모 다중 작업 언어 이해(MMLU) 테스트에서 여전히 60% 이상의 점수를 기록했다.
또한 오픈소스 모델과 닫힌 소스 모델 사이의 격차도 좁혀지고 있으며, 일부 벤치마크에서는 성능 차이가 8%에서 단 1.7%로 감소했다.

게다가 2022년 11월부터 2024년 10월까지 GPT-3.5 수준에 도달하는 시스템의 추론 비용은 280배 이상 감소했다. 하드웨어 측면에서는 매년 비용이 30% 감소하고, 에너지 효율은 매년 40% 향상되고 있다.
고급 인공지능의 진입 장벽이 급격히 낮아지고 있는 것이다. DeepSeek와 같은 희소 모델(Sparse Model) 개발 또한 MoE(Experts Mix, 전문가 혼합) 구조 하에서 사용자 질의에 응답할 때 관련된 파라미터만 활성화되어 전체 처리를 더욱 효율적으로 만들고 있다.
실제로 규모는 작지만 성능이 뛰어난 AI 모델이 지속해서 등장함에 따라 AI 모델 훈련 요구 사항이 줄어들고 있으며, 비용 대비 효과적인 분산 훈련이 향후 10년간 주류가 될 것으로 전망된다. 현재 여러 선도적인 프로젝트들이 서로 다른 이론 체계를 기반으로 관련 연구를 진행 중이다.
3. 인공지능이 일상생활에 점점 더 깊숙이 스며들고 있다
2023년 미국 식품의약국(FDA)은 인공지능 기반 의료기기 223건을 승인했는데, 이는 2015년의 고작 6건과 비교되는 수치다. 도로 위에서도 자율주행차는 더 이상 실험 단계가 아니다. 미국 최대 운영업체 중 하나인 Waymo는 매주 15만 건 이상의 무인 운전 서비스를 제공하고 있으며, 바이두의 Apollo Go 무인 택시 차량은 이미 중국 여러 도시에서 운행되고 있다.

4. 기업의 인공지능 투자 급증으로 사상 최대 규모의 투자와 적용이 이루어지고 있다
비즈니스 분야에서의 인공지능 활용도 가속화되고 있다. 2024년에는 조직의 78%가 인공지능을 사용하고 있으며, 이는 전년의 55%에서 크게 증가한 수치다. 동시에 점점 더 많은 연구들이 인공지능이 생산성을 향상시키고, 전반적인 노동력 내 기술 격차를 줄이는 데 기여한다는 것을 입증하고 있다.
사실 인공지능으로 인해 고객 기대치가 지수적으로 증가하면서 기존 솔루션이 하루아침에 낙후되어 기존 기업들이 대응할 기회를 잃게 되고, 제품-시장 적합(Product-Market Fit) 붕괴가 더 자주 발생하게 된다.
5. 전 세계적으로 인공지능에 대한 낙관적 시각이 증가하고 있지만, 아시아인들이 특히 더 낙관적이다
중국(83%), 인도네시아(80%), 태국(77%) 등 국가에서는 대부분의 사람들이 인공지능 제품과 서비스가 이익이 해악보다 크다고 본다. 반면 캐나다(40%), 미국(39%), 네덜란드(36%) 등에서는 낙관적 시각이 여전히 훨씬 낮은 수준이다.
하지만 이러한 태도는 변화하고 있다. 2022년 이후 독일(10% 증가), 프랑스(10% 증가), 캐나다(8% 증가), 영국(8% 증가), 미국(4% 증가) 등 과거 회의적이었던 일부 국가들에서 낙관적 시각이 눈에 띄게 증가하고 있다.

6. 인공지능은 과학연구에서 점점 더 큰 영향력을 행사하며 과학 발전을 이끄는 핵심 동력이 되고 있다
인공지능의 중요성 증가는 주요 과학상에서도 드러났다. 두 개의 노벨상이 각각 딥러닝(물리학상) 및 이를 단백질 접힘에 적용한 연구(화학상)에 수여되었으며, 튜링상은 강화학습 분야에서 획기적인 공헌을 한 연구자들에게 수여되었다.
분명히 인공지능은 지수함수적이고 예측을 뛰어넘는 속도로 급속히 발전하고 있으며, 이는 대부분의 사람들에게 중대한 의미를 갖는다. 따라서 인공지능 안전성 또한 점점 더 중요해지고 있다. 인공지능이 위조를 더 쉽게 만들 수는 있지만, 암호학은 위조를 더 어렵게 만든다. 블록체인의 고유한 특성(검증 가능성과 투명성)을 활용하여 이 분야의 실용적 해결책을 구축하는 암호화 프로젝트들을 기대한다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News













