
a16z: 500대 기업 중 30%가 이미 AI에 비용을 지불하고 있으며, 코드 작성과 고객 서비스 분야에서 가장 먼저 실현되고 있음
저자: a16z
번역·편집: TechFlow
TechFlow 편집자 주: MIT는 기업 내 생성형 AI 시범 프로젝트의 95%가 실제 도입으로 이어지지 못했다고 발표했으나, a16z는 포트폴리오 기업들의 일차적 실사 데이터를 근거로 이 주장을 직접 반박한다. 포춘 500사 중 29%, 글로벌 2000사 중 19%가 선도적인 AI 스타트업의 유료 고객이 되었으며, 프로그래밍 도구를 통해 최고 수준의 엔지니어 생산성이 10~20배 향상되었다. 이 23,928자 보고서는 내부 데이터를 기반으로, 어떤 AI 사용 사례가 실제로 가치를 창출하는지, 또 어떤 사례가 여전히 개념적 과장에 불과한지를 명확히 밝힌다.
대기업 내 AI 도입이 어느 정도 진전되었는지에 대한 추측은 많지만, 대부분 기존 정보는 기업 스스로 보고한 AI 사용 현황이나 구매자의 질적 감정을 반영한 설문조사에 불과하며, 객관적 실적 데이터는 부족하다. 또한 소수의 기존 연구는 기업 내 AI 성과가 부진하다고 주장하는데, 그중 가장 주목받는 것은 MIT의 연구로, 생성형 AI 시범 프로젝트의 95%가 실제 도입으로 전환되지 못했다고 보고했다.
a16z의 내부 데이터 및 기업 임원들과의 대화를 바탕으로, 우리는 이 통계 수치가 신뢰하기 어렵다고 판단했다. 우리는 AI가 어디에서 가장 빠르게 채택되고 있는지, 그리고 ROI가 명확히 나타나는 지점을 면밀히 추적해 왔으며, 기업 내 AI 활용에서 실제로 효과를 입증한 객관적 데이터를 종합했다.
기업 내 AI 침투율
분석 결과, 포춘 500사 중 29%, 글로벌 2000사 중 약 19%가 선도적인 AI 스타트업의 활성 유료 고객이다.

이 통계에 포함되려면 해당 기업들이 AI 스타트업과 상위주도 방식(top-down) 계약을 체결하고, 시범 프로젝트를 성공적으로 도입해 조직 내에서 제품을 정식 운영 중이어야 한다.
이처럼 짧은 기간 내에 이러한 수준의 침투율을 달성한 것은 매우 주목할 만하다. 왜냐하면 포춘 500사는 전통적으로 기술의 초기 채택자로 알려져 있지 않기 때문이다. 역사적으로 많은 스타트업들이 초기 동력을 확보하기 위해 먼저 다른 스타트업에 판매해야 했고, 몇 년 후에야 첫 번째 기업 계약을 체결할 수 있었으며, 최종적으로 포춘 500 규모의 고객을 확보하려면 추가적인 수익과 시간이 필요했다.
AI는 이러한 관행을 완전히 뒤엎었다. OpenAI는 2022년 11월 ChatGPT를 출시함으로써 즉각적으로 소비자와 기업 모두에게 AI의 잠재력을 보여주었다. 이를 계기로 AI에 대한 관심 폭발이 촉발되었는데, 이는 이전 세대의 어떤 기술도 유발하지 못했던 현상이었다. 결과적으로, 대기업은 이제 그 어느 때보다도 새로운 제품에 더 일찍 베팅하려는 의향을 보이고 있다. 단 3년 이상이 지난 지금, 거의 삼분의 일에 달하는 포춘 500사와 다섯 분의 일이 넘는 글로벌 2000사가 조직 내에 실제 기업용 AI 솔루션을 배포하고 있다.
기업 내 AI에서 실제로 효과를 발휘하는 것들

이러한 채택은 어디서 가장 빠르게 이루어지고 있으며, 모델이 본질적으로 더 잘 수행하는 작업과 어떻게 연관되는가?
우리는 각 사용 사례의 수익 증가세를 GDPval로 정의된 모델의 이론적 능력 위에 겹쳐 표현하는 방식이 가장 의미 있는 평가 방법임을 발견했다. GDPval은 OpenAI가 개발한 유명 벤치마크로, 모델이 현실 경제에서 실질적 가치를 창출하는 작업을 수행하는 능력을 평가한다. 우리에게 있어 이 두 요소는 모델이 얼마나 우수할 수 있는지뿐 아니라, 오늘날 실제로 어느 정도의 가치를 제공하는지도 종합적으로 설명해 준다. 따라서 이들은 현재 AI 채택이 어디에서 발생하고 있으며, 앞으로 어디로 나아갈 것인지, 그리고 모델 능력이 계속 성숙함에도 불구하고 여전히 채택이 미진한 영역이 어디인지를 매우 명확히 보여주는 지표가 된다.
기업 내 AI가 현재 가장 큰 가치를 제공하는 분야는?
수익 증가세 측면에서 기업의 AI 채택은 명확한 사용 사례 및 산업군에 의해 주도되고 있다. 프로그래밍, 지원(Support), 검색(Search)이 지금까지 대부분의 사용 사례를 차지하고 있으며(프로그래밍은 이 집단 내에서도 압도적인 비중을 차지함), 기술, 법률, 의료 분야가 AI 채택에 가장 적극적인 산업이다.

프로그래밍: 프로그래밍은 AI의 압도적 주도 사용 사례이며, 그 규모는 다른 사례와 비교해 한 자릿수 차이가 난다. Cursor 같은 기업이 보고한 폭발적 성장세, Claude Code 및 Codex 등 도구의 초고속 성장세에서 이를 명백히 확인할 수 있다. 이러한 성장률은 거의 모든 사람의 가장 낙관적인 예측을 넘어서며, 현재까지 포춘 500/글로벌 2000 기업의 AI 도구 채택 중 대부분이 코드 작성 분야에서 이루어지고 있다.
기술적 역량 측면과 기업 시장 수용도 측면에서 볼 때, 프로그래밍은 AI의 이상적인 사용 사례를 대표한다. 코드는 데이터 집약적이므로 온라인상에 고품질 코드가 풍부하게 존재하여 모델 학습에 유리하다. 또한 텍스트 기반이므로 모델이 쉽게 파싱할 수 있고, 정확하고 명확하며 엄격한 문법과 예측 가능한 결과를 갖는다. 무엇보다 중요한 점은 코드가 검증 가능하다는 것이다. 누구나 코드를 실행해 그것이 제대로 작동하는지 확인할 수 있으므로, 모델 학습 및 개선을 위한 긴밀한 피드백 루프가 형성된다.
비즈니스 측면에서도 매우 우수한 적용 분야이다. 포트폴리오 기업들로부터 들은 바에 따르면, 최고 수준의 엔지니어 생산성은 AI 코딩 도구 도입으로 10~20배 향상되었다. 엔지니어 채용은 늘 어려우며 비용도 높기 때문에, 그들의 생산성을 향상시키는 모든 솔루션은 명확한 ROI를 보장한다—AI 코딩 도구가 제공하는 생산성 향상은 채택을 위한 강력한 인센티브를 창출한다. 또한 엔지니어는 일반적으로 최고의 도구를 요구하는 초기 채택자인데, 프로그래밍은 대부분의 기업 업무와 비교해 훨씬 개인적인 작업이기 때문에, 협조 및 관료주의가 많은 다른 기업 기능을 거치지 않고도 스스로 최고의 도구를 쉽게 찾아 채택할 수 있다.
또한 프로그래밍 도구는 작업을 100% 단말-단말(end-to-end) 완료하지 않더라도 부가 가치를 창출할 수 있다. 버그 탐지, 샘플 코드 생성 등 일부 작업만 가속화해도 시간 절약 효과가 있으며 유용하다. 프로그래밍은 인간 중심의 긴밀한 워크플로우를 기반으로 하므로, 개발자는 여전히 개발 과정 전체를 감독하고, 이 도구들은 출력 속도를 높이는 동시에 인간의 판단, 검토, 편집, 반복을 위한 공간을 남겨준다. 이는 기업의 신뢰를 높이고, 채택 경로를 더욱 원활하게 만든다.
프로그래밍 능력은 지수적으로 향상되고 있으며, 각 연구실은 ‘코드’라는 사용 사례를 선점하기 위해 명확히 집중하고 있다. 이는 막대한 영향을 미친다. 코드는 소프트웨어의 핵심 구성 요소로서 모든 다른 응용 분야의 상류에 위치하므로, AI가 코드 개발을 가속화함으로써 다른 모든 분야 역시 가속화될 것이다. 이는 관련 분야에서 구축하는 장벽을 낮추고, AI를 통한 새로운 문제 해결 기회를 열어준다. 그러나 동시에 접근성 향상은 스타트업이 지속 가능한 경쟁 우위를 구축하는 것을 그 어느 때보다도 더 어렵게 만들기도 한다.
지원(Support): 지원은 프로그래밍과는 정반대의 양극단에 위치한다. 소프트웨어 공학은 조직 내에서 가장 많은 투자와 주목을 받는 반면, 지원은 일반적으로 소홀히 여겨진다. 지원 업무는 백오피스(back-office), 입문 수준의 업무로, 기업들이 자체 관리를 번거롭고 복잡하다고 판단해 해외 아웃소싱 업체나 BPO(Business Process Outsourcing) 업체에 위탁하는 경우가 많다.
AI는 여러 이유로 이러한 업무 관리에 뛰어난 성과를 보이고 있다. 첫째, 대부분의 지원 상호작용은 시간 제한이 있으며, 목적(예: 환불 요청)이 명확하게 제약되어 있어 에이전트가 처리할 명확한 문제를 제공한다. 둘째, 지원은 역할 내에서 수행되는 작업이 가장 명확하게 정의된 기능 중 하나이다. 셋째, 지원 팀은 규모가 크고 이직률이 높아 신규 대리인을 빠르고 표준화된 방식으로 교육해야 한다. 이를 위해 각 대리인이 따라야 할 명확한 표준 운영 절차(SOP)가 존재하며, 이 SOP는 AI 에이전트가 모방할 수 있는 명확한 규칙과 지침을 제공한다. 이는 대부분의 다른 기업 업무와 구분되는 점으로, 다른 업무는 일반적으로 기간이 길고 정의가 모호하며, 고객과 서비스 대리인 외에도 더 많은 이해관계자가 개입한다.
지원은 ROI를 가장 명확하게 입증할 수 있는 기업 기능 중 하나이기도 하다. 지원은 측정 가능한 지표를 기반으로 운영되며, 처리된 티켓 수, 고객 CSAT(만족도) 점수, 해결률 등이 그 예이다. 기존 방식과 AI 에이전트를 A/B 테스트하면 항상 AI 에이전트가 유리한 결과를 보인다: 더 많은 티켓을 처리하고, 해결률을 높이며, 고객 만족도 점수를 향상시킨다—그런데 모두 비용은 더 저렴하다. 대부분의 지원 업무가 이미 BPO에 아웃소싱되어 있기 때문에, AI 솔루션 도입은 제한된 변화 관리만 요구하므로 채택 경로가 훨씬 용이하다.
또한 지원은 100% 정확하지 않더라도 유용하다. 인간으로의 자연스러운 전환 경로(예: “관리자에게 연결해 드리겠습니다”)가 존재하기 때문이다. 이는 영업 주기를 더 빠르게 진행시켜주며, AI 기반 지원 에이전트 시범 도입을 상대적으로 낮은 리스크로 만들 수 있다. 최악의 경우, 모든 사례가 단순히 인간에게 전환되어 해결될 뿐이다.
끝으로, 지원은 본질적으로 거래(transactional)적이다. 고객은 상대방이 실제로 누군지에 대해 무관심하므로, 지원에는 AI가 재현하기 어려운 인간관계가 필요하지 않다. 이러한 특성들이 Decagon 및 Sierra 같은 기업이 왜 이렇게 빠르게 성장했는지, 그리고 Salient, HappyRobot 같은 수직 특화 지원 스타트업들이 왜 급부상했는지를 설명해준다.
검색(Search): 명확한 기업 시장 수요를 보이는 마지막 수평적 카테고리는 검색이다. ChatGPT의 주요 사용 사례 자체가 바로 검색이기 때문에, 검색의 영향력은 ChatGPT의 수익 및 사용량에 깊이 통합되어 있을 가능성이 높으며, 이 경우 그 중요성이 크게 과소평가되었을 수도 있다.
AI 검색이라는 카테고리는 너무 광범위하여 독립적인 대규모 스타트업들이 다수 등장할 수 있었다. 기업 내부의 주요 고통 포인트 중 하나는 직원들이 다양한 시스템 내에서 관련 정보를 쉽게 탐색하고 추출할 수 있도록 하는 것이다. Glean은 이 사용 사례의 주요 스타트업 공급업체로 급성장하고 있다. 또한 많은 대규모 산업은 매우 구체적인 산업 정보(내부 및 외부)를 기반으로 운영되는데, Harvey(법률 검색에서 시작) 및 OpenEvidence(의학 검색에서 시작) 같은 기업은 이러한 정보를 중심으로 핵심 제품을 구축함으로써 급성장하고 있다.

산업별 분석
기술: 현재까지 AI를 가장 많이 채택하는 산업은 기술 산업이다. ChatGPT 자체 보고서에 따르면, 상업 사용자 중 27%가 기술 산업에서 나온다. Cursor, Decagon, Glean 등의 초기 고객도 대부분 기술 기업이었다. 기술 산업은 거의 항상 초기 채택자였으며, AI 물결을 촉발한 산업이기도 하므로, 이는 전혀 놀랍지 않다.
더 놀라운 사실은, 전통적으로 초기 채택자로 여겨지지 않았던 시장이 이번에는 오히려 매우 적극적이라는 점이다.
법률: 법률 분야는 AI 채택의 선도 산업 중 하나로 놀라울 정도로 부상했다. 법률 분야는 전통적으로 소프트웨어의 어려운 시장으로 간주되어 왔으며, 구매 결정 주기는 길고, 구매자들은 기술에 익숙하지 않은 경우가 많았다.
그 이유는 전통적 기업 소프트웨어가 변호사에게 제공하는 가치가 제한적이었기 때문이다. 정적 워크플로우 도구는 변호사들이 주로 수행하는 비구조화되고 미묘한 작업을 가속화하지 못했다. 그러나 AI는 기술이 변호사에게 제공하는 가치 제안을 훨씬 명확하게 만들었다. AI는 밀집된 텍스트를 해석하고, 대량의 텍스트를 추론하며, 요약 및 응답 초안 작성에 능숙한데, 이 모든 작업은 변호사들이 매일 수행하는 일이다. AI는 현재 개별 변호사의 생산성을 높이기 위한 서포터(副駕駛員) 역할을 하고 있지만, 그 범위는 이보다 훨씬 넓어지고 있다: 특정 경우에는 로펌이 더 많은 사건을 처리할 수 있게 함으로써 직접적인 수익 창출까지 가능해지고 있다(예: 원고 전문 로펌인 Eve의 경우).
그 결과는 명확하다. Harvey는 창립 3년 만에 약 2억 달러의 연간 정기 수익(ARR)을 달성했으며, Eve 같은 기업은 450개 이상의 고객을 확보해 올가을 10억 달러의 기업 가치에 도달할 것으로 예상된다.
의료: 의료 분야는 전통적 소프트웨어가 결코 보여주지 못했던 방식으로 AI에 반응하고 있는 또 다른 시장이다. Abridge, Ambience Healthcare, OpenEvidence, Tennr 같은 기업은 의료 기록, 의료 검색, 의료 서비스 제공 및 지불 방식을 규정하는 복잡한 규칙의 백오피스 자동화 등 구체적인 사용 사례를 기반으로 수익을 급속히 확대하고 있다.
의료 분야는 전통적으로 소프트웨어 도입 속도가 느린 시장이었다. 그 이유는 첫째, 고도의 전문성과 복잡성을 요구하는 업무가 기존 워크플로우 소프트웨어가 해결할 수 있는 문제와 맞물리지 않기 때문이며, 둘째, Epic 같은 EHR 시스템이 시장에서 압도적 지위를 차지함으로써 완전히 새로운 소프트웨어 공급업체의 진입을 좁혔기 때문이다. 그러나 AI는 행정 업무(예: 의료 기록 담당자)를 대체하거나, 의사가 수행하는 고부가가치 업무를 보완함으로써, 기존 EHR 시스템을 우회하는 구체적인 인적 노동을 담당할 수 있게 되었다. 이러한 업무는 고유하며 EHR을 완전히 교체할 필요가 없기 때문에, 이 기업들은 기존 소프트웨어 공급업체를 대체하지 않고도 빠르게 성장할 수 있다.
분석에 대한 몇 가지 주의사항
이 추정치는 최선의 추정치일 뿐이다. 각 범주에서 창출된 수익 규모를 과소평가했을 가능성도 있으며, 반대로 모델의 능력을 과대평가했을 가능성도 있다.
우리가 수익을 과소평가했을 가능성은 다음과 같다:
수익 분석은 단순히 어느 부서 및 사용 사례가 대규모 독립 기업용 AI 사업을 성공적으로 창출했는지에만 기반하며, 다른 스타트업들이 다루고 있는 긴 꼬리(tail) 형태의 사용 사례는 배제하였다.
이 시장들 중 다수는 스타트업이 아닌 참여자들(예: 코드 분야의 Codex/Claude Code, 법률 분야의 Thomson Reuters CoCounsel) 역시 상당한 규모의 수익을 창출하고 있으나, 우리의 분석은 독립 스타트업 참여자에 초점을 맞추었다.
분석에서 설명된 많은 업무 과제가 모델 기업의 핵심 제품(예: ChatGPT 및 OpenAI의 검색 기능)에 통합되어 있을 수 있으나, 이는 분석에서 별도로 분리되지 않았다.
본 분석은 기업용 비즈니스에 초점을 맞추며, 소비자 또는 전문 소비자용 비즈니스는 제외하였다. Replit 및 Gamma처럼 앱 생성 및 디자인 분야에서 상당한 수의 기업 고객을 확보한 성공적인 비즈니스가 있긴 하나, 이들은 현재 주로 소비자 또는 전문 소비자층을 대상으로 한다. 본 분석은 기업용 AI 및 기업이 어디에서 가치를 얻는지에 초점을 맞추므로, 소비자 중심의 비즈니스는 배제하였다.
능력 측면에서는 AI가 경제의 다양한 부문에 미치는 영향을 측정하는 것이 극도로 어렵다. 많은 경제학자들이 이 문제를 해결하기 위해 노력하고 있으나, 업무 자체가 본질적으로 정의가 불명확하고 긴 꼬리 형태를 띠기 때문에 완전 자동화는 극히 어렵다. 또한 부분 자동화에서 기업이 어느 정도의 가치를 얻을 수 있을지 아직 명확하지 않다. 예를 들어 AI가 인간 작업의 50%만 수행할 수 있다면, 자동화되지 않는 작업의 중요성은 오히려 증가할 수 있다. 왜냐하면 이 작업들이 병목 현상을 일으키면서 상대적 가치가 높아지기 때문이다. 따라서 우리는 오늘날의 능력 상태를 과대평가했을 가능성도 있다. 왜냐하면 능력이 1% 향상된다고 해서 경제적 가치도 반드시 1% 증가하지 않기 때문이다. 그러나 상대적 능력 수준과 각 신규 모델 출시에 따라 이 능력이 어떻게 향상되는지는 여전히 매우 의미 있는 지표이다.
AI는 모든 시장으로 진입하고 있다

이 분석은 GDPval 벤치마크 테스트를 통해 최고 수준의 평가 모델이 인간 전문가를 얼마나 능가하는지를 측정한다. 이에 따르면, 2025년 가을 이후 모델은 경제적으로 가치 있는 작업 수행 능력에서 눈에 띄게 향상되었다.
그렇다면, 왜 이 평가에서 높은 순위를 차지한 모든 산업이 다른 산업과 동일한 수준의 수익 증가세를 보이지 않는가?
지금까지 AI를 열정적으로 채택한 산업들은 몇 가지 공통된 특징을 갖는다: 텍스트 기반이며, 기계적이고 반복적인 작업을 포함하며, 인간의 판단을 주입하기 위한 자연스러운 ‘인간 중심’ 워크플로우가 존재하고, 규제가 제한적이며, 실행 가능한 코드나 해결된 지원 티켓처럼 검증 가능한 최종 산출물을 갖는다. 많은 산업은 이러한 특성을 갖지 않는다. 그들은 물리적 세계를 다루거나, 인간관계에 심각하게 의존하거나, 다수의 이해관계자 사이에서 명확한 조정 비용을 수반하거나, 규제 또는 준수 장벽을 부과하거나, 검증 가능한 결과를 갖지 않는다. 수익 증가세와 모델 능력은 분명히 상관관계가 있지만, 모델 능력이 이론적으로 인간 대비 50% 미만의 승률을 보이는 분야(예: 법률 분야)에서도, Harvey 같은 기업은 개인 법률 업무를 보조하는 ‘서포터’ 제품을 통해 빠르게 시장 점유율을 확보하고, 모델이 진화함에 따라 핵심 제품을 지속적으로 개선해 나가고 있다.
가장 주목할 만한 발견은 모델 능력이 급속히 향상되고 있다는 점이다. 지난 4개월 동안 회계 및 감사 분야는 GDPval에서 약 20%의 급격한 향상을 보였고, 심지어 경찰/탐정 업무 분야에서도 약 30%의 향상을 보였다. 우리는 이러한 향상이 관련 분야에서 주목할 만한 신규 제품 및 기업을 촉발할 것으로 기대한다. 또한 모델 기업들은 전자 스프레드시트 및 재무 워크플로우, 레거시 시스템 및 산업 내 난해한 작업을 처리하기 위한 컴퓨터 활용, 장기 과제 수행 능력 향상 등 경제적으로 가치 있는 작업의 핵심 능력 향상을 명확히 선언하고 있다. 이는 짧고 소화하기 쉬운 조각으로 쉽게 분할되지 않는 새로운 업무 유형 전체를 열어줄 것이다.
빌더들에게 주는 시사점
기업이 어디에서 가치를 얻는지, 그리고 ROI를 어떻게 생각하는지, 또 어떤 부문에서 현재 명확한 수요가 발생하고 있으며 어떤 부문이 향후 수요를 보일 것인지에 대한 이해는, AI 빌더들이 기회가 어디에 있는지를 보다 명확히 사고하도록 해준다.
기술, 법률, 의료 분야의 구매자를 대상으로 하는 것은 지금 당장 매우 유망한 토양이지만, 우리는 각 부문에서 단 하나의 ‘승자(winner)’가 등장할 것이라고 믿지 않는다. 예를 들어 법률 분야에는 내부 법무팀, 로펌, 특허 변호사, 원고 전문 변호사 등 다양한 유형의 변호사들이 있으며, 이들은 서로 다른 워크플로우와 니즈를 갖고 있어, 기업이 해결할 수 있는 다양한 기회가 존재한다. 의료 분야 역시 다양한 유형의 의사, 의료기관 등이 복합적으로 얽혀 있으므로 마찬가지이다.
이러한 부문 외에도, 능력은 향상되고 있으나 아직 수익 측면에서 돌파구를 마련한 기업이 없는 분야를 탐색하는 것도 유익한 접근법이다. 현재 많은 기업은 모델 능력이 진정으로 제품을 해방하기 이전에 설립되었으나, 충분한 기술 인프라와 고객/시장 인식을 구축해 왔기 때문에, 모델 해방이 이루어질 때 가장 유리한 위치에 놓이게 될 것이다.
마지막으로, 연구실이 경제적으로 가치 있는 작업의 어떤 측면에 최신 연구 노력을 집중하고 있는지를 주의 깊게 살펴보는 것이 중요하다. 장기 에이전트가 급속히 개선되고, 컴퓨터 활용에 대한 막대한 투자가 이루어지고, 텍스트 외의 모달리티(예: 전자 스프레드시트, 프레젠테이션)에 대한 신뢰할 수 있는 인터페이스 연구가 진행됨에 따라, 새로운 유형의 스타트업이 곧 필요한 인프라를 갖추고 의미 있는 기업 가치를 창출하게 될 것이다.
데이터 방법론: 본 데이터는 선도적인 기업용 AI 스타트업에서 수집되었으며, 이 보고서 목적으로 우리와 데이터를 공유한 기업의 비공개 데이터, 공개적으로 이용 가능한 데이터, 그리고 a16z에서 스타트업 및 대기업과 수천 차례 진행한 대화에서 분석한 익명 데이터를 포함한다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News













