
Anthropic 데이터: AI 에이전트의 호출 중 거의 절반가량이 소프트웨어 엔지니어링 분야에 집중되며, 이 16개 수직 분야는 여전히 블루오션
저자: Garry's List
번역: TechFlow
TechFlow 서문: Anthropic은 지금까지 발표된 가장 포괄적인 AI 에이전트 실제 사용 연구를 최근 공개했다. 핵심 데이터는 다음과 같다: 소프트웨어 엔지니어링 분야가 전체 AI 에이전트 도구 호출량의 약 50%를 차지하며, 의료, 법률, 교육 등 16개 수직 분야를 모두 합쳐도 나머지 절반에도 미치지 못하고, 각 분야의 점유율은 모두 5% 미만이다.
이는 시장이 포화되었다는 신호가 아니라, 300개의 수직형 AI 유니콘 기업을 위한 지도다. 더욱 가치 있는 것은 이 글에서 인용한 반직관적 발견인데, 모델이 이미 약 5시간 동안 독립적으로 작동할 수 있음에도 불구하고, 사용자들은 실제로 단 42분만 작동시키고 있다는 점이다. 이 ‘신뢰 격차’ 자체가 바로 다음 번 제품 기회다.
전문:
소프트웨어 엔지니어링 분야가 모든 AI 에이전트 도구 호출량의 약 50%를 차지한다. 의료, 법률, 금융 등 16개 수직 분야는 거의 다루어지지 않았으며, 어느 하나도 9%를 넘지 않는다. 이는 300개의 수직형 AI 유니콘이 탄생하기를 기다리고 있음을 의미한다.
만약 내가 오늘 창업한다면, 나는 위의 막대그래프에서 붉은 영역을 바라보며 내 미래를 볼 때까지 그곳을 떠나지 않을 것이다.
Box 공동창업자인 Aaron Levie는 이렇게 말했다:
이 그래프는 우리가 현재 AI 에이전트 분야에서 얼마나 큰 기회를 누리고 있는지를 잘 상기시켜 준다.
수평적 방향으로는 물론 다수의 에이전트 기회가 존재하지만, 동시에 사용자의 고유한 수직 분야 프로세스를 진정으로 자동화하려면 깊은 분야 전문지식이 요구되는 워크플로우도 많다.
템플릿은 다음과 같다: 전용 데이터에 접속하는 에이전트 소프트웨어를 구축하여, 사용자가 에이전트와 협업하는 방식으로 워크플로우를 효과적으로 처리하도록 하고, 동시에 심층적이고 분야 특화된 컨텍스트 엔지니어링 능력과 고객 측의 변화 관리 추진 능력을 갖추는 것이다.
현재 많은 분야는 여전히 거대한 공백 상태다.
소프트웨어 엔지니어링 분야는 모든 AI 에이전트 활동의 절반을 차지한다. 나머지 절반은 16개 수직 분야에 분산되어 있으며, 어느 한 분야도 9%를 넘지 않는다. 의료 분야는 1%, 법률 분야는 0.9%, 교육 분야는 1.8%다. 이들 분야는 포화된 시장이 아니라, 사실상 아직 존재하지 않는 시장이다.
Anthropic은 최근 지금까지 발표된 가장 포괄적인 AI 에이전트 실제 사용 연구를 공개했다. 핵심 발견은 다음과 같다: 소프트웨어 엔지니어링 분야가 Anthropic API 상의 에이전트 도구 호출량의 49.7%를 차지한다. 숨겨진 핵심 결론은, 나머지 모든 분야가 청정해(블루오션)라는 점이다.
배포 지연
창업가들을 흥분시킬 만한 데이터 하나가 있다: 모델의 능력은 이미 사용자가 모델을 신뢰하려는 한계를 훨씬 초월했다.
METR의 능력 평가에 따르면, Claude는 인간이 약 5시간이 걸리는 작업을 해결할 수 있다. 그러나 실제 사용에서는 99.9 백분위수 기준 대화 시간이 약 42분에 불과하다. 이 격차—즉, AI가 할 수 있는 것과 우리가 그것을 허용하는 것 사이의 간극—은 거대한 기회다.

그림: Claude Code의 최장 훈련 시간은 3개월간 거의 두 배로 증가했다. 이는 능력 향상뿐 아니라 신뢰도 강화를 의미한다.
출처: x.com
2025년 10월부터 2026년 1월까지, 99.9 백분위수 기준 단일 대화 시간은 25분 미만에서 45분 이상으로 거의 두 배로 증가했다. 이 증가는 모든 모델 버전 간에 안정적으로 나타났다. 이는 단순히 모델이 더 강력해졌다는 것을 의미하는 것이 아니라, 사용자들이 반복적인 사용을 통해 점차 에이전트에 대한 신뢰를 확장해 나가고 있음을 보여준다.
“8월에서 12월까지, Claude Code는 내부 사용자들의 가장 어려운 과제에서 성공률이 두 배로 증가했으며, 동시에 회당 대화에서의 인공 개입 횟수는 5.4회에서 3.3회로 감소했다.”
능력은 이미 확보되었으나, 실제 배포는 따라가지 못하고 있다. 이는 문제라기보다는 오히려 제품 기회다.
신뢰의 진화 과정
신규 사용자 중 20%는 Claude Code의 조작을 자동 승인한다. 750회 대화 후에는 자동 승인 모드로 실행되는 대화 비율이 40%를 넘는다. 하지만 반직관적인 발견 하나가 있다: 경험 많은 사용자일수록 오히려 개입 빈도가 더 높아지고, 덜 하지는 않는다. 신규 사용자는 5%의 턴에서 개입하지만, 숙련 사용자는 9%에 달한다.

그림: 신뢰는 축적되는 기술이다. 신규 사용자는 20%의 대화를 자동 승인한다. 750회 대화 후에는 이 비율이 40%를 넘는다.
이미지: Anthropic
출처: x.com
이는 모순이 아니라 감독 전략의 전환이다. 초보자는 조작 발생 전 단계별로 승인하지만, 숙련 사용자는 먼저 권한을 부여하고 문제가 생겼을 때만 개입한다—즉, 사전 승인에서 능동적 모니터링으로 전환한 것이다.
보안 측면에서 주목할 만한 또 다른 발견은 다음과 같다: 복잡한 작업에서 Claude Code가 자발적으로 명확화를 요청하는 빈도가 인간의 자발적 개입 빈도의 두 배 이상이다. 에이전트는 문제를 해결하기 위해 무작정 진행하기보다는, 확인을 위해 일시 정지한다. 이는 결함이 아니라 고유한 특성이다.
“이 연구의 핵심 통찰은 다음과 같다: 실무에서 에이전트가 행사하는 자율성은 모델, 사용자, 그리고 제품이 공동으로 구축하는 것이다. Claude는 불확실할 때 스스로 일시 정지하여 질문함으로써 자신의 독립성을 제한한다. 사용자는 모델과의 협업 과정에서 신뢰를 구축하고, 이에 따라 자신의 감독 전략을 조정한다.”
Levie의 수직형 AI 전략
Aaron Levie는 풀리지 않은 거대한 부와 가치를 지적했다: 전용 데이터에 접속하는 에이전트 소프트웨어를 구축해 실제 사람과 문제를 진정으로 해결하고, 컨텍스트를 최대한 채워서 지능적 출력을 극대화하며—그리고 대부분의 창업가들이 간과하는 부분인데—고객 측의 변화 관리를 주도하는 것이다.
마지막 항목이 바로 수직형 AI가 복제되기 어려운 이유다. 누구나 API를 래핑하는 정도는 쉽게 할 수 있지만, 의료 청구서 처리, 법률 증거 수집, 건축 허가 승인 등 고유한 워크플로우, 규제 제약, 조직적 저항을 진정으로 다룰 수 있는 사람은 매우 드물다.
SaaS는 지난 수십 년간 매 10년마다 10배씩 성장해 왔다. 지난 20년간 리스크 투자 자금의 40% 이상이 SaaS 기업으로 유입되었다. 이 산업은 170개 이상의 SaaS 유니콘을 탄생시켰다. 논리는 간단하다: 이 유니콘들 각각에 대해, 수직형 AI 버전이 등장하기를 기다리고 있다. 그리고 이 AI 버전은 소프트웨어만을 대체하는 것이 아니라 운영 인력까지 대체하므로, 규모 면에서 10배 이상 클 가능성이 있다.
공동 구축의 본질
Anthropic의 핵심 발견은 AI 정책 수립에 관여하는 모든 이들에게 진지하게 주목할 가치가 있다. 자율성은 모델의 고유 속성이 아니라, 모델, 사용자, 제품이 공동으로 구축하는 것이다. 배포 전 평가만으로는 이를 파악할 수 없으며, 실제 사용 속에서 측정해야 한다.
Anthropic 공식 입장은 다음과 같다:
소프트웨어 엔지니어링 분야는 우리 API 상의 에이전트 도구 호출량의 약 50%를 차지하지만, 다른 산업 분야에서도 점차 성장세를 보이고 있다. 위험과 자율성의 경계가 계속 확장됨에 따라, 배포 후 모니터링이 매우 중요해지고 있다. 우리는 다른 모델 개발자들도 이 연구를 확장해 줄 것을 권장한다.
보안 측면의 수치는 안심할 만하다: 도구 호출의 73%는 인간이 루프 내에 참여하고 있으며, 되돌릴 수 없는 조작은 단 0.8%에 불과하다. 가장 높은 위험을 수반하는 배포 시나리오—예컨대 API 키 유출이나 자율 암호화 거래—는 대부분 보안 평가 용도이며, 실제 프로덕션 환경은 아니다.
“각 조작마다 인간 승인을 요구하는 등 구체적인 상호작용 패턴을 규정하는 규제 요건은 오히려 마찰만 유발할 뿐, 반드시 보안 향상을 가져오지는 않는다.”
‘모든 조작에 대한 승인’을 강제하는 정책은 생산성 향상을 막아버리지만, 보안 수준은 높이지 못한다. 더 나은 목표는 구체적인 승인 워크플로우를 규정하는 것이 아니라, 인간이 모니터링하고 개입할 수 있도록 보장하는 것이다.
유니콘이 숨어 있는 곳
지도는 이미 그려졌다. 소프트웨어 엔지니어링 분야는 이미 선점되었다. 의료, 법률, 금융, 교육, 고객 서비스, 물류 등 16개 수직 분야—각 분야의 시장 점유율은 모두 한 자릿수—는 전문 지식을 에이전트에 진정으로 통합할 사람을 기다리고 있다.
지금까지 300개의 SaaS 유니콘이 탄생했고, 앞으로는 300개의 수직형 AI 유니콘이 등장할 것이다. 특정 수직 분야를 선택해 전문 지식을 에이전트에 통합하고, 변화 관리 추진 방법을 고민하는 창업가들이 다음 10년간 기업용 소프트웨어 시장을 주도하게 될 것이다.
모델은 이미 5시간 동안 작동할 수 있으나, 사용자는 실제로 단 42분만 작동시킨다. 이것이 바로 신호다: 우리는 여전히 극초기 단계이며, 아직 아무것도 만들어지지 않은, 수없이 많은 장소에서 지능이 한 분이라도 작동해 본 적 없는 곳이 많다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News














