
거대 기업들이 진출을 서두르고 벤처캐피털(VC)이 돈을 마구 쏟아붓는 와중에, 'AI로 마음 읽기'를 가능하게 하려는 이 회사들 간의 경쟁은 이미 극한으로 치달았다
글: Lexie
편집: Lu

AI에 관한 큰 논의 속에서 사람들은 AI에게 두 가지 역할 중 하나를 부여한다. 즉, 우리를 가장 효과적으로 도와주는 조력자이거나 우리를 뒤엎을 '기계 군단'이라는 것이다. 적이든 아군이든 간에, AI는 인간이 제시한 과제를 수행할 수 있을 뿐 아니라 인간의 마음을 '읽어내는' 능력도 가져야 한다. 바로 이 '마음 읽기' 능력이 올해 들어 AI 분야의 주요 화두가 되고 있다.
PitchBook이 올해 발표한 기업용 SaaS 신기술 보고서에서 '감성 AI(Emotion AI)'가 주목받는 기술로 부상했다. 감성 AI란 감성 컴퓨팅과 인공지능 기술을 활용하여 인간의 감정을 인식하고 이해하며 상호작용하는 것을 의미한다. 텍스트, 얼굴 표정, 음성 및 기타 생리적 신호를 분석함으로써 인간의 감정 상태를 파악하려는 시도이며, 간단히 말해 감성 AI는 기계가 인간처럼, 혹은 인간보다 더 나아가 감정을 정확하게 '읽어내는' 것을 목표로 한다.
주요 기술은 다음과 같다:
-
얼굴 표정 분석: 카메라, 컴퓨터 비전 및 딥러닝을 통해 미세한 표정과 얼굴 근육 움직임을 탐지한다.
-
음성 분석: 음성 지문, 어조, 리듬 등을 통해 감정 상태를 식별한다.
-
텍스트 분석: 자연어 처리(NLP) 기술을 활용해 문장과 문맥을 해석한다.
-
생리 신호 모니터링: 웨어러블 기기를 사용해 심박수, 피부 반응 등을 분석하여 상호작용의 개인화 및 감성 깊이를 향상시킨다.

Emotion AI
감성 AI의 전신은 감성 분석 기술이다. 주로 텍스트 기반 상호작용을 분석하는 방식으로, 소셜미디어에서 사용자의 감정을 텍스트로 분석하고 추출하는 데 사용된다. 여기에 AI 기술이 더해져 시각 및 오디오 등 다양한 입력 방식을 통합함으로써, 감성 AI는 더욱 정밀하고 포괄적인 감성 분석을 약속한다.
01 VC의 투자 쏟아지고, 스타트업 거액 펀딩 성공
실리콘 래빗(Silicon Rabbit) 관측 결과, 감성 AI의 잠재력은 다수의 투자자들을 끌어모으고 있으며, Uniphore, MorphCast 등 해당 분야에 특화된 스타트업들이 이미 막대한 자금을 유치했다.
캘리포니아 기반의 Uniphore는 2008년부터 기업 대상 자동 대화 솔루션 개발을 시작했으며, U-Self Serve, U-Assist, U-Capture, U-Analyze 등 여러 제품 라인을 구축했다. 이들 제품은 고객이 음성, 텍스트, 시각 정보 및 감성 AI 기술을 통해 보다 개인화되고 감성적인 상호작용을 할 수 있도록 지원한다. 특히 U-Self Serve는 대화 속 감정과 어조를 정밀하게 인식해 기업이 맞춤형 서비스를 제공하도록 하며, 고객 참여 만족도를 높이는 데 기여한다.

U-Self Serve
U-Assist는 실시간 가이드와 업무 프로세스 자동화를 통해 고객 서비스 담당자의 효율성을 높인다. U-Capture는 자동화된 감성 데이터 수집과 분석을 통해 기업이 고객의 요구 사항과 만족도에 대한 심층 인사이트를 확보할 수 있게 한다. U-Analyze는 상호작용 내 핵심 트렌드와 감정 변화를 식별해 데이터 기반 의사결정을 지원하고 브랜드 충성도를 강화한다.
Uniphore의 기술은 단순히 기계가 언어를 이해하게 하는 것을 넘어서, 인간과의 상호작용 시 어조와 표정 속에 숨겨진 감정까지 포착하고 해석하는 것을 목표로 한다. 이를 통해 기업은 고객과의 상호작용에서 기계적인 반응을 넘어 고객의 감성적 요구를 더 잘 충족시킬 수 있다. 실제로 Uniphore를 활용한 기업들의 고객 만족도는 87%에 달하며, 고객 서비스 담당자의 성과도 30% 향상됐다.
Uniphore는 지금까지 누적 6.2억 달러 이상의 투자를 유치했으며, 최근 투자는 2022년 NEA가 주도한 4억 달러 규모였다. March Capital 등 기존 투자자들도 참여했고, 이 라운드 후 기업 가치는 25억 달러에 달했다.

Uniphore
Hume AI는 세계 최초의 공감 능력을 갖춘 음성 AI를 선보였다. 전 구글 과학자 Alan Cowen이 창립했는데, 그는 의미 공간 이론(Semantic Space Theory)의 개척자로 유명하다. 이 이론은 음성, 얼굴, 제스처의 미세한 차이를 분석해 감정 경험과 표현을 이해하는 데 기여한다. Cowen의 연구 성과는 '네이처(Nature)', '인지과학 트렌드(Trends in Cognitive Sciences)' 등 다수 저널에 게재되었으며, 지금까지 가장 광범위하고 다양하게 연구된 감정 샘플을 포함하고 있다.
이러한 연구 기반으로 Hume은 대화형 음성 API인 EVI를 개발했다. EVI는 대규모 언어 모델(LLM)과 공감 알고리즘을 결합해 인간의 감정 상태를 심층적으로 이해하고 해석한다. 단순히 음성 속 감정을 인식하는 것을 넘어, 사용자와의 상호작용에서 더 섬세하고 개인화된 반응을 가능하게 한다. 개발자는 몇 줄의 코드만으로 이러한 기능을 활용할 수 있으며, 어떤 애플리케이션에도 쉽게 통합할 수 있다.

Hume AI
현재 대부분의 AI 시스템은 인간이 주는 명령에 크게 의존한다는 한계가 있다. 이러한 명령이나 프롬프트는 오류가 발생하기 쉬우며, AI의 잠재력을 충분히 발휘하지 못하게 한다. 이에 반해 Hume이 개발한 공감형 대규모 언어 모델(eLLM)은 컨텍스트와 사용자의 감정 표현에 따라 어휘와 어조를 조정할 수 있다. 인간의 행복을 최우선 원칙으로 삼아 기계가 학습하고, 조정되며, 상호작용함으로써 정신 건강, 교육 훈련, 응급 전화, 브랜드 분석 등 다양한 분야에서 사용자에게 보다 자연스럽고 현실감 있는 경험을 제공한다.
올해 3월, Hume AI는 EQT Ventures가 주도하는 B 라운드에서 5000만 달러를 투자 유치했다. 투자자로는 Union Square Ventures, Nat Friedman & Daniel Gross, Metaplanet, Northwell Holdings 등이 포함된다.
이 외에도 소비자의 인지 및 감정 반응을 측정하는 전문 스타트업 Entropik이 있다. Entropik은 감성 AI, 행동 AI, 생성형 AI, 예측 AI를 통합한 'Decode' 기능을 통해 소비자의 행동과 선호도를 더 잘 이해하고, 맞춤형 마케팅 제안을 제공한다. Entropik은 2023년 2월 SIG Venture Capital과 Bessemer Venture Partners로부터 2500만 달러의 B 라운드 투자를 유치했다.

Entropik
02 거대 기업 진출, 경쟁 혼전 양상
기술 대기업들은 자체적인 강점을 바탕으로 감성 AI 분야에도 진출하고 있다.
Microsoft Azure의 인지 서비스 감정 API는 얼굴 표정과 감정을 분석해 사진 및 영상 속 기쁨, 분노, 슬픔, 놀람 등 다양한 감정을 식별할 수 있다.
IBM Watson의 자연어 이해 API는 방대한 텍스트 데이터를 처리해 긍정, 부정, 중립 등의 감성 경향을 식별함으로써 사용자 의도를 보다 정확하게 해석한다.
Google Cloud AI의 Cloud Vision API는 강력한 이미지 분석 기능을 갖추고 있어 사진 속 감정 표현을 신속하게 식별할 수 있으며, 텍스트 인식과 감정 연관 기능도 지원한다.
AWS Rekognition 역시 감정을 탐지하고, 얼굴 특징을 인식하며 표정 변화를 추적할 수 있으며, 다른 AWS 서비스와 연동되어 소셜미디어 분석 또는 감성 AI 기반 마케팅 애플리케이션으로 활용될 수 있다.

Cloud Vision API
일부 스타트업은 감성 AI 분야에서 매우 빠른 기술 개발 속도를 보이고 있어, 거대 기업조차 인력 영입에 나설 정도다. 예를 들어 유니콘 기업 Inflection AI는 투자자 중 하나인 마이크로소프트(MS)로부터 AI 팀과 모델에 주목받았다. MS는 빌 게이츠, 에릭 슈미트(Eric Schmidt), NVIDIA 등과 함께 Inflection AI에 13억 달러를 투자한 후, AI 분야의 선구자이자 Inflection AI 공동 설립자인 무스타파 수레이만(Mustafa Suleyman)에게 입사를 제안했다. 이후 수레이만을 비롯한 70여 명의 직원들이 마이크로소프트로 이직했으며, MS는 이들에게 약 6.5억 달러를 지불했다.
그러나 Inflection AI는 곧바로 새로운 팀을 재구성했다. 구글 번역, AI 컨설팅, 증강현실(AR) 등 다양한 배경을 가진 인재들로 새롭게 조직을 꾸린 Inflection AI는 핵심 제품 Pi에 집중하고 있다. Pi는 사용자의 감정을 이해하고 반응할 수 있는 개인용 어시스턴트로, 기존 AI와 달리 사용자와의 감성적 연결을 중요시한다. 음성, 텍스트 등 다양한 입력을 분석해 감정을 인식하고, 대화 속에서 공감 능력을 보여준다. Inflection AI는 Pi를 단순한 AI 어시스턴트가 아닌 코치, 친구, 경청자, 창의적 동반자로 정의한다. 또한 Pi는 강력한 기억 기능을 갖춰 사용자의 과거 대화 이력을 기억함으로써 상호작용의 지속성과 개인화된 경험을 높인다.

Inflection AI Pi
03 성장 여정 속 관심과 비판 공존
감성 AI는 보다 인간 중심의 상호작용을 향한 우리의 기대를 담고 있지만, 다른 모든 AI 기술과 마찬가지로 그 확산에는 관심과 의문이 동시에 존재한다. 우선 감성 AI가 정말 인간의 감정을 정확히 해석할 수 있을까? 이론적으로는 이 기술이 서비스, 장비, 기술 체험을 더욱 풍부하게 만들 수 있지만, 현실적으로 인간의 감정은 본질적으로 모호하고 주관적이기 때문에 문제가 된다. 2019년 연구진은 이미 이 기술에 대해 의문을 제기하며, 얼굴 표정이 인간의 진정한 감정을 신뢰성 있게 반영하지 못한다고 지적한 바 있다. 따라서 기계가 인간의 얼굴 표정, 자세, 어조를 단순히 모방해 감정을 이해하려는 것은 일정한 한계를 안고 있다.
둘째로, 엄격한 법규와 규제는 AI 발전의 걸림돌이 되고 있다. 예를 들어 EU의 AI 법안은 교육 등 특정 분야에서 컴퓨터 비전 기반 감성 감지 시스템의 사용을 금지하고 있어, 일부 감성 AI 솔루션의 확산을 제한할 수 있다. 미국 일리노이주 등 일부 지역에서는 허가 없이 생체정보를 수집하는 것을 금지하는 법률이 있어 감성 AI 기술의 적용 전제 자체를 직접적으로 제한한다. 또한 데이터 프라이버시와 보호 문제는 매우 중요하다. 감성 AI는 교육, 건강, 보험 등 데이터 프라이버시가 특히 중요한 분야에 적용되기 쉬워, 감성 데이터의 안전하고 합법적인 사용을 보장하는 것이 모든 감성 AI 기업이 직면한 과제다.
셋째, 서로 다른 문화권과 지역 간의 감정 해석은 인간 사이에서도 어려운 문제인데, AI에게는 더욱 큰 도전이다. 감정에 대한 이해와 표현 방식이 지역마다 다르기 때문에 감성 AI 시스템의 유효성과 완전성이 저해될 수 있다. 또한 인종, 성별, 성 정체성 관련 편향을 처리하는 과정에서 감성 AI는 상당한 어려움을 겪을 수 있다.
감성 AI는 인력 절감이라는 효율성뿐 아니라 인간의 마음을 헤아리는 세심함까지 약속한다. 그러나 이것이 진정한 인간 상호작용의 완전한 해결책이 될 수 있을까, 아니면 Siri와 별반 다르지 않은 스마트 어시스턴트에 머물러 감정적 이해가 필요한 과제에서는 평범한 성능만을 보여줄 것인가? 아마도 미래에는 AI의 '마음 읽기' 기술이 인간-기계, 그리고 인간 간 상호작용조차 뒤바꿔 놓을지도 모른다. 하지만 현재로서는 인간의 감정을 진정으로 이해하고 반응하는 데에는 여전히 인간의 개입과 신중함이 필요할지도 모른다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News












