
포켓몬 고의 300억 장 사진이 배달 로봇에게 길을 알려주고 있다
저자: 윌 더글러스 헤븐
번역·편집: TechFlow
TechFlow 서두: 니언틱(Niantic)은 포켓몬 고(Pokémon Go) 플레이어들이 찍은 300억 장의 도시 사진을 새로운 비즈니스로 전환했다. 자사의 AI 자회사 니언틱 스패셜(Niantic Spatial)은 이 데이터를 기반으로 시각 위치 추정 시스템(Visual Positioning System)을 개발했는데, 이 시스템은 GPS가 도시 캐니언(고층 빌딩 사이의 좁은 도로)에서 제대로 작동하지 못하는 상황에서도 센티미터 단위의 정밀한 위치 추정이 가능하다. 첫 번째 주요 고객사는 배달 로봇 기업 코코 로보틱스(Coco Robotics)다. 피카츄를 잡는 것에서 피자를 배달하는 것으로 진화한 이 사례는, 크라우드소싱 데이터의 가장 예상치 못한 상용화 경로 중 하나일 수 있다.
전문:
포켓몬 고는 세계 최초의 현상급 증강현실(AR) 게임이다. 2016년 구글 산하 자회사 니언틱이 출시한 이 게임은 포켓몬 IP에 AR 기능을 접목시킨 작품으로, 출시 직후 시카고, 오슬로, 에노시마 등 전 세계 곳곳에서 폭발적인 인기를 끌었다. 플레이어들은 거리로 뛰쳐나와 편타이트, 제니비, 혹은 운이 좋으면 극히 희귀한 갈레르 번개조류까지 잡기 위해 열광했다—그들은 현실 세계 위에 부유하며, 손끝만 닿을 듯 말 듯 한 거리에 있었다.
간단히 말해, 이는 엄청난 수의 사람들이 스마트폰을 들고 수많은 건물들을 향해 사진을 찍고 있다는 뜻이다. “60일 만에 앱을 설치한 사람이 5억 명에 달한다”고 니언틱 스패셜의 CTO 브라이언 맥클렌던(Brian McClendon)은 말한다. 니언틱 스패셜은 니언틱이 지난해 5월 분사한 AI 전문 자회사다. 동일 기간 니언틱으로부터 포켓몬 고의 지분을 인수한 게임사 스코플리(Scopely)에 따르면, 이 게임은 출시 8년이 지난 2024년에도 여전히 1억 명 이상의 활성 사용자를 보유하고 있다.
현재 니언틱 스패셜은 이 유례없는 크라우드소싱 데이터 자산—전 세계 수억 명의 포켓몬 고 플레이어들의 스마트폰에서 수집된 도시 랜드마크 사진과 그에 부착된 초정밀 위치 정보—를 활용해 ‘세계 모델(World Model)’을 구축하고 있다. 이는 현재 각광받는 기술 트렌드로, 대규모 언어모델(LLM)의 지능을 실제 세계 환경에 고정시키는 것을 목표로 한다.
이 회사의 최신 제품은 단 몇 장의 건물이나 기타 랜드마크 사진만으로도 사용자의 지도상 위치를 몇 센티미터 단위까지 정확히 파악할 수 있는 모델이다. 이 모델은 GPS 신호가 불안정한 지역에서 로봇의 보다 정밀한 내비게이션을 지원하기 위한 것이다.
이 기술의 첫 대규모 검증 사례로, 니언틱 스패셜은 최근 미국과 유럽 여러 도시에서 마지막 1마일 배달 로봇을 운영하는 스타트업 코코 로보틱스와 협력 관계를 맺었다. “모두가 AR가 미래라고 생각하고, AR 안경이 곧 출시될 것이라 믿고 있다”고 맥클렌던은 말한다. “그런데 오히려 로봇이 먼저 이 기술의 주요 사용자가 되었다.”
피카츄에서 피자 배달까지
코코 로보틱스는 로스앤젤레스, 시카고, 저지시티, 마이애미, 헬싱키 등지에 가방 크기의 배달 로봇 약 1,000대를 배치했다. 이 로봇은 최대 8판의 초대형 피자 또는 4봉지의 식료품을 실을 수 있다. CEO 재크 래시(Zach Rash)에 따르면, 지금까지 이 로봇들은 50만 건 이상의 배달을 완료했으며, 다양한 기상 조건 하에서 수백만 마일을 주행했다.
하지만 인간 배달원과 경쟁하려면 코코의 로봇(보도 위에서 시속 약 5마일로 이동)은 매우 신뢰성 있어야 한다. “우리가 할 수 있는 최선의 일은, 약속한 시간에 정확히 도착하는 것이다”라고 래시는 말한다. 즉, 길을 잃어서는 안 된다는 뜻이다.
코코가 직면한 문제는 GPS에 의존할 수 없다는 점이다. 도시에서는 무선 신호가 건물 사이에서 반사되고 간섭되어 GPS 신호가 약해진다. “우리는 고층 빌딩, 지하 통로, 고가도로가 밀집한 지역에서 많은 배달을 수행하는데, 이런 곳에서는 GPS가 거의 제대로 작동한 적이 없다”고 래시는 설명한다.
“도시 캐니언은 전 세계에서 GPS 성능이 가장 떨어지는 지역이다”라고 맥클렌던은 말한다. “스마트폰 화면의 파란 점을 보면 종종 50미터 정도 흔들리며, 다른 동네나 다른 방향, 심지어 도로 반대편으로 이동해 버린다.” 바로 이 문제를 니언틱 스패셜이 해결하고자 하는 것이다.
지난 몇 년간 니언틱 스패셜은 포켓몬 고와 니언틱이 2013년에 출시한 이전 AR 모바일 게임 인그레스(Ingress) 플레이어들이 생성한 데이터를 정리해 시각 위치 추정 시스템(Visual Positioning System)—즉, 눈앞에 보이는 것을 바탕으로 자신의 위치를 판단하는 시스템—을 구축해 왔다. “피카츄를 현실 거리 위에서 실제로 움직이게 하는 것과 코코의 로봇이 도시를 안전하고 정확하게 통과하게 하는 것은 본질적으로 동일한 문제다”라고 니언틱 스패셜 CEO 존 한케(John Hanke)는 말한다.
디지털 지도 및 공간 분석 전문 기업 ESRI의 콘라드 벤젤(Konrad Wenzel)은 “시각 위치 추정 기술 자체는 새로운 것이 아니다”라고 말한다. “하지만 분명한 사실은, 외부에 설치된 카메라가 많을수록 이 기술의 성능이 훨씬 좋아진다는 점이다.”
니언틱 스패셜은 도시 환경에서 촬영된 300억 장의 이미지를 활용해 모델을 훈련시켰다. 특히 이 이미지들은 니언틱 게임에서 플레이어가 방문하도록 유도되는 ‘핵심 지점(Hotspots)’—예컨대 포켓몬 배틀을 위한 도장(Gym) 같은 중요 장소—주변에 집중적으로 분포되어 있다. “전 세계에 100만 개 이상의 정확한 위치 정보를 제공할 수 있는 장소가 있다”고 맥클렌던은 말한다. “당신이 어디에 서 있는지, 정확히 몇 센티미터 단위로 알 수 있다. 더 중요한 건, 당신이 어느 방향을 바라보고 있는지도 정확히 안다는 점이다.”
그 결과, 이 100만 개의 핵심 지점 각각에 대해 니언틱 스패셜은 거의 동일한 위치에서, 서로 다른 각도와 시간대, 다양한 날씨 조건 아래 촬영된 수천 장의 사진을 보유하고 있다. 각 사진에는 당시 스마트폰의 정확한 공간상 위치, 방향, 자세, 이동 여부, 속도 및 진행 방향 등 상세한 메타데이터가 포함되어 있다.
이 데이터셋을 기반으로 회사는 모델을 훈련시켜, ‘눈앞에 보이는 것’만으로도 자신의 위치를 정확히 예측할 수 있도록 했다—이 100만 개의 핵심 지점 외부, 즉 이미지와 위치 데이터가 비교적 희소한 지역에서도 작동 가능하다.
GPS 외에도, 코코의 로봇(4개의 카메라 탑재)은 이제 이 모델을 통해 자신이 어디에 있는지, 그리고 어디로 가야 할지를 판단한다. 로봇의 카메라는 허리 높이에 설치되어 모든 방향을 동시에 촬영하며, 포켓몬 고 플레이어의 시각과는 다소 차이가 있지만, 래시는 데이터 적응이 복잡하지 않다고 말한다.
경쟁사들도 시각 위치 추정 시스템을 활용하고 있다. 예를 들어, 2014년 에스토니아에서 설립된 로봇 배달 기업 스타십 테크놀로지스(Starship Technologies)는 자사 로봇이 센서를 통해 주변 환경의 3D 지도를 구성하고, 건물 윤곽선과 가로등 위치 등을 표시한다고 밝혔다.
하지만 래시는 니언틱 스패셜의 기술이 코코에 경쟁 우위를 부여할 것이라고 확신한다. 그는 이를 통해 로봇이 식당 앞 올바른 픽업 위치에 정확히 정차해 누구의 길도 막지 않도록 하고, 고객의 집 문 앞에 정확히 멈출 수 있게 될 것이라고 기대한다—과거에는 종종 몇 발짝 차이로 인해 잘못된 위치에 정차하는 일이 빈번했다.
로봇의 캄브리아 대폭발
한케는 니언틱 스패셜이 시각 위치 추정 시스템 개발을 시작할 당시, 목표는 AR에 적용하는 것이었다고 말한다. “AR 안경을 착용했을 때 가상 세계가 당신의 시선 방향에 정확히 고정되려면, 이를 실현할 수 있는 어떤 방법이 필요하다. 그런데 지금 우리는 로봇 분야의 캄브리아 대폭발을 목격하고 있다.”
일부 로봇은 건설 현장이나 보도처럼 인간과 공간을 공유해야 한다. “로봇이 이러한 환경에 인간을 방해하지 않고 자연스럽게 통합되기 위해서는 인간과 유사한 공간 인식 능력을 가져야 한다”고 한케는 말한다. “로봇이 밀리거나 충돌한 후에도, 우리가 그 위치를 정확히 다시 찾아줄 수 있다.”
코코 로보틱스와의 협력은 단지 시작에 불과하다. 한케는 니언틱 스패셜이 구축 중인 것이 바로 그가 ‘살아있는 지도(Living Map)’라고 부르는 시스템의 첫 구성 요소들이라고 말한다—즉, 현실 세계의 변화에 따라 실시간으로 업데이트되는 초고정밀 가상 세계 시뮬레이션이다. 코코와 다른 기업의 로봇들이 전 세계를 주행함에 따라, 이들은 새로운 지도 데이터 소스가 되어 디지털 세계의 복제본을 점점 더 세밀하게 만들어갈 것이다.
한케와 맥클렌던은 지도가 단순히 더 정밀해지는 것을 넘어, 점차 기계 중심으로 사용되기 시작했다고 본다. 이는 지도의 용도 자체를 바꾸고 있다. 오랫동안 지도는 인간의 자기 위치 파악을 돕는 도구였다. 2D에서 3D, 그리고 4D(디지털 트윈 같은 실시간 시뮬레이션을 떠올려보라)로 진화하면서도 기본 원리는 변하지 않았다—지도 위의 점은 공간 또는 시간상의 특정 점에 대응된다.
하지만 기계를 위한 지도는 인간이 당연시하는 정보가 풍부하게 담긴 여행 가이드북처럼 구성되어야 할 수도 있다. 니언틱 스패셜과 ESRI 같은 기업은 지도에 설명 텍스트를 추가해, 기계가 실제로 무엇을 보고 있는지를 알려주고, 각 객체에 대한 일련의 속성을 명시적으로 표시하려 한다. “이 시대의 과제는 기계에게 유용한 세상 묘사를 구축하는 것이다”라고 한케는 말한다. “우리가 보유한 데이터는, 세상의 연결 구조와 작동 방식을 이해하는 데 훌륭한 출발점이 된다.”
현재 ‘세계 모델’이 큰 주목을 받고 있으며, 니언틱 스패셜 역시 이를 잘 알고 있다. LLM은 모든 걸 아는 듯 보이지만, 일상 환경을 해석하거나 상호작용할 때는 거의 상식이 결여되어 있다. 세계 모델은 바로 이 문제를 해결하기 위한 것이다. 구글 딥마인드(Google DeepMind)나 월드 랩스(World Labs) 같은 일부 기업은 가상의 환상 세계를 실시간으로 생성하는 모델을 개발하고 있으며, 이를 AI 에이전트의 훈련장으로 활용하고 있다.
니언틱 스패셜은 이 문제를 다른 각도에서 접근한다고 밝혔다. 맥클렌던은 “지도를 극한까지 정교하게 만들면 결국 모든 것을 포착하게 된다”고 말한다. “우리는 아직 그 단계에 이르지 못했지만, 반드시 도달하고자 한다. 나는 지금 이 순간, 현실 세계를 가능한 한 정확히 재구성하는 데 집중하고 있다.”
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News










