
『ポケモンGO』の300億枚の写真が、デリバリー用ロボットに道を教える
TechFlow厳選深潮セレクト

『ポケモンGO』の300億枚の写真が、デリバリー用ロボットに道を教える
ピカチュウを捕まえることからピザを配達することまで——これは、クラウドソーシングデータの商業化において最も予想外の経路の一つかもしれません。
著者:ウィル・ダグラス・ヘブン
編訳:TechFlow
TechFlow解説:ニアンティック(Niantic)は、『ポケモンGO』のプレイヤーが撮影した300億枚に及ぶ都市写真を新たなビジネスへと転化させた。同社のAI子会社「ニアンティック・スペーシャル(Niantic Spatial)」は、これらのデータを活用して視覚的測位システム(Visual Positioning System)を訓練し、その精度を数センチメートルレベルまで高めることに成功した。これは、都市峡谷(高層ビルが密集するエリア)においてGPSが機能しない状況下でも、圧倒的な性能を発揮するものである。この技術の最初の大口顧客は、配達ロボット企業「ココ・ロボティクス(Coco Robotics)」だ。「ピカチュウを捕まえる」から「ピザを届ける」へ——これは、クラウドソーシングによるデータ収集が実現した、最も予期せぬ商業化の道筋の一つかもしれない。
全文は以下の通り:
『ポケモンGO』は、世界初の現象級ARゲームである。2016年にグーグルの子会社であるニアンティックがリリースした本作は、ポケモンという人気IPに拡張現実(AR)要素を融合させた革新的なタイトルであり、発売直後から世界中で爆発的な人気を博した。シカゴからオスロ、さらには江ノ島に至るまで、プレイヤーたちは街中に繰り出し、プクリンやゼニガメ、あるいは運が良ければ極めて希少なガラルのライチュウ——現実世界の上空に浮かびながら、ほんの少し手が届かない位置にいる——を捕まえようと熱心に歩き回った。
要するに、これは膨大な人数がスマートフォンを手に、無数の建物を撮影しているということを意味する。「アプリをわずか60日間で5億人がダウンロードした」と、ニアンティック・スペーシャルのCTOブライアン・マクレンドン氏は語る。ニアンティック・スペーシャルは、昨年5月にニアンティックから分社化されたAI専門企業である。また、同時期にニアンティックから『ポケモンGO』の権利を買収したゲーム会社スコープリー(Scopely)によると、2024年時点で本作のアクティブユーザーは1億人以上に上っており、リリースからすでに8年が経過しているにもかかわらず、依然として高い人気を維持している。
現在、ニアンティック・スペーシャルは、この比類なきクラウドソーシング型データ宝庫——世界中の数億人の『ポケモンGO』プレイヤーのスマートフォンから得られた、超高精度の位置情報付き都市ランドマーク写真——を活用し、「ワールドモデル(World Model)」の構築に取り組んでいる。これは現在注目を集める技術分野であり、LLM(大規模言語モデル)の知能を現実世界の環境に正確に「固定」することを目的としている。
同社が最近発表した新製品は、建物やその他のランドマークの数枚のスナップショットのみで、地図上の自分の位置を数センチメートル単位で特定できるモデルである。この技術は、GPSの精度が信頼できない場所でのロボットのより正確なナビゲーションを支援することを目指している。
本技術の初めての大規模実証として、ニアンティック・スペーシャルは先日、米国および欧州の複数都市で「ラストマイル配達ロボット」を展開するスタートアップ企業ココ・ロボティクスと提携した。マクレンドン氏はこう語る。「誰もが『ARこそが未来だ、ARメガネがもうすぐ登場する』と考えていた。ところが、実際に最初のユーザーとなったのはロボットだったのだ。」
ピカチュウからピザへ
ココ・ロボティクスは、ロサンゼルス、シカゴ、ジャージーシティ、マイアミ、ヘルシンキの各都市に、スーツケースサイズの配達ロボット約1,000台を展開している。同社CEOザック・ラッシュ氏によれば、これらのロボットは最大8枚の大型ピザまたは4袋の食料品を積載可能で、これまでに50万回以上の配達を完了し、あらゆる天候条件下で累計数百万マイルを走行したという。
しかし、人間の配達員と競合するためには、ココのロボット(歩道を時速約5マイル=約8km/hで走行)は極めて信頼性が求められる。「私たちにとって最良の働き方とは、約束した時間に必ず到着することです」とラッシュ氏は述べる。つまり、道に迷ってはならないのだ。
ココが直面する課題は、GPSへの依存が不可能である点にある。都市部では、電波が建物間で反射・干渉し、GPS信号が極端に弱くなる。「私たちは高層ビル、地下トンネル、高架道路などが密集した地域で多数の配達を行っていますが、こうした場所ではGPSはほぼ常に機能しません」とラッシュ氏は指摘する。
「都市峡谷は、GPSが世界中で最も苦手とする環境です」とマクレンドン氏。「スマホ画面に表示される青いドットは、しばしば50メートルもずれ込み、別の街区や反対方向、あるいは道路の向かい側まで飛んでしまうことがあります。」まさにこの問題を解決しようとしているのが、ニアンティック・スペーシャルなのである。
過去数年間、ニアンティック・スペーシャルは、『ポケモンGO』およびニアンティックが2013年にリリースした前作ARゲーム『イングレス(Ingress)』のプレイヤーが生み出したデータを整理し、視覚的測位システム(Visual Positioning System)——「自分が何を見ているか」によって位置を推定する仕組み——の構築を進めてきた。「ピカチュウをリアルに街中で走らせるのも、ココのロボットを安全かつ正確に都市内を走行させるのも、本質的には同じ問題なのです」と、ニアンティック・スペーシャルのCEOジョン・ハンケ氏は語る。
「視覚的測位自体は新しい技術ではありません」と、デジタル地図・地理空間分析企業ESRIのコンラッド・ヴェンツェル氏は言う。「ただし、明らかに、外部に設置されたカメラの数が多ければ多いほど、その性能は向上します。」
ニアンティック・スペーシャルは、都市環境で撮影された300億枚の画像を用いてモデルを訓練した。これらの画像は特に「ホットスポット」周辺に高密度に集中しており、それはニアンティックのゲーム内でプレイヤーが訪れるよう促されている重要な地点——例えばポケモンバトルのためのジム——である。「世界中に100万カ所以上の地点があり、そこではあなたの位置を数センチメートル単位で正確に特定できます」とマクレンドン氏は説明する。「私たちはあなたがどこに立っているかだけでなく、さらに重要なことに、あなたがどの方向を向いているかも把握しています。」
その結果、この100万カ所の各々について、ニアンティック・スペーシャルは、ほぼ同一の位置から、異なる角度・異なる時間帯・異なる天候条件で撮影された数千枚の写真を保有している。さらに、各写真には、スマートフォンの空間内における正確な位置・向き・姿勢・移動の有無・速度・進行方向など、詳細なメタデータが付与されている。
同社はこのデータセットを用いてモデルを訓練し、それが「何を見ているか」から自身の位置を正確に予測できるようにした。しかも、この100万カ所のホットスポット以外——画像と位置情報が比較的少ないエリア——においても、十分に機能するようになっている。
ココのロボットは、GPSに加えて、このモデルを活用して現在地と目的地を判断する。ロボットには4台のカメラが搭載されており、腰部の高さに設置され、全方向を同時に見渡す構造となっている。これは『ポケモンGO』プレイヤーの視点とはやや異なるが、ラッシュ氏によれば、データの適合はそれほど難しくないという。
他社も視覚的測位システムを採用している。例えば、2014年にエストニアで設立されたロボット配達企業スターシップ・テクノロジーズ(Starship Technologies)は、自社ロボットがセンサーを用いて周囲の3Dマップを構築し、建物の縁や街灯の位置をマーキングしていると主張している。
だがラッシュ氏は、ニアンティック・スペーシャルの技術がココに差別化をもたらすと確信している。彼は、これによりロボットがレストランの外で正しいピックアップ位置に正確に停車でき、通行人の邪魔にならず、また顧客の玄関先ではなく、数歩手前の場所に止まってしまうといった過去の問題を解消できると期待している。
ロボットのカンブリア紀大爆発
ニアンティック・スペーシャルが視覚的測位システムの開発を始めた当初の目的は、ARへの応用であったとハンケ氏は語る。「ARメガネを装着した際、仮想世界がユーザーの視線方向に正確に固定されるようにするには、何らかの方法が必要です。しかし今、私たちはロボット分野におけるカンブリア紀の大爆発を目撃しているのです。」
一部のロボットは建築現場や歩道など、人間と空間を共有しなければならない。ハンケ氏はこう説明する。「ロボットがこうした環境に、人間に迷惑をかけずに自然に溶け込むためには、人間と同程度の空間認識能力を備える必要があります。ロボットが押しやられたり衝突したりした後でも、我々はその正確な現在地を即座に再特定できるのです。」
ココ・ロボティクスとの提携は、あくまで始まりに過ぎない。ハンケ氏によれば、ニアンティック・スペーシャルが構築しようとしているのは、いわゆる「リビングマップ(Living Map)」——現実世界の変化に合わせてリアルタイムに更新される、超高精度な仮想世界のシミュレーション——の第一段階となるコンポーネント群である。ココやその他企業のロボットが世界中を走行することで、新たなマップデータの源泉となり、デジタル上の現実世界のコピーはますます精巧になっていくだろう。
ハンケ氏とマクレンドン氏は、マップは単に精度が高まるだけでなく、次第に機械によって使われるようになるという点に注目している。これはマップの用途を根本的に変えるものである。長年にわたり、マップは人間の自己位置確認を支援してきた。2Dから3D、さらにはデジタルツインのようなリアルタイムシミュレーションを含む4Dへと進化しても、基本原理は変わらない——マップ上の一点は、空間または時間上の一点に対応する。
しかし、機械向けのマップは、ガイドブックのように、人間が当然のこととして理解している情報を豊富に含む必要があるかもしれない。ニアンティック・スペーシャルやESRIなどの企業は、マップに説明文を追加し、機械が実際に何を見ているのかを明示するとともに、それぞれの物体に一連の属性を付与しようとしている。「この時代の使命は、機械にとって有用な世界の記述を作り上げることです」とハンケ氏は述べる。「我々が保有するデータは、世界のつながりや組織構造を理解するうえで、非常に優れた出発点となります。」
現在、ワールドモデルは非常に注目を集めているが、ニアンティック・スペーシャルもその重要性を十分に認識している。LLMはあらゆることを知っているように見えるが、日常的な環境を解釈したり、それと相互作用したりする際には、ほとんど常識を持たない。ワールドモデルはまさにこの課題を解決しようとするものである。グーグル・ディープマインド(Google DeepMind)やワールド・ラボズ(World Labs)などの企業は、リアルタイムで仮想のファンタジー世界を生成するモデルを開発し、それをAIエージェントのトレーニングフィールドとして活用しようとしている。
ニアンティック・スペーシャルは、この問題に対して異なるアプローチを取っていると説明する。「マップを極限まで高精度に作り上げていけば、最終的にはあらゆるものが捉えられるようになります」とマクレンドン氏。「我々はまだその域には達していませんが、そこに到達することを目指しています。今は、現実世界を可能な限り忠実に再構築することに、極めて集中しています。」
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News










