「ポケモンGO」や「Ingress」といった位置情報ゲームの開発・運営元として知られるNianticが、これまでのゲーム運営で蓄積してきた視覚測位システム(Visual Positioning System:VPS)情報を活用する形で、空間コンピューティングプラットフォームである「Niantic Spatial Platform」を構築しました。また、VPSで得られた100万以上のスポット情報を基盤として、物理的な世界をナビゲート可能な「大規模地理空間モデル(Large Geospatial Model:LGM)」を構築していることも明らかにしています。

Niantic Spatial Platform

https://www.nianticspatial.com/



Building a Large Geospatial Model to Achieve Spatial Intelligence - Niantic Labs

https://nianticlabs.com/news/largegeospatialmodel

Pokémon Go Players Have Unwittingly Trained AI to Navigate the World

https://www.404media.co/pokemon-go-players-have-unwittingly-trained-ai-to-navigate-the-world/

Niantic uses Pokémon Go player data to build AI navigation system - Ars Technica

https://arstechnica.com/ai/2024/11/niantic-uses-pokemon-go-player-data-to-build-ai-navigation-system/

「ポケモンGO」などの位置情報ゲームを展開するにあたり、Nianticは全世界のさまざまなスポットについて多方面から撮影された詳細なデータを保有することになりました。NianticがGPS(全地球測位システム)になぞらえて、VPSと呼ぶ仕組みによって集まった情報は全世界で100万カ所にも上り、たとえば「ポケモンの姿を現実世界上に表示させたい」と考えたとき、わずか数十cm単位の精度で表示させることが可能になっているとのこと。

Niantic Spatial Platfromは、こうしたVPS情報を活用して構築された、3Dデジタルマップなどで構成されるプラットフォームです。活用例の動画が公開されています。

Sphere XR | Remote Assistance with Niantic Spatial Technology - YouTube

作業員とオペレーターが通話中、作業員は作業対象がどの部位なのかをオペレーターに尋ねています。



現場はこんな感じ。



作業員がスマートフォンでスキャン機能を立ち上げました。



対象物にカメラを向けつつ周りをぐるっと移動。



現地のスキャンモデルが生成されました。



続いて、オペレーターがヘッドセットを着用。



そして注釈ツールを起動。



先ほど生成されたスキャンモデルの作業対象部位に印をつけた上で、「ここをドリルして」と指示を書き込みました。



すると、オペレーターの入力した情報が作業員の手元のスマートフォンに表示されました。写真に対してではなく、スキャンモデルに対して書き込まれていて、オペレーターが移動するとモデルの向きも変化します。



おかげで、場所が容易に特定できて作業に入ることができました。



これはあくまでデモンストレーションですが、NianticではVPSをベースにLGMの構築も進めています。

言葉の理解・生成が可能な大規模言語モデル(LLM)に続いて、画像理解・生成が可能な2Dビジョンモデル、さらにオブジェクトの立体的外観がモデリング可能な3Dビジョンモデルまで登場していますが、LGMは3Dビジョンモデルを越え、特定の地理的場所に基づいてメトリック情報を持つ3Dエンティティをキャプチャする、いわば「3D地図」になるとのこと。3Dビジョンモデルは3Dシーンを生成することが可能ですが、LGMは具体的にシーンが「世界のどの場所と関連しているか」を理解することができるそうです。

なお、VPSはプレイヤーが蓄積してきたデータがもとになっていますが、ソーシャル掲示板のRedditでは、このことについて「Nianticのビジネスモデルがプレイヤーのサポートを中心としたものではないことには多くの人が気付いていた」という投稿があるものの、特にデータ利用について騒ぎになっているわけではありませんでした。