Google、ニューラルネットワークで写真の場所を特定する「PlaNet」を開発。人間を超える能力を発揮
Googleのチームは、こうした写真と撮影場所を記した約1億2600万枚もの画像データベースを構築。それをPlaNet と名付けた人工ニューラルネットワークに入力し、写真と撮影場所の関連性を教え込みました。
動作を確認するため、チームはFlickrで公開されている270万枚の画像を使い、ジオタグを除いたうえで写っている場所を特定するテストを実施しました。まず写真が写している道路(通り)の名前を特定する実験では、正答率はわずか3.6%にとどまりました。これが都市名をあてるルールにすると10.1%に、国を特定するのであれば28.4%にまで増加しました。ちなみに大陸レベルでの正答率は48%。
数字だけを見ると、その程度かと思ってしまうところですが、マサチューセッツ工科大学の技術誌 MIT テクノロジー・レビューによれば、これはもの凄い数字なのだとか。
開発チームはさらに人間の記憶力と PlaNet を比較するため Google ストリートビューからランダムに選んだ風景から、その場所を答えるゲームのサイト「GeoGuessr」を使った試験を実施しました。世界各国を旅した経験を持つ10人の被験者に PlaNet と勝負してもらったところ、PlaNet が人間に対して28勝22敗で勝ち越す結果となりました。
また開発チームによれば、写真の撮られた場所と回答場所の距離的な誤差は PlaNet が平均1131.7km、人間は平均 2320.75km となり、精度の面でも PlaNet のほうが優れていることがわかったとのこと。
数字の大小だけを比較すれば、とりあえずすべてのテストで PlaNet が人間に勝っており、素晴らしい能力といえるのかもしれません。開発チームは正答率をさらに上げるべく研究を続けるとのことなので、今後に期待したいところです。
なお、GeoGuessr は誰でも自由にプレイできます。筆者がアクセスしてみたところ、だだっ広い草原にひたすら続く一本道、傍らには送電用の鉄塔、という写真が現れました。ここが一体どこなのか全くわからないものの、右下に表示される世界地図の右下の大陸が「オーストララシア」になっているのが気になってしかたがありません。
