600時間分のドラマを観た人工知能による「人間行動の予測」の精度

写真拡大

マサチューセッツ工科大学(MIT)が、テレビドラマをたくさん観せることで、次に起こる人の行動を予測できるAIを開発した。テレビ番組のようなキャプションや説明のない動画こそ、複雑な世界を理解するために有効なリソースだと研究者は語る。

人工知能(AI)にとって難しいことのひとつが、人間が次に何をするかを予測することだ。

「600時間分のドラマを観た人工知能による「人間行動の予測」の精度」の写真・リンク付きの記事はこちら

この問題を解決するために、マサチューセッツ工科大学(MIT)コンピュータ科学・人工知能研究所のコンピューターヴィジョン(ロボットの目をつくる研究分野)の専門家たちは、あるアルゴリズムに600時間分のテレビ番組を見せた。「アグリー・ベティ」「Scrubs〜恋のお騒がせ病棟」「ビッグ バン★セオリー/ギークなボクらの恋愛法則」「The Office」といった番組だ。

AIはこれらの動画を分析したあとで別の動画を見せられ、次に何が起こるかを予測した。するとAIは、5秒先に起こることを43パーセントの確率で予測できたという。

「男と女が、キスをするかハグをする。あるいはバーにいる男たちがハイタッチするといったことを、AIは正しく予測できました」と研究者たちは書いている。「しかし、ハグを予想していたが第三者が不意に場面に登場したため予想が間違ったケースもありました」

「(テレビ番組のような)ラベル付けされていない動画こそ、わたしたちが世の中を理解するために有効なリソースです。この無尽蔵なリソースを使用すれば、AIは未来を予想できるようになります」と、研究者たちは論文で書いている。

RELATED

ここでは、「ラベル付けされていない」という特徴が重要になる。(テレビ番組には)何が起こったかを説明するキャプションや説明が付いていないので、AIはその内容を独力で理解しなければならないからだ。

リリースによると、研究者たちは人間の行動だけでなく、あるシーンで次に何が現れるか(例えば「電子レンジをあけるとコーヒーカップが出てくる」)についてもAIがどれくらいの確率で予測できるかを調べ、人間の予測能力と比較している。正答率は、人間が71パーセントだったのに対してAIは11パーセントだった。

「こうしたタスクに関して、AIはまだ人間の能力にはるかに及びません。しかしラベル付けされていない動画を使えば、機械が(人間の行動だけでなく)物体の動きを予測できるようになる可能性もあります」と研究者たちは書いている。「未来は本来不確実なものなので、完璧に予測することは人間にもできません。だからこそ、未来について複数の予測を立てるAIが必要になるのです」

INFORMATION

『WIRED』VOL.20は、「人工知能」と「都市」の2大特集・特別保存版

第1特集「人工知能はどんな未来を夢見るか」では、『WIRED』US版創刊編集長のケヴィン・ケリーによる論考をはじめ、ベン・ゲーツェル、PEZY Computing・齊藤元章、全脳アーキテクチャ取材記事やAIコミック「シンギュラリティ・ロック」を掲載。第2特集「未来都市TOKYOのゆくえ」では、テクノロジーとデザインが変えゆくTOKYOの未来の姿を考察。建築家ビャルケ・インゲルスのや、「デスラボ」カーラ・マリア=ロススタインの死の都市TOKYO彷徨記など盛りだくさんの内容。