ゲーマーの脳波から大量のロボットを動かす司令AIを開発するという試み
by Lyncconf Games
ゲームで世界チャンピオンに勝利したり、人類上位0.2%と肩を並べたり、人工知能(AI)が人間からゲームプレイを学ぶ時代となる中で、「ゲーマーの脳波を測定して得られたデータを機械学習に用いることで、大量のロボットに指示を与える司令塔となるAIを構築する」という試みが国防高等研究計画局(DARPA)の協力の下で行われていると、技術系メディアのDigital Trendsが報じています。
https://www.digitaltrends.com/cool-tech/brain-training-future-swarm-robot-armies/
バッファロー大学のSouma Chowdhury教授は、「個体がシンプルなルールで行動を行うことで、群れとして高度な振る舞いを生み出す」という群知能の研究を行っています。Chowdhury教授は「100万ドル(約1億1000万円)のロボットを1台使うのではなく、よりシンプルで安価なロボットを大量に使うことで、さまざまなアプリケーションを実行できることが知られています」と語り、シンプルで安価なロボットが群体として自律的に機能する能力を得るために、現代の機械学習によるアルゴリズムが利用できるという考えを明らかにしています。
by Justin Morgan
そして、「『人間がリアルタイムストラテジーゲームで戦術的あるいは戦略的な決定をどう下すか』をつぶさに観察することで、人間の思考や行動の動機付けとなる機能やイベントを特定できる」とChowdhury教授は考えており、「ゲーマーの反応を正確に観察し、その脳波や目の動きをAIに学習させる」という研究を行っています。
Chowdhury教授は「スタークラフト」や「Stellaris」のようなリアルタイムストラテジーゲームを制作。このゲームは資源を使ってユニットを生産し、画面上にある多くのエージェントを操作してミッションを達成するというもので、1ゲームの長さはだいたい5〜10分に設定されており、レベルと設定に応じて6〜7パターンをプレイできるそうです。
このゲームをプレイするテストプレイヤー25人は脳波を測定され、同時に目の動きを超高速カメラで追跡されるとのこと。テストプレイ自体は記事作成時点ではまだ行われていませんが、Chowdhury教授によれば、従来であればアルゴリズムを構築する学習に1万回のシミュレーションを要するところが、人間のデータで学習を補強することで1000回のシミュレーションで済むそうです。
「例えば災害対応の現場では、監督者が必要となります。救助隊が100人いても、監督者は各チームメンバーに何をすべきかを詳細に伝えることはしません。救助隊員は現場でそれぞれ独立した決定を下し、監督者は全体的な戦術を考えます。監督者こそ私たちが構築したいものなのです」とChowdhury教授は語りました。
Chowdhury教授の研究にはDARPAも予算を投入しており、技術系メディアのDigital Trendsはゲーマーの脳波や目の動きから学習したAIが軍用技術として応用される可能性も示唆しています。