「プレイヤーの数だけエンディングが存在するゲーム」が生まれるか　ゲーム開発の最先端で起きていること

2024年10月31日 7時0分

　2024年にノーベル化学賞を受賞したデミス・ハサビス氏率いる「Google DeepMind」が注目されるキッカケとなった業績が、トッププロ囲碁棋士に勝利した囲碁プレイAI「AlphaGo」であったように、「AI研究開発」と「ゲーム」は以前から密接な関係にある。

【画像】「序盤の最強武器は？」　AIに教えてくれるゲームの攻略法

　AlphaGoがヨーロッパチャンピオンに勝利して大きな話題となった2015年からはや9年。現在ではChatGPTに実装されているLLM（Large Language Model：大規模言語モデル）が進化したことで、AIとゲームの関係はさらに高度かつ複雑になっている。そこで本稿では、2024年発表のゲームに応用された「ゲームAI」のなかから興味深いものを紹介したい。

■台頭が期待される「プレイヤーアシスタント」

　マルタ大学らの研究チームは2024年2月、ゲームにおけるLLM活用に関する調査結果をまとめた論文を発表した（※1）。その論文では、ゲームにおけるLLM活用として実際に存在する、あるいは想定されるものとして、8種類の事例をあげている。それらにはプレイヤーとNPCとの会話で活用するわかりやすいものから、ゲームシステムの基幹部分として動作するものまで、さまざまなユースケースがある。

　ゲームシステムとして活用する事例には、元素を組み合わせて新元素を生成するブラウザゲーム『Infinite Craft』がある。このゲームは、ゲームプレイ画面右側にある「Fire（火）」のような単語が書かれたラベルを画面に並べて重ねると、新しいラベルが生成されるというものである。新ラベルの生成には、Metaが開発したオープンソースのLLMであるLlama 2が活用されている。

　これから増えると考えられる活用法には、プレイヤーがゲームをプレイ中にLLMがヒントを教えてくれるプレイヤーアシスタントがある。こうした活用法の具体例として、NVIDIAは2024年6月2日に「Project G-Assist」を発表している（※2）。同システムは、ゲームプレイ中にゲームに関する疑問を音声あるいはテキストで質問すると、AIが回答してくれるというものである。

　NVIDIAはProject G-Assistの有益性を実証するために、恐竜が生息する世界でサバイバルするゲーム『ARK: Survival Ascended』に同システムを実装したデモ動画を公開した。この動画を見ると、攻略サイトを調べて解決していた質問、たとえば「序盤の最強武器は？」といった質問にAIが回答しているのが確認できる。

　前出のマルタ大学発表の論文では、今後期待されるLLM活用法として、LLMによる「ゲーム実況」にも言及している。この活用法を使えば、ゲームプレイは得意だが話すのが苦手なプレイヤーであっても、ゲーム実況動画を制作できるようになるかもしれない。

■“ストーリーのあるゲーム”の在り方を根幹から揺るがすMicrosoftの研究

　RPGのようなストーリーを伴うゲームでは、マルチエンディングのようにストーリーの分岐があったとしても、ゲーム開発者が想定したストーリーの流れをプレイヤーが体験するのが基本となっている。Microsoftの研究チームは2024年4月、こうした既存ゲームにおける前提をLLMの活用によって揺さぶる研究を発表した（※3）。

　Microsoftの研究では、プレイヤーがゲーム開発者によって想定されていなかったストーリーを生成できるかどうかが検証された。この検証のために、『Dejaboom!』と名付けられた小規模のテキストアドベンチャーゲームが開発された。

　このゲームは、プレイヤーはとある村の住民となって、村に隠された爆弾の爆発を回避するのが目標となる。プレイヤーはほかの村人と会話したり村のなかを移動したりして、制限時間内に爆弾の在り処と爆発の解除法を突き止めなければならない。制限時間内に解除法が判明しない場合は爆弾が爆発するのだが、プレイヤーは1日前に戻って目覚めることになる。このように同ゲームのストーリーは一種の“タイムリープ”ものであり、ゲーム名に含まれる「Deja」は既視感を表す「デジャヴ（déjà vu）」に由来する。

　Dejaboom!の最大の特徴は、NPCに該当する村人のセリフが事前に設定されていないことだ。セリフがない代わりに、村人が話す内容はLLMによって生成される。複数登場する村人の性格や爆弾について知っていることは、LLMが事前に学習している。そしてプレイヤーは村人にさまざまな質問、あるいは会話を投げかけることで爆弾に関する情報を得ていく。それゆえ、プレイヤーと村人の会話の内容によっては、ゲーム開発者がまったく想定していなかったストーリー展開が生成される可能性もあるのだ。

　Microsoft研究チームはDejaboom!を28人のプレイヤーにプレイさせ、「想定外のストーリー展開の生成」について調査した。具体的には、想定内のストーリーの流れを可視化したうえで、想定外の内容を追記したのだ。このようにして作成されたストーリーグラフのひとつが、以下の画像である。「start」はゲームの始まり、「end」は爆弾解除によって生じるエンディング、薄青が想定内のストーリー、薄緑が想定外のそれをあらわしている。

　以上の研究は、ゲーム開発者によって事前に用意されていないストーリーを、プレイヤー自身が生成できるゲームの可能性を示唆している。こうした、文字通りプレイヤーの数だけストーリーがある「プレイヤー生成型アドベンチャーゲーム」が、いずれ開発されるかもしれない。

■人間と競うことから、人間に従うことを目指して

　DeepMindが開発した囲碁プレイAIのAlphaGoが代表するように、ゲームプレイAI研究は、特定のゲームについて「人間を凌駕する成績」を上げることを目標としてきた。しかし、LLMの台頭によってAIが自然言語を理解できるようになったことで、ゲームプレイAI研究は、人間と協力したり、人間の指示にしたがったりすることが新たな目標として設定されるようになった。

　DeepMindが2024年3月に発表した「SIMA」（Scalable Instructable Multiworld Agent：拡張可能かつ指導可能なマルチワールドエージェント）は、9つのゲームを自然言語による指示にしたがってプレイするように開発された（※4）。プレイできるゲームにはヤギが登場する『Goat Simulator 3』や惑星探索ゲーム『No Man’s Sky』などが含まれ、さらには4つの実験用ゲームのプレイを学習した。

　SIMAの開発にあたっては、学習データを収集するために人間のプレイヤーに2人一組となって各ゲームをプレイしてもらった。このプレイでは一方の人間が自然言語によるゲームプレイの指示を担当し、他方の人間が実際のゲームプレイを実行した。このような学習データによって訓練したことで、同AIは自然言語の指示にしたがってゲームをプレイできるようになった。

　DeepMindの研究チームは、SIMAが指示通りプレイできるかどうかを検証するテストを実施した。その結果、「戦闘」や「建設」のような正確な動きや空間認識を伴うプレイが難しいことがわかった。また、「調理する」より「食べる」ほうが難しいという直感に反する結果も判明した。

　SIMAの評価テストでは、各ゲームのみを学習した場合と、9つのゲームを学習した場合の比較も行った。この比較から、特定のゲームに特化して学習するよりも、さまざまなゲームを学習するほうが指示通りにプレイできるようになることがわかった。この結果を踏まえると、あらゆるゲームプレイの指示に対応できる汎用ゲームプレイAIを開発するには、幅広いジャンルのゲームを学習させる必要があると言える。この知見は、最近たびたび語られるようになった“AGI”（Artificial General Intelligence：汎用人工知能）の開発にも役立つものと考えられる。

■“動画駆動型ゲーム開発”という新たな可能性

　OpenAIが2024年2月に公開した動画生成AI「Sora」は、テキスト入力からMinecraftのプレイ動画を生成する能力をそなえている。そしてこの能力は、動画生成AIをゲームエンジンとして流用する可能性も示唆していた。

　Googleらの研究チームが2024年8月に発表したAI「GameNGen」（「ゲームエンジン」と発音する）は、「動画生成AIをゲームエンジンに流用すること」をテーマにして開発されたものだ（※5）。同AIは、特定のゲームの動画を大量に学習した結果、任意のゲームプレイ画面を入力すると、その画面に続くゲームプレイ画面を出力できるようになった。このような性能を実現したことで、同AIはまるでゲームエンジンのように機能するようになった。

　今回の研究では、シミュレーションするゲームとしてFPSの古典である『DOOM』が選ばれた。以下の動画は、人間プレイヤーがプレイするDOOMの画面を連続的にGameNGenに入力して、入力画面に続く画面を出力したものである。この動画はAIが生成したものであるが、通常のゲームプレイ動画のように見えるだろう（本稿のトップ画像は、このシミュレーション動画の一部）。

　今回の研究では学習するゲームとして『DOOM』が選ばれたが、学習するゲームを変えれば、そのゲームをシミュレーションできるようになる。さらには、ゲームに関する動画を制作すれば、その動画を学習することで新しいゲームを開発できる可能性をも示している。この可能性は、画像生成AIが“テキスト入力による画像制作”という新しい創作技法を提供したように、プログラミングをせずに動画を制作することでゲームを開発する“動画駆動型ゲーム開発”という新しいアプローチの誕生を予感させるものなのだ。

　以上のように、最先端のゲームAI研究ではゲームシステムやゲーム開発を根本的に変革する可能性を探求している。とくに最後に触れた動画駆動型ゲーム開発は、入力する動画自体も動画生成AIによって生成すれば、理論的にはテキスト入力だけでゲーム開発をおこなえるようになる可能性を含んでいる。この可能性が現実のものとなれば、プログラミングの知識なしで使える“ゲーム開発AI”が誕生して、ゲーム開発における技術的な敷居が大きく下がるのではないだろうか。引き続き注目したい分野だ。

（※1）マルタ大学ら「Large Language Models and Games: A Survey and Roadmap」：https://arxiv.org/html/2402.18659v1（※2）NVIDIA「Project G-Assist の紹介: AI アシスタントがゲームとアプリをどのように強化できるかプレビュー」：https://www.nvidia.com/ja-jp/geforce/news/g-assist-ai-assistant/（※3）Microsoft Research「Players, creators, and AI collaborate to build and expand rich game narratives」：https://www.microsoft.com/en-us/research/blog/players-creators-and-ai-collaborate-to-build-and-expand-rich-game-narratives/（※4）DeepMind「A generalist AI agent for 3D virtual environments」：https://deepmind.google/discover/blog/sima-generalist-ai-agent-for-3d-virtual-environments/（※5）Google Researchら「Diffusion Models Are Real-Time Game Engines」：https://gamengen.github.io/

（文＝吉本幸記）