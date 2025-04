Microsoftが2025年4月4日に、プレイヤーの操作にリアルタイムで応答し、ゲーム環境を生成できるAIモデル「World and Human Action MaskGIT Model(WHAMM)」をリリースしました。これに合わせ、1997年発売のシューティングゲーム「Quake II」をAIが再現したデモをプレイすることが可能です。WHAMM! Real-time world modelling of interactive environments. - Microsoft Research

https://www.microsoft.com/en-us/research/articles/whamm-real-time-world-modelling-of-interactive-environments/Microsoft has created an AI-generated version of Quake | The Vergehttps://www.theverge.com/news/644117/microsoft-quake-ii-ai-generated-tech-demo-muse-ai-model-copilotMicrosoft releases AI-generated Quake II demo, but admits ‘limitations’ | TechCrunchhttps://techcrunch.com/2025/04/06/microsoft-releases-ai-generated-quake-ii-demo-but-admits-limitations/WHAMMのデモは以下のリンクから利用できます。Microsoft Copilot: Copilot Gaming Experiencehttps://copilot.microsoft.com/whamユーザーが18歳以上である場合「Agree」をクリックしてプレイ開始。実際のゲームプレイが以下。操作には非常に大きなラグがあり、快適にプレイすることは困難です。Microsoftのゲーム生成AIモデル「WHAMM」を使った「Quake II」のデモ - YouTubeプレイできるのは120秒間で、制限時間に達すると「Game Over」と表示されます。今回Microsoftが発表したWHAMMは、2025年2月に発表された「World and Human Action Model(WHAM)の改良版とも呼べるAIモデルで、プレイヤーの操作に合わせてAIがリアルタイムでゲームの画面を生成するというものです。WHAM-1.6Bは1秒間に約1フレームの生成しかできなかった一方でWHAMMは毎秒10フレーム以上を生成可能です。そのため、プレイヤーのキーボードやコントローラー操作に即座に反応するリアルタイムな描写が可能とのこと。従来のWHAMでは、大規模言語モデルのようにトークンを1つずつ生成するモデリング方法を採用していました。しかし、このモデリング方法には「高品質だが生成に時間がかかる」という課題がありました。そこでMicrosoftはWHAMMにおいて「MaskGIT」と呼ばれるアーキテクチャを採用しました。これは、画像全体のトークンを一度に生成し、その後一部のトークンをマスクして再度予測・修正するという手法で、この手順を反復することで画像予測を徐々に洗練させることが可能です。少ない計算ステップでリアルタイムな応答を実現するために、WHAMMは画像全体のトークンの初期予測を生成する約5億パラメーターの「Backbone」transformerと、初期予測を絞り込んで精密化を行う約2億5000万パラメーターの「Refinement」transformerを採用しています。これにより、MaskGITステップを何度も反復して実行することが可能になり、より良い最終予測を確実に行うことができるそうです。一方でMicrosoftは現時点でのWHAMMの課題も挙げています。・敵とのインタラクション:敵キャラクターがぼやけて表示されたり、戦闘ダメージの計算が不正確だったりといった問題・コンテキストの長さ:記事作成時点でのWHAMMのコンテキスト長は10fpsにつき9フレームであるため、0.9秒間視界から外れた敵やオブジェクトが消失してしまうという問題・数値の正確性:残り体力などの数値が不正確になる問題・範囲の制限:WHAMMはQuake IIの一部分でしか訓練されていないため、エリアの終点に到達すると生成が停止してしまう問題・遅延:WHAMMを誰でも試せるようにウェブブラウザ経由で公開したことによる、操作に対する遅延が発生する問題Microsoftは「このWHAMMモデルは、リアルタイムで生成されたゲームプレイエクスペリエンスの初期の実験です。私たちは、こうしたモデルによってどのような新しいインタラクティブメディアが実現可能になるかを探求することにワクワクしています」と述べています。