Googleが、自然言語による人間の指示に従ってさまざまなゲームをプレイできるAI「Scalable Instructable Multiworld Agent(SIMA)」を発表しました。

SIMA generalist AI agent for 3D virtual environments - Google DeepMind

https://deepmind.google/discover/blog/sima-generalist-ai-agent-for-3d-virtual-environments/

Google’s new gaming AI aims past “superhuman opponent” and at “obedient partner” | Ars Technica

https://arstechnica.com/ai/2024/03/google-deepmind-wants-its-sima-ai-model-to-be-the-ultimate-co-op-gaming-partner/

Googleはこれまで、囲碁やAtari、StarCraft IIを人間以上のスキルでプレイするAIを作り上げてきました。

プロゲーマーに大勝したAI「AlphaStar」が「スタークラフト2」で人類の上位0.2%となるグランドマスターに昇格 - GIGAZINE



by Marco Verch Professional Photographer and Speaker

今回Googleが開発した「スケーラブルで指示可能なマルチワールドエージェント(SIMA)」はこれまでのAIとは異なり、ハイスコアをたたき出したり人間に勝ったりすることではなく、人間の指示に従ってプレイすることを目標にして作られました。

Googleのエンジニアであるティム・ハーレー氏は「SIMAはゲームに勝つために訓練されたのではなく、言われたことを実行するように訓練されました。ひとつのゲームをプレイすることを学習するだけでも、AIシステムにとっては技術的な偉業ですが、さまざまなゲームで指示に従うことを学習すれば、あらゆる環境でもっと役に立つAIエージェントのロックを解除できるでしょう」と話しています。

SIMAの開発にあたり、Googleは8つのゲームスタジオの協力を得て、「Goat Simulator 3」「Hydroneer」「No Man’s Sky」「Satisfactory」「Valheim」など9本のゲームの遊び方をSIMAに学習させました。

AIのトレーニングでは、まずUnityで構築した環境でオブジェクトの基本的な動きを学ばせてから、人間によるプレイでの学習を行いました。人間のゲームプレイには、2人一組になった人間のうち片方がゲームをプレイし、もう片方が次の行動を指示するものや、1人のプレイヤーが自由にゲームを遊んでから、なにがゲーム中での自分の行動につながったのかを説明したものが使われました。

こうしてゲームの遊び方を学習したSIMAは、「小惑星を撃って」「資源を採取して」「柵を跳び越えて」といった言葉での指示を受けることで、約10秒以内に完了できる単純なタスク約600種類をこなすことができるようになりました。



今回の研究で注目すべき点は、9本のゲームすべてでトレーニングを受けたSIMAは、特定のゲームだけを専門にトレーニングされたエージェントより優れたパフォーマンスを示したことです。具体的には、トレーニングデータに別のゲームが含まれている場合のパフォーマンスは、そうでない場合に比べて67%も高かったとのこと。

SIMAの開発チームは今後、より広範なトレーニングを重ねることでさらに汎用(はんよう)的で多用途なAIを開発し、将来的には「資材を調達してキャンプを建設する」といった複雑なタスクをこなせるようにしたいと考えています。

「最終的には、オンラインだけでなく現実世界でも人の役に立つように、幅広いタスクを理解し安全に実行することが可能な、より一般的なAIシステムとエージェントが構築できるよう、研究を進めています」とSIMAチームは述べました。