Claude CodeなどのAIエージェントでロボットを自律的に改善する仕組み「ENPIRE」がNVIDIAによって開発される

NVIDIAがAIエージェントの自律能力をロボットに導入するハーネスフレームワーク「ENPIRE」を発表しました。ENPIREはカーネギーメロン大学やカリフォルニア大学バークレー校の研究者と共同開発されたフレームワークで、Claude CodeやCodexなどのAIエージェントを用いてロボットのタスク遂行能力を強化することができます。
ENPIRE: Agentic Robot Policy Self-Improvement in the Real World
細かいタスクを実行可能な器用なロボットを作るには「人間による監視」と「人間によるアルゴリズム構築」が必要です。しかし、NVIDIAは人間による監視および構築が汎用的なフィジカルインテリジェンスを開発する上でのボトルネックになっていると指摘しています。
ENPIREは「Claude Code」「Codex」「Kimi Code」といった既存のAIエージェントをロボット開発に応用するためのハーネスフレームワークです。AIエージェントはデジタル環境上ではロボット用のアルゴリズムを自律的に開発することができますが、現実世界のロボットに適用することはできません。そこで、NVIDIAはアルゴリズムを現実世界のロボットに適用したり結果を検証したりできるハーネスフレームワークとして「ENPIRE」を開発し、AIエージェントの自律能力をロボット開発に応用できるようにしました。ENPIREという名称は「Environment(環境)」「Policy Improvement(ポリシー改善)」「Rollout(ロールアウト)」「Evolution(進化)」から来ています。

ENPIREを用いることで、「タスクの実行」「結果をもとに改善を計画」「アルゴリズムに改善を導入」「改善版アルゴリズムをロボットに適用」というループを実行してロボットの動作を継続的に改善できます。NVIDIAの実験では「ピンを挿入する」「GPUを基板にセットする」「結束バンドを切断する」といった動作の成功率を自律的に向上させ、成功率99%を達成できることが確認されています。

また、ENPIREには「一度に操作するロボットの数を増やすと、タスク改善速度が向上する」というメリットも存在します。ただし、ENPIREには「AIエージェントがロボットのリソースを十分に活用できておらず、GPUが無駄になっている」「一度に操作するロボットの数を増やすとトークン消費量が増加しコストが増大する」といった問題も存在しているとのことです。
