チェスで人間を打ち負かしたり、新薬を創出したりと、AIは難しい課題で人間を超えるような才能を見せることがある一方で、人間なら容易にこなせるタスクに苦戦することがあります。このことは、機械工学研究者のハンス・モラベックによる「モラベックのパラドックス」として知られているのですが、物理的な課題の解決にも取り組んでいかなければならないということで、基盤モデルと学習アルゴリズムの開発を手がけるグループのPhisycal Intelligenceが、8カ月かけて、汎用的な動きを実現するロボットに対応するためのAIモデルとして、汎用ロボット基盤モデルの「π0」を開発しました。

Our First Generalist Policy

https://www.physicalintelligence.company/blog/pi0

Physical Intelligenceによると、「π0」は「人工物理知能(Artificial Physical Intelligence)」開発という長期的目標の最初のステップだとのことで、大規模言語モデル(LLM)やチャットボットアシスタントを使うときと同じように、ロボットに任意のタスクを解決するよう依頼することができます。

「π0」は多様なデータを学習しているので、さまざまな指示を実行することができます。LLMとは異なり画像やテキストだけではなく、ロボットの具体的な体験にも基づいたトレーニングから、新たなアーキテクチャを介して直接的な運動のコマンドを出力することを学び、「物理的知性」を獲得しています。

デモンストレーション映像として、「π0」が洗濯物を洗濯機から取り出して畳んだり、食事が終わった後のテーブルを片付けたり、箱を組み立てたりするタスクをこなす様子が公開されています。

ロボットアームでドラム型洗濯機のフタを開けて洗濯物を取り出す様子

洗濯機から取り出した洗濯物を次々と畳んでいく様子

食事が終わった後に残された食器を片付ける様子

コーヒー豆を計量してミルに移していく様子

箱を組み立てる様子

プロトタイプの第1号モデルは、オープンソースのデータセットおよび8つの異なるロボットから集めた器用な作業のデータセットでトレーニングが行われました。トレーニング元として、特化した作業ではなく幅広い作業が含まれるデータが用いられた理由は、特定用途を解決するのではなく、物理的な相互作用の一般的な知識を基盤モデルに学習させるためで、「物理的知性の最初の基盤」とPhysical Intelligenceは表現しています。

モデル構築を成功させるために、Physical Intelligenceはロボットコミュニティ全体を巻き込んでの共同作業が必要だと考えていると述べており、すでに多くの企業や研究所との協力を始めていることを明かしています。