NVIDIAのヒューマノイド開発基盤「GR00T」ヒト型ロボット開発効率が飛躍的に上がる理由【動画解説】Cosmosとドリーム

そして次の動画を公開した。この動画について解説しよう。
なお、これらのプラットフォームやブループリントは、Agility Robotics、Boston Dynamics、Fourier、Foxlink、Galbot、Mentee Robotics、NEURA Robotics、General Robotics、Skild AI、XPENG Roboticsなど、先進的で著名なヒューマノイド開発企業が採用していることを発表している。
●ヒューマノイドのメリットは汎用性
ロボットは工場や倉庫などを中心に、主に人が行なっている単純で繰り返しの、専門的で特定の作業を代替してきた。一方、ヒューマノイドの最大の特徴は「汎用性」。これは、特定の分野や状況に限らず、様々な場面や用途に広く使えることを指す。

汎用性は、まさに人間の持つ利点のひとつだ。人手不足や労働者不足が深刻化する中で、汎用的なヒューマノイドはその解決策として注目されている。AIや生成AIの進化によって、ロボットの知性が著しく向上し、その時がいよいよやってくるのでは、と期待されている。


●ロボット開発の課題は訓練データ不足
しかし、人間の持つ汎用性は、そう簡単にAIロボットで代用することができない。できることを増やすためには、作業ごとに大量の訓練データが必要となる。仕事に就任した新人に作業の手順を手本を見せて覚えさせるように、ロボットにも実データや合成データを見せて学習させる。ところが、従来からある「人がロボットに手本を見せる方法」人間によるデモは時間がかかりすぎてスケールしないというのが現状だ。

ロボット開発にはこうした「訓練データの不足」が最大の課題とされてきた。
●生成AIが未知の動きを想像(ドリーム)して訓練データを生成
そこでNVIDIAが提案しているのがAIモデル「Cosmos」と「GR00T-Dreams」だ。覚えさせたい作業を人が一度、もしくは数回見せるだけで、それを映像として記録する。

生成AIが未来の動きを「ドリーム」のように想像して生成、それを現実軌道と動作データに変換してAIが学習していく。



同社の発表によれば、人が作成した場合3ヶ月かかる量の訓練データを、NVIDIA Research はわずか36時間で合成データを生成できたとしている。

少人数の開発陣、比較的少ないデータしかなくても、少ないデータをもとに生成された膨大なデータを使ってAIは動作を学習し、仮想空間(デジタルツイン)で経験を積み重ねていき、精度の高い作業ができるようになる、というしくみだ。

左が生成AI(ドリーム)で生成した訓練データ。動作データは人間の自然言語から生成される。右がリアルのロボットに作業をデプロイした様子

●ヒューマノイド開発の期間やコストの大幅な削減
人間がひとつの経験をもとに、それを応用してはじめての作業にもある程度対応し、数回経験すれば慣れて上手になっていく、そのようなプロセスを基盤モデルに組み込むことで、ヒューマノイドの汎用性の底上げするとともに、開発期間やコストの大幅な削減を実現しようとしている。
