家庭の掃除ロボットや工業施設内の産業用ロボットなど、世の中にはさまざまなロボットがあふれています。しかし、これらのロボットは大抵が決まった動作しか行うことができません。Googleは新たに、人間のコミュニケーション方法を学んで人間が求める動作を自然に行うことができるAIを開発していることを明らかにし、そのAIを搭載した開発中のロボットを公開しました。

PaLM-SayCan

https://sites.research.google/palm-saycan

Google gives its helper robots language skills to understand humans better

https://www.siliconrepublic.com/machines/google-robots-alphabet-large-language-models

For helper robots, the smallest things can be the hardest to grasp - YouTube

多くのロボットは「物をつかんで」「ゴミを集めて」といった単純な命令に従うことはできても、「部屋を掃除して片付けて」「何か飲み物を持って来て」といったロボット自身で行動を選択する必要がある複雑なタスクをこなすことは困難です。Googleが新たに開発したロボット「PaLM-SayCan」は、人間の言葉の文脈を理解し、ロボット自身の能力や周囲の環境を把握して、最も適切だと思われる行動を取れるというものです。

例えば人間が飲み物をこぼしてしまい、PaLM-SayCanに「飲み物をこぼしたので何か拭くものを持って来てくれないか?」と尋ねたとします。



すると、PaLM-SayCanは「何か拭くもの」という曖昧な指示を受けて「飲み物を拭くのには何が適切なのか」と考察し、「最適なものはスポンジ」という判断を下したあと、「スポンジを拾う」「スポンジを人間のところまで持っていく」「スポンジを置く」といった一連の動作を行ってくれるそうです。



また、指示を少し変更して「飲み物をこぼしたので代わりの飲み物を持って来てくれないか?」と尋ねたときも、正しく理解して飲み物を持って来てくれるとのこと。

Googleは5400億ものパラメーターで人間の言語を理解し、複雑なタスクを実現する言語モデル「Pathways Language Model(PaLM)」を開発しており、人間が何を言いたいのか、どう返すべきなのかをAIが判断して自然なやりとりを行えるよう取り組んでいます。「これをロボットに組み込んだらどうなるだろうか」ということでスタートしたのが今回の取り組み。Googleが協力しているロボット企業Everyday Robotsのロボット「SayCan」にPaLMを組み合わせ、PaLM-SayCanとして開発しているそうです。実際にGoogleのオフィスで動作させており、これまで異なる101のタスクを要求したところ、84%の確率で適切な判断を下し、74%の確率で正常にタスクを実行したとのこと。

Googleの研究者であるKarol Hausman氏は「これが家庭の必需品となるにはほど遠く、ロボットとより自然にコミュニケーションを取れるようになるのはまだまだ先のことです。しかし、より人間中心のロボットを訓練するための新しいアプローチを模索している中で、この可能性にワクワクしています」と述べました。