人間らしく歌い上げるロボット『HRP-4C未夢』の秘密は″無意識″だった

写真拡大

独立行政法人産業技術総合研究所が開発した『HRP-4C未夢』をテレビなどで1度は目にしたことがある人は多いだろう。美少女の頭部に、ロボット的なボディをもち、人間のように振る舞うロボットで"ヒューマノイド"とよばれている。
『HRP-4C未夢』は最新デジタル製品の展示会『CEATEC JAPAN 2010』で人間そのままに歌う姿が披露され、話題を呼んだ。先端研究と産業の融合をはかる『デジタルコンテンツエキスポ2010』ではバックダンサーを引き連れて踊る姿が披露された。今回は歌のほうに注目し、開発者に"人間らしさ"についてインタビューを行った。

今回の歌唱には二つの技術が使われている。まずは、歌を担当する「VocaListener(ぼかりす)」だ。人間の歌を入力すると、VOCALOIDのデータが歌声によって人間のように調整されるというソフトで、元歌にはニコニコ動画で活躍する歌い手サリヤ人さんや、ELTのボーカル・持田香織さんなどが起用されている。この技術について開発者の一人、情報技術研究部門メディアインタラクション研究グループの中野倫靖氏にお話をうかがってみた。

――人間そっくりに初音ミクが歌っていてびっくりしました。なぜ、歌い手を真似るのでしょう?
「ぼかりす」は歌い手を真似るのではなく、入力装置なんです。初音ミクなどVOCALOIDを使うときは"調教"と呼ばれる音程調整が必要なんですね。その作業はマウスで専用ソフトをいじるのですが結構大変で、実際に歌ったほうが早くて的確だという人も多いはずです。

――なるほど。今回さらにリアルになっているように思うのですが、なぜこんな人間らしい歌声になっているのでしょう。
「ぼかりす」は音の高さや大きさ、声色などを解析して元々非常に人間らしい歌声を作れるソフトです。今回進歩したのはブレス位置の推測の技術が大きいですね。歌の間の息を吸い込むタイミングを独自の技術で解析し、初音ミクのブレスに置き換えています。また、サリヤ人さんなどの歌唱が非常に素直で、真似しやすかったというのもあります。

――なるほど。……ちなみに好きなボーカロイドの曲は?

最近だと『ワールズエンド・ダンスホール』ですね!

ぼかりす ぼかうお
二つ目の技術。その歌声にロボットとしての表情をつけるのが「VocaWatcher(ぼかうお)」だ。歌にあわせて口、まぶた、首といった各部分が人間のように動いて表情を作る。これは人間の歌い手の歌唱中の表情をカメラで映し、それを解析してロボットに移植することで実現している。この技術について開発者の一人、知能システム研究部門ヒューマノイド研究グループの梶田秀司氏にお話をうかがってみた。

――なぜこうしたロボットを作ったのでしょう?
リアルに歌を歌わせたい、というところからです。

――人間らしさはどこから来ているのでしょうか?
歌にあわせて口が動く部分が大きいですね、単純な発見なのですが、口を大きく開けるのは大きい声を出すときではなく、その前段階のブレスのときなんです。今回人間をモデルに表情を作ったおかげでよくわかりました。また、モデルのサリヤ人さんにはステージを意識した歌い方をしてもらったのですが、歌唱中の首の動きや感情を込めたときのまぶたの動き、間奏中の首の振りなどがHRP-4Cに反映できました。こうした無意識の動きが人間らしさを生んでいるとおもいます。

――なるほど。この研究の夢やゴールはなんですか?

産総研のゴールというのは、科学技術の実用化にあります。ですので、まずはこうしたロボット技術が商品として誰かの役にたつようになることですね。大きな夢だと、一家に一台ヒューマノイドでしょうか。そのためには歌うだけでなく、掃除、洗濯などありとあらゆることができないといけないとおもってます。

開発者

今回のヒューマノイドの大きな革新は"無意識"なのではないかと思う。もともと、ロボットはまばたきをさせると、不思議と人間らしさが出るのだという。初音ミクの歌唱でも、曲によって現れる微妙なクセのようなものに人間らしさを感じてしまう。機械として動かす技術が発達したことで、こうした微妙な動きを再現できるようになったのは興味深い。

ところで、こういった研究には常に「なんの役にたつのか?」という批判がつきまとう。歌い、踊るヒューマノイド『HRP-4C未夢』にしても産業として実用化するのか疑問を感じる人もいるだろう。しかし筆者は、最も産業化に近い道ではないかと考えている。

というのも、歌うロボットというのは人型ロボットの歴史としては非常に長く、そして一番実用的に使われてきたものだからだ。ヒューマノイド研究は昔から「せっかく作っても使い道がない」ことが悩みだった。戦争に使うなら戦車のほうが強いし、家事を手伝うなら食器洗い機のほうが便利だ。何かを効率的に成し遂げるための道具としては、二本足で手が2本、指が10本ある必要など全くないのだ。そこで最近は『ROBO-ONE』という二足歩行ロボットが戦うイベントや、『バカロボ』という面白いけど役に立たないロボットのイベントなどが開催され、エンターテイメントとしてのロボットが追求されている。

こうしたエンターテイメントロボットの最大の成功例は、『ディズニーランド』の『カリブの海賊』などのアトラクションに組み込まれたロボット達だと思われる。人間のようになめらかに歌い、踊り、ミュージカルを行っている。限られた動作しか行えないが、そこに確かに楽しさがあるし、事実20年以上も渡りお客さんに愛された実績がある。

ヒューマノイド研究のもう一つの用途として、「人間の存在感とは何か?」を問いかける『ジェミノイド』というプロジェクトがある。これは実在の教授そっくりのヒューマノイドを作り、その意義について実践的に考えるものだ。たとえば、人間そっくりのロボットを遠隔地から操って会議に出席させたら、それは本人が出席したことになるのだろうか? 違和感があるとしたらなぜか? というのを実験しながら考えていくもので、ヒューマノイドでしかできない研究だといえる。

歌うロボットは「エンターテイメントとしての実用性」「人型だからできる用途」をあわせた領域として、非常に将来性のあるものではないだろうか。初音ミクが登場したときに多くの人がただのシンセサイザーとは違った特別な愛着を持ってしまった。魂を感じるという人もいるように、「歌う」というのは限りなく人間らしい行動なのだ。その魂が人型のロボットに宿ったときに、これまでにない人間らしさが生まれる可能性がある。

『HRP-4C未夢』以外にもニコニコ動画上でみさいる氏が作成した『等身大初音ミク』や、アーティスト明和電気が作る『セーモンズ』など歌うロボットの研究は近年急速に進んでいる。人間らしさとは何か? その謎を解き明かし、ヒューマノイドの主役となるのは、こうした歌うロボットたちかもしれない。

 執筆:伊予柑([NKH]ニコ生企画放送局)
 


■最近の注目記事
まさかのNHK・日テレ・ニコ生・ USTがコラボ。全国32カ所で動物たちを中継!
誰でも簡単に”俺の嫁”と会話できる『MMDAgent』が切り開く新しい世界とは?
アメリカにも”東方”みたいな同人ゲームってあるの? 多言語ゲーム作者に聞いてみた
『ヨハネスブルグのガイドライン』はどこまで本当? 大使にきいてみた!
【放送技術】1万5千円でフィールドミキサーを作るやりかた