会話できるC-3POを自作。動画を見てみて
完成度の高さよ!
みなさんは『スター・ウォーズ』のキャラクター、誰がお気に入りでしょうか? ずっと『スター・ウォーズ』に出続けてるメインキャラクターの一人、金色ピカピカのドロイドC-3POが近くにいたらなって思ったことありませんか?(おしゃべりすぎるかな...)
先月、『帝国の逆襲』で実際に使われたオリジナルのC-3POの頭部が、オークションで100万ドル(約1億5600万円)を超える値をつけ、『スター・ウォーズ』関連グッズの中でも最高額クラスの一品となりました。ほしいなー、でも1.5億円も出せないよなと思っている方、安心してください。自分で作れます。しかも、あのちょっとうるさい(?)おしゃべりもできるんです。
DIYのC-3PO
カリフォルニア州のチャップマン大学の学生、Samuel Potozkin氏がAIを搭載した会話できるDIY版C-3PO頭部の制作し、その過程動画を投稿しています。音声機能を支えているのは、もちろんAI。しかもちゃんとC-3POの個性を入れ込んだカスタムLLMとなっています。プロジェクトの詳細が気になる人のために、Potozkin氏はGitHubページで論文も公開しているので、見てみてください。知りたいことはほぼ全部載っています。
どんな作りになってるの?
仕組みは、かなりシンプル。マイクが声を拾うようになっていて、そのマイクはRaspberry Pi 5に接続されています。この小さなコンピューターがリアルタイムで音声をテキストに変換し、変換が終わると、そのテキストをプロンプトとしてLLMに送ります。LLMの返答は今度はテキスト読み上げシステムに通され、C-3PO独特の話し方を再現した音声として出力されます。これで相棒のR2-D2になった気分を味わえるというわけです。
驚きの完成度
細かいところを見ていくと、面白いところがたくさんあります。たとえば、Potozkin氏が最初にテキスト読み上げ出力を試したところ、C-3POのあの金属的な声質とは一致しなかったそうで、あの声を再現するために使ったオーディオ処理の手法というのが、もはやAIの研究というよりギターのエフェクターボードの話に近いのではないかと思ってしまうんですが、「短いディレイラインを追加して密接な時間的反射を作り出し、複製した信号の時間とピッチをわずかに変調するコーラスエフェクトをかけることで、層を重ねた声の共鳴のような印象を生み出した」とのこと。
結果、そのエフェクトは見事に完成。C-3POの頭部からの流れて来ている音声だと知らなくても、C-3POの声だとわかる仕上がりになっています。
Source: BBC, Cardbase, Github

