フランスのAI研究機関「Kyutai」が、豊かな感情表現によってスムーズにコミュニケーションが取れる発声能力ありのAIモデル「Moshi」を発表しました。生成音声AIとしては初めて、オンラインでの自由なテストが可能です。

Kyutai unveils today the very first voice-enabled AI openly accessible to all

(PDFファイル)https://kyutai.org/cp_moshi.pdf



Kyutaiがパリで開催したプレゼンテーションの映像が公開されており、Moshiのデモンストレーション動作の様子が見られます。

Unveiling of Moshi: the first voice-enabled AI openly accessible to all. - YouTube

まずは会場に紹介されて「ハイ、私の名前はMoshiです。本日はどのようなご用件ですか?」と応じるMoshi。



制作元について問われると「非営利のAI研究団体・Kyutaiが開発しました」と、Kyutaiについてなめらかに説明。



対話者が交代して「山に登ろうと思っています」と伝えると、まだ話を続けようとしている間に「すばらしいことです」と反応。対話内容を出力する待ち時間みたいなものはほぼ感じさせず、リアルタイムな応答を実現していることがわかります。



3人目の対話者から「フランス風の発音で、パリについての詩を読んでみて」といわれると、ただちに「パリ、愛の町、時が止まり心の飛び立つ場所」と詩を読み始めました。



「海賊風に」と言われると海賊になりきって対応。「お前、名前は?海賊の暮らしはどうだ?ワイルドな乗り心地だろう、相棒?至る所に自由と、危険と冒険があるぜ」とキャプテン気取りで、対話者がMoshiを止めるのに苦労する場面もありました。



このデモンストレーションと同じ内容を、誰でもオンラインで体験可能です。

moshi.chat

https://moshi.chat/



KyutaiはMoshiを、6カ月の期間と8人のチームでゼロから開発したとのこと。ローカルへのインストールも可能なので、ネット非接続の端末でも安全に動作可能です。

KyutaiはMoshiを通じて、AIのオープンな研究とエコシステム全体の発展に貢献していく意思を示しています。