口腔内の動画で本人の声を合成できる、東大がAI技術
ウエアラブルな超音波エコー端末にすると、身に付けておけばエコー動画と音声を自動収集でき、病気で声を失っても本人の声で話せるようになると期待される。
超音波エコーは唇の動きの撮影が不十分で「マ」や「パ」などの唇を使う発音の再現性は低い。だが、人間は言葉の断片的な音を聞いて文脈を含めて単語を認識するため、コミュニケーション上は大きな問題にならないという。実際にAIスピーカーのキーワード認識機能を合成音声で操作できた。
音声は合成と認識の双方でAI技術が浸透しており機能を補完し合える。キーワード生成と認識は利用シーンや文脈を反映すると識別精度を上げられる。自由文の生成は大量のエコー動画と音声データが必要になる。
