【合成音声サンプルを聴いてみよう】音声処理における世界最大規模の国際会議で「りんな」(rinna社)の音声合成技術の論文が採択

rinna社のリサーチチームでは、人工知能によるテキスト・音声・画像の生成を中心に研究開発を行っています。研究成果は、トップカンファレンスをはじめとする会議で発表しています。また、日本語に特化したGPT
< https://tinyurl.com/359jfty3 > ・BERT
< https://tinyurl.com/5ftd9ud2 >・CLIP
< https://tinyurl.com/mrxdynzt > 等の大規模事前学習モデルを学習・公開する活動も行っている。
さらに、最先端の技術をユーザー体験として提供するためのサービス開発も進めている。これらの研究活動を通して、会社のビジョンである人とAIの共創世界を目指すとしている。信頼できるAI技術を活用し、すべての人が自分らしく活き活きと過ごすことができる、色とりどりの世界を実現したい考え。

●今後のrinna社の研究発表

rinna社のリサーチチームは、研究成果の発表を以下の場で行う(以下、敬称略)。

MIRU 2022 第25回画像の認識・理解シンポジウム：

日時：2022年7月25日(月)～28日(木)
公式サイト：https://sites.google.com/view/miru2022

「日本語における言語画像事前学習モデルの構築と公開」
シーン誠、趙天雨、沢田慶

CEDEC 2022：

日時：2022年8月23日(火)～25日(木)
公式サイト：https://cedec.cesa.or.jp/2022
「ディープラーニングの活用：AI × キャラクターによる新しいゲームの世界」
沢田慶、シーン誠、三井健太郎、趙天雨
セッションURL：https://cedec.cesa.or.jp/2022/session/detail/105

日本音響学会2022年秋季研究発表会：

日時：2022年9月14日(水)～16日(金)
公式サイト：https://acoustics.jp/annualmeeting/

「自発的対話を用いた潜在スタイル表現の抽出・予測に基づく音声合成」
三井健太郎、趙天雨、沢田慶、法野行哉*、南角吉彦*、徳田恵一* (*名古屋工業大学)
「テキストを入力とする音声・顔ランドマーク系列の同期生成」
三井健太郎、沢田慶

INTERSPEECH 2022：

日時：2022年9月18日(日)～22日(木)
公式サイト：https://interspeech2022.org/

「End-to-End Text-to-Speech Based on Latent Representation of Speaking Styles Using Spontaneous Dialogue」
三井健太郎、趙天雨、沢田慶、法野行哉*、南角吉彦*、徳田恵一* (*名古屋工業大学)
「MSR-NV: Neural Vocoder Using Multiple Sampling Rates」
三井健太郎、沢田慶

外部リンクロボスタ

おすすめ記事

ITニュースランキング