東北地方のマスコットキャラクター「ずんだもん」を展開するSSS合同会社が、中国語、英語、日本語、広東語、韓国語を話せるずんだもんの音声合成ソフト「Voiceger」を公開しました。

Voiceger - ずんだもん多言語TTS

https://zunko.jp/voiceger.php

Zundamon's NEW Voice is Here! | Voiceger - Free Text-to-Speech - YouTube

「Voiceger」は公式サイトからWindows版を無料でダウンロードできます。Voicegerずんだもん音源利用規約では、「音源についての共通規約」を順守する限り、商用、非商用ともに利用できるとされています。MacやLinuxの場合、GitHubから「根性でインストール」できるそうです。





今回はWindows版を導入します。公式サイトの「Windows版ダウンロード」をクリック。



ダウンロードされたZIPファイルを解凍します。



中にあるSetup.exeを実行します。



11.3GBのデータをダウンロードするというダイアログが表示されるので「OK」をクリック。



処理中に表示されるコンソールを閉じないでくださいという警告が表示されるので「OK」をクリックします。



しばらく待機するとインストーラーが起動するので「Next」をクリック。



インストール先を確認して「Install」をクリック。



処理が終わったら「Finish」をクリック。スタートメニュー等からVoicegerを探して起動します。



Voicegerのインターフェースはこんな感じ。



表示言語は英語固定です。設定項目に言語設定はないようです。



まずは出力音声の感情を選択します。用意されていた選択肢は「Neutral(普通)」「Sweet(甘い)」「Snippy(ぶっきらぼう)」「Sexy(色っぽい)」「Whispering(ささやき声)」「Murmuring(つぶやき)」「Exhausted(疲れた)」「Sobbing(すすり泣き)」の8種類でした。感情を選択すると、その下の「Reference Text」を読み上げさせてどんな声色なのかを確かめられます。



続いて言語を選択。中国語、英語、日本語、広東語、韓国語に加え、英語以外の4言語と英語のミックスという設定も存在しました。



入力ボックスへ読み上げさせたい文章を入れ、「Generate Speech」をクリックすれば完了です。まずは普通の声、日本語で、夏目漱石「坊っちゃん」の一節を読み上げさせてみました。



数秒の処理後に音声が出力されました。再生ボタンを押して聞くか、「Save to File」を押してファイル(WAVファイル)を保存できます。



実際の音声は以下です。

次は言語を英語にして「マクベス」の一節を読み上げさせます。



実際の音声は以下。

英語にして「坊ちゃん」を読み上げさせると、文章内に英語がないためか、代わりに例文が読み上げられました。

中国語はこんな感じになります。

広東語を生成しようとするとエラーが発生しました。必要なファイルをダウンロードできていないようです。



韓国語も同じくエラーです。



次に「Japanese-English Mixed」の言語設定がどんなものなのか確かめてみたところ、「坊っちゃん」は日本語で、「マクベス」は英語で先ほどと同じく出力されるだけでした。



代わりに「TodayはAppleをBuyしてJuiceにしてDrinkしたぜ!」という英語と日本語が混じった文章を作成。日本語設定だと、以下のように英語部分を日本語のアクセントで読み上げました。

英語設定だと英語部分だけを淀みなく読み上げます。

「Japanese-English Mixed」設定だと、英語と日本語の発音をそれぞれ淀みなく読み上げました。