写真提供:マイナビニュース

写真拡大

音声技術の応用開発を行うエーアイは、ブラウザ上で人の声に近い自然な音声を合成できるサービス「AITalk 声の職人 クラウド版」を5月9日より提供する。

同社は、2003年に文京区で設立され、音声技術の応用開発を行い続けている企業。2005年にはIPAの次世代ソフトウェア開発・普及事業に採択、コーパスベース音声合成方式と呼ばれる膨大なデータベースを用いる方式で、より人間らしい自然な音声の組み合わせを実現。高品質音声合成エンジン「AITalk」を開発し、40種類近くにおよぶ言語、使用するシチュエーションや用途に合わせた感情表現と滑らかな音声が特徴になる。

防災行政、道路交通情報、観光案内から電話応答システム、ロボットへの組み込み、パッケージやWebでのナビゲーションと活用事例も多い。Webサイトには、OEMとして提供している事例が数多く掲載されており、マツコ・デラックス氏を忠実に実現したアンドロイド「マツコロイド」の音声にもAITalkが活用されている。

発表された「AITalk 声の職人 クラウド版」は、同社の持つ自然な音声作成をクラウド上で可能とするサービスで、標準語・関西弁総勢17名の話者を使えるほか、オプションで利用できるオリジナル音声辞書作成サービスを利用することでオリジナルな話者にも対応する。今回、クラウド版として提供することで、最新のバージョンを常に利用でき、複数拠点での作業できるというクラウドの特性を活かせるようになる。

なお、主な機能として、単語辞書機能(地名や名前など特殊な読み方、イントネーションを登録)、0.5〜4.0倍の話速調整、抑揚調整機能、ピッチ調整機能、音声ファイル一括作成、音声合成形式SSML形式への対応。サービス価格は、月間1000文字の単月ミニプランで基本料金30,000円(追加料金30円/1文字)、2000文字のプランで基本料金50,000円(15円/1文字)、12000文字の年間プランで360,000円(10円/1文字)。

(長岡弥太郎)