写真提供:マイナビニュース

写真拡大

5月10日より東京ビッグサイトで開催されている日本最大級のIT展示会「2017 Japan IT Week 春」。約1,600社に上る出展企業が最新のテクノロジーを駆使した製品やハードウェア、サービスやソフトウェアが一堂に会した本展示会場で、筆者のアンテナに「ビビビッ!」と飛び込んできたものをピックアップして紹介していこう。

第一弾として筆者がピックアップしたのは、東芝の音声合成ミドルウェア「ToSpeak」だ。この「ToSpeak」は、同社の音声・映像活用AIクラウドサービス「RECAIUS(リカイアス)」の技術を活用し、読み上げさせたいテキストを用意するだけで多様な電子デバイスで自然な合成音声を出力することが可能になるというもの。既に、「Yahoo! カーナビ」でも採用されており、「あの音声はこの技術を使っていたんだ!」と思われた読者もいらっしゃるのではないだろうか。

また、この「ToSpeak」のユニークな点のひとつに、収録時間わずか1時間程度のサンプルデータがあれば、任意の声で自然な合成音声が作り出せることにある。言葉を換えるならば、サンプルデータさえ用意できれば声優や俳優、著名人の声で任意のフレーズを喋らせることができるのだ。

エンターテインメント分野、とくにゲームなどでは、ユーザーにより良い体験を提供するため「今をときめく声優○○をCV(キャラクターボイス)に採用!」といったように、“音声”というかたちで付加価値を高めている向きもある。昨年末にカプコンより登場したニンテンドー3DSシリーズ向けソフト「めがみめぐり」では、プレーヤーとともに旅をする「ツクモ」の音声に「ToSpeak」が活用されており、キャラクターとあたかも会話しているかのようなコミュニケーションを楽しむことができる。

メカメカしさのない自然な音声でありながら、クオリティの高い音質で音声データサイズが小さいという「ToSpeak」のメリットは、ゲームのみならずデジタルサイネージや家電製品との親和性も高そうだ。例えば、駅に設置されている観光案内看板からご当地キャラが自然に話しかけてくる、目覚まし時計が毎朝自分の名前を呼びながら起こしてくれるといった、今までの製品にはない新たな価値を提供してくれるかもしれない。

説明員の方にお話を伺ったところ、今後この「ToSpeak」はより自然な音声を追求していくとのこと。将来的には、地域によってことなる言葉のイントネーションや喜怒哀楽といった感情表現、関西弁や津軽弁といった方言なども自在に、そして合成でありながら自然な音声として再現してくれる。……そう考えるだけで、いろいろな可能性が広がっている「ToSpeak」の進化には大いに期待したい。

(渡部仁)