会議や会話の自動文字おこし、筆談ができる! ポケトーク技術を活かしたボイスレコーダーとタブレット

写真拡大 (全10枚)

ソースネクストは、大ヒット製品であるAIを使った音声翻訳機「POCKETALK(ポケトーク)」の技術を活かした、「タブレットmimi」および「AutoMemo(オートメモ)」などの新製品を発表した。

2020年11月10日、都内で開催された新製品発表会は、新型コロナウイルス感染症の感染防止のため、オンラインでも同時配信された。


■ポケトークテクノロジーを利用した新製品
ソースネクスト株式会社 代表取締役社長 松田憲幸氏は、同社のIoT戦略について語った。

松田憲幸氏
「ポケトークテクノロジーの応用として翻訳だけでなく、そこで使われているさまざまなパーツ。たとえば、『文字にする』だけでも新たなIoT製品になるので、今後どんどんやっていこうと思っています。」
こう語り、AIボイス筆談機「ポケトークmimi」を例にとり、音声を認識してテキストで表示するだけでも、難聴者にとって有用なツールになることを説明した。

松田憲幸氏
「ポケトークで『日本語を日本語に翻訳する』と、そのまま話した言葉が文字になりますので、それだけで非常に良かったという声をいただきました。これは開発すべきだと特化して開発にしました。」

ポケトークmimiの開発のキッカケは、利用者からの声だったそうだ。


ソースネクストのIoT戦略を図で表現したもの。


ソースネクストのIoT戦略は、同社を通して世界中のテクノロジーを、世界中の人々に喜びと感動を広げるために提供するというもの。今回、投入された2つのIoT関連の新製品は、いずれもポケトークテクノロジーを応用したものとなっている。


○話すだけで文字になる「タブレットmimi」
世界における難聴者の数は継続的に増加傾向にある。
2018年は4.66億人、2050年は9億人に達すると予測されている(WHO(世界保健機関)「World Hearing Day 2018」)。

ソースネクストが難聴者向けに実施した調査結果によると、
「家族や友人など身近な人とのふだんのコミュニケーション方法で近いものをお選びください。」
このような質問に対して、
最も多かった回答が「大声で話してもらう(65.9%)」
次いで「(そもそも)耳が遠いのであまり会話しない(30.6%)」
このような回答だった。
また新型コロナウイルス感染症の感染予防のため8割以上の人がマスクを着用する生活となり、会話がしづらくなったという回答もあった。

一方、同居人に耳の遠い家族がいる人を対象に実施した調査結果によると、
耳の遠いご家族とコミュニケーションする上で大変なこととして、
「大声を出さなければいけないので大変(62.5%)」
こうした回答が最も多く、
「ちょっとした会話でもコミュニケーションに時間がかかる(35.7%)」
このような回答が続き、難聴者と家族が日常のコミュニケーションに不便さを感じていることがわかった。


難聴者向けに実施した調査結果では、「大声で話してもらう」という回答が多かった。


こうした状況を踏まえ、耳の遠い人を笑顔にするAIボイス筆談機「タブレットmimi」を開発し発売するという。

「タブレットmimi」は、
「ポケトークmimi」の姉妹品であたり、製品に向かって話すだけで自動的に文字化される、筆談できる。
電子機器の操作が苦手な人でも、安心して使うことができる。

卓上に置いても見やすい、8インチのディスプレイを搭載したことで、大きい画面に大きな文字で、快適な筆談ができる。文字の大きさは好みにあわせて調整が可能であり、フォントは教科書体フォントを採用しているため、日本語も読みやすい。

利便性も高く、置くだけで充電ができるクレードルも同梱されており、充電しながら使うこともできるためバッテリー切れを心配する必要がない。


「タブレットmimi」を病院で使っているデモ。


音声データから日本語への文字変換には、クラウド上に音声をアップロードする必要がある。
そこでタブレットmimiは日本国内で使えるモバイル通信用のeSIMを内蔵している。
サービスプランは2年間使い放題なので、ケータイやスマートフォンと違い、初期の契約も月額の通信料金も不要となる。
2年後は、タブレットmimiのサービスの延長手続きが必要となる。
延長しない場合は、Wi-Fi接続でも使えなくなるので、注意が必要だ。

発売日は、2020年12月4日。11月10日より予約受付を開始。
価格は、3万1,800円(税別)。

まずは試してみたいという人のために、月額2,980円(税別)のレンタルサービスも用意される。


○文字起こしができるボイスレコーダー「AutoMemo」
スマートフォンの録音機能やアプリを含む録音機器/ボイスレコーダーに関するアンケートを実施したところ、「録音したデータをどのように活用していますか。」の質問に対する回答として、
「必要な個所を探して聞き返す(60.2%)」
「PCに録音データを移す(33.3%)」
このような回答が多く、2つの回答をあわせると、
実に6割の人が必要な個所を探して聞き返し、
3割の人はテキスト化していることがわかったという。

「1時間以内の録音の場合、テキスト化にかける作業時間はどのぐらいですか。」の質問に対しては、
「3時間以上(8.6%)」
「2時間|〜3時間(10.4%)」
「1時間〜2時間(32.1%)」
このような回答から、半数以上の人が録音時間よりも長い時間をかけてテキスト化している実態も明らかとなった。

また「録音機器/ボイスレコーダーのどういった箇所に不満を感じていますか。」の質問に対しては、
「録音の精度(63.5%)」
「聞きにくいところが探しにくい(61.1%)」
「ボタンが多すぎて操作が難しい(17.4%)」
このように6割以上の人が録音の精度・聞きたいところが探しにくいことに不満を感じている。


必要な個所を探して聞き返す人が多かった。


こうした状況を踏まえ、自動でテキスト化するAIボイスレコーダー「AutoMemo」を開発し、発売する。

「AutoMemo」は、
ボタンを押すだけですぐに録音が可能であり、スマートフォン専用アプリとメールにより、テキスト化された内容を確認することができる。

「AutoMemo」を利用することにより、会議メモや議事録、取材記事の作成など、今まで手間と時間を費やした文字起こし作業の負担を軽減できる。さらにテキストを検索して、その場所から聞き返すことも可能だ。

ただし録音した音声の再生は、専用アプリが必要となるため、「AutoMemo」本体のみで再生することはできない。


AutoMemo本体は、2つのボタンしかない。


発売日は12月4日。2020年11月10日より予約受付を開始。
価格は、1万9,800円(税別)。
これに加え、録音データをテキスト化するための費用が発生する。
・ベーシックプラン 0円(上限1時間/月)
・プレミアムプラン 980円(上限30時間/月)
※上限時間を超えた場合、10時間ごとに980円で追加購入となる。

なお、発売記念キャンペーンとして、2021年6月まではプレミアムプランが無料で利用できる。


■日本語のテキスト化がスムーズ
タッチ&トライのコーナーでは、スタッフに新製品の説明を聞きながら、実機を触ることができた。

残念なことに「タブレットmimi」はモックのみの展示であり、実機を触ることはできなかったが、本体サイズや重さは実機と同じということで、その場で確認することができた。


「タブレットmimi」のモック。


「タブレットmimi」は、となりに置いてあった「ポケトークmimi」に比べると大きいが、文字は大きく表示できるため視認性と利便性が高い。

日本語をテキスト化する機能は「ポケトークmimi」と同等ということなので、「ポケトークmimi」で試してみた。
話した内容は正確にテキスト化される。これなら、聴覚障害者だけでなく、耳が遠くなったお年寄りにも便利に使えそうだ。


日本語をテキスト化する機能は同等という「ポケトークmimi」で日本語変換の精度を試してみた





「AutoMemo」は製品版に近い実機を試すことができた。
「AutoMemo」には、2つのボタンが搭載されている。
大きなボタンを押して、普通に話し、もう一度ボタンを押すと、それまで話した日本語がテキストに変換される。

実際に試したみたところ、会話が正確にテキスト化される。
録音した音声はクラウド上にアップロードされた後、日本語に変換されるのだが、待たされる感はなく、すぐにテキストに変換された。

変換時間は、感覚的には、「アップロードとダウンロードにかかる時間+アルファ(一呼吸分)」でテキストが表示される。レスポンスの良さに驚かされた。


「AutoMemo」は実機でテストができた。


音声はクラウド上に保存できるため、「ボイスレコーダーの容量不足で記録できてなかった」という事態もおきない。

またスマートフォン専用アプリを利用すれば、文字起こしされた文字をタップするだけで、タップしたテキストの音声が再生される。音声で確認したいときに便利な機能だ。


「AutoMemo」を使って、音声データをテキスト化した様子。




今回発表された「タブレットmimi」「AutoMemo」は、いずれもポケトークで利用していた機能や技術を応用したものだ。
「タブレットmimi」は、難聴者だけでなく、耳が遠くなったお年寄りにも便利に使えるだろう。
「AutoMemo」は、社内の議事録の作成や、取材記事の作成時に役立つアイテムだ。
どちらも身近な生活やビジネスで活用できることから、人気商品になる可能性は高そうだ。


ITライフハック 関口哲司