開発したウェアラブル型ハンズフリー音声翻訳端末の外観(写真:富士通研究所の発表資料より)

写真拡大

 富士通研究所は19日、医療現場での診察、看護など両手が塞がりやすい業務に適したウェアラブル型のハンズフリー音声翻訳端末を世界で初めて開発したと発表した。病棟での看護など様々な場所で、端末に触れずに外国人との会話が可能になる。この技術に必要なのは、音声翻訳と話者の認識である。

【こちらも】医療分野にも多言語対応の音声翻訳技術の導入を 富士通とNICTが実証実験

 富士通研究所の開発したウェアラブル型のハンズフリー音声翻訳端末と、情報通信研究機構(NICT)が開発した医療現場における日本語、英語、中国語の高精度な翻訳に対応した音声翻訳システムを用いて、東大病院を含む全国の医療機関で11月から臨床試験を実施する。

 NICTは9日、自動翻訳システムのさらなる高精度化に向けて、様々な分野の翻訳データを集積する「翻訳バンク」の運用を開始することも発表している。

●2020年の訪日外国人客数目標4千万人

 日本政府は、東京オリンピック・パラリンピックの開催される2020年の訪日外国人客数4千万人の目標を掲げているが、その目標達成は近い。事実、日本政府観光局が発表した7月の訪日外国人客数は前年同月比16.8%増の268万人で、単月としての過去最高を記録。訪日外国人客数の増加に伴い、病院を訪れる外国人患者が増加しており、多言語による会話の支援が課題となっているという。

●自動翻訳のブレークスルー

 自動翻訳技術の歴史60年での主流はルール翻訳であった。翻訳に必要な翻訳規則と翻訳辞書をつくり、それにそって翻訳をするものである。翻訳の精度を飛躍的に高めたのは、統計翻訳やニューラルネット翻訳と呼ばれるものである。

 統計翻訳は、対訳や翻訳のデータを大量に集めて統計処理することで、翻訳規則や翻訳辞書に相当する翻訳モデルを自動的に作成するAI技術を使う。

 人間の脳を模したニューラルネット翻訳も、対訳や翻訳の大量のデータを読み込んで、深層学習するが、統計翻訳のように文の一部ごと翻訳するのではなく、文脈を把握することで、より適切な翻訳を試みる。

●対話者の音声認識のブレークスルー

 医療現場で活用できるウェアラブル型のハンズフリー音声翻訳端末は、世界初という。ブレークスルーは、音の回折回数を利用する。端末の音道をL字型形状にすると、医療者方向からの音は1回回折し、医療者方向以外からの音は2回回折する。音は回折する際に減衰する性質があり、回折数で医療者方向の指向性を強調する。

 発話検出の精度向上は、患者音声の強調と雑音抑制で対応。患者方向に高感度マイク素子を採用して録音レベル上げる。また、空調機器や検査機器などの定常雑音を抑圧したという。

●ハンズフリー音声翻訳(富士通研、NICT)のテクノロジー

 大病院の検査室相当の環境(60デシベルの雑音)で、医療者と患者が対面で会話する際に自然な距離80cmにおいて、発話の検出精度95%を達成。また、ウェアラブル型のハンズフリー音声翻訳端末は、病棟での看護など両手が塞がりやすい業務において、端末に触れることなく、音声翻訳を利用することが可能となり、医療者の負担軽減が期待できたという。

 NICTは、自動翻訳システムのさらなる高精度化に向けて、様々な分野の翻訳データをオール・ジャパン体制で集積する「翻訳バンク」を設定。世界の「言葉の壁」をなくすことを目指すグローバルコミュニケーション計画を推進している。