言葉の壁、2020年にも崩壊。総務省とNICTが多言語自動翻訳の実用化目指し「翻訳バンク」開始
総務省と情報通信研究機構(NICT)は、音声翻訳とテキスト翻訳の社会実装に向けた取り組みとして、さまざまな分野の翻訳データを集積・活用する「翻訳バンク」を開始しました。

NICTは、音声翻訳アプリ「VoiceTra」、テキスト翻訳システム「TexTra」を通じて翻訳サービスの社会実装に向けた研究開発を行っています。今回の翻訳バンクは、翻訳の高精度化に不可欠ともいえる多岐にわたる翻訳データを総務省とNICTが束ねるといういうものです。当面、100万文 x 100社=1億文のデータ集積を目指す計画。

また、翻訳データのライセンス料決める際には、利用する翻訳データを想定したライセンス料を算定します。これにより、コスト負担を軽減できるとしています。

自動翻訳技術の性能向上には、翻訳アルゴリズムの改良に加え、翻訳データの質と量が重要です。NICTでは、翻訳バンクの提供によって質と量を確保するとともに、ライセンス料算定においては、データ提供者とデータを活用する側の好循環モデルを構築したい考えです。

現在、2020年の東京オリンピックに向けたさまざまな取り組みがなされているところです。総務省とNICTでは、オリンピックまでに言葉の壁をなくすのを目標に、音声翻訳技術の多言語&多分野化を推進しています。



これを「グローバルコミュニケーション計画」という名前にするのがいかにも行政機関らしいですが、観光面だけでなく、自治体や病院、防災、商業施設などで言葉の壁を取り払う計画です。

なおNICTは、2017年6月に脳の神経回路を模したニューラルネットワークを活用した自動翻訳技術「ニューラル機械翻訳技術」を導入しています。膨大な翻訳データから学習し翻訳すれば、従来よりも高精度な翻訳ができるとしていいます。現在の日英双方向翻訳を皮切りに、中国語、韓国語、タイ語、インドネシア語、ベトナム語、ミャンマー語、スペイン語、フランス語へと拡大していく方針です。