最大100人まで同時通訳ーーMS、日本語の音声リアルタイム翻訳を提供開始

写真拡大


マイクロソフトは、Microsoft TranslatorとSkypeにおいて、ニューラルネットワーク(AI)を活用した日本語の音声リアルタイム翻訳の提供を本日(4月7日)開始しました。

翻訳をAIベースに刷新

マイクロソフトはこれまで、機械翻訳サービスに伝統的な統計手法を用いていました。しかし「2〜3年で、このテクノロジーの限界がわかってきた。改善してもわずかな改善しかできない」(オリヴィエ氏)といい、AIベースの機械翻訳への移行を決定したといいます。



本日(4月7日)より、マイクロソフトが提供する翻訳サービス「Microsoft Translator」(Android / iOS / Windows / WEB)がAIベースに刷新。AIベースの機械翻訳は、統計手法に比べて文章全体の文脈の判断に優れており、翻訳精度が大きく向上するといいます。

さらに、日本語の音声リアルタイム翻訳「ライブ機能」の提供も開始。これは、最大100人が同時翻訳付きで会話できる機能。スマートフォンやPC、タブレットなどマルチデバイスで利用できます。トークルームでは、各発言(音声・テキストの両方)を、参加者それぞれの母国語にリアルタイム翻訳してくれます。​​​​​日本語や英語、フランス語など、3つ以上の言語の話者が混在していても問題ありません。

また、Skypeでも日本語の音声リアルタイム翻訳を利用できるようになりました。

Microsoft Translatorのライブ機能はAndroid / iOS / Windowsのほか、WEBでも利用できる

Skypeでも日本語のリアルタイム翻訳を利用可能に

さらに、Edgeブラウザ、Microsoft Office(Excel、PowerPoint、Outlook)統合の機械翻訳も、本日からAIベースに刷新。APIも提供し、さまざまなサービスでAI機械翻訳を活用できます。

意味を汲み取るには十分な精度

Microsoft Translatorのライブ翻訳を実際に試したところ、発話中ではなく、発話を終えた1秒後くらいに翻訳された音声が聞こえてきます。ドラえもんに登場する「翻訳こんにゃく」とはではいきませんが、翻訳スピードは高速でストレスを感じることはありませんでした。

また、スマートフォンやPC、WEBなどのマルチプラットフォ―ムへの対応も魅力的。アプリでQRコードを読み取って、最大100人が同じトークルームで、同時通訳付きの会話を行えます。

さらに、翻訳したデータは(誰が発言したという情報も含め)テキスト化されるため、簡易的な議事録の作成にも便利だなと感じました。

1つのトークルームに最大100人まで参加でき、3つ以上の言語も同時翻訳する。翻訳結果はテキストで出力でき、簡単な議事録作成にも便利

AI翻訳のメリットは「継続的に改善する」こと

肝心の翻訳精度ですが、機械翻訳特有の粗さは残っており、通訳者を置き換えるというレベルには到底達していません。これは「ニューラル(AI)ベースの機械翻訳が発展途上にある」(オリヴィエ氏)ため。

「ニューラル機械翻訳は使えば使うほど精度が高まるのが特徴です。マイクロソフトの全ての製品に搭載されたわけですから、ユーザーが沢山使うことで、どんどん翻訳精度が向上していきます。ガソリンから電気エンジンに変わるクルマと一緒で、まだ黎明期なんですが、3年後、5年後が本当にワクワクします」(オリヴィエ氏)

とはいえ、発言の意味を汲み取るには十分。今後の精度向上にも期待したいところです。

マイクロソフト AIリサーチ グループディレクターのオリヴィエ・フォンタナ氏