日々大量データを処理することでAIが進化していく

写真拡大

 数年前まで機械翻訳の精度は50%とされてきた。しかし、深層学習(ディープラーニング)の活用で流ちょうに翻訳する性能が向上し、精度も85%に上るといわれている。一方で企業の活動がグローバル化する中、翻訳人材の不足が課題になっている。こうした中、八楽(東京都渋谷区、坂西優社長)は、独自の人工知能(AI)を生かし、ビジネスに特化した自動翻訳サービス「ヤラクゼン」を提供している。

 ヤラクゼンは、クラウド上で文章を入力し翻訳する。また、Wordなどファイル形式のデータを取り込み、フォーマットを使えば、そのまま翻訳も可能だ。

 現在22カ国の言語に対応。大きな特徴は「ユーザーごとの好みの翻訳表現データを収集し、自動翻訳に生かせる点にある」と湊幹取締役最高執行責任者(COO)はいう。

 同サービスは個人および企業単位でアカウントを登録する。利用者は、第1段階としてグーグル翻訳や同社独自の「ヤラク翻訳」などから基礎エンジンを選び、自動翻訳する。

 第2段階として、できた文章について、アカウントごとの翻訳データが蓄積されたAIを搭載した「パーソナライズドエンジン」に通す。

 例えば「すさまじい」でも、人によって「awful」「terrible」など好きな表現は異なる。そうしたユーザー好みの表現を候補から選択・保存していくことで、AIが学習。翻訳ごとに「データベースと一致した表現」「50%一致した表現」「一致部分がない」の三つにマーカーで分類表示されるようになる。

 機械翻訳は近年、脳の神経回路をまねたニューラルネットワークの活用により発展した。日々アルゴリズムと大量の翻訳データを掛け合わせ、処理をすることでAIが進化していく。

 湊COOは「当社には数百や数千万のビジネス用途に特化した文章が、データベースに蓄積されている。加えて、そのデータは人が修正した精度の高いデータだ」と独自データの強みを強調する。

 固有名詞や文脈などは分からないようにしながら、蓄積されたデータを文節で区切り、データ処理する。それにより、パーソナライズドエンジンだけでなく、独自の基礎エンジン「ヤラク翻訳」もビジネス向け表現を得意とする翻訳エンジンに進化している。

 今後、業界特化型の翻訳エンジンの開発も検討している。また音声認識も取り入れることで、英語を使った会議の議事録作成や外国人社長の演説での同時字幕などへの活用も期待する。
(文=大串菜月)