ざっくり言うと

自動翻訳特有のぎこちない文章で「使えない」と揶揄されていたGoogle翻訳
AIの予測力が進化したことで、正しい単語やフレーズが選択されるように
翻訳された文章だと気づかれないこともあるほど、精度が向上している

｢グーグル翻訳｣が急激によくなっている理由

2019年3月14日 5時0分

AIの「予測力」は、どこまで進化するのだろうか（写真：Erikona／iStock）

大手ネット企業が「予測力」の改善に力を入れている。かつては「まったく使えない」と揶揄されていた「グーグル翻訳」はどんどん精度を上げているほか、アマゾンは顧客の購入に基づいて、将来的には顧客が注文する前に「欲しがっていることが予測される」商品を配送するサービスを思案している。

AIによる予測精度はどこまで上がっていくのか。『予測マシンの世紀　AIが駆動する新たな経済』を著したトロント大学経営大学院教授のアジェイ・アグラワル、ジョシュア・ガンズ、アヴィ・ゴールドファーブの3氏が、AIによる「予測」の未来を論じる。

アマゾンの予測的中率は現在5％程度

企業の幹部から私たちが最も頻繁に受ける質問をひとつ挙げるなら、「AIはわれわれのビジネス戦略にどのような影響を与えるのだろうか」という質問だろう。それに答えるため、ここで思考実験を行ってみよう。

ほとんどの人たちは、アマゾンでの買い物に慣れている。そしてたいていのオンライン小売業者を相手にする場合と同じく、あなたはアマゾンのウェブサイトを訪れ、目指す商品を買い求め、カートに入れる。支払い手続きを済ますと、アマゾンから商品が送られてくる。現在、アマゾンはこの「ショッピング・ゼン・シッピング（商品購入後に発送する）」のビジネスモデルを採用している。

買い物のプロセスで、アマゾンのAIはあなたが購入したくなりそうなアイテムを予測して、オススメ商品として紹介する。AIはまずまずの仕事をしているが、完璧からは程遠い。私たち筆者のケースでは、購入したくなるものをAIが正確に予測する割合は全体のおよそ5％。決して悪くない数字だが、20回勧められて1回購入するだけにすぎない。

では、アマゾンのAIが私たちに関する情報をもっとたくさん集め、そのデータを使って予測を改善するところを想像してほしい。スピーカーのつまみを回して音量を上げるように、AIによる予測の精度を上げるところを思い描いてほしい。

つまみを回し続けると、AIの予測精度はある時点で閾値（いきち）を超え、アマゾンのビジネスモデルに変化が引き起こされる。予測の精度が十分に高まれば、注文を受けるまで待っているより、顧客が欲しがっていることが予測された時点で商品を送るほうが利益につながる。

注文しなくても製品が送られてくれば、あなたはほかの小売業者を訪問する必要がなくなる。そして手元に届けられた商品に刺激され、もっと買い物をしたい気分になるかもしれない。こうしてアマゾンの顧客内シェアは高くなる。

当然ながら、これはアマゾンにとってすばらしいが、あなたにとってもすばらしい。アマゾンは買い物する前に出荷してくれるのだから、万事がうまくいけば、買い物の手間はすっかり省略される。ダイアルを回して予測の精度を上げれば、アマゾンのビジネスモデルが変化して、「ショッピング・ゼン・シッピング」から「シッピング・ゼン・ショッピング（商品発送後に購入する）」へと移行するのだ。

すでに「予測配送」の特許を取得している

もちろん買い物客は、欲しくもない商品が手元にどっさり届けられ、返品するような面倒に関わりたくない。そうなるとアマゾンは、返品のためのインフラに投資するだろう。配達用のトラックと同じものが何台も準備され、それが顧客のもとを1週間に一度巡回し、不要な商品を回収するシステムが確立されれば便利だ。

では、こちらのほうがいいビジネスモデルだとしたら、なぜアマゾンはこれまで実行に移していないのだろう。実行すれば、返品を回収して処理するコストが顧客内シェアの増加による利益を上回ってしまうからだ。今のままでは、発送した商品の95％が返品されてしまう。送られる側にとってもアマゾンにとっても、これは実に迷惑な話だ。現時点では、アマゾンが新しいモデルを採用できるほど、予測能力は高くないのである。

ただし、新しいやり方が利益につながることがある時点で見込めるようになれば、実際に予測の精度の向上が利益をもたらすようになる以前の段階でも、アマゾンが新しい戦略を採用するシナリオは想像できる。実際、アマゾンは2013年に「予測発送」の特許をアメリカで取得しているのだ。

アマゾンの例からもわかるように、AIとは予測技術にほかならない。「人工知能」といっても、知能そのものが実現するわけではないことを強調しておきたい。

いまでも予測は在庫管理や需要予測など、従来のタスクに使われ続けているが、最近では、まったく新しい問題にも予測が応用されるようになった。物体認識、言語翻訳、創薬など、AIが進歩する以前は、予測がほとんど不可能だった分野が多い。

例えば、イメージネット・チャレンジという世界的な画像認識コンテストでは、画像に写っている物体が何かを予測して競い合う。画像の中の物体を予測するタスクは、人間にとっても難しい。イメージネットのデータは1000種類ものカテゴリーに分かれ、その中には犬種をはじめよく似た画像も含まれている。チベタン・マスティフとバーニーズ・マウンテン・ドッグ、あるいは金庫のダイヤルとダイヤル錠は、識別が困難だ。人間は全体のおよそ5％で間違いを犯す。

コンテストが始まった2010年から最後に開催された2017年の間に、予測は大きく改善された。次の図にはコンテストに優勝したチームの予測の正確さを年ごとに表した。

縦軸はエラー率なので、低いほど優れていることになる。2010年、最も成績のよかった機械による予測は、エラー率が27％だった。2012年にコンテスト参加者がディープラーニングをはじめて使うようになると、エラー率は16％にまで下がった。

ついにエラー率は人間の標準値の半分以下に

プリンストン大学教授でコンピューター科学者のオルガ・ルッサコフスキーは、次のように語っている。「2012年には、正確さに関して大きなブレークスルーが実現した。しかしそれは、数十年前から存在してきたディープラーニングという概念の正しさの証でもあった」。

アルゴリズムの著しい改善はその後も続き、2015年には、あるチームのエラー率が人間の標準値をはじめて下回った。2017年になると、参加した38チームの大半が人間の標準値を下回り、優勝チームのエラー率は人間の標準値の半分以下になった。機械はこのようなタイプの画像を人間よりも上手に確認できるようになったのである。

もうひとつ、近年AIが達成した大きな成果が、言語翻訳だ。グーグルの翻訳サービスの質がいきなり向上した結果、翻訳は魔法のように感じられる。

例えば、アーネスト・ヘミングウェイの「キリマンジャロの雪」は、次のような美しい文章で始まっている。

Kilimanjaro is a snow- covered mountain 19,710 feet high, and is said to be the highest mountain in Africa.

2016年11月のある日、コンピューター科学者であり東京大学大学院教授の暦本純一は、このヘミングウェイの珠玉の短篇小説の日本語訳（キリマンジャロは雪に覆われた1万9710フィートの山で、アフリカで最も高い山と言われている）をグーグルで英語に翻訳し直した。その結果、次のような英文が出来上がった。

Kilimanjaro is 19,710 feet of the mountain covered with snow, and it is said that the highest mountain in Africa.

ところが翌日、グーグル翻訳は次のように変化していた。

Kilimanjaro is a mountain of 19,710 feet covered with snow and is said to be the highest mountain in Africa.

ふたつの訳文には大きな違いが存在する。自動翻訳特有のぎこちない文章は、筋の通った文章へと一夜にして変化した。最初の訳文からは辞書を片手に翻訳者が苦戦しているイメージが思い浮かぶが、後のほうでは、翻訳者がどちらの言語にも精通しているような印象を受ける。

英語から日本語への翻訳では、英語にマッチする日本語の単語やフレーズを予測する。ここでは、選んだ日本語を並べる順序についての情報が欠落している。したがって、外国語から得られるデータに基づいて正しい言葉を選んだら、正しい順序に並べるための予測が必要で、その作業を経て理解可能な文章が出来上がる。作業が順調ならば、翻訳された文章だと気づかれないこともある。

企業は競うかのように、この魔法のテクノロジーの商業利用に乗り出した。例えば中国では、アイフライテック（科大訊飛）がディープラーニングを用いた自然言語処理サービスを開発し、利用者はすでに5億人を突破している。

このサービスは、中国語の音声メッセージをさまざまな言語のテキストメッセージに変換し、2言語間でのコミュニケーションを可能にするものだ。具体的には、家主が入居者と異なる言語でコミュニケーションを交わすため、病院の患者がロボットに行き先を尋ねるため、医師が患者の病気の詳細について指示するため、ドライバーが車両とコミュニケーションを交わすために、この自然言語処理サービスが利用されている。AIが頻繁に使われるほど多くのデータが集まり、多くの事柄を学ぶほど性能は向上する。ユーザーがたくさんいれば、AIはどんどん改善していく。

予測コストが大きく下がっている

重要なのは、機械学習（ディープラーニングはそのサブフィールドのひとつ）において予測の質を調整するコストが大きく低下したことだ。計算能力に従来と同じコストをかけるだけで、以前よりも質の高い翻訳が提供される。従来と同じ質の予測を生み出すコストが、大きく下がったのだ。

現代のAIは、SFに登場する知的機械にはまだ遠くおよばない。予測するだけでは、『2001年宇宙の旅』のHALや『ターミネーター』のスカイネット、『スター・ウォーズ』のC-3POのような存在は実現しない。

では、現代のAIが予測するだけなら、なぜこれほど大騒ぎされるのだろう。それは、予測は極めて基本的な入力情報だからだ。あなたは気づいていないかもしれないが、予測はいたるところで行われている。ビジネスも私生活も予測だらけだ。しかも予測は往々にして、意思決定を支える入力情報として隠されている。予測が改善すれば情報が改善し、ひいては意思決定が改善する。

予測のコストが下がり続ければ、予測が役に立つ活動は増え続け、応用範囲は広がっていく。そのプロセスのなかで、機械翻訳のように以前は想像もできなかった多くの事柄が実現するのだ。

みんなの感想は？

Google翻訳が急激に精度を上げている訳進化するAIの「予測力」

ざっくり言うと

｢グーグル翻訳｣が急激によくなっている理由

アマゾンの予測的中率は現在5％程度

すでに「予測配送」の特許を取得している

ついにエラー率は人間の標準値の半分以下に

予測コストが大きく下がっている

外部サイト

ランキング

Google翻訳が急激に精度を上げている訳 進化するAIの「予測力」

ざっくり言うと

アマゾンの予測的中率は現在5％程度

すでに「予測配送」の特許を取得している

ついにエラー率は人間の標準値の半分以下に

予測コストが大きく下がっている

外部サイト

ランキング

Google翻訳が急激に精度を上げている訳進化するAIの「予測力」