グーグルが米オクラホマ州に置くデータセンターの内部。膨大な数のサーバーが並ぶ(写真:Google)

米ライドシェアサービス「ウーバー」の運転手は、乗務を始める前にアプリで顔写真を撮る。すると、アカウントに登録された本人と同一人物かどうかがAI(人工知能)にチェックされ、承認されれば運転を開始できる。

実はこのAI、開発したのはウーバー自身ではない。米IT大手のマイクロソフトが自社のクラウド上に開発したAIシステムだ。

同社のクラウドサービス「アジュール」では、アプリなどの開発者向けに、オープンな機械学習のAPI(アプリケーション・プログラミング・インターフェース)を提供している。自分のアプリとクラウド上のAIをつなぐ仕組みだ。APIを使えば、画像や音声の認識、翻訳といった機能をアプリに組み込める。

クラウド事業が急成長

AIを“民主化”する──。マイクロソフトは今、そんなビジョンを掲げる。誰でも気軽にAIを使えるようにするのが狙いだ。APIはその一例であり、世界中のデータセンターを通して、誰でもこのAIコンピュータにアクセスできる。データの処理量や回数などに応じて課金される。


マイクロソフトが展開する顔認識AIはあらかじめ登録した人物の認識のほか、感情や年齢の判別もできる(記者撮影)

アジュールはここ数年、急成長を遂げている。直近2017年10〜12月期では、クラウド事業全体の売上高が前年同期比15%増の78億ドルだったが、アジュールだけでは倍増となった。

「今後、AIがクラウドの成長の原動力になる。新たなアルゴリズムを開発し、それを大規模に活用するには、クラウドの計算能力が必須になる」。そう語るのは、マイクロソフトのAIビジネスを統括するバイスプレジデントのスティーブン・グッゲンハイマー氏だ。

アジュールのターゲットは企業だ。「オフィス」シリーズに代表されるように、マイクロソフトはこれまで多くの企業と強固な関係を築いてきた。AIの土台となったのも、オフィスや16年に買収したビジネスSNSのリンクトインなどから集められた、ビジネスに関する膨大なデータである。


パワーポイントの最新版では、日付を認識し自動的に年表にしてくれるAI機能がある(記者撮影)

クラウド上のソフト「オフィス365」にもさまざまなAIの機能が搭載されている。たとえばパワーポイントには、スライド内に書かれた年月日を認識し、自動的に年表にしてくれる機能がある。

AI開発には、つねにアルゴリズムを洗練させる研究が必要になる。同社は16年に研究所を再編し、現在AIの専門組織の下に約8000人の人員を抱える。

その先に見据えるのが、“アマゾン超え”だ。クラウドビジネスの頂点に立つのが、米アマゾンが展開する「アマゾン ウェブ サービス(AWS)」。3割強のシェアで他を圧倒する。ただ成長率だけを見れば、マイクロソフトはアマゾンを大きく上回る。

グーグルとマイクロソフトがAIで拮抗

同じようにクラウド事業が急成長しているのが、米グーグルだ。年間の売上高は推計40億ドル規模。同社は検索エンジンやマップ、ユーチューブといった10億単位のユーザーが利用するサービスの膨大なデータを抱える。それを活用した機械学習APIを提供し、やはりAIの民主化を標榜する。


アマゾン1強に挑むマイクロソフトとグーグルは、AIにおいては一枚うわてだ。クラウドビジネスに詳しい米調査会社ガートナーのアナリスト、エド・アンダーソン氏は「両社はAIサービスを使いたい客を取り込めている。(AWSと比較すると)長期にわたって収集してきた膨大なデータ、継続的なテクノロジーへの投資、AIの高い能力を示せるだけのアプリケーションをそろえていることが大きな強みだ」と評価する。

AIの開発競争でしのぎを削るマイクロソフトとグーグル。両社のAIによる画像や音声の認識率は、すでに人間の値を超えたとのデータもある。今後の焦点は、「カスタマイズしやすいAI」だ。企業のニーズは多様な一方で、基本的なAPIでは機能が限られる。

たとえば画像認識のAPIに車の写真を読み込ませても、ただ「車」としか認識しない。「プリウス」「フィット」といったように特定の車種を見分けるようにするには、機械学習の専門家がプログラミングを行い、大量のデータを読み込んで学習させる必要があった。

この領域に両社が入ってきた。マイクロソフトは昨年5月に「カスタム・ビジョン・サービス」、グーグルも今年1月に「クラウド・オートML・ビジョン」と呼ばれる新たな画像認識のAPIを発表。たとえばプリウスというタグを付けた写真をドラッグ・アンド・ドロップで10枚ほど読み込ませれば、AIがプリウスを認識するようになる。


マイクロソフトはすでに画像認識だけでなく、音声認識や翻訳にもカスタムサービスを広げており、より文脈に合った表現を可能にした。一方グーグルは、画像認識アルゴリズムの作成を自動化する仕組みを新たに開発。人手では実現できなかった認識精度まで短時間で高めることができるという。

AIのデータ処理が複雑になればなるほど、応答速度の向上が求められるようになる。クラウドの場合はデータセンターの地理的な距離によって速度が変わる。マイクロソフトは世界に36拠点を持っており、前出のグッゲンハイマー氏は、「地球上で最大のクラウドインフラを持っている」と自信を見せる。実際、AWSは19拠点、グーグルは15拠点にとどまる。

AIを極めるため、半導体チップを自社開発

インフラの規模だけではない。その性能も重要だ。多くの企業は機械学習の訓練のために、GPU(グラフィック・プロセッシング・ユニット)と呼ばれるチップを用いる。本来はゲームのグラフィックス処理に使われていたもので、機械学習の計算に向いている。だが、より応答速度を向上させるため、各社はAI処理に特化した半導体システムの独自開発にも踏みこんでいる。


グーグルが開発した「テンサー・プロセッシング・ユニット(TPU)」。機械学習の計算に特化させるため、自社で一から設計した(写真:Google)

特に熱心なのが、グーグルだ。同社は機械学習用に「テンサー・プロセッシング・ユニット(TPU)」と呼ばれるチップを一から自社で設計。処理速度を上げつつ、消費電力量は抑えた。一方のマイクロソフトは、米インテルのFPGAチップ(製造後でも回路の書き換えが可能なチップ)を基盤とした「ブレインウェーブシステム」を開発した。


当記事は「週刊東洋経済」3月10日号 <3月5日発売>からの転載記事に加筆したものです

これらの半導体システムはすでに、AIを用いた自社のサービスにおける計算で能力を発揮している。今後はこうした機械学習の計算インフラを、外部の開発者にも開放していく方針だ。まさに、AIの民主化はクラウドなしには実現できないといえる。

アマゾン1強は崩れるのか。クラウド全盛時代の覇権争いに注目が集まる。