AIアシスタントデバイスの今後は?(写真:Petmal / iStock)

ディープラーニングが音声認識の精度を大幅に改善し、人工知能(AI)を活用した音声対話型のアシスタント(AIアシスタント)の利用が進んでいる。Amazon EchoなどAIアシスタントを搭載した新しい機器(デバイス)の普及によって、家庭で、ホテルで、あるいは自動車運転中に、何ができるようになるのか。
特定の重要技術や複合的な新サービスそれぞれについて、5年先までの進化を予想する『ITロードマップ 2018年版 情報通信技術は5年後こう変わる!』を上梓した気鋭のITアナリストが、AIアシスタントデバイスの普及がもたらす近未来を展望する。

人と機械とのコミュニケーション方法が変化しはじめている。ユーザーインターフェースは、近年は、より直観的かつ自然な動作で操作するNUI(Natural User Interface)の利用が増えてきている。中でも有望視されているのが、VUI(Voice User Interface)である。


きっかけの一つは、AIを活用した音声入力によるアシスタント(AIアシスタント)の登場だ。たとえば、アップルの「Siri」、グーグルの「Google Assistant」、マイクロソフトの「Cortana」などが挙げられる。

AIアシスタントが身近な存在になってきたのは、人工知能(AI)の構成技術の1つであるディープラーニングによる音声認識の精度が向上していることが大きい。

認識精度が高まったAIアシスタントを搭載した新たなデバイス(AIアシスタントデバイス)が今、さまざまなシーンで活用され始めている。

さまざまな場所、シーンでの導入が進む

家庭では一家に2台も当たり前?

AIアシスタントデバイスの普及がもっとも進むと予想されているのが、一般家庭である。

アマゾンは、2015年7月にAlexaと呼ばれるAIを搭載した「Amazon Echo」の一般販売を開始した。米国の調査会社フォレスター・リサーチによれば、2016年には1100万台、2017年にはその倍の2200万台が販売されたと推計されている。一方、グーグル、LINE、Harman Kardon(マイクロソフトの「Cortana」を搭載)、アップル、アリババ、バイドゥなど、さまざまな企業から相次いでAIアシスタントデバイスが発売されている。

米米国調査会社のガートナーは、Amazon Echoに代表される「仮想パーソナル・アシスタント対応無線スピーカー(スピーカー型のAIアシスタントデバイス)」市場の売り上げは、2015年の3億6000万ドルから2020年には21億ドルまで成長し、所有世帯の25%が同デバイスを2台以上所有するようになると予測している。

ホテル客室での「簡易コンシェルジュ」

一般家庭と並んで、ホテルの客室や受付などでも活用が進むと考えられる。

米国スタートアップ企業のVolaraは、ホテル客室に設置したAmazon Echoを利用して、宿泊客からの質問やリクエストに対応する簡易コンシェルジュサービスを提供している。

宿泊客は、Echoに問いかけることで、ルームサービスの依頼、おすすめのレストランの情報、客室内のテレビや照明のオン・オフ、チェックアウト時刻の確認など、さまざまなサービスを受けられる。宿泊客からよくある問い合わせには、フロントを介さずEchoが対応することで、フロントの業務削減とすばやい回答による宿泊客の満足度向上を図ることができる。

Volaraは、米国のヒルトングループのホテル、ウェスティンホテル、JWマリオットホテルなどでも導入が始まっている。

BMW、トヨタなどクルマにも搭載

AIアシスタントデバイスの普及は、屋内だけにとどまらない。有力視されているのが、クルマへの搭載である。

ドイツの大手自動車メーカーBMWグループは、2018年中ごろから米国、英国、ドイツで販売される「BMW」および「MINI」ブランドの車両にアマゾンのAIアシスタント「Alexa」の搭載を始めると発表した。スマートフォンなどを介さず、音楽を聴いたり、目的地の天気を確認したり、近くのおすすめの飲食店を調べたりできるようになる。

Alexaの車両への搭載は、ほかにもフォード、フォルクスワーゲン、トヨタが対応を発表している。一方、アウディとボルボ・カーズは、車内で「Google Assistant」を利用できる車載システム「Android Auto」を次世代モデルに搭載することを発表している。

「声だけインターフェース」からの変化

これらのAIアシスタントデバイスのユーザーインターフェースは、現在のところ主として音声のみである。しかし、音声のみではできることが限定されるため、実際に使われるシーンは非常に限られる。

たとえば米国の調査会社comScoreが2017年4月に実施した調査によると、Amazon Echoでよく利用されている機能の上位3つは「一般的な質問」「天気」「音楽の再生」であった。一方で、「商品の注文」や「食事やサービスの注文」といった機能はあまり使われていない。

しかし、ユーザーとAIアシスタントデバイスをつなぐインターフェースも進化がはじまっている。

タッチディスプレイ付きデバイスやテレビとの連携

第一の進化の方向性は、ディスプレイによる表現力の強化である。

アマゾンは、2017年6月からタッチディスプレイ付きの「Echo Show」を発売。2018年1月に開催されたInternational CES(Consumer Electronics Show)2018では、LenovoやLGなど複数のメーカーからGoogle Assistantが搭載されたディスプレイ付きAIアシスタントデバイスが発表された。

また、テレビとの連携も進みつつある。アマゾンはテレビに接続して動画配信サービスを視聴できる「Fire TV」とAmazon Echoとの連携も発表した。グーグルも同様に「Chromecast」とGoogle Homeの連携を発表している。こうした一連の動きは、テレビやディスプレイを通じて、音声だけでなく、文字や画像による情報提供も可能になることを意味する。

3Dカメラ搭載

さらなる進化の方向性として、3Dカメラを搭載する動きも見られる。

アマゾンは2017年4月にインテル製の3Dカメラを搭載した「Echo Look」を発表。招待制ではあるが米国での販売を開始した。Echo Lookは、Amazon Echoの基本機能に加え、専用のスマートフォンアプリと3Dカメラを使い、日々のファッションスタイルの登録や、独自の機械学習アルゴリズムを用いた「スタイルチェック機能」などを提供している。

このようなインターフェースの多様化により、AIアシスタントデバイスの使われ方にも変化が訪れるだろう。音声だけではなく、ディスプレイやテレビと連携して表現力やリアリティを高めることで、「商品の注文」のような利用が増える可能性もある。また、3Dカメラの活用で、パソコンやスマートフォンではできないような購買体験が可能になるかもしれない。

AIアシスタントデバイスは、家庭における新たなショッピングチャネルになる可能性も秘めている。

AIアシスタントデバイスのロードマップ

以下に、野村総合研究所(NRI)が5年程度先までのITの将来動向の予測として毎年継続的に作成し、書籍としても上梓している『ITロードマップ』の最新版(2018年版)から、AIアシスタントデバイスのロードマップを示す。

2018〜2019年度:スピーカー型の普及と話者認識技術の活用開始

スピーカー型のAIアシスタントデバイスの普及に伴い、家族の誰でも使えるサービスではなく、個人向けのサービスも増えてくるだろう。その際に重要になるのが、個人を識別し認証する技術である。

Amazon EchoやGoogle Homeでは、音声でユーザーを識別するマルチユーザー対応機能を提供している。ただし、この機能は特定のデバイスを利用している家族の中から話者を識別する機能であり、ある程度のセキュリティレベルが求められるサービスの認証に使うのは難しい。音声だけでなく、たとえばカメラを使った顔認識やジェスチャーなども組み合わせた話者認識技術により、個人を識別したよりセキュリティレベルの高いサービスの提供も徐々にはじまるだろう。

2020〜2021年度:スマート家電や車載などに拡大

このころになると、スピーカー型以外のデバイスへのAIアシスタントの搭載が広がる。Alexaの機能の搭載では、自動車とテレビがとくに有望である。実際、複数の自動車メーカーが、車載AIアシスタントについて発表している。また、テレビについても、米国ではAlexa搭載テレビやGoogle Assistantに対応したAndroid TVの販売がはじまっている。しかし、自動車やテレビは製品のライフサイクルが長く、本格的な普及にはある程度の時間を必要とする。そのため、AIアシスタントが搭載されたさまざまなデバイスが使われはじめるのは、このタイミングになるだろう。

2022年度以降:AIアシスタント間の連携と状況データの活用の本格化

生活の中にさまざまなAIアシスタントデバイスが登場し使われはじめると、そのデバイスに搭載されたAIアシスタントごとに指示を切り替える必要が生じてくる。しかし、メインのAIアシスタントが各用途に応じて適切なAIアシスタントを呼び出し、サービスの利用ができるほうが利便性は高い。そのため、このころにはAIアシスタント間の連携が本格化するだろう。

また、利用シーンの多様化は、ユーザーの状況(コンテキスト)に応じた意図の理解が求められることでもある。たとえば、「今日の天気は?」という質問への回答が、自宅のリビングで聞かれた場合と、車の中とでは、異なる場合もある。さまざまなデータを複合的に活用し、ユーザーの意図理解を高度化する取り組みが本格化するだろう。

2016年12月にフェイスブックのCEOマーク・ザッカーバーグ氏は、自らが開発した家庭用人工知能「Jarvis」を自宅に導入した。ザッカーバーグ氏は、「自宅外からJarvisとコミュニケーションを取りたくなるときが驚くほど多かったので、自宅に設置するデバイスではなく、スマートフォンを主要なインターフェースにすることが重要」と述べている。

今後、さまざまなAIアシスタントデバイスが登場し生活の中で普及したとして、それでもスマートフォンというデバイスの重要性が変わらないのであれば、AIアシスタントデバイスの領域でも、Androidプラットフォームを持つグーグルが存在感を増すことになるだろう。