写真提供:マイナビニュース

写真拡大

●クルマに特化した音声認識AI
○クルマで使えるAIとは?

最近のビジネスシーンにおいて、聞かない日はないというほどの勢いを持つ「人工知能(AI)」という言葉。すでにさまざまなサービスに活用されており、クルマも例外ではない。多くのカーナビゲーションは、タッチパネルやダイヤル(コマンドコントローラ)を用いて住所や電話番号を入力するが、音声入力に対応するものも増えてきている。近年は、単純に住所などを音声で入力するのではなく、ナビと対話するような形で行き先を設定したりもできるようになってきた。

そうしたクルマの音声入力を支援しているのがNuance Communicationsが提供する音声認識プラットフォーム「Nuance Automotive Assistant」であり、クルマに特化した音声アシスタントとなる。最近では、スマートフォン(スマホ)でもナビゲーションが可能であり、音声認識もしてくれるが、クルマの中で直感的に利用しようと思うと、音声で指示をして、タッチパネル上に候補を出してもらい、それを実行という手順は、特に走行中の場合、事故の危険性を高める行為となる、と指摘するのはNuance Communications DeutschlandでAI技術の車載分野への適用を担当しているマイケル・カイザー(Michael Kaisser)氏である。

「運転中、目的地付近の駐車場を探したいといったことは良くあるが、手や目が運転によりふさがっていることを考えれば、こうしたニーズは音声で解決する必要がある。しかも、目的地からどれくらい離れているのか、料金はいくらか、なども対話でやり取りする必要がある。重要なのは、ユーザーごとに最適な結果を提供できるという点であり、ユーザーによっては高くても近いところ、ちょっと離れていても安いところ、ちょっと離れているの"ちょっと"とはどの程度か、といったやり取りができる必要がある」と同氏は説明する。

AIには、こうした対話のやり取りの実現が求められるが、同氏はもう1つ重要なポイントとなるのが「ナレッジソース」だと指摘する。つまり、この場合は駐車場のデータベースと、さまざまなデータベースを組み合わせて、ユーザーごとの最適な答えを導くための土台を構築することが求められる。「これを実現するためには、ユーザーにとって一番何が正しい選択肢なのかをAIが学んで、ユーザーの嗜好や特定のガソリンスタンドの会員であるといったことを学ぶ"パーソナライゼーション"と、何をユーザーは重視しているのか、といったことや、駐車場に行く途中で渋滞が発生していないかといった状況の理解も含めた"文脈理解"の2つの要素が重要となる」とのことで、同社では「スマートインタラクション」「パーソナライゼーション」「文脈理解」「ナレッジ」の4つにフォーカスを当てて、車載向けAIとして提供することを目指した開発を進めているという。

●運転時のあらゆるニーズへの対応を目指す
○次世代のクルマ向けAIとはどのようなものなのか

ちなみに同社は、同社ブランドとして自動車(OEM)メーカーにソリューションを利用させるようなことはない。例えばAppleは「CarPlay」、Googleであれば「Android Auto」といった名称が存在するが、同社の場合はOEMメーカーが自社のブランド戦略に併せてカスタマイズすることが可能なパッケージとしての提供となるので、そこに他社の技術を組み合わせるといったような付加価値を生み出すこともできる点が特徴となっている。また、Automotive Assistantが提供しようとしている領域も、「駐車場」「ガソリン」「POI(Point of interest)」「レストラン」「トラベルガイド」「音楽」「メッセージ」「その他」と幅が広いことも特徴と言える。

そんなAutomotive Assistantだが、実はすでにOEMメーカー向けにユーザーにとって最適な駐車スペースを検索する「Smart Parking」ならびにユーザーにとって最適なガソリンスタンドを検索する「Smart Fuel」の2つの機能が提供済みである。このほかにも、インテリジェントなPOI検索を可能とし、使うごとにユーザーの好みを学習していく「Smart POI」ならびにクルマとその機能に関する取扱説明書でも対応できない質問にも答えてくれる「Smart Car Manual」の2つを、それぞれ2017年5月および6月に提供を開始する予定だという。実は2016年秋の時点では、Smart POIは2017年1月に、Smart は同6月にそれぞれOEMに向けて提供する予定であったのだが、Smart POIに関しては開発遅延が生じており、5月へとずれ込んだとのことであった。

また、この4つの機能以外にもメッセージから本文と意図を抽出し、内容によっては返信を自動生成し、ドライバーに提案してくれる「Smart Messaging」、現在地や目的地に関する質問への回答や見所を推薦してくれる「Smart Travel Guide」、音楽の検索やリコメンデーションをしてくれる「Smart Music」、パーソナライズされた文脈を理解したうえでレストランをリコメンデーションしてくれる「Smart Restaurants」などの開発が進められているとするほか、「Custom Domain」としてOEMメーカーと一緒に開発を行い、特定領域でスマートなUXを実現していくといったOEMメーカーが本来考える領域まで踏み込んでいくとしており、より高度な自動車市場での音声認識の実現を目指していくとしている。

なお、同氏によると、開発に際しては通常15言語への対応を図っており、日本語もその中に含まれるとのことであり、日本の中でクルマと対話しながらドライブを楽しむことが可能になる日もそれほど遠くない未来に訪れるかもしれないとのことであった。

(小林行雄)