10月6日に日本での販売が始まったグーグルホーム(撮影:今井康一)

10月に発売された「グーグルホーム」、年内に発売が予定される「アマゾン・エコー」など、AI(人工知能)による音声認識デバイスを備えたAIスピーカーが日本でも話題となっている。
こうしたAIの進化と実用化で、「ポストスマートフォン」の世界はどう変わるのか。ITの中心地である米シリコンバレーに近いサンフランシスコに在住し、現地でベンチャーキャピタル、スクラム・ベンチャーズを運営する宮田拓弥氏に聞いた。

「AIがハードウエアを変える」

――今、注目している技術的なトレンドは何でしょうか?

今後10年間の「ポストスマホ」時代がどうなるのかに注目している。ソフトウエアのテクノロジーではすでにAIが中核になってきているが、車、家、店舗といったハードウエアも大きく変わっていくだろう。


宮田拓弥(みやた たくや)/サンフランシスコをベースに米国の技術系スタートアップに投資を行うベンチャーキャピタル、スクラム・ベンチャーズの創業者兼ゼネラルパートナー。早稲田大学大学院理工学研究科薄膜材料工学修了。2009年ミクシィのアライアンス担当役員に就任、その後、ミクシィ・アメリカCEOを経て、2013年から現職(記者撮影)

10月にサンフランシスコで開催されたグーグルの発表イベントは、「AIがハードを変える」というトレンドが明確に示された歴史的なものだった。

中でも興味深かったのが、外国語の同時翻訳機能がついたイヤホンだ。アプリとしては以前からあるグーグル翻訳はかなりの精度にまで進化してきており、グーグルはイヤホンにその機能を導入する研究開発をしている。

従来、音楽やラジオを聴くためのデバイスだったイヤホンに、AIによる音声認識、翻訳機能を埋め込んでいく。これまでのイヤホンの「音質をよくする」という技術的な方向性とは、まったく違う進化に向かっているといえるだろう。

また、人間がシャッターを押さずにAIが家族や友人など被写体や撮影タイミングを自動で判断して撮影する新しいカメラや、スマホのカメラをかざすことで膨大な視覚情報を取り込み、関連情報の検索や商品購入などができる画像検索機能も発表された。

つまり、特定の領域に限られるが、人間ではできないことをAIが実現し始めたので、グーグルはAIをベースとした新しいハードウエアの開発に取り組んでいるということ。

これは世界中のあらゆる分野でこれから起こることだ。いまの自動車はハンドルがついているのが当たり前だが、10年後にはその常識は変わっているはずだ。AIが進化したことによって、「そもそもハンドルは何のために必要なのか」など、ハードのあり方を根底から考え直さなくてはいけない段階に来ている。

「"胴元"が儲かる世界は変わらない」

――グーグルはこのようなAIを導入したハードを自社で作ろうとしているのでしょうか、それともハードメーカーとの提携戦略を進めていくのでしょうか?


LINEも10月5日からAIスピーカー「クローバ・ウェーブ」の販売を開始している(撮影:大澤 誠)

スマートフォンにおけるアップルのiOSの戦略と、アンドロイドの戦略のハイブリッドを狙っているのではないかと考えている。

アップルはiOSを自社で独占してオープン化しないことで、スマホ端末というハードで大きく儲けることができている。一方、他社にもオープンにしているアンドロイドは、世界でいちばん多く普及しているとはいえ、グーグルはハードでは儲けることができていない。

今回のAIを導入したハードについては、グーグルは翻訳機能のついたイヤホンのように自社で徹底的に作り込んだハードで収益を狙いつつ、他社にもオープンにするというハイブリッド型となると見ている。

――その場合、日本メーカーにも商機はあるのでしょうか?

あるとは思うが、プラットフォームという「胴元」が儲かる世界であることは変わらない。AIプラットフォームを握らないメーカーが活路を見いだしていくのは簡単ではないだろう。

1つ可能性があるのは、ローカルなデータを活用した差別化だ。AIは「ソフトウエア」と「データ」の集合体。グーグルやアマゾンほどデータを持っている会社はないとはいえ、日本語や日本の写真といったローカルなデータや、専門領域のニッチなデータを活用できれば差別化につながるだろう。

――「ポストスマホ」という点では、音声認識という入力インターフェースも注目度がますます高まっていると感じます。

コンピュータとともに、キーボードというインターフェースが普及した。しかし、これはある程度リテラシーのある人しか使えないインターフェースでもあった。

その後、スマホで画期的なタッチインターフェースが出てきて、世界中で利用者数が急速に拡大した。音声認識は、このような「インターフェースの民主化」をさらに進めていくことになるだろう。

――10月に発売された「グーグルホーム」や年内に発売予定の「アマゾン・エコー」など、日本でも音声認識デバイスが増えています。すぐに思い浮かぶのは天気を確認したり、音楽をかけたりといった使い方ですが、これ以外にも用途は拡大していくのでしょうか?

米国では日本より先に音声認識デバイスが発売されていて、その用途が拡大している。われわれは米国の音声認識データ分析会社に投資をしているが、米国では音声認識デバイスを通じたeコマース(EC)が増えてきている。

また、フォード・モーターは来年から出す自動車にアマゾンの音声認識サービス「アレクサ」を搭載することを発表していて、音声によるエンジンの始動やキーロックの開閉、ナビゲーションの操作などができるようになる予定だ。

では、音声認識の次のインターフェースは何か。米国のテック企業のイベントでは、そのヒントが出てきている。たとえば、フェイスブックは脳波から読み取る「ブレインインターフェース(脳認識)」の研究を進めている。

「小売り段階を飛ばす経路が増えている」

――流通の世界にも大きな変化が起きているそうですね。

ECが始まってから約20年が経ち、全小売りの10%がECとなった。アマゾンは米国の全ECの4割以上を占める非常に大きな存在となっているが、レジなしのリアル店舗「アマゾン・ゴー」の取り組みや自然食品スーパーのホールフーズ・マーケットの買収からもわかるように、残りの9割の市場であるリアルの小売市場にも進出してきている。

一方で、D2C(Direct to Consumuer、メーカーから顧客への直販)の流れも強まっている。これまではメーカーがいて、物流があって、小売りに商品が並んで、顧客が選んで買うという構図だった。このうち、小売りの段階を飛ばす経路がこれまで以上に増えてきている。

このようなD2Cの世界ではマスマーケティングが必要なくなる。たとえば原価が低いひげそりのような商品では、大量のCMを流すことで認知度を高め、小売りの場で顧客に選んでもらっていた。

しかし、D2Cのプレーヤーはこのようなマーケティングコストをかけず、クオリティの高い商品を低価格で直接顧客に販売している。D2Cの成功のカギはSNSによる顧客とのつながりで、インスタグラムやツイッターなどオープンなSNSの普及率が日本以上に高い米国が先行している。

あらゆるメーカーが顧客との接点を近づけざるをえなくなり、安売り勝負でユーザーIDを持っていないようなビジネスモデルは今後成り立ちにくくなってくるだろう。メーカーはモノづくりをしていればいいわけではなく、アマゾンのプライム会員のようなユーザーの囲い込みが重要になる。

――D2Cでの成功例はもう出てきているのでしょうか?

米国ではアパレルや寝具、旅行用バッグなど、あらゆるカテゴリーで出てきている。

たとえば、キャスパーというオンライン専門のマットレスの会社。店舗を持たずオンラインのみで直販するため、非常にクオリティの高い商品を低価格で提供することができている。100日間使った後でも返品を保証するという売り文句で商品の信頼性を訴え、創業3年で年商100億円規模にまで急成長している。