アマゾンエコーによって生活は便利になる?(編集部撮影)

写真拡大

2017年は3つの技術に注目が集まった。対話型のスマートスピーカー、廉価で高性能なVR機器、そしてAIの急速な進化だ。これらの流行は18年も続くのだろうか。ジャーナリストの佐々木俊尚氏は「情報通信テクノロジーは常に、インプットと計算、そしてアウトプットという3つのプロセスから成立してきた。ただの流行では終わらない」と解説する――。

■スマートスピーカーが持つ本当の意味

2017年に起きた情報通信テクノロジーの3つの出来事から、近未来のトレンドを考えてみたい。その3つとは、スマートスピーカーの発売、廉価で高性能なVR(仮想現実)/AR(拡張現実)機器の発表、そしてAI(人工知能)の急速な進化である。

まずスマートスピーカーからスタートしよう。この分野の代表的な製品であるアマゾンの「アマゾンエコー(Amazon Echo)」が11月、ついに日本でも発売された。アマゾンの製品としては、電子書籍リーダー「Kindle」を超える過去最大のヒット商品になっていると言われている。

スマートスピーカーは普通の外部スピーカーとしても使えるが、それだけではなく、音声でさまざまな指示を行えるのが特徴だ。ニュースや天気を読んでもらったり、音楽のストリーミングサービスと連携して好みの音楽を鳴らしたり、さらには簡単な会話も楽しめる。

■「アレクサ!」でできること

アマゾンエコーの音声認識機能は「アレクサ(Alexa)」という名称で呼ばれている。「アレクサ」の最大の強みは、API(ソフトウェアの一部を公開し、他者が利用できるようにすること)を経由して、アマゾン以外の外部の企業も音声認識を使えるようになっていることだ。たとえば自宅のリビングルームに設置したアマゾンエコーを経由して、室内の照明をオンオフしたり、自宅のガレージのドアを開閉したり、自動車のエンジンを起動したり、タクシーを呼んだりといったことが行える。

さらにアレクサはアマゾンエコーだけでなく、自動車などさまざまな外部の機器にも実装されている。アマゾンのアレクササーバが中心にあって、アマゾンエコー、自動車、自宅、ガレージ、各種の家電、外部のタクシーサービスなど、さまざまな機器・サービスがネットを経由して接続されてぶら下がっているイメージだ。アレクサのいる場所ならどこからでも音声で命令することができ、アレクサのつながっている機器すべてに指示を出せる。

つまりアマゾンエコーは単なる「スピーカーの進化型」というだけでなく、日常生活の新しいUIとして音声認識が急速に台頭していることのひとつの現れとして捉えるべきなのだ。それゆえ、本当はもはやスピーカーの形状をしている必要もない。住宅や自動車などに、目に見えないようにアマゾンエコーが埋め込まれて、室内や車内で「アレクサ」と呼びかけると、どこからともなく返事が聞こえてくるという未来はすぐにもやってくるだろう。

情報通信のUIは、キーボードのみという初期のCUI(Character-based User Interface/キーボードを用いた文字のみでの操作入力システム)から、マウスを駆使するGUI(Graphical User Interface/画面上の操作+キーボード入力で動かすシステム)のパーソナルコンピューターへと進化し、2010年代になってタッチスクリーンのスマホへと進んだ。この先にはウェアラブルデバイスのジェスチャー操作なども期待されてきたが、ここに来て音声認識の可能性が一気に浮上してきている。音声認識だけですべてのことができるわけではないが、モニター画面を見なくてもいい音声認識には操作を暗黙化し、日常の行動に近づけることができるというメリットがある。ゆえに、広く普及し定着していく可能性は大きい。

■VR分野に現れた注目新製品2つ

次に移ろう。VRでは、刮目すべき新製品の発表が2つあった。ひとつはVR分野をリードする企業オキュラスリフトが今年10月に発表した、外部機器が不要で価格も手ごろな「オキュラス・ゴー(Oculus Go)」。同社は199ドルのこの製品を、2018年の早い時期に発売するとされている。

グーグルなどから巨額の資金調達を行いながら、長らくどのような製品を開発しているのか謎だったスタートアップ「マジックリープ(Magic Leap)」も12月、ついにARのデバイス「Magic Leap One」を発表した。2018年には開発者向けに提供を始めるとしている。

VRは長らく次世代の視覚体験として期待されてきたが、実際に販売されている製品が大がかりで、外部の高性能パソコンやゲーム機などを必要とし、価格も高いのがネックだった。しかしオキュラス・ゴーの登場で、消費市場で一気にブレイクすることになるだろう。

VRと同時に、ARやMR(Mixed Reality/複合現実)も注目を集め始めている。VRが、現実の空間には存在しない仮想の空間をコンピュータによって作成し、没入できるようにするのに対し、ARは仮想空間に現実の空間も重ね合わせて表示する。VRは現実の空間とは切り離された世界に入り込むのが目的なのに対し、ARはあくまでも現実の空間が主体で、そこに仮想のCGなどを表示するものと言える。2018年発売予定のMagic Leap Oneは奥行きのあるAR表現を目指しており、近くにある仮想のオブジェクトはくっきり見えて、遠くにあるものはぼやけて見え、より現実感が高くなるという。

そしてMRは、仮想空間と現実空間を融合させていくものだ。単に重ね合わせて表示するだけでなく、仮想と現実の物体の間でなんらかの相互作用が起きる。たとえば仮想のボールを投げると、現実のテーブルに跳ね返るように見えるのだ。MRの分野ではマイクロソフトが「HoloLens」という製品を開発しており、すでに開発者向けの製品は発売されている。

VR・AR・MRでの今後の課題は二つある。コンテンツの最適化と、さらなる軽量化だ。

■コンテンツの楽しさだけではない可能性

シリコンバレーの有力VC、アンドリーセン・ホロヴィッツのパートナーであるクリス・ディクソンは、こう語っている。「VRにとってのこれからの数十年は、映画が生まれてからの最初の数十年間に似たようなものとなるだろう」

当初は舞台の演技を観客席から撮影するようなものにすぎなかった映画が、モンタージュやクロスカットなど独自の技法を発明し、新たな文化として独立していくまでには数十年がかかった。これと同じように、VRも単なる「奥行きのある映画」ではなく、VRでなければ得られないようなまったく新しい体験を実現していくだろう。「エンパシーマシーン(感情移入機械)」という言葉がある。他人の視野を代替して手に入れ、その感覚をごっそり自分のものとして体験することで、その人の感情の動きまでも自分のものにできるという考え方だ。このエンパシーマシーンの実現が、VRのコンテンツ進化の課題となるだろう。

ARやMRは物理空間と融合しているがゆえに、コンテンツを楽しむだけでなく、日常生活を支えるインフラとしても期待されている。今後は作業現場やスポーツ観戦、家電製品のマニュアル、不動産案内、医療などあらゆる場所に浸透していくだろう。そのためには機器が「装着していることが気にならない」レベルにまで軽量化されることが必須だ。

さらにその先には、裸眼でVRやAR、MRを実現する技術も期待されている。身体に外部機器を装着するのではなく、なんらかの手法で身体にデバイスを埋め込む方向性だ。コンタクトレンズ型を経て外科手術的なインプラントまで、この方面の技術には無限の未来が広がっている。

さて、一般の人たちに今年もっとも注目されたIT分野は、なんといってもAI(人工知能)だろう。グーグル傘下のAI企業ディープマインドは12月、「アルファゼロ(AlphaZero)」という新しいAIのプログラムを発表した。これは囲碁の李世石九段を5戦4勝で破り名をはせたアルファ碁(AlphaGo)をさらに進化させたもので、人間の棋士が対戦した棋譜データを与えなくても、自身のプログラム同士で対戦し、最善手を学習していくことができる。この結果、従来の囲碁や将棋、チェスのAIプログラムに圧勝する性能に達したという。

近年のAIは、深層学習(ディープラーニング)という手法を採用している。それにより、多くのデータから特徴量(学習データにどのような特徴があるか数値化したもの)を抽出し、同じ特徴がほかの場所や将来に起きる可能性があるかどうかを予測するまでを、人間の手を介さずにアルゴリズムによってこなすことができる。結果、AIがなぜその特徴量を抽出できたのか、そしてそこにおいてどのような計算をしているのかを人間が理解するのは、非常に難しくなっている。これが最近、AIの「黒魔術化」「ブラックボックス化」と呼ばれている現象で、この不可解さは今後もさらに加速していくだろう。

■人間の知性に匹敵する「汎用型AI」は現れるか

この進化がどこまで進むのかを予測するのは難しい。すでに現在の深層学習でも、相当複雑な分析や予測が可能になっている。その成果が、2020年代には社会全体に一気に普及してくるだろう。まもなく実用化されるであろう自動運転車や、音声認識技術によるアシスタント機能、検索エンジンの自然文化などは、すべて深層学習がベースになっている。

深層学習をベースにしたAIは特化型AIと呼ばれ、人間の知性とはまったく異なるものだ。しかしこの先には、人間の知性に匹敵するような汎用型AIの可能性も期待されている。汎用型AIは深層学習の進化の先にあり得るのか、それともまったく別のアプローチが必要になるのか。このテーマでの議論や技術開発は今後も活発に行われていくことになるだろう。

ここまで、スマートスピーカーとVR/AR、AIについて論じてきた。情報通信テクノロジーは常に、インプットと計算、そしてアウトプットという3つのプロセスから成立している。インプットを多様化させ、データの処理を高度化し、そして人に与えるアウトプットを身体感覚に近いところに近づけるかというのが課題となっている。その意味で、インプットとしてのスマートスピーカー、データ処理を担うAI、そしてアウトプットを身体化するVR/ARというのはそれぞれのプロセスを形成する重要なイノベーションとしての意味を秘めているのだ。

----------

佐々木俊尚(ささき・としなお)
作家・ジャーナリスト
1961年生まれ。毎日新聞、アスキーを経てフリージャーナリストに。テクノロジーの世界に精通し、それらが社会をどう変容させていくか、取材を続けている。『新しいメディアの教科書』(Amazon Publishing)ほか著書多数。

----------

(作家・ジャーナリスト 佐々木 俊尚 写真=Imaginechina/時事通信フォト)