人工知能は、人の「目」となり「耳」となる

写真拡大

バイドゥが開発するあるプロトタイプは、人工知能(AI)の力で視覚障害者に「目」を与えた。それに限らず、SkypeやFacebookといったサーヴィスを通じて利用が進むAIは、2015年末のオープンソース化ラッシュ以降、さらなる広がりを見せている。

「人工知能は、人の「目」となり「耳」となる」の写真・リンク付きの記事はこちら

アンドリュー・ングは、わたしに耳を覆う小さなデヴァイスを手渡した。細いケーブルでスマートフォンと接続するイヤホンは、Bluetooth接続のものが溢れるいま、時代に逆行しているようにも感じられる。

しかし、実際のところ、わたしはそこに未来を垣間見ることになった。このちっぽけなデヴァイスは、視覚障害者に「目」を与えるのだ。

ングは中国のテクノロジー大手・バイドゥのチーフサイエンティストで、このデヴァイスは同社の最新プロトタイプのひとつだ。名前は「Dulight」。人の顔、道路標識、食品パックなど目の前にものをすべてとらえる超小型カメラが搭載されており、画像をスマートフォン上のアプリに送信する。アプリは画像を分析し、それが何かを特定し、イヤホンを通して届けられる音声で描写する。目が見えなくても、少なくとも目の前に何があるかを知ることができる。

Dulightはまだ開発の初期段階のため、完全には機能しない。だが、機械が人間と同じくらい、あるはそれ以上に、周りの環境を認識・理解する未来を指し示している。この種の人工知能(AI)は、わたしたちが世界と対話する方法までをも変えるのだ。

「Dulight」が目の前にいる人物や物の画像を解析し、それを音声で伝えることによって、視覚障害者でも周りに何があるのかを認識できるようになる。まだ開発初期段階だが、実用化への期待は大きい。

人の目となり、耳となる

ングのプロトタイプに使われているのは、ディープラーニングと呼ばれるテクノロジーだ。バイドゥのオンラインサーヴィスを支える巨大なコンピューターデータセンターでは、人間の脳内にある神経細胞網に似たハードウェアとソフトウェアのネットワーク、ニューラルネットワークが管理されている。

ニューラルネットワークは、十分なヴォリュームの猫の画像を与えられれば猫の識別法を学び、雲の画像を与えられれば雲の識別法を学ぶ。そして、バイドゥやグーグル、フェイスブック、マイクロソフトでは、すでにこうしたテクノロジーが広範囲のあらゆるタスクを処理している。

グーグルでは、画像の山に埋もれた特定の人物や場所、物を瞬時に検索することを可能にし、Android端末の音声認識にも役立っている。フェイスブックでは投稿された画像の顔認識に使われ、Skype(マイクロソフト)では、会話を他言語に瞬時に翻訳するサーヴィスが実現している。

ニューラルネットワークはいま、人の自然な話し方さえも理解し始めた。グーグルが開発中のチャットボットの例もある。何もかもがまるでSFのようだ。

2015年は、AI技術が世界中で大きく飛躍した年だった。

グーグルは、その基軸であるインターネット検索エンジンにもこのテクノロジーを利用している。Twitterでは、ポルノのブロックのための識別に利用されているし、バイドゥではターゲティング広告において、あるいはマルウェアの識別に用いられている。ディープラーニングの進歩は加速する一方だ。

進化を加速させるAIのオープンソース化

11月初旬、グーグルはディープラーニングを動かすソフトウェアエンジンをオープンソース化し、この極めて重要な技術をあまねく共有すると発表してテック業界を驚かせた。もちろん、グーグルはすべての技術を表に出したわけではない。それでも、このオープンソース化は社外でのディープラーニングの進化を後押しするのに十分だ。

その数週間後には、フェイスブックがディープラーニング機能を動かすカスタムビルト・ハードウェアサーヴァーのための設計をオープンソース化した。

さらにその翌日、テスラモーターズの創設者イーロン・マスクとYコンビネーターの社長サム・アルトマンが率いるグループは、AI研究とテクノロジーを共有することを約束する「OpenAI」という1億ドル規模の非営利団体の設立を発表した。OpenAIは、グーグルのトップAI研究者のひとりだったイリヤ・サツケバーの下に置かれることとなり関心を集めた。

マスクとアルトマンは、同組織をAIの危険から世界を守る方法としても売り込んでいる(「多くの人は善良で、それゆえその人道的な力が悪の力を食い止めている。同じように、多くのAIが存在すれば、一部の悪いAIが出てきたとしてもそれに対抗できると思う」とアルトマンは言っている)。

2014年にSkypeがテスト公開した音声・動画のリアルタイム通訳サーヴィス。15年には英語とスペイン語に加え、中国語(北京語)とイタリア語のサーヴィスも開始された。インスタントメッセージのみであれば日本語も利用可能だ。

危険性は確かに考慮すべきだ。しかし、同時に、社会はAIによるメリットを受け入れるべきだ。DuLightは、その最たるものだといえる。

15年の秋、視覚障害者のためにFacebookのニュースフィードにある写真を自動分析し、音声変換エンジンを介して写真に何があるかを説明する技術が披露された。その効果はすぐに現れた。何が写っているか見えなくとも、すでに5万人以上の視覚障害者がFacebookを使っている。

これから、機械は人の目となる。いまやAIの影響は、誰の目にも明らかなのだ。

『WIRED』VOL.20
「人工知能」と「未来都市」の2大特集・特別保存版!

Amazonで購入する>>

第1特集「人工知能はどんな未来を夢見るか」では、ぼくらの暮らしのすべてを変えていくAIの向かう先を考える。ケヴィン・ケリー、ベン・ゲーツェル、DeepMindの天才創業者たちのヴィジョンから、PEZY Computing・齊藤元章や「全脳アーキテクチャ」の解明を目指す日本の科学者の挑戦を紹介。

TAG

AIAndrew NgBaiduDeep LearningElon MuskWIRED US