人工知能「Watson」に足りないのは、スタートアップ発のデータだった!:佐俣アンリ×IBM〜生きたデータが、ぼくらのビジネスをエンパワーする

写真拡大

世界屈指の人工知能である、IBMのWatson。しかしこのWatsonは、単なる人工知能ではなく、実は多様性をもった「存在」なのだという。そして、そんなWatsonの視線はいま、スタートアップに向き始めている。そこで、独立系ヴェンチャーキャピタリストとしてスタートアップの最前線に立つ佐俣アンリが、Watsonがなんたるかを確かめるべく、日本IBMの中林紀彦との対話に臨んだ。

「人工知能「Watson」に足りないのは、スタートアップ発のデータだった!:佐俣アンリ×IBM〜生きたデータが、ぼくらのビジネスをエンパワーする」の写真・リンク付きの記事はこちら

佐俣アンリANRI SAMATA
1984年生まれ。ANRI General Partner。慶應義塾大学経済学部卒業後リクルートに入社、モバイルコンテンツ・ソーシャルゲームの新規事業立ち上げに携わる。クロノスファンド/EastVenturesにてFreakOut(2014年マザーズ上場)、CAMFIREの投資と事業立ち上げを行う。また個人としてRaksulやスマポ(2013年楽天に売却)の立ちあげを支援する。2012年ANRI設立、独立系ベンチャーキャピタルとして23社に投資実行し、事業立ち上げを行っている。現在20億円規模のファンドを運営中。主な投資支援先としてRaksul、Coiney、CrowdWorks(2014年マザーズ上場)、MERY(2014年DeNAに売却)、UUUM、Schooがある。http://anri.vc

中林紀彦NORIHIKO NAKABAYASHI
ソフトウェア事業 ビッグデータ&アナリティクス アーキテクト。データベース関連ソフトウェアのプリセールス・エンジニアを経て、製品のマーケティングマネージャを担当。データサービスに関するエバンジェリストとしても活躍。2014年よりスタートアップ企業の抱えるさまざまな課題をデータ分析およびそれに関わるテクノロジーの観点から支援を行う。また、データサイエンティストとして先進的なアーキテクチャを取り入れた顧客のデータ分析を多方面からサポート。共同インキュベーション テクニカル・メンター、筑波大学大学院 客員准教授。

佐俣 今回、中林さんと対談をするにあたって、グーグルでWatsonについての記事をざっと読んだんです。「Jeopardy!(ジョパディ!)」というアメリカのクイズ番組で歴代最強のチャンピオンに勝ったり、医者にリコメンデーションしたりといった、非常に優秀な人工知能であることは元々知っていたのですが、どうやら、それ以外の用途もあるみたいですね。

中林 そうなんです。実はWatsonというのはブランド名で、何かを明確に指すわけではないんです。仰っていただいたような人工知能としての側面のほかに、検索エンジンでもありますし、データ処理のアーキテクチャ自体を、Watson Foundationと呼んでいたりもします。利用するみなさんにWatsonとはどんなものかを定義してもらうのもよいと思うので、だから今日は、佐俣さんと対話をする中で、Watsonのひとつの輪郭を出せればいいなと思っているんです。

佐俣 そういえばIBMさんって、自然言語処理のテクノロジーをずっと探究していましたよね。1990年代にチェスのチャンピオンに勝ったディープ・ブルーとか。その集大成がWatsonだと、まずは捉えればいいのでしょうか。

中林 そうですね。簡単に言うと、人工知能の部分と解析の部分、その両方のソリューションで成り立っているのが現在のWatsonです。仰られた通り、いまアメリカでは、医療の分野で実用化されはじめています。医者が患者と対面して診断している際に、どういう診断をするべきか迷ったとき、自然言語で「こういう症状なんだけれど、どうすればいいかな?」って訊くと、ものすごい量の論文や症例にアクセスし、最も適切な答えを瞬時に返してきます。

あとは金融の分野では資産運用的なところで、例えば「娘を大学に行かせるにはどれくらいかかるか」と訊けば、「こういうケースだとこれくらい、こういう場合はこの程度」といったカタチで見積もりを教えてくれます。要は質問に対して、自分がもっている知識というか、バックにある膨大なデータから最も適切な答えを返してくれるわけです。

いまIBMでは、そういったWatsonの機能を、スタートアップの方々にどんどん使っていただきたいと思っているんです。

佐俣 BluemixというプラットフォームにWatsonが実装されたのは、そのひとつの取り組みというわけですね。

中林 はい。クラウド上での開発環境やアプリの実行環境を提供する、いわゆるPaaS(Platform as a Service)として、現在IBMではこのBluemixに力を入れているのですが、そこに提供されているサーヴィス(API)のなかに、Watsonの機能もラインナップされることになりました。つまり、アプリの開発にあたって、自然言語処理/解析に関係するものや人工知能的なアプローチをしたいと思ったときに、気軽にWatsonのテクノロジーを活用してもらうことができるようになったわけです。

佐俣 BluemixにおけるWatsonの「サーヴィス」というのは、具体的にどのようなものなのでしょうか。

中林 まずは「質疑応答サーヴィス」です。「ジョパディ!」に出演したときのように森羅万象を知っているわけではなく、現時点では医療と旅行の分野の知識に限られているのですが、英語で答えると、何かしらの答えを返してくれます。

それ以外には「顧客モデル化サーヴィス」といって、誰かが書いたテキストを解析して、その人のプロファイル等を分析する機能もあります。

あとは、「言語識別サーヴィス」と「機械翻訳サーヴィス」ですね。現在は10言語を読んで、何語で書かれているか識別する「言語識別サーヴィス」と、ある言語で書かれたテキストを、他の言語のテキストに翻訳する「機械翻訳サーヴィス」が利用可能です。さらに、婉曲表現、例えばニューヨークのことをThe Big Appleと表した場合でも、前後のコンテキストを見極めて適切な処理を可能にする「概念拡張サーヴィス」も備えています。

佐俣 確かにそれらのサーヴィスを、ゼロからコーディングするのではなく、機能をブロックのように組み立てて重ねていけるのは、アプリやプロダクトの開発コストや期間を大幅に削減できると思います。

中林 Watsonがもつケイパビリティは、膨大なデータを非常に高速で解析処理して、答えを返してくれることなのですが、その機能を、スタートアップの方々の優れたアイデアを実現していくときのツールとして、どんどん活用していただければと思っています。

正直IBMは、1990年代のITバブルのときも、2000年代にゲームが伸びたときも、そのマーケットにうまく入り込むことができませんでした。最近になって、IoTをはじめ、次に来るマーケットがある程度見えてきているので、今度こそいち早く優秀な方々と一緒にさまざまなことをやり始めたいと思っているんです。

佐俣 ぼくはいま、24社ほどのスタートアップにかかわっています。これまで携わった数でいうと、40社くらいでしょうか。その立場から言うと、いま社会は、ある大きな方向へ向かっている気がします。それはなにかと言うと、「機械でできるものは機械になっていくし、人にしかできないものは、より人が担っていく」という社会です。Watsonは、その実現に向けたラスト1マイルを埋めるための要因になるのではないかと思います。

中林 確かにIoTとはいってみたものの、現時点では、データを吸い上げるところで止まってしまい、データを使ってその先何をやるのかが見えていないスタートアップも多いと思います。わたしたちはWatsonをはじめとするアナリティクスを通じて、テクニカルな面からサポートを差し上げることで、事業の付加価値や競争力を生み出せるのではないかと考えているんです。

佐俣 スタートアップの課題というと、正直それ以前に、常に人が足りないことなんです。ぼくは、ラクスルというクラウド型の印刷会社に投資をしているのですが、いますごい勢いで伸びていて、倍々で成長しています。そうなると、カスタマーサポートが数十人規模くで必要になるのですが、そう簡単にサポートを増やすことはできないんです。人間は、なかなかスケーリングできませんからね。

中林 そこも、Watsonで解決できる分野かもしれません。ひとりの人間のナレッジを全部覚え込ませていけば、あとは機械がスケールしてくれるかもしれませんから。実際大手銀行と一緒に、Watsonを使ったコールセンター業務をスタートするべく共同研究をしているところです。

佐俣 それってすごくいいことだと思います。人がやるべき仕事と、やるべきではない仕事は明確に分かれていくべきだと思いますし、特にぼくらはインターネット屋さんなので、人がやるべきじゃない仕事は、いろいろなテクノロジーや誰もつくったことがない仕組みを生み出して、どんどん自動化していくべきだと思っています。そのとき、Watsonがテクノロジー側のパートナーになっていくという状況は、大いにアリですね。

実はずっと、自分の仕事のどこまでが機械化できて、どこまでができないのか、ということを考えているんです。ぼくは投資を依頼してきた人を、100個くらいのポイントをパッと見て判断しているのですが、結構、機械化というか仕組み化できるのではないかなと。仕組み化できてしまえば、ぼくはインターネット教の信者なので、自動化できるはずだと思っているんです。超アナログに見えて、本当はデジタルでやっていることがいくつかあるんじゃないかなと。Watsonがぼくの変わりに投資先を判断してくれたら、その間ぼくは、家で寝ていればよくなるかもしれませんね(笑)。

中林 あはは。

佐俣 テクノロジーと人という観点でさらに言うと、いま、書き起こしとかキュレーションとかバイラルメディアが増えていて、食えなくなる編集者が逆相関的に発生しているわけですが、その一方で、いいコンテンツをつくっている編集者はどんどん収入が上がっていくと思うんです。あと、いま世界的にEDMといってクラブミュージックのジャンルがものすごく流行っていて、トップDJは年収が10億円を超えるような状況です。その一方で、食えないDJはどんどんテクノロジーによって駆逐されていくのではないかと思います。ハコの雰囲気に合わせて音楽を変えていった方が盛り上がるに決まっていますからね。テクノロジーによって、編集者もDJも、超イケている人とそうじゃない人に2極化されると思います。

中林 なるほど。だとすると、WatsonにDJをやらせたりしたら面白いかもしれませんね。

佐俣 曲をつなぐだけではなく、盛り上がる音楽を、Watson自体がつくれるといいですね。オーディエンスの反応をリアルタイムで解析しながら音楽を生成し続けるとか、できそうですけどね。心拍数や脳波や目線とか、センシングする手段は現時点でもあるので、そうやって人の感情とか活動の方に踏み込んで行くというのも、Watsonの1つの道として面白いのではないでしょうか。

中林 確かに、Watsonは「耳」がいいので、曲の自動生成もいずれ可能かもしれません。あといま研究が進んでいるのが、「目」なんです。主に画像解析に使う技術なのですが、これが発達すると、絵を描けるようになるかもしれません。

佐俣 人工知能が描いた抽象画が、いずれ登場するかもしれないということですか(笑)。あとWatsonには、ぜひお笑いをやって欲しいと思います。ネタ元のベースをつくっておけば、会場の空気をセンシングして、分岐すればいいわけですよね。シナリオのツリーをつくっておいて、会場の空気に合わせてどんどん分岐させていけば、可能なのではないでしょうか?

中林 Watsonだと、シナリオツリーもいらないですね。うまくセンシングさえできれば、瞬時に考えてネタをつくっていけると思います。

佐俣 ということは、Watsonがいちばん面白い芸人になる、ということもあり得るわけですね。そういういままでの人工知能に期待していなかったぎょっとするようなことに挑戦していくと、いろいろな人がWatsonに対して想像力を膨らませられるのではないでしょうか。

佐俣 現時点におけるWatsonの課題を挙げるとすれば、どのような点になるのでしょうか。

中林 データを食わせないと学習しないので、どうやってデータを食わせるか、という点がまずひとつ。次に言語の問題です。英語はペラペラなのですが、日本語は今後の課題といえます。あとは値段でしょうか。どうやって高機能のサーヴィスをリーズナブルな価格で提供できるか、というビジネスモデルを構築しなければなりません。

佐俣 データということで言うと、ぼくはいまSmartDriveというIoT系の会社に出資をしていて、そこでは、クルマの走行ログを取るデヴァイスを開発しています。開発者は元々東大の大学院で交通データの研究をしていた人物なのですが、とにかくいまは、走行データを取り続けるのが勝負だと考えています。

中林 クルマってカーナビのほかにも200個くらいのセンサーがあって、データがあるところに貯まっているわけですが、修理工場に行って専用のデヴァイスにつながないと、取り出せないんですよね。メーカーは、それをリアルタイムで抜き出せる仕組みを考えているようですが。

佐俣 確かにメーカー自体はみんなそれを考えているのですが、結構パーミッションを取っていなかったりするので、実際には難しい部分もあると思います。そこでぼくらの場合は、そのような課題を超えてユーザーがポジティヴにデータを出していきたくなるサーヴィスを開発しているんです。

走行データって、本当に面白いと思います。例えばテスラとか、明らかにタイヤがついたスマートフォンといった感じですよね。知り合いの方が先日購入したのですが、OSアップデートがあって、「いますぐ始めると30分間乗れません」みたいなメッセージが出ると言っていました(笑)。既存のクルマとは、明らかに概念が違いますよね。

あとUberは、いずれタイミングを見て自動走行車をやるはずです。つまり、移動をリプレイスしようとしているんです。そのために、どの道路にどれだけクルマがいて、どれだけ時間がかかって人を運んだか、というデータを取り続けているわけで、すさまじい会社だなと思います。じゃないと、1兆円程度のヴァリューなんて付かないですよ。日本でトップレヴェルのタクシー会社である大和自動車交通が、時価総額50億円くらいですから、世界中のタクシー会社をどれだけ積算しても、絶対Uberにはならないわけです。それだけ、走行データには価値があるんだと思います。

中林 なるほど…。

佐俣 先程中林さんも仰いましたが、確かにデータは貯めてなんぼで、そこから何をするかが重要になってくると思います。それなのに既存のIoT分野は、計るだけで、リアクションの部分が設計されていないことがほとんどです。そんなものが流行るわけないですよね。

中林 Watsonにとってデータは大好物なので、どんどん食わせて欲しいですね(笑)。

佐俣 データを取って、その対価を返すというサイクルが回り始めることで、ようやくいいものができるわけですからね。デヴァイス自体はただのモノなので、コモディティ化が激しい。誰でもつくれるものだから、つくってどこまで配りきれるか。そうするとお金勝負になってくるので、今度はどうやってキャピタルをもってくるか、ということになってきます。そのとき、IBMさんがパートナーだったりすると、一気に信頼度が上がるというメリットも、スタートアップ側にはあると思います。

ぼくは、カンムという金融データを扱う会社にも出資しているのですが、いまでこそクレディセゾンと共同でカード利用履歴データを用いて広告をつくる、いわゆるCLO(カードリンクドオファー)をやっているのですが、契約にこぎつけるまでに1年以上かかりました。既存の企業から信頼を勝ち取るのは、スタートアップにとって本当に敷居が高いんです。

ただ、走行データにせよクレジット履歴にせよ、データは宝の山なんです。スタートアップにとって、アイデアを絞っていかに早くデータを集め切るかは、非常に大きな勝負どころなんです。

中林 わたしたちがスタートアップの方々にアプローチするのは、大企業からはおよそ生まれ得ないシャープなアイデアで、宝の山であるデータを集めてくださるからでもあるんです。集めていただいた宝を「食わせて」いただき、その後の分析をご一緒させていただいて、付加価値をつける。こちらとしては「食わせて」いただく分、安価でWatsonをご提供しようというわけです。

佐俣 コンサルタント同士が話をするときに、「脳のリソースを貸してよ」という会話をしているのをたびたび見たことがあります。確かに自分のアタマは1つだから、デュアルにするというか、あるイシューに対してパートナーと一緒に考えると、パフォーマンスが上がるのは確かだと思います。そういう考えるパートナーといった関係に、Watsonがなれるといいですよね。サポーターというか。

だとすると、自分のデータをどんどんWatsonに食わせて、精度を上げていくことも厭わなくなると、ぼく自身は思います。元々、インターネット上に自分の一切が上がっていたとすれば、別に死も怖くないという立場ですから(笑)。そうやって自分のデータが移し終わったWatsonに、「これどう思う?」って聞ける日が早く訪れるといいなぁ。

中林 なるほど。そうなってくると、いろいろな人格や役割をもったWatsonができていくことになるのかもしれませんね。うん、何となくWatsonの新しい輪郭が見えてきたかもしれない!