※この記事は2014年03月01日にBLOGOSで公開されたものです

2013年の「流行語大賞」にもノミネートされた「ビッグデータ」。ビジネスから選挙結果の予測まで、様々な場面での活用が話題になっているほか、安倍政権による成長戦略でも、IT分野の柱として、人材育成や法整備を通じたビッグデータ利用の推進が議論されている。
そんなビッグデータについて、昨年出版された「ビッグデータの正体 情報の産業革命が世界のすべてを変える(オックスフォード大学のビクター・マイヤー・ショーンベルガー教授との共著、邦訳版は講談社から出版)」がベストセラーとなっている、ケネス・クキエ氏(英国「エコノミスト」誌データエディター)が語った。

写真一覧

ビッグデータとは何か

エコノミスト誌の特集になりうるような題材を探す中で、「情報量がものすごく増えている」という点に関して興味を持つようになりました。結果、それが2010年末の特集になりました。取材の過程で、この"情報の多さ"を、どう呼ぶべきなのか考えていた時に、「ビッグデータ」という言葉に巡りあったのです。当時はそれほど大きな話題にはなりませんでしたが、今ではオバマ大統領までもが、ビッグデータという言葉を使うようになっています。しかしながら、全ての人が本質的な意味をわかっているとは必ずしも言えない状況でもあります。

ビッグデータ普及の背景には、さまざまな要素があります。技術やアルゴリズムの進歩、処理能力、ストレージの増大もあるでしょう。加えて、マインドセットが変わったことが挙げられると思います。つまり、データには"無駄なものも多く含まれている"という考え方から、"多くの宝物が含まれている"という考え方に大きく変わったのです。従来、経済学では労働、土地、資本が生産のための資源とされてきましたが、新しい時代には、これにデータを加えることによって、新しい価値を創りだすことができるかもしれないのです。

ビッグデータを説明するための典型的なお話をします。 あるコンピュータ・サイエンスの科学者が、航空券は早めに予約する方が安いと思って購入したのに、フライトの数日前に購入したという隣の乗客が払った額の方が安かったことを知りました。彼はびっくりし、怒り、他の乗客にも価格を聞いて回ったそうです。すると、フライトが近づいてから購入した乗客に、自分よりも安い値段で購入した人が多数いたことがわかったと言います。 つまり、コモディティ化しているものには、様々な価格がついているのです。彼は、その情報を活用できないかと考え、"飛行機の中で価格を聞いて回る行為"を拡大しようとしました。

すなわち、ネットを通じて、あらゆる座席についてのデータを収集、分析したのです。彼は会社に「ハムレット」という名前をつけました。-「購入すべきか、そうでないか、それが問題だ」と。さらに「Farecast」と社名を変え、航空券を安く購入できるサイトを設立しました。これは後にマイクロソフトがおよそ1億ドルで買収することになります。09年には、米国のあらゆる便、あらゆるフライトの座席をカバーし、2000億件に上る価格の情報を処理するまでになりました。航空会社は、自分たちのビジネスモデルが打ち砕かれてしまうことを予測できなかったのです。

2003年の時点では、ヒトゲノムの解析をするために10年くらいの年月と10億ドルの費用がかかっていました。しかし今では1日で、しかも1,000ドルでできると発表している企業もあるのです。生物科学だけでなく、メディアの世界、あらゆる産業がこのビッグデータの影響を避けられなくなると思います。

ビッグデータにおいては、重要なコンセプトがあります。"more"=多量で、"messy"=雑多で、"correlations"=相関があること、です。かつては多くのデータを集めて解析するには労力がかかっていたために、サンプルを取ることで対処してきましたが、低コスト化により、その必要もなくなりました。確かに、サンプリングの方が、よりクリーンなデータを集められるかもしれませんが、やはり量があれば克服できるのです。そして、因果関係がわからなかったとしても、相関関係さえわかれば十分だという考えもうまれています。

病院では入院患者の方々が様々なモニタに繋がれているわけですが、多くの場合、そのデータが保存されることは無いと思います。未来の人は"治療が終わったからと言ってそれらのデータを捨ててしまうのはもったいない"と言うでしょう。世界中の医師が帰宅後、夜中に看護師に起こされているのが現状ですが、データから相関関係がわかれば、感染などを事前に察知し対処することもできるようになるかもしれません。

また、人によって足の長さも違いますし、椅子の座り方や姿勢も異なります。椅子にセンサーを付ければ、それらをデータ化することができます。自動車に応用すれば、運転席に承認されていない者が座った場合に運転できないようロックすることもできるでしょうし、ドライバーに合わせ椅子を起こすとか、疲労感を評価して、"もっと注意せよ"というようなアラートを出すことで、事故を防ぐ事ができるようになるでしょう。部屋に入ってきた人がどんな人なのか、歩き方でドアをアクティベートするといったことも可能になるかもしれません。

あるいは、異なる二つの薬品を組み合わせて服用した場合、どのような副作用があるのかという研究テーマがあります。サーチエンジンの人々のクエリを分析した結果、規制当局がわからなかった副作用がわかったということがあるそうです。こういう患者にとって価値ある情報は、ライセンスすることでビジネスになるのではないかと思います。

ビッグデータの活用が、すでに人々の行動にも変化が現れていると思います。統計では、アメリカの既婚カップルの3分の1は"オンライン・デート"から始まっていると言われています。それは非常に効率が良いからです。こういう特徴のある人は、別のこういう特徴のある人と結ばれる、相関関係が見えてきて、効率的にレコメンドされているのです。結果的に上手く行かなかった場合も同様に、相関関係が見えてきているわけです。

ビッグデータの負の部分

一方で、リスクもあると思います。プライバシーの問題、データのオーナーシップという問題ももちろんあります。

また、予測によって罰を与える、という問題はどうでしょうか。予測に基づけば、その人が99%の確率で置き引きをする可能性があるとして、その人を犯罪者と決めていいかどうかということです。残り1%は置き引きをしない可能性があるのです。21世紀においては、人間の自由意志、公平性、正義とは…いった課題が出てくるでしょう。さらには、共産主義や資本主義のように、新しい思想として"データイズム"というものも出てくるでしょう。それらはビッグデータの弱点にもなるのではないでしょうか。

ビッグデータが表すものは、現実のひとつの側面にしか過ぎないということもまた事実です。地図が領土そのものではないように、ビッグデータにも限界があるということを認識しなければならないし、人間が判断し、コントロールしていかなければならないものなのではないでしょうか。今後、様々なデバイスによるデータの収集が進むと思いますが、逆に、全てを収集することはない、という方向性も出てくるかもしれません。

日本はビッグデータのリーダーになりうる

東日本大震災の際、陸前高田市に取材に行きました。その際、カーナビゲーションのシステムが収集した走行軌跡を元に、通行可能な道路を表示する取り組みに助けられ、非常に効率的に取材が出来ました。車では行けない道を教えてくれる、生きた地図、賢い地図ができていったのです。

かつての日本の成功の鍵はハードウェアでした。しかしソフトウェアでは遅れをとっていると思います。東京に駐在していた時期に、男はやっぱりハードウェアをやるんだ、という先入観があると聞いたことがあります(笑)。保守的な社会も決して悪いことではありませんが、多様性やセカンドチャンスを認めることも必要だと思います。

私はアメリカ人ですけども、日本を第二の故郷だと思っています。日本は数学の分野に長けているわけですし、創造性の面からも、この分野でも成果が出せると思うのです。日本はビッグデータのリーダーになりうるのです。しかし、まだまだ活発では無いと思いますね。

質疑応答

-今後、ビッグデータは特定の団体や企業が所有するものになるのでしょうか。例えば、健康情報や医療情報は、誰が再利用できるようになるのでしょう?本人が使いたいときに使えるようになるのでしょうか。

重要な問題です。これからの10年間は、それがテーマになるでしょう。つまり、企業だけが所有するようなデータとオープンなデータ、それぞれが存在することになると思いますが、国立公園の歴史を考えてみると、たくさんの土地を一部の人達が所有することへの反動で国立公園が整備された経緯があります。また、IPアドレスの問題が進むことによって、パブリックドメインの概念ができました。

データの価値が増してくることにより、やはりデータは自分のものだと主張する人や企業が出てきて、一方でシェアされないようなデータも出てくると思いますが、片方では、データは社会、人類全体ものである、共有すべきだというひとたちも出てくるでしょう。そのような対立関係の中で、コモンズのような、人類全体で持つべきだという動きが出てくるかもしれません。 データについてのジョブの機会 これにどのように貢献することができるのだろうか。

-人事管理や採用に与える影響もあるのではないでしょうか。

これも素晴らしい質問です。例えばファストフードの労働者は、1年間くらいで転職していってしまうわけです。そうした企業は、大量の履歴書や勤務情報を持っているわけですから、履歴書を元に、例えばこの人の方が長く働いてくれるのではないかとか、そういったことを予測することができるでしょう。 また、心理的なペーパーや小規模なデータを元に評価することはすでに行っていると思いますが、住所、学歴、犯罪歴などに対して、先入観を持ってしまうことも多いと思います。それも、ビッグデータの分析から、本当はそうではない、という結果が出ることもあるでしょうから、ビッグデータによる評価は、雇用創出に効果があると思います。

ただ、あらゆるデータが収集され、活用されるようになると、これまでホワイトカラーがしていた仕事が無くなってしてしまう可能性もあります。そういう点では、アルゴリズムの脅威に晒されているも言えるでしょう。

-データを収集されたくない、消して欲しいという人々がいることを、どう考えれば良いのでしょうか。

同様の問題は、これまでオフラインでも起って来たはずです。ひとつのポイントは法律でしょう。例えば、それまで高価だった複写技術が安価になり、情報がコピーされ、シェアされることが活発になった結果、イギリスでは1710年に最初の著作権法が作られ、14年間の保護期間が与えられたのです。その後、情報の伝達速度が向上し、環境が変わるにつれ、法律も厳しくなってきました。私たちが乗り越えなければならない様々な対立があります。著作権の問題と同様に、皆が懸命に考える姿勢が必要だと思います。

■プロフィール
(Kenneth Cukier,ケネス・クキエ)
英「エコノミスト誌」のデータエディターとして、ビジネス、テクノロジー分野の記事を主に手がける。2002年から2004年にはハーバード大学ケネディスクールの客員研究員を務めたほか、外交問題評議会のメンバーも務める。2007年から2012年まで、東京特派員として日本に駐在した経験もある。

・Kenneth Cukier - The Economist
・cukier.com|@kncukier



リンク先を見る
ビッグデータの正体 情報の産業革命が世界のすべてを変える
posted with amazlet at 14.02.27
ビクター・マイヤー=ショーンベルガー ケネス・クキエ
講談社
売り上げランキング: 4,986
Amazon.co.jpで詳細を見る