MTI0NzkyMTI1Mzc5MzU0Njk2

写真拡大 (全3枚)

人こそがビッグデータの理解への鍵となる

「ビッグデータ」の魅惑とは、充分なデータさえあれば、人間の洞察力に頼らずとも、データが全てをやってくれるようになる、ということにある。本当にそれが可能であれば、The Economist誌のケネス・クキエが断言するように、「データに語らせる」ことで、データ自身がその関係性を明らかにし、人は原因追求をしなくて済むというわけだ。それは実に美しい理想郷と言えるだろう。

悲しいかな、それは全くのナンセンスでしかない。

そんな事はわかりきっていた、とも言える。数ある調査において、経営者達は幾度となくデータには価値があると主張してきた…そのくせ、結局本能的判断を信用したりするのだ。彼らに考えを改めさせ、データと洞察力をうまく働かせるには、社外のデータサイエンティストよりも自社のデータアナリストを信用する、ということが必要なのかもしれない。

データ大好き!(かもしれない)

ガートナー・リサーチによれば、ビッグデータは、テクノロジー業界で最も旬のフレーズであり、それを利用するために、様々な計画が立てられてきたということだ。

「ビッグデータ技術への投資と計画」(Source: Gartner 2014)

我々はビッグデータに絶対的な信頼を置くことさえできるのだが、経営者達は自分達の勘を優先する傾向がある。
実際に見てみよう:

・CMO(最高マーケティング責任者)の40%が、データではなく自分達の洞察力に基づいて意思決定を行っている(Formstack 2014)

・約50%のCMOがデータを「最も活用されていない資産」とみなして入るが、意思決定において日頃からデータを活用していると答えたCMOは全体の37%(Formstack 2014)に過ぎない

・62%のビジネス経営者が自分の直感を信用しており、61%が現実世界の洞察力のほうが、分析よりも意思決定において有用だと考えている(Fortune Knowledge Group 2014)

企業が採用するデータサイエンスの種類を考えれば、これは驚くには値しない。「ビッグデータ」は機械によって機械の為に作られているというのに、ほとんどの企業が実際に焦点を当てているのは、人に関するビッグデータなのだ。グレゴリー・ピエタツキーが自身のKDnuggetsコミュニティで行った世論調査がそれを示している。

「過去3年の間どのような種類のデータサイエンスに関わっていたか」(Source: Gregory Piatesky)

事実、データによって失敗をなんとか回避できないかと願ってみても、結局人間が携わらないとデータのみでは役に立たないのである。

人間のデータは人間が分析すべき

問題は、我々がデータサイエンスはどれも同じようなものだと考えがちなところにある。実際は同じではないのだ。グーグルとFoursquareの元データサイエンティストであるマイケル・リーが明確に示すように、データサイエンティストの分析は機械に関するもの、もしくは人間に関するもののどちらか一方である。兼用可能な分析は通常ありえない。そして個々の分析には違ったスキルが求められるのだ。

人に関するデータサイエンスを行う者には、ある理想的な特徴が必要だとリーは主張する。分析結果を人間が理解できるようにまとめ上げ、「どうやって」や「なぜ」を明確に表現し、伝える能力を持っているということだ。

開発者にしても同じことだ。どんなに1と0だけの世界に住む事を望んでも、現実には遥かに長い時間を人々と過ごさねばならない。

Rachael (@r343l):「ソフトウェアに関わろうとする人にアドバイスがある。コンピューター言語より実際は人の言語を使うことになる。そちらを上達しておいた方が良い」

開発者だろうがデータサイエンティストだろうが、どんな職業の人であれ、一番優れているのはコミュニケーションに優れた者、ということだ。

それゆえ、組織の内情を把握できるデータサイエンティストを見つけることが最重要になる。データを基に(あるいは無視して)行動する経営陣もそこに含まれる。当然の事ながら、そのような人材を組織内で見つけることの方が、世界中を探しまわり、ウォール街出身のデータサイエンティストを見つけ出すことよりも遥かに簡単だろう。

自社のビジネスに詳しいデータサイエンティストがより適切な設問をし、ビッグデータを用いたその解を正確に伝えることができるということだ。

小さく始めてそれから大きく

ビッグデータの解析には、適任者をたった一人選ぶよりも、チームで当たった方が良い場合が多い。マイケル・シュラージ(マサチューセッツ工科大スローン校、デジタル・ビジネス・センターのリサーチ・フェロー)は、チームで取り組むことこそが最善だと強調する。

これまで見た中で最も優れたやり方を示しましょう。職能上の枠を超えたデータ志向の小規模チームに資金と権限を与え、データを用いて短期間で目に見える成果をあげさせる、というものです。ここで強調されるべきは「チーム」という単語です。重要なのはデータをよりよく扱うことであり、優れたデジタル・インフラを構築することではないのです。確率や統計、テクノロジー、それにビジネス・バリュー創造をどう扱うのか、ギークやアナリスト達だけでなく組織全体としてよく理解することを目指すべきなのです。

このチーム・アプローチを採用したとしても、新しく人材を求める必要があるかもしれない。その場合でもこのアプローチによって、迎え入れたデータサイエンティストが活躍する土台が構築できる、とシュラージは主張する。

クラウドのおかげでその土台作りは簡単になった。マット・ウッド(アマゾン ウェブ サービスのデータサイエンス・チーフ)がインタビューで語ったように、クラウドはビッグデータの価値を、「指数曲線」的に成長させた。チームを組んで柔軟な環境でビッグデータを利用することで、我々は急速に、データサイエンスのノウハウを社内に蓄積しているのだ。

これまで見てきたことから組織内でビッグデータを正しく活用する術が見えてくる。クラウドで小さなプロジェクトから始めて、多分野をカバーする組織内の小さなチームに任せる、ということだ。

トップ画像提供:Shutterstock

Matt Asay
[原文]