近年注目されている「ビッグデータ」の活用において最も期待されているのが、

「未来予測」

ですね。

商品の売れ行きの予測や、消費者・顧客の行動予測が高い精度で行なえれば、的確な事業計画やマーケティング施策の立案・展開が可能になります。




さて、将来の変化を予測するためには第一に、現象の

「因果関係」

を把握しなければなりません。

昨日のブログでご紹介した

「気温が高くなると、整腸剤が売れる」

という現象の場合、以下のような因果関係が推定できました。

------------------------

気温が上昇する

体が火照る・のどがかわく

冷たいものが欲しくなる

冷たい飲料や冷菓を過剰に摂る

腸の働きが過剰になる

お腹を壊す

整腸剤を飲む

-----------------------

この一連の因果は自然なものであり、納得できるものですね。

そして昨日の記事でも書いたように、現象の背景に存在していると思われる

「因果関係が何か」

を考えてみるのは論理思考力を養い、ビッグデータから優れた

「予測モデル」

を構築するためにとても役に立ちます。


ただ、ひとつ気をつけたいことがあります。

それは、

「擬似相関」

に惑わされないようにすることです。

「擬似相関」は「みせかけの相関」とも、言われます。

複数の現象の間に「比例・反比例」のような関係が認められる。しかし、実は直接の関係性はなく、別の要因が隠れている場合もあるのです。しかし、その隠れた別の要因によって、あたかも両者に相関関係があるように見えるので

「擬似相関」あるいは、「みせかけの相関」

と呼ばれるわけです。


例えば、

「血圧が高い人ほど年収が高い」

という記述を見てみましょう。


ここでは、「血圧」と「年収」に相関があり、「血圧の高さ」が、年収を押し上げる

「原因」

と推定されているわけです。

もちろん、逆の因果関係を推定することも可能ですね。

「年収が高い人ほど、血圧が高い」


どちらにせよ、もっともらしい説明が可能でしょう。

続きはこちら