「擬似相関」に気をつけろ!/松尾 順
近年注目されている「ビッグデータ」の活用において最も期待されているのが、
「未来予測」
ですね。
商品の売れ行きの予測や、消費者・顧客の行動予測が高い精度で行なえれば、的確な事業計画やマーケティング施策の立案・展開が可能になります。
さて、将来の変化を予測するためには第一に、現象の
「因果関係」
を把握しなければなりません。
昨日のブログでご紹介した
「気温が高くなると、整腸剤が売れる」
という現象の場合、以下のような因果関係が推定できました。
------------------------
気温が上昇する
↓
体が火照る・のどがかわく
↓
冷たいものが欲しくなる
↓
冷たい飲料や冷菓を過剰に摂る
↓
腸の働きが過剰になる
↓
お腹を壊す
↓
整腸剤を飲む
-----------------------
この一連の因果は自然なものであり、納得できるものですね。
そして昨日の記事でも書いたように、現象の背景に存在していると思われる
「因果関係が何か」
を考えてみるのは論理思考力を養い、ビッグデータから優れた
「予測モデル」
を構築するためにとても役に立ちます。
ただ、ひとつ気をつけたいことがあります。
それは、
「擬似相関」
に惑わされないようにすることです。
「擬似相関」は「みせかけの相関」とも、言われます。
複数の現象の間に「比例・反比例」のような関係が認められる。しかし、実は直接の関係性はなく、別の要因が隠れている場合もあるのです。しかし、その隠れた別の要因によって、あたかも両者に相関関係があるように見えるので
「擬似相関」あるいは、「みせかけの相関」
と呼ばれるわけです。
例えば、
「血圧が高い人ほど年収が高い」
という記述を見てみましょう。
ここでは、「血圧」と「年収」に相関があり、「血圧の高さ」が、年収を押し上げる
「原因」
と推定されているわけです。
もちろん、逆の因果関係を推定することも可能ですね。
「年収が高い人ほど、血圧が高い」
どちらにせよ、もっともらしい説明が可能でしょう。
続きはこちら
「未来予測」
ですね。
商品の売れ行きの予測や、消費者・顧客の行動予測が高い精度で行なえれば、的確な事業計画やマーケティング施策の立案・展開が可能になります。
さて、将来の変化を予測するためには第一に、現象の
「因果関係」
を把握しなければなりません。
昨日のブログでご紹介した
「気温が高くなると、整腸剤が売れる」
------------------------
気温が上昇する
↓
体が火照る・のどがかわく
↓
冷たいものが欲しくなる
↓
冷たい飲料や冷菓を過剰に摂る
↓
腸の働きが過剰になる
↓
お腹を壊す
↓
整腸剤を飲む
-----------------------
この一連の因果は自然なものであり、納得できるものですね。
そして昨日の記事でも書いたように、現象の背景に存在していると思われる
「因果関係が何か」
を考えてみるのは論理思考力を養い、ビッグデータから優れた
「予測モデル」
を構築するためにとても役に立ちます。
ただ、ひとつ気をつけたいことがあります。
それは、
「擬似相関」
に惑わされないようにすることです。
「擬似相関」は「みせかけの相関」とも、言われます。
複数の現象の間に「比例・反比例」のような関係が認められる。しかし、実は直接の関係性はなく、別の要因が隠れている場合もあるのです。しかし、その隠れた別の要因によって、あたかも両者に相関関係があるように見えるので
「擬似相関」あるいは、「みせかけの相関」
と呼ばれるわけです。
例えば、
「血圧が高い人ほど年収が高い」
という記述を見てみましょう。
ここでは、「血圧」と「年収」に相関があり、「血圧の高さ」が、年収を押し上げる
「原因」
と推定されているわけです。
もちろん、逆の因果関係を推定することも可能ですね。
「年収が高い人ほど、血圧が高い」
どちらにせよ、もっともらしい説明が可能でしょう。
続きはこちら