[Nathan Green: "Correlation is not causation" (2012/01/06) on The Guardin]
相関関係は因果関係ではない
「相関関係は因果関係ではない。相関関係は因果関係ではない。相関関係は因果関係ではない。」統計学を勉強していたころ、私は映画シャイニングの中のジャック・ニコルソンの気分を感じていた。シャイニングでは、「勉強ばかりで遊ばないとジャックは退屈な男の子になる。「勉強ばかりで遊ばないとジャックは退屈な男の子になる」と同じ文を繰り返しタイプするにつれて狂気になっていく。
「相関関係は因果関係ではない」は統計学のマントラだ。新進の統計学者は陸軍士官学校スタイルに練習する。しかし、「相関関係は因果関係ではない」は本当はどういう意味だろうか? 相関関係は2つのものがどれくらい密接に関連しているかの指標だ。一方の数字が変化したとき、もう一方の数字の変化を考えてみよう。相関係数が1なら、強く正の関係があり、-1なら強く負の関係があり、0なら無関係だ。
「相関関係は因果関係ではない」は「相関関係があるというだけでは、必ずしも因果関係がることを意味しない」という意味である。たとえば季節の例だと、英国では寒いとき買い物が多くなり、暑いとき少なくなるが、これは天候が買い物の原因になっていることを意味するものではない。より尤もらしい説明は、寒いときがたまたまクリスマス商戦および新年商戦と重なっているということだ。
「相関関係は因果関係ではない」は重要な真理を具現化しているが、広く世界では知られていない。その理由は簡単だ。物事の働きについての我々の先入観と疑念が、手堅い証拠なしに、相関関係から因果関係へと我々を飛躍させてしまう傾向があるからだ。
2つの物事の相関関係は、その両方に影響を与える第3のファクターによって引き起こされたものかもしれない。この隠れた第3の要因は交絡因子と呼ばれる。
相関関係が明白でありながら、因果関係には疑念を持たれていた、おそらく最もよく知られた例は、1950年代における喫煙と肺癌の関係である。当時、過去20年で肺癌は6倍に増加していた。誰も、喫煙と肺癌の相関関係を否定しなかったが、一方が他方の原因になっていることを証明するのは至難の業だった。
喫煙と肺癌との相関関係をつくりだす交絡因子があったかもしれない。肺癌の増加は診断技術の向上や工業による汚染あるいは自動車の排気ガスのよるものだったかもしれない。喫煙したがる人は、癌になりやすい遺伝的要因を持っていたかもしれない。
英国で4万人の医師が参加した研究によって、喫煙が本当に癌の原因であること結論された。
【Othersの最新記事】
「偽相関」とかいう単語があるという…
もうね、アホか、と
何やっちゅうねん
そんなこと百も承知やがな
偽(因果関係でない)相関は普通の相関そのものやないのけ