相関と因果
因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk: 林岳彦の研究メモ
ひっそりと感想文をば。
相関関係の定義
リンク先では、因果関係の便宜的な定義がなされているけれど、相関関係の方にはそれが無かったりします。で、この種の問題においては、そもそも相関関係って何だっけ?みたいな問題意識もあると思う訳ですね。
サイコロ
独立した2つの現象に関連性が現れることは、単なる偶然によっても生じえます。もっとも単純には、「二つのサイコロを転がしたら同じ目がでた」なんてのがそれにあたります。
で、ここにある、二つのサイコロを転がしたら同じ目がでた
を、相関関係と呼べるのかどうか、みたいな疑問も出てきたりするのです。2つサイコロを振ってゾロ目になる事を相関関係と表現出来るのなら、どこからどこまでの現象をそのように呼べるのだろうか、と思えてくる。
相関関係の指標
この種の文脈において相関関係は、数量的な関係、統計的な関係、というように定義され評価されるものですね( 相関と相関係数 )。そして、その指標として相関係数等が考えられており、それにもいくつかの種類がある。で、相関関係というのをどこまで含めた概念として話を進めるのか。
相関関係と因果関係
リンク先のテキストは、因果関係に無いのに相関関係があるケースを丁寧に説明した良質なものです。
ここで考えられているのは、因果関係に無いが相関関係がある場合ですが、では、因果関係にあるが相関関係が無い場合はあるのでしょうか。
よく使われるピアソンの積率相関係数は、2変数の直線的関係を表す指標ですが、曲線的な関係を持つデータでそれを計算すると、低い値が出る事があります。たとえば、y = x^2 の x と y とでピアソンの相関係数を計算する事を考える。x と y は確かに因果関係にあるけれど、相関係数を出してみると……みたいな。
いやそれは曲線的な相関があるのであって……という話になるのでしょうけれど、では相関とは何ぞやと、さっき出したような所に繋がっていくと。
因果関係の必要条件として相関関係(関連)がある事、と説明しているものはしばしば見ますが、では相関関係があるとはどのような意味か、を丁寧に解説するものは、あまり見かけません。
疑似相関
因果関係に無いが相関関係がある、という場合を、疑似相関と表現する場合がありますが、相関を、変数に何らかの数量的な関係がある事とするならば(たとえば相関係数が高い)、相関とは内部構造を無視して変数間の関係を数量的に見たものだから、疑似も何も無いではないか、のように考える事も出来ます。それよりは、相関関係の無い(低い)母集団から標本を抽出して統計的推測を行い、標本データにおいて相関関係がある(高い)→母集団においても相関関係がある(高い)と判断する事(相関関係があると看做された事)を疑似相関と呼ぶ、とする方がまだしっくりと来る。見かけの関連なんかもそうですね。
もちろん、語感の問題と言われればそれまでですが。私はそのような概念は、以前参照した疫学のテキストに従って、非原因的関連と表現します。これはまさに、因果関係に無いが関連はある、という概念を直接的に示した語だからです。