読者です 読者をやめる 読者になる 読者になる

「真の相関関係」

統計的消去で擬似相関を見抜こう! - ほくそ笑む

したがって、年齢と算数能力は、真の相関関係にあると言えます。

強調は私が施しました。
うーん、違和感があるのですよね。真のという所に。真の相関関係とはどのような概念なのでしょうか。あるいは、真で無い相関関係とは。
ある2変数に関連があった時に、その2変数両方に関連していそうな変数の影響をパーシャルアウトしたら関連が消える場合、それを疑似相関と呼ぶ。まあこれは、教科書的な、よくある説明です(私はそのような表現はしませんけれども)。
では、それを踏まえると、真の相関関係というのは、他に関連しているであろう変数の影響を悉く除去しても見いだせる相関関係、となるのでしょうか。でも、影響を与えていそうな要因というのは、未知のものも含め、数え切れないほどある訳ですよね。
もしそれが可能だとして、他の影響を除去し切った時に現れる関連というのは、因果関係とは違うものなのでしょうか。もし因果関係なのだとすれば、因果関係=真の相関関係となり、「真の」というのは「疑似」との比較のために用いられているのでそれを消すと、
因果関係=相関関係
となるのではないのかな、と思う訳なのであります。
そうなると、およそ観測される相関関係のほとんどは疑似相関と言わなくてはならないのではないか。これが私の数年来の疑問です。
疑似という語が、因果関係があるように見せるというような意味合いであれば、まだ解ります(初めから因果関係と相関関係を違う概念として扱っているので)。しかしその語が、真の相関関係で無いという意味を指しているのだとすれば、それはちょっと納得がいかないなあ、と(じゃあ真の相関関係とはどのような概念か、となる)。
いや、ここら辺の言葉の使い方については、自分の中では整理は終わっている訳なんですが(何度か書いたし、全然複雑な話でも無い)、同じような論点からの考察をほとんど見ないもので、悶々としている(と言うと大袈裟だけれど)のであります。
もしかしたら自分は途方も無い思い違いをしているのではないか、とか、自分が言っている事そのものが全く理解されていないのではないか、とか。

                          • -

これはブクマコメントでも指摘がありますが……リンク先では、年齢と算数の能力が真の相関関係にある、とされていますが、これは、もっと複雑に考える事も出来ると思うのですね。
たとえば、年齢と共に変化する変数として、脳の発達の仕方であるとか、算数を勉強した時間とかが想定出来ますよね。
また、算数の能力が向上するというのは、現代的な教育システムがある事を前提しているはずです。そのような教育システムが普及していない地域においては、算数の能力と年齢の関連は小さい、と推測出来ます。いやその前に、算数の能力というそのものが、ほぼ一定なのかも知れません(尺度の作り方や構成概念の捉え方にもよる)。
その場合に、関連や相関というものを、母集団を限定して考えるのか、とか、因果関係というものはどう捉えるかとか、色々考える事はあると思うのです。