検定での仮説の立てかた

www.youtube.com

これを観て思った事。

この動画のように、統計的仮説検定をおこなう際に、帰無仮説を、知りたい現象や理論そのものに基づいて立てるのって、見かける場合がありますね。動画のように、感じる・感じないとか、薬が効く・効かないといったものです(それぞれ、後者を帰無仮説として、その否定の前者を対立仮説とする)。

けれど、ほんとうを言えば、あまりこういう仮説の立てかたは、するべきではありません。と言うのは、統計的仮説検定における仮説はあくまで、文字通りに統計(学)的な仮説であって、これは、実証したい理論的仮説から導かれる作業仮説として扱うべきものであるからです。

たとえば、ある病気を治す事を期待して薬が開発されたとします。ここで確かめたいのは当然、この薬は病気に効くというものです。で、この確かめたい理論に基づいて、

対立仮説
薬が効く
帰無仮説
薬は効かない

と立てたくなる……のですが、ここでちょっと待たなければなりません。統計的仮説検定における帰無仮説は、母集団における相加平均値が0であるといったように、統計学的な表現(母集団パラメタについての定量的言明)でもって立てるものだからです。ですから統計的仮説は、

  • もし薬が効くなら、この統計的仮説検定をクリアするであろう

と、あくまでも、理論的仮説から導かれる、クリアすべき(弱く言うと、クリアが期待される)作業仮説として設定します。

すごく細かい、人によっては、些末な表現上の事と思われるかも知れませんけれど、そうではありません。実際、効果が無いのと母平均に差が無いのとは、概念的に同じではありませんし、効果がある事は、母平均に差があるのとは違います。

薬が効く、といった表現・命題・主張は、その内に因果関係の言明をも含みます。たとえば、開発した薬の作用に着目していて、治す事が期待されている対象の病気の具合を示す何らかの指標がある場合、薬が効くとは、その薬が指標を良い方向に変化させるといった因果関係を含意している訳です。しかるに、統計的仮説検定において確かめられるのは、あくまでも、

母平均が0であるならば、このような検定統計量の実現値、またはそれより極端な値が出る確率は低い

といった所であって、それだけでは決して、因果関係を確かめる事は出来ません。もし、帰無仮説として効果が無いという現象的なものを立て、その帰無仮説と同等のものとして母平均に差が無いのような統計的仮説を位置づけてしまうと、対立仮説の採択(帰無仮説の棄却)が、因果関係があるとの仮説を採択する、と解釈出来てしまいます。

実際には、因果関係を確かめる場合、バイアスや交絡といったものが影響している事を考慮し、それを(前もってでも事後的でも)統制したり、実質科学的検討をおこなったりして(どのくらいの差があれば効果を示していると考えるか、など)評価します。たとえば、母平均に違いが出たとしても、それには、着目している要因(たとえば薬)以外のもの(同時期に摂取した別の薬や栄養、変化した生活習慣など)が影響を及ぼしている可能性があります。この所を突き詰めて考えるのが、統計的因果推論や疫学などの分野です。確率論・数理統計学の理論体系に基づいておこなわれる統計的仮説検定は、そういったプロセスの一環としての評価方法の一つ、とでも位置づけておくのが良いでしょう。

これらの事がありますから、方法の一環である(でしか無い)検定仮説の表現上に、因果関係そのものが含まれる言明を設定するのはまずい訳ですね。そして、それを知らない論者が、統計的仮説検定で帰無仮説が棄却された事をもって、因果関係が示されたかのごとく主張するのも、時折見られます。因果関係の評価は、哲学的な部分にも関わる、極めて複雑でややこしいものなのです。

参考文献:

takehiko-i-hayashi.hatenablog.com

↑林さんの記事。統計的仮説検定が、あくまでも母集団の様子などを推測する方法に過ぎない、という事を踏まえた上で、林さんによる因果関係が無いのに相関関係(関連)はある例示を見ると、参考になるでしょう。

しっかり学ぶ基礎からの疫学

しっかり学ぶ基礎からの疫学

↑下の本、さりげなく出していますが、極めて良い本なので、読んでおくべきだと思います