関連の型――見かけ上の関連(spurious association)と非原因的関連(noncausal association)

関連の型

しばしば話題にする、疑似相関見かけの関連といった言葉の意味合いに関する事。私は、確かに関連(あるいは相関)はあるが因果関係に無いという関係の事を、非原因的関連と呼ぶのが良いのではないか、と、よく書く訳ですが、今回は、その語を知るきっかけとなった本より、少々長めですが、引用してみましょう。参考になれば幸いです。
引用文献は↓

しっかり学ぶ基礎からの疫学

しっかり学ぶ基礎からの疫学

この本の、P120-122 註釈は省略。強調は原典のままとします。

見かけ上の関連

まずは、見かけ上の関連から

 見かけ上の関連 spurious associationは,偽の関連である.これらは通常,標本誤差かバイアスによって生じている.例えば,6章で述べられているように,一般的に関連はP値が0.05未満であれば,統計学的に有意とみなされる.これは,研究デザインや実施,分析に重要な欠陥がなければ,真の関連があるということに少なくとも95%の信頼性があることを意味している.にもかかわらず,まだ100回に5回くらいの関連性は標本誤差によるものだと予測している.このように,きちんと実施された疫学研究に基づく統計学的に有意な関連でさえ,ときには見かけ上のものである.例えば,Inderjit S. Thindは,食物摂取とがんとの関係について60カ国の標本を用いて関連性を調べる生態学的研究を行った.
 彼は統計学的に有意な多くの関連を見いだしたが,なかには生物学的に信じがたく,彼自身それは偽りだと思っていたものもあった.彼は結果の考察において,数多くの統計学的な有意性の検定を行う一般的研究に共通する懸念について何度も繰り返し述べた.
 Thindは,“その…数々の関連は…単に,偶然に,有意な関連が生じているのであり,危険因子として特定の食物の役割を評価したり,公共政策の基礎としてこの結果を用いる場合には,十分な注意が必要である”と述べて,読者に注意を促した.
 見かけ上の関連はバイアスによって生じているのかもしれない.バイアス biasとは,8章で述べるように,欠陥のある測定技法や,比較群の差別的な思い出しや,本当は比較できない比較群を選択したというような,疫学研究のデザイン,実施,分析における系統的な(非偶然な)誤りのことである.
 バイアスは,知らないうちに進むものである.電線や電気毛布や電気目覚まし時計によって発生するような低周波電磁場への曝露と,小児白血病の罹患との関係についての仮説症例対照研究を考えてみるとよい.症例群は,地域病院で小児白血病だと新たに診断された患者で構成され,対照群は,同じような年齢,性,人種や民族的背景をもつ人々で,病院に提示された地域から無作為に選ばれた,そして,症例群と対照群の親は,子どもの低周波電磁場への曝露について質問される.症例群の親は自分の子どもの曝露について,対照群の親よりもよく思い出すだろう,なぜなら,自分の子どもの白血病の原因を明らかにする助けになるかもしれない過去の曝露の思い出しには,症例群の親は対照群の親よりも強い動機があると考えられるからだ.もしこれが本当ならば,その研究は,低周波電磁場への曝露と小児白血病との間に,偽のものだが,関連があるという結論になる.

まず、検定の話に絡めて論じています。検定というのは、知りたい対象全体を調べ切れない時に、そこから一部を抽出して調べ、そこから全体の様子について推測する方法の一つです。今は、関連があるかどうかの話ですから、私達は、ある集団における要因と他の要因との関連を知りたい、と表現出来る訳ですが、その全部を調べ切るのは叶わないので、一部を採り出し、その部分集団における関連の程度を検討して、全体へと考察を敷衍するのです。
そうすると当然、実は全体では関連が無いのに、採ってきた一部においては関連が大きくなる、という事があり得ます。全体から一部がどのように構成されるかは、採ってみないと解らないので、一部をもって、全体がこうである、と断言をする事は出来ません。従って、採られたものから全体について推測する時には、可能性の程度というものを同時に評価する必要があります。それが引用文中にある95%とか信頼性といった言葉が意味する所です。
統計的検定論では、採ってきた一部で関連がある程度強い時には、全体において関連が無い、という仮説が否定出来ると評価します。もって回った言い方ですが、つまり、まあある程度の確からしさで、全体においても関連があると考えて良かろう、と評価するという事ですね。
で、全体では実は関連が無いのに*1、研究結果から得られた結論は、全体においても関連があるというものなので、これを、見かけ上、即ち、採ってきた一部を検討した結果の上では関連がある(見かけ上の関連)と評価する、という寸法です。
もう一つは、バイアスの問題です。これは日本語では偏りと言います。ここで着目されるのは、全体から一部がどう採られるか、といった所では無く、病気に罹っている人やその関係者は質問にこのように答えやすい、とか、そういった、偶然に関わる事では無い何らかの理由によって生ずる傾向、というようなものを指します。引用文中の例で言うと、症例群、つまり、小児白血病を持つ子の養育者と、対照群、つまりその病気に罹っていない子を持つ養育者とに、低周波電磁場にさらされた事の頻度を聞き取った時に、症例群では思い出しやすく、対照群では思い出しにくいという傾向があれば、ある病気を持つ事と低周波電磁場とにさらされる事とに関係がある(つまり関連がある)と(実際に無くとも、バイアスによって結果的に)看做されてしまう、という事になります。

非原因的関連

次に、非原因的関連です。

 非原因的関連 noncausal associationは真の関連だが,因果関係ではない.曝露における変化は,必ずしも帰結に変化をもたらすわけではない.非原因的関連は通常交絡因子による二次的な関連を表している.曝露は,帰結に関連している別の要因と関連しているので,関連自体は存在するのである.Max Michael IIIとW. Thomas BoyceとAllen J. Wilcoxによって示された奇妙な例がある.Al Betzerov医師は,賭博はがんの原因になるという仮説を検証するための前向きコホート研究を実施した.彼は,賭博は合法だという州と,非合法だという州の,2つの離接した州を選んだ.それから,彼は,年齢,性,居住地の特性,10年間の世帯収入が合致する対象者をそれぞれの州から無作為に選び出した.この研究の結論として,彼は,賭博とがんとの間に,統計学的に有意な正の関連を指摘した.特に,ネバダの住民はユタの住民よりもがんが高率だった.この関連は現実に存在するものであったけれども,原因―結果の関連ではなかった.不運にも,Betzerov医師が選んだ州の1つはユタであった.ユタは数多くのモルモン教徒で構成された州であり,人々は,モルモン教徒ではない典型的なネバダの住民とは大きく異なる生活習慣をもっている.モルモン教はたばこやお酒を慎むよう強く求めているということが,この関連性を説明している.賭博とがんとの関連は,ユタよりもネバダのほうが高率であるアルコール摂取と喫煙による交絡で生じた二次的なものであった.言い換えると,賭博は,がんと直接関連しているアルコール摂取や喫煙と関連があるということである.したがって,賭博自体はがんの原因ではないけれども,がんの原因との関連が,二次的な,しかし非原因的ながんとの関連をもたらしたのである.このタイプの関連は,誤った結論を導き出す見かけ上のものとも考えられる.
 非原因的関連は,ある曝露が帰結に起因しているときにも存在するかもしれない.たとえば,高血圧は腎臓病に起因しているかもしれない.両者の間に関連はあるかもしれないが,この例においては,曝露が帰結よりも先に起きていないし,発生頻度を変えることもできないので,高血圧は腎臓病の原因とみなせない.このタイプの高血圧は,一般に一次的な高血圧と区別して,二次的な高血圧として腎臓に損傷を起こす.

ここでのポイントは、関連は現実に存在するものであったという所。つまり、全体からの一部の抽出のされかたとか、バイアスのかかり方などを考慮しても、関連があると考えられる、という事。
今の例では、賭博の 合法/非合法 の州から一部を採って比較したら、がんのかかり方が違っていた事から、賭博とがんの罹患のしかたとに関連があると看做された訳です。けれども、それは、賭博が がんを惹き起こすという関係、即ち因果関係(原因→結果 の関係)によって生じたものでは無く、がんの原因となるアルコールや喫煙(アルコール・煙草→がん)が、信仰に関わる生活習慣と関連していて、それが結果的に、賭博―がん という関連を生み出したのであった、と。
高血圧と腎臓病の例は、実は腎臓病が高血圧を惹き起こしている(二次性高血圧)という場合にも、高血圧―腎臓病 という関連は確認されるけれども、それは 高血圧→腎臓病 という意味においては非原因的である、という事ですね。つまり、因果関係が逆である、と。

まとめ

多くのテキストでは、ここで紹介した非原因的関連の意味で、見かけの関連や疑似相関といった言葉が使われます。けれどもこれらの語は、そのまま素直に読むと、関連や相関自体が偽物といったように取れてしまうと思うのですね。その観点から言えば、標本の採り方やバイアスによって、関連が実は無いのに関連があると結論する事を見かけの関連と表現し、関連は実際あるがそれは因果関係によるものでは無い、というものを非原因的関連と呼ぶ、とするこの本の用法に従う方がすっきりするのではないかと考えます。

*1:ここでは、立ち入った話、つまり、母集団において現実に、関連が0になる事など有り得るのか、というような議論は措いておきます。