死亡割合、死因割合

疫学における割合なる尺度の設定(比の内で、分子が分母の部分集合であるようなもの。それは無名数である)、および、それに基づいて定義された罹患割合致死割合などの指標の字面を鑑みれば、

人口に占める死亡者の割合

なる指標は、死亡割合と表現するのが自然(当然)だし、他の指標と整合的である。

ところが、文献によっては死亡割合で、

総死亡に占める、疾患(原因)特異的死亡の割合

なる指標を指す場合がある。しかし、概念内容と字面を考えると、その指標を死亡割合と表現するのは、全く適切では無いと思う。いったい、死亡割合をどう捉えれば、総死亡に占める、特定の原因による死亡の割合と解する事が出来るというのか。

英語を見ると、その概念を指す語は、proportionate mortalityである。proportionateは、比例したという意味であるから、そのまま比例死亡率とする文献もある。しかるに、日本語の比例から、特定の死因が占める割合と解するのも、全く直観的では無いだろう。

そこで私は、当該指標を死因割合と表現する事を提案したい。これであれば、死亡の原因に着目しているのが明らかであるし、割合の尺度であるのもそのまま表せる。また、死亡割合の語を、人口に占める死亡者の割合なる概念を表す語に充てられ、先述のように、より自然・整合的になると考える。

実際、資料によっては死因割合と表記しているものもある。自治体の発表する人口動態などで見られる。例↓

www.city.osaka.lg.jp

www.fukushihoken.metro.tokyo.lg.jp

つまり、別に私の造語でも無く、既に採用されている語である。

下の資料を参照すると、年齢階級別主要死因割合と表現しつつ、直後には、がんによる死亡割合はと書いていて、ぶれがある。尤もこの場合は、前後の文脈から意味は明らかであるけれども。

困った事に、いま言っている死因割合の概念(総死亡に占める特定死因)を死亡割合と表現するものが、保健統計や疫学の教科書でもいくらか見られる。もう少し、字面がそのまま意味内容を表せるように、用語を整備したらどうか。

比・割合・率の概念の区別もそう。これらは厳密に分けるべき概念であると紹介しておきながら、慣習であるからと、割合の指標を率と表現したりする(有病率など)。いや、厳密に区別するんじゃなかったんかいな、となるし、実際に区別すべきものであるから、読んでいると、意味が判然としなかったりする事もある。初学者は混乱するし、慣れていても解りづらい事があるだろう。

相関と因果

相関は必ずしも因果を意味しない

www.youtube.com

ヨビノリたくみ氏による動画。

マスメディアによる情報発信などを受け取る際の注意を促す、良い内容だと思います。○○をした人は△△が多かった(少なかった)、といった報道なりがあった時に、○○が△△を増やした(減らした)と短絡しないよう、敢えて立ち止まらせるようにするのは、とても大切です。

必ずしも

動画タイトルに、必ずしもと入っているのが、一つのポイントだと思います。おそらくですが、たくみ氏は、ここは慎重に表現しているのではないでしょうか。

同じ事を注意喚起する際の似た言い回しに、

相関(関係)は因果(関係)では無い

のような表現もあります↓

"相関関係は因果関係ではない" - Google 検索

けれどもこの言いかた、ともすれば、相関と因果は排他的である(両立しない)と捉えられかねません。もちろん、前後の流れから読み取れる場合が多いのでしょうが、では無いとの表現は、前者を否定するかのような意味で取られそうです。

対して、たくみ氏の表現(必ずしも因果を意味しない)は慎重です。必ずしも意味しない、なのでこれは、意味する事もあるとの含みが持たされていますね。つまり、相関(関係)が見られたとしても、それは、因果(関係)の場合もあるしそうで無い場合もある、だから即断しないようにしようと促している訳です。

場合によっては、含意しない包含しないみたいなものもありますが、少々小難しいので、たくみ氏の表現は、上手いですね。

私であれば、たとえば、相関関係は、因果関係が反映されたものとは限らないあたりの表現を採るでしょうか。

疑似(擬似)相関

たくみ氏が動画でも解説しており、また動画コメント欄でもいくつか指摘があるように、因果関係では無い相関を、

疑似(擬似)相関

と表現するのは、結構ややこしいものがあります。動画内やコメントで言われているのは、

因果関係で無くとも相関関係はあるのだから、それを疑似相関と呼ぶのは変ではないか

といったものです。これはご尤もですね。相関関係はあるけど因果関係は無い場合、相関に疑似とつけるのはおかしいのではないか、との指摘です。

これを補って、因果関係を想起させる、あるいは誤認させる、といった意味合いで、疑似とついている、と読めなくも無いですが、少々無理があります。

では、他の言い回しは無いだろうか、と考えます。たとえば、(動画のコメントにもありますが)疑似因果はどうでしょう。私は、これはよろしく無いと思います。疑似と言うと、本物では無いとの意味を含みます。それは、誤認する・させる、といった所も思わせるものです。けれども、相関関係は、あくまで要因同士の数量的な関係の一種であって、そこに疑似の語をくっつけると、ちょっと余計な意味合いがついてしまうと考えるのです。

そこで、私がよく使うのは、

非原因的関連

です。これは、

関連はあるが、どちらかの要因が原因であるような関係(因果関係)では無い

という意味合いをストレートに表せる語だと思います。参考文献↓

しっかり学ぶ基礎からの疫学

しっかり学ぶ基礎からの疫学

他に、今年出た本(極めて良い本です)では、

非因果的関連

の語が用いられています↓

これも良い表現だと思います。より詳しく見ると、原因的だと片方に着目しているように感ぜられ、因果的だと双方を見ているような意味にも取れます*1

これらの表現を採用すれば、疑似相関の語を用いなくとも、その相関は非原因的関連(非因果的関連)であると、すっきり書く事が出来るでしょう。

じゃあ因果関係は

動画のコメント欄で、じゃあ因果関係とは何でしょうか、といった意見が見られます。また、より進んだ、因果関係を見出すアプローチの解説をリクエストするのもありました。

ところが、これは、とても難しい問題です。因果関係とは何かとの問いは、古来、哲学的な分野で扱われ、現代でも、疫学や(現代的な分野としての)科学哲学、あるいは、そのまま因果推論(統計学的手法を用いるのは、統計的因果推論)なる専門分野で研究がなされているトピックです。ちょっとやそっとで理解出来る内容ではありませんし、簡潔な解説も困難でしょう。また、不用意な説明をすると、専門的な批判を受けます。ですから、じゃあ因果関係って何なんだろう、どう確かめるのだろう、という所に疑問が湧いたかたには、疫学統計的因果推論などの文献を読みましょう、と案内するのが良いと思われます。

改めて、たくみ氏の動画説明の目的を拝察すると、最初のほうで書いたように、あくまでもそれは、

相関関係(関連)があったとしても、それは因果関係が反映されたものとは限らない

場合がある所に目を向けさせる、つまり、認識的に敢えて立ち止まらせる事にあるのでしょう。その段階までの理解は、そんなにむつかしいものではありません。むつかしく無いけれど言われてみればそうだ、という所を考えてもらうきっかけ、と捉えるのが良いと思います。それより先は専門的な本を読んで勉強してみましょう、と。

高度な見かた、考えかたか

動画で解説されているのは、特に、分野において高度な考え、応用的で複雑な知識、というものではありません。むしろ、多くの統計学の本で、当たり前に説明されている(相関係数の説明部などで)ものです。

(紹介した)たくみ氏の動画が上手なのは、高度な内容の事を解説しているから、と言うよりは、統計学的には基礎の部分だけれど世間に知られているとは限らない、といった知識を、軽妙な語り口で明瞭に解説している所、なのだと思います。

報道などを見る時の注意

さて、動画での説明内容を理解したとして、それを念頭に置きながら、マスメディアの報道などを検討します。動画が作成された目的は、主にそれでしょう。実際それは、いわゆるメディア・リテラシー的な一環としても、大切な事です。ただ、その見かたをする場合、注意しておいたほうが良い所があります。

たとえば、マスメディアが、大学の発表(プレスリリースなど)を紹介したとします。内容はもちろん、○○をした人は△△が多い、的な内容。で、たくみ氏の動画を見て勉強した人は、それは疑似相関だろのように指摘するかも知れません。ここに気をつける必要があります。

大学の発表は、もちろん、専門家が研究した結果を紹介するものです。そこでは、よほど分野外であったり、実証の方法に疎いので無ければ、相関は必ずしも因果関係を意味しない、といった事は、当たり前の前提とされているものです。つまり、専門的には分かり切っている部分です。

疫学にしろ社会心理学にしろ、(特に、観察を用いた研究を重視する)専門分野では、着目している要因同士に関連(相関を含む広い語)が見いだされても、それが因果関係の反映を即意味しない事は、当然のものと前提されます。ですから、他に関係していそうな要因にも同時に着目して、その影響を取り除いたりして、因果関係を見出すべく検討します(因果推論・因果分析)。ですから、詳しい研究内容を見ない内に、それは疑似相関だろ的に言ったりすると、足をすくわれます。したがって、こういう場合には、

  • 研究では具体的にどのような分析がなされているか
  • リリースや報道で、研究内容から逸脱した表現はなされていないか

このような部分をきちんと評価・検討する必要があります。たとえば、研究において、他のどのような要因が観察・測定されているか、とか、どういった統計解析法が採られているか、といった部分です。それは、各専門分野の具体的知識によって変わってくる部分であり、それら知識をきちんと把握している必要があります。当然、ちゃんと見ようとすれば、時間も要るし、知識も問われます。要するに、難しい事です。

そして、これらを検討した上で、リリースや報道の表現のしかたを見ます。たとえば、研究論文においては、あくまで関連を検討している段階であったり、ディスカッション部において、因果関係を言うには更なる研究が必要である、と書かれている、にも拘らず、リリースや報道で、あたかも因果関係が判明したかのごとく書かれている、のような場合もあります。研究では、○○が多い人は△△も多いとしか言っていないのに、報道では○○は△△を上げる的な意味合いの表現をしたりです(○○が多い人は△△も多い、のを見出すのも立派な研究成果です)。しかし、その実態と情報発信とのズレの具合を検討するのは、難しいものなのです(まず研究内容を、ある程度把握出来なくてはならない)。

敢えて立ち止まる

ここまで書いたように、報じられた研究などが、実際にどういった部分までを検討しているか、報じる内容とどれくらいのズレがあるのか、をきちんと評価するのは、結構むつかしいものです。けれども、そこまでする必要は無いのです。そうでは無く、何か関連(相関)が見いだされたとの報道があり、そこから更に、因果関係をも仄めかしたような発表がなされたとすれば、果たしてそこまで言えるような研究が実施されたのだろうか、くらいの所で立ち止まれれば、それで充分なのです。

そうすれば、他の報道ではどうか、とか、その分野に詳しそうな人は何と言っているか、と調べる事も出来ます。逆に、1つや2つの報道だけで、研究内容そのものに踏み込んで否定的な主張をしてしまって、いや、それはちゃんと検討されているよと返される危険性もある訳ですからね(例:こういうのが交絡してるんじゃね?→それ研究では調整されてるよ)。急いでやらなくても、ちょっと寝かせておけば良いのです。そして、たくみ氏の動画は、それを促すための有用なものなのだと思います(現状、YouTube(r)の情報発信の影響は大きいでしょう)。

*1:私は、非因果的関連と表現しようともしましたが、どうやら、心理方面に非因果的連関なる語があるようなので、とりあえずは、原因的と書いてきたのでした