読者です 読者をやめる 読者になる 読者になる

疫学における「原因」の考えかたと、指標について――後編

ご案内

本エントリーは、疫学における原因の考えかたと、それにまつわる指標について説明した連載記事の一部です。
連載は、以下の記事からなっています。

対象とする全体(人口)も加味した、曝露起因のリスク

曝露者と非曝露者を混ぜ合わせた場合の起因リスク

寄与リスクは、曝露因子によって(起因として)曝露群の発生割合がどのくらい増えるか、という指標でした。たとえば、沢山喫煙する(曝露)事によって(起因・寄与)、肺がんで死亡する(肺がん死というイベント)程度(曝露起因のリスク:寄与リスク)は、10 万人あたり 89 人である、といった具合です。これは、沢山喫煙する人が 10 万人いれば、大量喫煙起因の肺がんで死亡する人が 89 人発生する事が予測されるという事であり、もし曝露群の 10 万人が喫煙しなければ 89 人の肺がん死が防げた、のを示します。

さて、今度は、発生した人と発生してない人、曝露された人とされていない人を含めた全体に着目して考えてみましょう。

ここで、対象とする集団全体の事を、人口(populationと表現します。たとえば、日本に住む成人全体とか、選挙権を持つ男性全体、といった具合です。これは、問題の設定によって、関心を持つものによって変わってきます。色々の要因、食物や嗜好品などの影響を測り、病気の予防に役立てる、といったような政策的な観点からは、この、人口を全体として捉えるのが肝要です。

簡単のため、いま考える人口は単純に、曝露群と非曝露群を合わせた集団であると設定しておきましょう。
先ほどは、曝露群における、曝露起因発生の割合:(曝露群における)寄与リスク を考えました。そして今度は、

人口に占める、曝露起因発生の割合

を考えるのです。そうすると、求めるのは、

曝露起因の発生数÷人口

となります。図で表すと、

f:id:ublftbo:20170204235813p:plain

こうです。ここで分母は全人口、そして分子は、曝露起因の発生数です。
この図から、もし曝露起因の発生数が分かれば、それを人口で割って求められる、というのが解ります。単純な割り算の理屈です。しかし、実際には曝露起因の発生数はすぐに判明しないので(種々の要因が絡み合って発生させているから)、研究を巧くデザインして、理想的には比較対照して、曝露因子起因とバックグラウンド起因の発生を分離して評価する、という訳です。

ところで、先ほど提示した図は、曝露群と非曝露群が半々になっています。ここで、真ん中に引いている、曝露群と非曝露群との境界線を、全体の大きさ及び横線の位置を変えないまま、左右にシフトさせてみてください。
そうすると、

  • 境界線を左に動かせば、曝露起因の発生が減る
  • 境界線を右に動かせば、曝露起因の発生が増える

こうなる事が想像出来ると思います。図示してみましょう。

f:id:ublftbo:20170204235814p:plain

f:id:ublftbo:20170204235815p:plain

図は、分子のみにクローズアップしています。全体がそのままで境界線が動くのは、人口の大きさはそのままで、曝露群と非曝露群との比が変化するのを意味します。そして、横線の位置を変えないのは、それぞれの群におけるリスクや、曝露群内の発生に占める曝露起因発生の割合(曝露群における寄与リスク%)は変化しないという事です。

図の赤塗りつぶし部分、つまり曝露起因の発生に注目すると、境界線の位置を変えれば、人口に占める曝露起因の発生数も変化する事が見て取れます。かつ、横線の関係は固定したままです。ですからこれは、

曝露群及び非曝露群におけるリスク(発生割合)

と、

曝露群内の発生(リスク)に占める曝露起因発生の割合(曝露群における寄与リスク%):横線の関係

は変化しなくとも、

人口に占める曝露群の割合:境界線(縦線)の位置

が変化すれば、

人口に占める曝露起因の発生数

も増減する

という事を表しているのです。極端な例で考えてみると、もし境界線を左端に動かせば、それは曝露群の割合がゼロになるのを意味しますから、当然、曝露起因の発生もゼロになります。タバコを吸う人が一人もいなければ、タバコによって肺がんになる人はいません。文字通り、曝露群の割合に左右される訳です。

さて、いま見ている指標は、全人口を分母にしたものですから、これまで求めた指標と人口を用いて求める事が出来ます(これは、いくつかの求め方の考えの内の1つです)。つまり、

全人口
着目している集団全体
曝露割合
全人口中に占める、曝露群の割合
曝露群内リスク
曝露群に占める、発生の割合
寄与リスク%
曝露群内発生に占める、曝露起因発生の割合

これを用いると求められます。

これらの指標をよく見ると、下の指標は上の指標に占める割合である事が解ります。つまり、

  • 寄与リスク%は曝露群内リスクの
  • 曝露群内リスクは曝露割合の
  • 曝露割合は全人口の

それぞれ割合です。そして、求める量は、全人口に占める、一番下の寄与リスク%(一般的化すると寄与リスク割合の割合ですから、結局、

曝露割合×曝露群内リスク×寄与リスク割合

で求められます(全人口を 1 とする)。簡単な例として、

  • 曝露している人は人口の半分
  • 曝露している人の内、発生したのは半分
  • 曝露して発生した人の内、曝露によって発生したのは半分

であるとすると、曝露によって発生した人は、人口の半分の半分の半分、つまり、(1÷2)3=1÷8 なので、人口の 8 分の 1 、となります。1 枚の正方形の海苔か何かを 3 回半分に切って、出来た物が、元の海苔全体のどのくらいを占めるか、とでも想像してみてください。もちろん、海苔全体というのが、全人口にあたります(下図参照)。

f:id:ublftbo:20170206205743p:plain

ところで、この指標は、次のようにも考える事が出来ます。
まず、全人口内のリスク(発生割合)を見ます。リスクは割合ですから、計算としては、全発生数÷全人口となります。しかしここでは全人口内のリスクを、曝露群内リスクと非曝露群内リスクに分けて考えます。
今まで、曝露群と非曝露群のリスクを、1 万人中○○人、というように、分母を揃えて表現してきました。また、示した図には、簡単のため、曝露群と非曝露群とが同人数であるようなものを描いたものがありました。
ところが、人口というのは通常、曝露者と非曝露者の構成比が異なるものです。つまり、曝露者と非曝露者の比は 1:1 ではありません。ですから、人口全体における発生割合を考える場合には、曝露群と非曝露群それぞれのリスクをそのまま単純に足し合わせるのでは無く、曝露者と非曝露者それぞれの割合に応じて配分して混ぜ合わせなければなりません。従って、全人口内のリスクを求めるには、

(曝露群内リスク×曝露者の割合)+(非曝露群内リスク×非曝露者の割合)

このようにする必要があります。たとえば、

  • 曝露群内リスク:1,000 人あたり 100 人
  • 非曝露群内リスク:1,000 人あたり 50 人

であり、

  • 人口に占める曝露者の割合:0.3(3 割:30%)
  • 人口に占める非曝露者の割合:0.7(7 割:70%)

だとすると、全人口内のリスクは、

100×0.3+50×0.7=65 → 1,000 人あたり 65 人

となります。このように、曝露因子がリスクを増やす条件の場合、一般に、全人口内のリスクは、曝露群内のリスクより小さく、非曝露群内のリスクより大きくなります。

ここまでで、全人口内のリスクを求めました。これは、曝露者と非曝露者を混ぜたリスクです。全人口内のリスクには当然、バックグラウンドリスクも含まれています。さて、これから、

全人口に占める、曝露起因のリスク

を求めるにはどうすれば良いでしょうか。

曝露群内の曝露起因リスク(寄与リスク)を求める場合は、それぞれの群における割合を求め、曝露群内リスクから非曝露群内リスク(バックグラウンドリスク)を引けば良い(リスク差)のでした。では、全人口内の場合には……。

この場合も、全人口内のリスクから、非曝露群内のリスクを引きます。

と言われると、求める指標が異なり、基準になる量(曝露群内の発生割合と、全人口内の発生割合)も違うのに、差し引く量が同じ(非曝露群内のリスク)である事に、違和感を覚えるかも知れません。ここはこう考えてみてください。

先ほど、全人口内のリスクを求めました。これは、曝露者と非曝露者が混じった集団です。という事は、発生者の増え方は、曝露者と非曝露者の構成比を保ったまま考える、というのが重要です。例では 1,000 人に 65 人のリスクでしたが、このようなリスクのある 3000 人の集団が存在するとすれば、そこでの曝露者と非曝露者の比は、3 : 7 のままで無くてはならない、という事です。

そして、このような、曝露者と非曝露者が混じった集団から、曝露起因のリスクを取り出すには、

全てが非曝露者である集団と比較する

のです。つまりそれは、非曝露群内リスクそのものです。非曝露群には当然、曝露者は含まれませんから、曝露者分が加わっている全人口内のリスクから、非曝露群内のリスクを引いてあげれば良い、という寸法です。

f:id:ublftbo:20170206212638p:plain

例では、非曝露群内のリスクは 1,000 人あたり 50 人であったので、全人口内のリスクから差し引くと、65-50=15(人口 1,000 対)となります。同じ構成比の集団であれば、1,000 人増えるごとに、曝露起因の発生者が 15 人増える、という勘定です。これは表現を換えると、

人口から曝露が除かれていたら、全人口内で発生がどのくらい防げていたか

を示す指標とも言えます。ですからこれは、集団に着目して疾病の発生の予防等に役立てる、公衆衛生的な観点から重要な指標なのです。

そして、このように求めた指標の事を、人口寄与リスク(集団寄与リスク:population attributable risk)と言います。曝露群内における起因(寄与)リスクと、全人口内における起因(寄与)リスクとを、しっかりと区別しておきましょう。

人口リスク内の、曝露起因リスクの割合

最後に、いま求めた全人口内の曝露起因リスクが、全人口内のリスクに占める割合を求めます。先ほどとの違いは、分母の大きさです

  • 全人口内寄与リスクの分母:全人口そのもの――つまり、発生していない人も含む総体
  • いまから求める割合の分母:全発生者。全人口から発生していない人を除く

これを単純に、発生数を元にして考えれば、

曝露起因の発生数÷(曝露起因の発生数+曝露群のバックグラウンド起因発生数+非曝露群のバックグラウンド起因発生数)

このようになります。さきほど求めた、全人口内の曝露起因リスク(人口寄与リスク)を使うと、

人口寄与リスク÷全人口内リスク

で計算出来ます。全人口内の曝露起因リスク(人口寄与リスク)は、曝露が無かったら人口からどのくらい発生が抑えられたかを示す指標でしたが、いま考えているのは、発生の内、曝露を起因として発生したもの、見方を換えれば、もし曝露が無ければ発生を何割抑えられたかを示す指標です。

そして、このような指標を、人口寄与リスク%(population attributable risk percent)と言います(人口内寄与リスクを全人口内リスクで割ったものに 100 を掛けて、パーセントにする)。

この名称は解りにくいですね。寄与リスク、つまり、曝露起因のリスクが分子であるのは解るのですが、どれが分母なのかピンとこない。で、この指標の分母は、上でも示したように、人口におけるリスク全体です。人口が入っているので、全人口に占める割合と思いそうですが、そうではありません(全人口に占める曝露起因発生の割合は、一つ前で紹介した人口寄与リスクという他の指標です)。

また、ここでの指標は %、つまり、全人口内リスクを 100 とした時の割合ですが、より一般的には、%(percent)割合(proportionと表現されます(人口寄与リスク割合:population attributable risk proportion ※割合:proportion は、分画:fraction とも表現される事があります)。

さて、このリスクは、リスク全体に占める、全人口内の曝露因子起因リスク(人口寄与リスク)、の割合でした。喫煙と肺がんの具体例で言うと、

全人口における肺がん発生割合に占める、全人口における喫煙起因肺がん発生、の割合

です。これは、別の表現をすれば、

全人口において、肺がんに罹った人の内、喫煙が原因である割合

です。

気付かれたでしょうか。これは、最初に紹介した NATROM さんの記事で検討されていた、

胃がんに罹った人の内、ピロリ菌感染が原因である割合(NATROM さんの記事タイトルは、ピロリ菌は胃がんの原因の何%か?

と同型ではありませんか。そうです。私達が知りたかったのは、疫学指標の中の、人口寄与リスク%(割合)だったのです。NATROM さんが、

ある集団の胃がん患者のうちピロリ菌が原因である割合をあらわす数値を集団寄与危険割合(人口寄与リスク割合)という。
ピロリ菌は胃がんの原因の何%か?-NATROMの日記

ここから説明を進めた事の、これが背景だったのであります。ある集団の胃がん患者人口内の全リスクであり、ピロリ菌が原因人口内のピロリ菌起因のリスクであるのは、言うまでもありません。

発生に占める曝露

NATROM さんの記事では、人口内の発生に占める曝露起因発生の割合、が検討されていた訳ですが、そのきっかけの一つは、胃がん患者の 99%にピロリ菌が見つかったという研究に基づいてピロリ菌除菌を推進する主張、でした。ひとまず、その研究自体が妥当であるかは措いておいて、もし、実際にそういう事実が認められたら、と仮定します。そう仮定して、
胃がん患者の 99%にピロリ菌が見つかった
というのを、これまで説明してきた指標を用いて表現し直すと、

人口内リスクの 99%は曝露されていた

となります。そして、これをもって、

人口内リスクの 99%が曝露起因の発生である

とは言えないのだ、というのが、NATROM さんの記事の趣旨です。つまり、患者の大部分が曝露されている事と、患者の大部分が曝露起因だったかは違うのです。単に曝露されている事と、着目している曝露が原因である事とは違い、さらに、これまで見てきたように、人口内の発生における曝露起因の程度というのは、

  • 全人口に占める曝露者の割合
  • 曝露と発生との関連の強さ

の両方に左右される、のがこの話における味噌なのです。

ここで、図を示します。

f:id:ublftbo:20170204235810p:plain

この図は、NATROM さんの記事で例示されている表の一番下、つまり、

  • 感染割合:99% ←曝露割合
  • 相対リスク:10
  • 集団寄与危険割合:89.9% ←人口寄与リスク%

これを実際に図にしたものです。図を対応させると、

  • =99:1
  • =9:1
  • は、 の 89.9%

このようになります。つまり、全人口の 99% の人が曝露因子を持っていて、その曝露因子は曝露者の発生を 10 倍にする(※バックグラウンドリスクの 10 倍にするのは、リスクを 9 倍分増やすのと同じ)、という条件であっても、全発生に占める曝露起因の発生は 89.9% までしかいかない、という事を表しているのです。

f:id:ublftbo:20170205000311p:plain

割合と原因

だいぶん長くなりましたが、ここまでで、疫学における原因の指標について、基本的な所を説明しました。

説明を読んで解ってくださったと思いますが、これらの指標は、基本的な四則演算によって計算出来るものばかりです。ですから、計算そのものは、とても簡単です。
けれども、この種の問題はとてもむつかしいと感ぜられます。それは、

  • 用語が何を表しているのか解りにくい
  • 分数の分母と分子の取りかたが解りにくい

これらの事情による、と私は考えています。たとえば、寄与リスク%人口寄与リスク%は、ぱっと見では、どのような概念を指しているのか、どう違うのか、とても解りにくいものです。また、関係が解っても、別に求めた指標をどのように計算に組み込んで良いのかがむつかしい。何を分子にとってどれを分母に置けば良いのかが、ややこしいのですね。

そして、NATROM さんの記事で検討されたような、原因が発生のどの程度を占めるか、といったような問題は、つい他の割合と混同しがちです。胃がんの人の 99% にピロリ菌が見つかったとして、胃がんの 99% がピロリ菌原因だと解釈してしまう、というような誤りをおかしてしまうのです。ですから、このような問題や議論があった場合は、基本に立ち返って、自分はどの割合を知りたいのか、どの指標について現状明らかになっているのか、といった所を、きちんと押さえておく事が肝要です。

もし、本記事が、ややこしい疫学概念の理解に少しでも役立てたとすれば、幸いです。

補足:寄与リスク%と人口寄与リスク%

区別のややこしい指標だと思いますので、補足します。

まず、一般に寄与リスク%というのを、

累積発生割合に対する、寄与リスクの割合

と考えます。そうすると、分母の取り方によって、複数の寄与リスク%を定義出来ます。

分母となる累積発生割合(絶対リスク)は、

  • 曝露群
  • 非曝露群
  • 全人口

が考えられそうですが、実際は、

  • 曝露群
  • 全人口

この 2 つしかありません。何故なら、非曝露群に寄与リスクは存在しないからです(理想的には)。非曝露群とは、定義上曝露が無いので当然ですし、割合分子が分母に含まれる量ですから、非曝露群内のリスクを分母とした寄与リスク%は、ありません。

そして、曝露群の累積発生割合に対する寄与リスクの割合を、単に寄与リスク%と言い、対象を全人口に広げた場合には、人口寄与リスク%と表現する訳です。解りやすいように、前者を、曝露群内寄与リスク%とでもすると良いでしょう。

注意しなくてはならないのは、それぞれの指標における寄与リスク自体の値が異なるという所です。本文でも解説したように、後者は、曝露群内の寄与リスクに、人口に占める曝露群の割合、で重み付けをしなくてはなりません。

指標一覧・参考資料に続く