研究に潜む敵――バイアス(偏り)のはなし

バイアスとは

人間の集団を観察したり調査したりして、何らかの傾向や因果関係を見出そうとする際には、バイアスの存在に気をつけなければなりません。

研究においては、知りたい対象がまずあります。たとえば、30代女性の傾向はどうかとか、60代の男性はどんな病気に罹りやすいか、とか。けれど、その対象の構成員があまりにも多い場合には、その一部を調べる事しか出来ません。ここで、調べたい対象全体の事を、母集団あるいは標的集団と言い、調べる事の出来た一部を、標本と言います。
いま、ある国の20代男性全体の、何らかの傾向を知りたい、としましょう。全部は調べ切らないので、一部分を対象にして、そこから得られたデータを処理して、20代男性一般の傾向はこうであろうと推測する。これが研究の流れです。
ところで、採ってきた一部(標本)が、それを含む全体と似通った構成なら良いのですが、これがたとえば、標本に属する人が皆、身長が高かったとしたらどうでしょう。標本を調べた結果を、20代男性全般に当てはめて傾向を推測しても、実はそれは、身長の高い人の傾向が現れたものだったかも知れないのです。

デジタルの秤で物の重さを測るとしましょう。ところがこの秤、故障によって、常に10g多く表示されるようになっていたのです。これでは、この秤では、何の重さを何回量っても、実際の重さよりも10g程度ズレてしまう事になります。

いま見てきたような、偶然では無い要因によって(特定の範囲の身長、秤の故障――これを系統的であると言います)、知りたいもの(20代男性全体の持つ傾向、量る物のほんとうの重さ)と調べたもの(20代男性で高身長の人が持つ傾向、故障した秤で量られる物体の重さ)とに生ずる特定の方向へのズレの事を、バイアス(偏り)と呼びます。

人間(ヒト)の集団について、こういう年齢層ではこの病気に罹りやすいのではないか、とか、どんな行動があのような結果をもたらすのか、といった事を調べる時には、このバイアスが入り込む可能性を、常に念頭に置かなくてはなりません。特に、病気に罹っている人とそうで無い人とを集めて比較検討する、といった方法の場合は要注意です。

人間集団と何らかの要因との関連や因果関係を調べる学問である疫学では、バイアスについて、分類と整理がおこなわれています。本記事では、その幾種類かのバイアスについて、紹介をします。

選択バイアス

調べる対象の選び方によって生ずるバイアスを、選択バイアスと言います。次のような種類があります。

入院患者を選択する事により生ずるバイアス
入院割合のバイアス(バークソンバイアス)

ある要因(たとえば高血圧)と病気の関連に関心があるとします。そこで、その病気で地域の大きな病院に入院している患者の情報を集めて、着目している要因と病気との間に関連があるかを確かめようとしました。比較するのは、同じ病院での、その病気を持っていない受診者です。ところで、いま着目している要因は、他の病気と関連を持つ事が知られています。

この場合、着目している要因と病気を同時に持っている人の方が、病気のみ持っている人よりも、入院する割合が高いとすればどうでしょう。病気が同じ程度であっても、一緒に要因も持っている事によって、薬を飲んで様子を見ましょうとなるか、他の病気になる可能性もあるので、しばらく入院してしっかり治しましょうとなるかが変わるという訳です。 そうすると、要因と病気を両方持っている人の割合が、より広い集団でのそれよりも、不当に高く見積もられ、要因と病気との関連を過大評価する可能性があります。

次は、異なる場合を考えてみましょう。
前の例で比較したのは、受診患者同士の中で、着目している病気に罹っている集団と罹っていない集団、というものでした。ここで、着目している要因(たとえば高血圧)が、病院を受診する人が罹っている、他の色々の病気になりやすくなるものであったとしましょう。
そうすると、病気に罹っていない(他の病気に罹っている)人の内、要因を持っている割合が高まる事が予想されます。
ここで比較しているのは、同じ病院の受診者ですから(病院対照)、より広い一般的な集団(健康者対照)と比較する場合よりも、病気を持っていないが要因を持っている人、の割合を大きく評価するでしょう。
この種の研究では、病気を持っている人における割合や、病気を持っていない人における割合などを用いて関連を計算しますから、結果的に、興味を持っている要因と病気との関連を過小評価する可能性があります。

これらのように、入院患者が選ばれる際に起こる偏りを、入院割合のバイアス(バークソンバイアス)と言います。このバイアスは、病気に罹っても医療機関を受診しなかったり、病気に罹ってすぐ治ったり死んでしまったりする人は入院患者に含まれない、というような場合にも起こります。調べるのが、対象の病気を持つ人の内、入院する人に限られるからです。

診断バイアス

ある要因はこの病気を引き起こすか、という事に関心のある医師がいるとします。その医師が診断をおこなう時、対象の患者が、いま興味を持っている要因にさらされていた、という事を知っていた場合、興味を持っている病気であると診断しやすくなり、入院の指示も多くなる傾向があるかも知れません。そうである場合、その病気で入院した患者は、興味を持っている要因にさらされている人に偏る可能性があります。それを診断バイアスと言います。

さらけ出しバイアス(疾病発見促進要因バイアス)

ある病気で入院している患者の多くは、特定の症状を自覚して、その後検査をして症状が発覚したものとします。
そして、そのきっかけとなる症状は、病気とは関連の無い何らかの要因が引き起こしたものであったらどうでしょう。結果的に、その病気で入院している人が要因を持っている割合が高くなる事が予想されます。

このような偏りを、さらけ出しバイアス(疾病発見促進要因バイアス)と呼びます。その要因は、着目した病気に罹りやすくする訳では無いけれど、病気を発覚させる症状・徴候を起こすために、病気の人全体を調べれば無かったであろう関連が、あるように見えてしまうという事です。

所属グループのバイアス(加入者バイアス)

何らかの組織化された人々を研究対象とした場合、その結果は、より広い集団と異なった傾向を示す可能性があります。

たとえば、働いている人のみを研究対象にするとしましょう。その場合、健康を害して働けなくなった人が対象から外れる事になります。ですからたとえば、特定の職種の労働者のみと、より広い、健康状態の悪い人も含まれた集団との、死ぬ人の割合を調べた場合に、その職業の人々の死ぬ人々の割合が低く見積もられる可能性があります。

ある工場で扱う物資が健康被害を引き起こすのではないかと疑われており、実際にそこには因果関係があるとします。工場で、対象の健康被害が生じている人の割合を調べたとしましょう。その場合、健康被害が起こる程度を過小評価してしまう可能性があります。何故ならば、重い健康被害を被っている人は、すでにその工場を辞めているかも知れないからです。

こうして生じた異なりを、健康労働者効果と言います。そしてこのような、ある組織に属する人々を対象にした場合の偏りを、所属グループのバイアス(加入者バイアス)と呼びます。

非協力者バイアス・積極協力者バイアス

希望者に対しておこなう、ある病気の検診があるとしましょう。そして、検診の効果を確かめるために、その検診を受けた人と、そうで無い人とで、検診対象の病気での死にやすさを比較するとしましょう。
もしも、検診を進んで受ける人が、より健康に気を遣い、生活習慣や食事にも気を付けているとしたら、そして、その習慣そのものが、検診対象の病気の程度と関係しているとしたらどうでしょうか。その場合、もしも検診にあまり効果が無いとしても、検診を受けた人とそうで無い人とで、検診した病気での死にやすさに差が出るかも知れません。そうすると、実際には生活習慣その他が重要であるのに、検診の効果であると誤って考えてしまう可能性があります。

そのような、検診なり研究なりへ積極的に協力する人とそうで無い人とで生ずる傾向の違いによる偏りを、非協力者・積極協力者バイアスと言います。
このバイアスはまた、志願者バイアス自己選択バイアスとも呼ばれます。

応答バイアス

たとえば、性行動に関するアンケート調査を、調査票を送っておこなったとしましょう。その場合、アンケートに回答した人とそうで無い人とで、傾向の違いがあるかも知れません。
もしかすると、そのアンケートに積極的に答える人は、より性的な事に関してオープンな傾向があるかも知れません。答えなかった人は、そういうアンケートに答える事自体に嫌悪を覚えている可能性があります。
ですから、ある集団に対して調査票を送ってアンケートをおこなった際に、回収の割合がとても低ければ、回答した人とそうで無い人の傾向の違いが、集まった回答全体に反映されている事を考える必要があります。

そのようにして生ずるものを、応答バイアスと言います。一つ前の、協力者に関するバイアス(志願者バイアス)も、応答バイアスの一種と考える事も出来ます。

有病・発生(罹患)バイアス(ネイマンバイアス)

ある時点で病気に罹っている人とその人が持っている要因、を研究の対象として調査すると考えます(これを、横断調査断面調査と言います)。そして、その病気に罹っている集団の多くは、特定の習慣を持っている事が判明しました。では、その習慣が、病気を引き起こす危険因子であるのか……。

いま考えているのは、時点における、病気に罹っている人です。という事は、罹ったがすぐ治った人や、罹ってすぐ死んだ人が、対象から除外されてしまいます。従って、調べる事の出来たのは、ある程度長く病気を持っている人です。それを踏まえて、もし、その病気に罹った人の内、軽症で済む人、もしくは重症化して死ぬ人の割合が多く、それらの人々が、断面調査によって判明した習慣をあまり持っていないのだとすればどうでしょう。そうだとすると、病気に罹る人全体と着目している要因との関連を見誤る可能性があります。調べた時点で病気に罹っている人が持っている特徴が、病気に罹りやすい要因なのか、その病気に罹っている人が死ににくくなる要因なのかが判別出来なくなったりします。

これは、本来調べるべき、期間内で新しく病気に罹る人では無く、ある時点で病気を持っている人を対象とした事に起因する偏りです。この事を、有病・発生(罹患)バイアス(ネイマンバイアス)と呼びます。

情報バイアス

研究では、何かの物質にさらされたかどうかとか、ある病気を持っているかいないか、といったように、ある・無しの2つに分けて調べます。研究対象者に関する情報が不正確なためにこの分け方が誤り、結果生ずる偏りを、情報バイアスと呼びます。観察バイアス測定バイアスとも言われます。

誤分類

分け方を誤ってしまって生ずる偏りを、情報バイアスと言いました。ここで、誤って分けてしまう事を、誤分類と言います。

たとえば、検査に用いる血圧計が、常に高い数値が出るようになっているとしましょう。また、その数値の結果によって、高血圧 / 正常 と2つに分けるとします。
そうすると、ほんとうなら、高めの正常とされる人が、高血圧と判断されてしまいます。つまり、血圧の状態という事に関して、誤分類が起こったのです。これなどは、情報バイアスより測定バイアスの語の方が、より解りやすいかも知れません。

思い出しバイアス(リコールバイアス)

ある病気と、特定の食べ物とに、関係があるのではないか、という仮説を立てて研究をおこなうとします。
そこで、病気に罹っている人と罹っていない人を集めて、調べる以前の何年間かで、その食べ物を月ごとにどのくらい食べていたか、という事を聞き取りました。その場合、どういう事が起こり得るでしょうか。
考えられるのは、病気に罹っている人の方が、研究内容に、より関心を持っていて、その結果、以前の事をよく思い出そうとする傾向を持つ、というものです。そうすれば、相対的に、病気に罹っていない人が食べた量を、過小評価してしまいます(罹っていない人は、きちんと思い出そうとしないため)。結果、病気と食べる量との関連を過大評価する可能性があります。

このようにして生じる偏りを、思い出しバイアス(リコールバイアス)と言います。

また、思い出しバイアスの一種として、母性思い出し(想起)バイアスというものがあります。これは、好ましく無い出産の経験がある母親の方が、そうで無い母親よりも、妊娠期の事をより深く思い出そうとするために起こる偏りです。

面接者バイアス(質問者バイアス)

調査は、面接によっておこなわれる場合もあります。その際に、面接者によって、質問や記録の仕方に何らかの傾向があれば、結果に偏りが生じるでしょう。たとえば、面接する相手が、研究対象の病気に罹っている事を知っていれば、より熱心に質問をおこない、それと関連があると目される要因との関わりを、過大評価するかも知れません。それを、面接者バイアス(質問者バイアス)と呼びます。

診断容疑バイアス

ある物質の摂取と病気に関連がある、という説を支持する医師がいるとしましょう。その病気は、画像的な所見で診断されるとします。
そうすると、診断対象について、関心を持っている物質の摂取経験があるかどうか知っている場合、得られた画像にそれほどの差が無くとも、摂取経験のある人を異常ありと診断し、摂取経験の無い人を異常無しにしてまうかも知れません。

このようにして生ずるものを、診断容疑バイアスと言います。

曝露容疑バイアス(曝露気遣いバイアス)

何らかの生活習慣と病気に関連がある事が知られており、その病気に罹っている人と罹っていない人を集めて、その生活習慣を持っていたかを調べるという研究を考えます。その場合、調査者は、病気に罹っている人の方の習慣がある事を、よりきちんと確かめようとするかも知れません。そうした場合、病気に罹っている人が習慣を持っている割合を過大評価してしまうでしょう。

このような偏りは、曝露容疑バイアス(曝露気遣いバイアス)と呼びます。曝露というのは、病気なりの何らかの結果(帰結と言う)をもたらすと考えられる要因を指す、疫学の用語です。これは、摂取する物質などに留まらず、対象の行動や年齢等の属性をも含む、かなり広い意味合いを持つ言葉です。

家族情報バイアス

病気に罹っている人は、その病気をよく知っているものと考えられます。そうすると、家族が同じ病気に罹っている事に気付きやすくなるでしょう。その場合、病気に罹っている人とそうで無い人を集め、家族が同じ病気に罹っているかどうか(家族歴)を調べると、対象の病気に罹っている人の家族の方が、そうで無い人の家族よりも、その病気に罹っている割合が高い、と過大評価されます。その偏りを、家族情報バイアスと言います。

バイアスを念頭に置く

ここまで見てきたように、研究には、実に様々なバイアスが入り込む可能性があります。
私達は、マスメディアの報道などで、色々な、健康や病気に関する情報に触れます。◯◯が健康に良い事が判明した、というものだったり、この病気の原因は△△の可能性がある、のようなニュースだったり。
こういった情報はしばしば論争を呼び、場合によってはそれは、政策などにまで影響を及ぼします。
ですから、そういった情報が発信された場合、一体それはどのような研究方法で、どんなデータが得られ、データをどのように解釈して導かれた結論なのか、という事を意識しておくのが肝腎です。そして、それを考察する際に忘れてならないのが、本記事で紹介した、いくつかのバイアスです。

人間を対象に研究する場合、倫理的な問題から実験がおこなえなかったり、どうしても、研究協力者の記憶に頼らざるを得ない所があります。また、病気の診断をおこなう医師についても、予断をもって判断してしまう可能性を考えておかねばなりません。
ここで紹介したバイアスには、対処方法や回避のやり方が存在する場合もあります。ですので、この研究にはどのようなバイアスが入り込む可能性を持つのか、このバイアスを考慮した研究のデザインになっているか、研究者や紹介をする人はバイアスに気を遣って結果を解釈しているか、といった事を常に念頭に置きつつ、情報を吟味したいものです。

参考文献・資料

書籍

しっかり学ぶ基礎からの疫学

しっかり学ぶ基礎からの疫学

ロスマンの疫学―科学的思考への誘い

ロスマンの疫学―科学的思考への誘い

今日の疫学

今日の疫学

はじめて学ぶやさしい疫学 改訂第2版

はじめて学ぶやさしい疫学 改訂第2版

  • 作者: 日本疫学会,田中平三,秋葉澄伯
  • 出版社/メーカー: 南江堂
  • 発売日: 2010/10/05
  • メディア: 単行本
  • 購入: 1人 クリック: 5回
  • この商品を含むブログを見る
バイアスの事例についても、上記書籍を参照して書きました。

WEBページ

※全てPDFです