中川恵一氏の誤り――がん検診の論理

hc.nikkan-gendai.com

全くひどい内容なので、指摘します。

がんは早期発見が一番です。

誤り、もしくは不正確です。

明らかに、本記事は検診の文脈ですので、早期発見とは、無症状時に発見する事に同義です。そして、がんは、無症状時に見つければ良いというものではありません(後述)。
早期発見を、あまり進行していないとの意味で用いる場合もあるでしょうが、いや、日常的にはそちらのほうでよく使われるのかも知れませんが、なればこそ、検診の文脈における用法を注意深く考えるのが、肝心です。

尤もここは、情況によって用法が異なる語の使いかた、という意味で、そこまで拘る事も無いのでは、と思われる所やも知れません。しかるに、次の指摘箇所は、明らかな誤りです。

感度は、Aと診断して実際にAだった人の割合。

全く違います。

まず注意として、診断を、判定評価のように言い換えます。何故なら、一次検診(無症状時の人に対する、病気の有無の最初の篩い分け)における検査結果は、病気のある無しを確定するものでは無く、あるだろう/無いだろうと、蓋然的に評価するものであるからです。また、用語として、

  • 病気があるだろうと判定:陽性
  • 病気が無いだろうと判定:陰性

上記を導入しておきます。

それを踏まえて、感度とは、

病気を持つ人の内、陽性になる人の割合(または確率)

の事です。全く、見ている指標が異なります。図で表します。

f:id:ublftbo:20130316193052p:plain
感度

ここで、図の四角形において、縦線で分割された右側が、病気を持つ人で、赤が病気があるだろうと判定(陽性)、青が病気を持たないだろうと判定(陰性)された事を示します。

改めて書くと、感度なる指標は、病気を持っている人に検査をした時、陽性と判定される割合を意味します。

対して、中川氏の説明は、

感度は、Aと診断して実際にAだった人の割合。

となっています。明らかに、ほんらいの感度とは、異なる割合です。引用文と少し表現を換えて書き直せば、

陽性と判定された人の内、実際に病気を持つ人の割合(確率)

と言えます(この段階で診断と表現するのが紛らわしいのは、何となく分かってもらえると思います)。
これは、検診の文脈で言えば(診断学的には)、

陽性反応適中度

と表現される指標です。図で示すと、次のようです。

f:id:ublftbo:20130316193051p:plain
陽性反応適中度

四角形の、縦線で分割された左側の部分は、病気を持たない人を示します。ですから、左側にあって赤い(陽性)所なので、

誤った陽性判定

が、分数に組み込まれているのを意味します。先に示した感度とは全く別の指標である事が、理解出来るでしょう。

ここで、それら指標の違いが、それほど気をつけなければならない所なのか、と疑問を持たれるかたも、あるやも知れません。
実際、峻別すべきです。なぜなら、

感度が高くても、陽性反応適中度が低い

場合があり、これらを混同すれば、検査の性能の評価を全く誤る危険性があるからです。

感度は、病気を持つ人の内、陽性になる人の割合なので、病気を持つ人に着目すれば良いです。しかるに、陽性反応適中度は、分母が総陽性、つまり、

病気を持ち陽性 + 病気を持たずに陽性

を足し合わせたものです。そして、分子は、病気を持ち陽性ですから、結果としての割合は、

病気を持つ人と病気を持たない人の比

に左右されます。ここで、病気を持つ人に着目すれば、陽性反応適中度は、

全体に占める、病気を持つ人の割合(有病割合)

如何である、と言えます。下のGIFアニメーションに、その様相を示してあります(以前作成したもので、指標名の表現が少し異なります)。

f:id:ublftbo:20130318193734g:plain
各検査指標の、有病割合に応じる変化

これを見れば、

感度が同じでも、有病割合が低ければ、陽性適中度は著しく低下する

事が、理解出来ると思います。そして、がんという疾病はそもそも、何万人に一人という頻度で発生する、という事を思い返しましょう。すなわち、がんに対する検査は、感度が高くても、陽性反応適中度が低くなる事が、当然に起こり得るのです。したがって、感度が高ければ適中度も高い、と一般に導けません。これは、統計(の、ベイズの定理説明箇所)や疫学の教科書において、練習問題として出てくるような論理で、重要、かつ基本として押さえておかねばならないものです。
※有病割合が低い場合には特に、病気を持たない人が病気が無いだろうと判定される割合、が決定的に重要です

過剰診療が社会問題になりました。

その前では、過剰診断を用いているのに、ここでは過剰診療となっています。これらは、別の概念を指す用語として使われる場合があるので、区別すべきでしょう。

そのほかでいうと、膵臓がんと胆道がんは発見しにくい上、有効な検診法が定まっていないので、血液検査が有望でしょう。高リスク判定なら、超音波検査などの精密検査を受けるといい。肺で高リスクならCT、食道なら内視鏡といった具合です。

不正確です。ある検査が、

がんを見つける性能が高い

としても、それを用いた

検診が有効であるとは限らない

事を、押さえておくべきです。どういう事かと言うと、がんは、無症状時に発見するだけでは、症状が出てから発見される場合よりも予後が良くなる事は、保証されません。検診が効果を発揮するには、

  • 有効な治療法がある
  • 治療法の成否を左右するポイントが、無症状時に存在する
  • そのポイントの前に見つけられるように、適切なインターバルで検診をおこなう

などの条件が必要だからです。ですから、

検査として有望(高性能である可能性を持つ)

であるのは、

検診として有望

とは異なるのです。実際に検診が有効であるかは、正確には、

病気を持たない人を、くじ引きで振り分けて、検診を受けるグループと受けないグループで結果を比較する

というような方法を用いないと、判明しません(それの実施が現実的にむつかしい事は、措いておきます)。

血液検査がどんなに効果的であっても、定期的ながん検診を受けることが重要なのは、今後も変わりません。

いま説明したように、定期的ながん検診を受けることが重要かどうかは、検診の種類によります。具体的には、

  • がんの種類による
  • 検査の種類による
  • 受ける人の年代による
  • 受ける人の性別による
  • 実施する地域における有病割合による

これらの条件に左右されます。そこを説明せずに、定期的な検診を受けるべきとか、がんは早期発見が重要、とただ主張するのは、誤っているし無責任でもある、と言えるでしょう。

↓ここまでに書いたような所を総合的に判断し、検診の推奨の程度を検討しているサイトをご紹介しておきます

canscreen.ncc.go.jp

様々の指標を考慮し、利益と害の程度とを比較して、各検診の推奨グレードを決め、検診のガイドラインを定めています。ガイドライン作成の手順も示されているので、参照すると良いでしょう(全く簡単では無いですが)。

↓また、私が書いたものですが、ここで書いたような、検診の有効性に関する事を、もう少し詳しく説明したものも、紹介します。

検診で押さえておくべき事|TAKESAN|note

interdisciplinary.hateblo.jp

↓これも私が作った、検査の各指標をグラフィカルに確認出来るページです ※記事内で示した図とは、有病と非有病が左右逆です

screening.iaigiri.com