検診における、「生存率が○○倍に」という表現の罠――ためしてガッテンと尾道方式

ためしてガッテン

twitterを見ていて、来週、このような番組が放送されるという事を知りました。

www9.nhk.or.jp

引用します。

死亡者数が年々増加している、すい臓がん。早期発見できる確率が極端に低く、がんの中でも特に恐ろしいがんとされています。ところが、その生存率を全国平均の約2倍にまで高めている町が!それは広島県尾道市。ここでは、町の開業医が「ある検査」を使って超早期のすい臓がんを次々と発見、多くの患者の命を救っているんです!私たちにとって身近なその検査とは!?2万7千人分もの検査画像を検証し見つけ出された、すい臓がんを早期発見するための“サイン”を大公開!

番組は、NHKの『ためしてガッテン』で、内容は、これまで早く見つける事が困難であった、たちの悪い病気である膵がんについて、ある検査をおこなうと、病気を早く発見出来、その結果、生存率を全国平均の約2倍にまで高められた、といったものです。

これを見ると、「なるほど、膵がんは経過が良くないのは知っている。それを早く見つけられて、生存率を高める事が出来たのなら、その検査法は優れているに違い無い」と思うのではないでしょうか。

確かに、超早期の膵がんを見つけるとか、生存率を上げる、といった言葉のインパクトは大きいと思います。しかし、検診について考える際、こういった表現に、ある種のが潜んでいるのです。

尾道方式

リンク先を見ると、次のようなキーワードを見出せます。

  • すい臓がん
  • 早期発見
  • 生存率を全国平均の約2倍にまで高めている
  • 広島県尾道市
  • ある検査
  • 2万7千人

これらのワードから、ここで紹介されているのは、広島県尾道市でおこなわれている主治医機能支援システム、尾道方式(主治医機能支援システム | 一般社団法人 尾道市医師会の一環、膵癌早期診断プロジェクト(主治医機能支援システム | 一般社団法人 尾道市医師会である、と推測する事が出来ます。
概要としては、膵がんのリスク因子をいくつか有している人に対して検査をおこない、その後の多段階の検査を経て、膵がんを早く見つけて命を救おうとする、という試みです。そしてその結果、小さい膵がんの発見数が増え、生存率が改善された、と言うのです。

他の紹介記事を見てみても、だいたい同じような内容です。

medicalnote.jp

www.dailyshincho.jp

これらを考え併せると、ためしてガッテンで来週採り上げられるのは、この尾道方式における膵がん検診である、と見る事が出来るでしょう。

もちろん実際は、番組を観てみないと確実な事は言えませんが、いずれにしても、検診について考えるのは重要ですし、生存率などの考えかたも知っておいたほうが良いので、本記事では、それらの一般的な所について解説し、生存率のような指標に関しても説明を試みます。

検診

まず、検診とは何でしょうか。

検診というのは、症状が無い時に病気を見つける事です。これは最も大切で基本的な定義ですので、押さえておきましょう。症状が出てから医療機関を受診して発見するのは、通常は検診と言いません。

この定義を前提とすれば、尾道方式では、

症状が無い人に検査をおこない、膵がんを発見して、生存率を改善させた

のであると、要約出来ます。

生存割合(生存率)

では、生存率とは何でしょうか。

生存率とは、

ある病気に罹った人の内、一定期間で生存した(死ななかった)人が占める割合

の事です。がんでは通常、5年や10年の期間が設定され、5年生存率・10年生存率が評価されます。尾道方式で3年生存率が用いられるのは、膵がんの予後(経過)が悪いから、なのでしょう。

ところで、定義で示した通り、生存率は、実際は割合です。実は、医学(の中でも疫学)においては、割合は、厳密には別の指標ですので、以降、生存割合と表現します。

たとえば、膵がんに罹った人が100人いるとして、発見から5年の間に90人が亡くなれば、5年生存割合は10%である、となります。

ですので、尾道方式では、検査法や手続きを工夫した結果、膵がん発見後から一定期間に生き残る人が、それまでの何倍かになった(ためしてガッテンでは2倍、その他の記事では3倍)、と言えます。

これを見ると、「なんだ、やはり、尾道方式によって命を救われる人が増えたのではないか」と、改めて思うかも知れません。

生存期間

しかし実は、ここにが隠されているのです。

ここで、仮想の話として、「甲乙 丙」氏という人の歴史を考えるとしましょう。

甲乙氏は、60歳の時に、胃や背中の不調を覚え、体重減少などが起こったので、医療機関を受診しました。その結果、膵がんが見つかります。甲乙氏はただちに手術を受けましたが、残念な事に、63歳の時に、膵がんが原因で亡くなってしまいました。

この甲乙氏の歴史を、α世界線(by『シュタインズ・ゲート』)としましょう。次に、全く同じ甲乙氏の別の歴史、すなわちβ世界線における甲乙氏の運命を見てみます。

β世界線において甲乙氏は、尾道方式的な検診を受けました。その検診によって、57歳の時に膵がんが発見されます。そして、がんは手術で切除されます。その結果、甲乙氏は、6年間生き延びる事が出来たのです。α世界線とβ世界線の甲乙氏は、がんに罹った時は同じです。β世界線ではそれを、より早く発見し処置する事が出来た、のです。

ここで、がんが発見された時から、その病気で亡くなるまでの期間を、生存期間と言います。そうすると、甲乙氏の生存期間は、それぞれの世界線で、

このようであったと言えます。生存期間は、α世界線では3年、β世界線では6年でした。つまり、β世界線での生存期間は、α世界線でのそれよりも、2倍長かったと言えます。

という事は、検診は効果をもたらしたと言えるのではないか……言えません。何故でしょうか。

今は、生存期間を見てきましたが、ここで、死亡した年齢を見てみましょう。

  • α世界線:60歳時発見→3年後死亡⇒63歳で死亡
  • β世界線:57歳時発見→6年後死亡⇒63歳で死亡

あれ? α世界線でもβ世界線でも、甲乙氏の亡くなった年齢は、同じではないですか。生存期間は延びたはずなのに、亡くなった年齢は同じ、とは?

ここで、生存期間算出のしかたを思い出してください。そうです、生存期間は、がんが発見された時を開始時点とするのでした。がんのような、病気に罹ってから何年も経ってから症状が出るようなものは、病気に罹った時を開始時点とする事が出来ません。ですから、発見時(診断時)をそう看做すのです。すると生存期間は、

  • α世界線症状が出てから死亡まで
  • β世界線無症状時に発見されてから死亡まで

となります。つまり、β世界線での生存期間は、

検診発見時から、症状が出るはずだった時点

分、延長されます。死ぬ年齢は同じなのにも拘らず、です。このように延びた期間を、リードタイムと呼びます。

この節の参考文献↓

病の皇帝「がん」に挑む ―  人類4000年の苦闘 下

病の皇帝「がん」に挑む ― 人類4000年の苦闘 下

甲乙氏の例は、本書の4章を参照して設定しました。

リードタイムバイアス

このようなリードタイムが生ずると、早く発見した事が寿命を延ばさないとしても、見かけ上の生存期間が延長されます。そうすると、実際の延命効果を、不当に長く評価してしまう事になります。このように、実際の結果から偏らせてしまう働きを、リードタイムバイアスと言います(バイアスとは偏りの事)。

検診の効果は生存割合で評価してはならない

これまでを踏まえて、検診の効果を生存期間で評価すると、リードタイムバイアスが生じてしまい、正確な評価がおこなえない、という事が解って頂けたと思います。

再び、生存割合に戻ります。
生存割合は、生存期間を集団でまとめて評価する指標と言う事が出来ます。簡単のため、がんに罹る人が10人いたとして、全員が同じ時に症状を呈して発見され、3年後に死亡した、とします。そして、もし全く同じ集団に検診をおこなったとして(別の世界線)、全員のがんが症状が出現する3年前に発見され、検診しない場合と同じ年齢で死亡した、と考えます。
そうすると、5年生存割合は次のようになります。

  • 検診無し:0%
  • 検診あり:100%

どうですか。同じ病気に罹り、その病気で亡くなる年齢が同じであるにも拘らず、生存割合という指標での評価は、まるで違います。これが、生存割合で検診の効果を評価する事のという訳です。

正しい評価

では、検診の効果を測るには、どうすれば良いのでしょうか。次のように考えます。

α世界線とβ世界線で、全く同じ集団に対して、

  • 検診をしない
  • 検診をする

というようにします。そして、それぞれの世界線での

(検診した)がんで死ぬ人の割合

を較べるのです。そうすれば、

α世界線で死ぬはずだった人を、β世界線でどれくらい救う事が出来るか

を見出だせます。

死亡割合とRCT

生存割合は、病気に罹った人を分母とする割合でした。対して、先程の例で出した割合の分母は、対象とした集団全員です。集団には、がんに罹る人罹らない人、そのがんで死ぬ人死なない人など、色々な人がいます。それらを引っくるめて評価します。そして、同じ集団に検診をおこなったとしたらと考えるのです。今見た割合を、生存割合に対して、死亡割合と呼びます(生存率と同じく、これを死亡率と表現する場合がある)。

今は、同じ集団の異なる世界線を設定して考えましたが、これはSFの話です。実際には、ある集団を用意して、それを、くじ引きで検診をしない集団と検診をする集団に分けて、調べる病気での死亡割合を比較するのです。くじ引きで分ける事で、なるだけ似たような集団にする事が期待されます。このような方法を、RCT(確率化統制試験:無作為化対照試験)と言います。

整理すると、検診の効果を評価するには、

  • 集団をくじ引きで分け
  • 片方の集団にだけ検診をおこない
  • それぞれの集団での(がん)死亡割合を比較する

のが最適である、と言えます。

再び、尾道方式

ここまでを踏まえて再度、尾道方式を見ると、尾道方式では、生存割合しか出していない事が解ります(主治医機能支援システム | 一般社団法人 尾道市医師会)。これは、検診の効果を評価するという観点からは、極めて不充分です。先に見たように、生存割合の評価では、リードタイムバイアスがかかりやすいですし、その他にも、検診では、大人しい病気のほうが見つかりやすく、その結果、生存期間の長い人の割合が大きくなるという現象も起こり得ます(このような働きを、レングスバイアスと言います)。

実際には、RCTをおこなうというのは、コスト的にも倫理的にも困難です。現在は、前立腺がんや甲状腺がんのように、検診による効果が、ほぼ無いか、あっても小さいと考えられているものがあり、更に、症状が出ないものまで見つけるという害を及ぼす事もあるのが知られています。従って、検診をしない集団と検診をする集団を単純に比較するのが難しいのです。だから実際には、検診をおこなった地域における死亡割合が、通年でどのように変化したか、とか、他の地域と比較する、といった間接的な方法によって検討されます(甲状腺がん検診は、このような間接的な証拠が集められています)。しかし尾道方式では、このような評価がきちんとされた形跡が見つかりません(尾道方式を紹介するページや、PubMedJ-STAGE等で検索)。

もちろん、証拠に乏しい事は即、効果が無いのを意味しません。検査法の性能向上や検査プロセスの構築、検診間隔の設定などによって、検診が効果をもたらす可能性は否定し切れません。ですが、それはあくまでも可能性であって、効果をもたらす根拠が無いとは言えます。色々の所でアピールされている生存割合、で検診の効果を評価してはならないというのは、先に説明した通りです(がん検診の考え方 ■なぜ「生存率」ではだめなのか)。

証拠の無い検診を勧める事

尾道方式には、効果を示す証拠は見出されていません。もし、ためしてガッテンで採り上げるのが尾道方式(やそれに類似する方法)なのであれば、

効く証拠の無い医療行為を肯定的に紹介し、あるいは勧める

のを意味します。恰も効果があるかのごとく紹介する可能性がある訳です(紹介映像からは、そう推測されます)。これは、とても問題のある事です。もし効果が無ければ、検査に伴う害やリードタイム延長に伴う害のみを被る事になりますし(身体的・心理的・経済的)、効果があると信じた視聴者が、医療機関に問い合わせる、という現象も生ずるやも知れません。それへの対処は、医療機関にとっては、全く不必要の負担です。

もし、このような検診を紹介するとすれば、それには、効果が認められている事が必要です。そうで無いなら、広く世間に周知すべきではありません。
仮にそのような検診への参加を促すにしても、

  • 効果が無い可能性の提示
  • 害が生ずる可能性の提示

などをきちんとおこなって、臨床試験として設定する、とするべきでしょう。それでさえ、先述したような倫理的な壁があるのに、証拠の無い検診を広め、あるいは受診を促すのは、医療的に極めて大きな問題であると言えるでしょう。

それでも、もし小さい可能性であっても、命が救われるかも知れないのであれば、検診を受けてみたい、と思うかたがあるかも知れません。そういうかたも、出来ればここで説明したような所をよく考慮してから決める事をお勧めします。

がんは見つけるのが早ければ早いほど良いと思いがちです。ところが、実際はそうではありません。検診に関する研究は、その事を次々に明らかにしてきました。この記事では、そのような事実の一端を知らしめ、冷静に情報を吟味するきっかけになるように、と考えて書きました。少しでも参考になれば幸いです。

参考資料

検診について、より詳しく知りたいかたに、私が書いた、以下の記事をご紹介します。

interdisciplinary.hateblo.jp

分量は多いですが、検診という医療介入について、ある程度まとまった説明をしようとすると、これくらい長くなってしまいます。出来るだけ噛み砕いて書いていますので、よろしければお読みください。

また、連載の最後には、参考資料も紹介していますので、そちらも参照すると、より深く理解出来るでしょう。

メモ:生存割合と死亡割合

もしかすると、尾道方式(と言うか、ガッテンについて)について書くかも。

参考資料としてメモ。

病の皇帝「がん」に挑む ―  人類4000年の苦闘 下

病の皇帝「がん」に挑む ― 人類4000年の苦闘 下

つまりわれわれの検査は、さらなるハードルを乗り越えなければならないということになる。「生存率」ではなく「死亡率」を改善しなければならないのだ。ホープの受けた検査がほんとうに有効だったかどうかを判定する唯一の適切な方法は、ホープがプルーデンスよりも実際に「長く生きたかどうか」を調べることだ。もしホープが二〇一〇年まで生きたとしたら(プルーデンスよりも一〇年長生きしたら)、検査は有効だったとわれわれは堂々と主張できたはずだ。しかし、実際には二人の女性は同時に亡くなったために、スクリーニング検査は無効だったと判定せざるをえない。

上記引用文は、がん検診の有効性を説明する箇所。この前に、生存期間の比較ではリードタイムバイアスが生ずるので良くない、という事が書かれている。