福島での甲状腺がん検診議論の整理

福島における甲状腺がん検診の話。

被ばくによる流行vs過剰診断という図式は成り立たない

流行とは、ある地域において対象の疾病の罹患率が、通常より大きくなる事。過剰診断とは、症状発現しない疾病を発見する事。これらはそもそも文脈の異なる議論で用いられる概念だから、二項対立のように扱うものでは無い。

流行が起こっても過剰診断は否定されない

流行とは、平時よりも高い確率で疾病が発生する事しか指さないので、それが起こるのは、症状発現しない疾病が発生しないのを全く意味しない。当然、

  • 過剰診断されるような疾病が流行する
  • 症状発現するような疾病が流行する

この両方があり得る。もちろんこれは、論理的に否定出来ないという意味であって、その蓋然性は知見によって評価・支持される必要がある。

転移や浸潤がある事は、過剰診断を否定しない

無症状時に発見したのであれば、その後の処置にて確認された転移・浸潤のある事は、過剰診断で無いのを意味しない。症状発現して発見されたものに転移・浸潤が認められ予後が悪かったとしても、それは即座に、検診発見がんに敷衍出来ない。レングスバイアスを考える。

検診が無効である事と過剰診断である事は一致はしない

検診が無効とは、無症状時に発見し処置しても予後が(症状発現時発見より)改善されないのを意味する。つまり、過剰診断で無いものであっても成り立つ理屈。過剰診断ならば検診無効、は定義から成り立つが、検診無効ならば過剰診断、は一般には成り立たない。

検診が有効か否かは、概念的には前臨床期のクリティカルポイントを捉えられるかどうかで決まる。クリティカルポイントの定義が介入で予後を左右する時点であるのでそうなる。クリティカルポイントが臨床期以後にしか無いのであれば、検診は有効とならず、逆に害(病悩期間延伸)のみ発生させる。

発見したものの内ほぼ全て過剰診断である、とは言えない

成人において、発見した甲状腺がんの内、アメリカで80%弱、韓国で90%くらいは過剰診断であると推定されている(Thyroid Cancer Screening (PDQ®)–Health Professional Version - National Cancer Institute)。しかし、若年者における過剰診断割合の推定はあまり無い。あっても、福島のような超大規模検診(対象人口の80%くらい)について良い推定を与えるような根拠は無い。高野らの主張(学説)、つまり、若年者において発生するほとんどが隠遁がん(症状を現さないがん)となるという説は興味深いものだが、現状でのスタンダードとは言えない。2022年1月24日追記・補足:ご指摘を受けたので補足。高野氏の学説への評価部分ですが、これは、現時点で取るに足りないとか考慮に値しない、と言っているのでは無く、学説として興味深く理論的考察としても検討されて良いものだが、現時点において専門家集団での標準的なものとまでは言えない、くらいの意味合いです。

甲状腺がん発見における推定(検診発見における割合、では無い)は、主に時系列的研究によるもので、RCTは無い。検診のRCTをおこなって過剰診断割合を推定する研究は少ない(乳がん検診など)が、もし出来たとしても良い推定は簡単では無い。乳がん検診における過剰診断割合推定の研究などを見ても解るが、推定の幅が大きい。フォローアップが短いと、割合を過大に推定するバイアスが掛かるが、長期フォローアップには莫大なリソースを割く必要がある。しかも福島の場合、余命の長い若年者が対象。

甲状腺がん検診が有効性に乏しい事は示されている

前掲の資料↓

www.cancer.gov

現状は、間接的だがしっかりした証拠によって、甲状腺がん検診に効果が無い(あっても観察出来ないほど小さい)事が示されている。なお、ここで言う間接的とは、介入研究(RCT)では無いという意味。時系列研究含めた観察研究によって効果が認められないので、あっても効果が極小であると示唆される。最大限に慎重を期すとしても、甲状腺がん検診の効果を示す証拠は無いと確実に言える。

流行していれば、検診しない人たちでも流行が認められるはずである

検診を受けていない人は数万人に上る。もし甲状腺がん発生率が数十倍や数百倍になっていて、かつ前臨床期が短いのだとすれば、未受診者から臨床発見がん(ここでは、症状発現による発見の意)の発見割合が大きくなっているはずである。

もし、前臨床期が10年以上であるようなものが特異的に流行しているとすれば(だから未検診集団で観察されない)、そういうものを早く見つける意義があるのか、と問える。

流行していれば、隣接地域でも流行が認められるはずである

もし、被ばく線量と疾病罹患とに用量-反応関係があれば、検診を受けた地域の外側の地域においても、臨床発見がんの流行が認められるはずである。

被ばく量と発見数に関連があっても、即座に因果関係を示さない

発見とは検診のプロセスの帰結なので、検査時にバイアスがあれば、発見数を左右する。被ばく量と発見数に関連があっても、それは重要な知見とは言えるが、すぐに因果関係の証拠となる訳では無い(関連の有無は因果関係の決定的証拠では無い)。

参考資料⇒【PDF】2018年度 九州厚生局 医療安全に関するワークショップ 診断に関連するエラー

現在の手順では、画像所見によって超低リスクのものを見つけないようにするという閾値設定であるので、そもそも人口において保有割合が高ければ、その閾値付近の振り分けの結果で関連が出る(地域差として反映される)事は、不思議では無い。

当然だが、そもそも関連があるのか、あるとすればどのくらいか、を問うべきなのは言うまでも無い。

過剰診断は少ないvs過剰診断がほとんど という図式

この図式は、

被ばくによる流行は無い(あっても無視出来るほど小さい*1

という部分に了解があるので成り立つ。その上で、過剰診断割合がどのくらいなのかを議論している。その意味では噛み合っている。ところが、この図式を維持したまま後者の立場の人が、がんが流行していると考える論者と議論したら、絶対に噛み合わない。

  • 流行していないのに発見数が激増した理由は何か
  • 発見数が激増したのは流行しているからだ

↑このような立場の人たちの議論が噛み合うはずが無い。

  • 流行していないのに発見数が激増した主な理由:症状発現がんの先行発見
  • 流行していないのに発見数が激増した主な理由:隠遁がんの発見

↑これは噛み合う

閾値を上げる事による過剰診断抑制

抑制が、人口における過剰診断割合を少なくするのを意味するのであれば、それを期待する事ができる。もちろん、発見時のエコー所見と隠遁がんであるかどうかに関連がある、とするのが前提。見つけにくくすれば過剰診断そのものも減るであろう、と考えるのは不合理では無い。

問題は、検診発見がんにおける過剰診断割合をどのくらい減らせるかの観点。ここについて、はっきりした事は言えない。少なくとも、確定診断(手術後の病理検査)のデータから、過剰診断では無いとは言えない。これを基本的な知識と押さえておかないと、絶対に議論は進まない。なぜ他の乳がんなどで、RCTによって過剰診断割合を推定しているかを考えると良い。鈴木眞一氏などの主張、つまり、一次検診の閾値設定によって過剰診断を大部分抑えられた、と取れるような主張は成り立たない。転移や浸潤などがあっても過剰診断が起こるというのが議論の難しい所であるのに、検診発見がんにてそれが認められれば過剰診断で無い、などとは言えない。

閾値を上げたら

閾値を上げるのは、疾病を見つけにくい方向にバイアスを掛けるのを意味する。つまり、感度を下げる事となる。一般に検診は、症状発現しない時期(DPCP・PCDP)に、他の人に過剰診断を起こしてでも見つけて命を救う、という志向である。それなのに、一次検診(エコー検査)の閾値を上げて(感度を下げて)過剰診断を抑制しています、とただ言った所で、じゃあそれによって検診の効果を下げる方向に操作して良いのかと問われるし、問われた側は答えられなければならない。もちろん、どのくらい抑制できるのか、も考えるべきなのは先述の通り。

検診の性能管理(精度管理)を検討する際、感度特異度の評価が重要なのは言うまでも無い。であるのに、実に簡単に感度を下げる事を言っている。検診効果の議論であれば、感度を下げてインターバルがんが出たらどうする、となるだろう。そうならないのは、

感度を下げてもインターバルがんが生じないような疾病である

のを示唆する(前臨床期が長い)。見つけた時に小さくても悪さするかも知れないから見つけておく、のが検診の出発点だが、福島の検診では、見つけた時にこの大きさであれば悪さはしないであろう、と感度を下げている。本来その閾値の設定は、RCT等で注意深く検討し、至適のバランス点を見出すべきものであるのに。

発症と罹患

発症とは症状が発現する事を意味するが、議論においては、病気に罹るのも含めて指している人もいる。だからたとえば、発症したがんを検診で見つけたのような表現が用いられ得る。本来それは誤った使いかただが(症状があるなら検診では無い)、そう使っている人がいる事に注意して表現を考慮する。だから私は、発症そのものを滅多に使わず、症状が発現すると表現し、病気に罹るのを罹患としている。がんは長い前臨床期(病気に罹っているが症状が無い期間)を持つ所が重要なので、ここはしっかりと区別しておきたい。

悪性、悪性度

福島で見つかったものが悪性であったから、と言う人がいるが、がんは悪性腫瘍を指すので、誤診で無ければ悪性に決まっている(細胞診が誤陽性だったのは1件)。しかし、がんでは悪性度なる概念もある。そもそも悪性なのに悪性度とは、と思わなくも無いが、ともかく両方あるので、それを区別しておく。で無いと噛み合わない。

過剰診断は、悪さをしない悪性腫瘍を見つける事であるので、すぐには理解しがたいもの。

過剰診断⇒進行が緩徐 では無い

この議論での定義上、過剰診断は症状発現しない病気を見つける事であるので、もしも、数カ月後に症状発現するような性質のものを上手く見つけ、その数日後(処置しないまま)に交通事故で死亡したとしたら、それは過剰診断であると言える。だから、過剰診断とは進行が遅い(停止や退縮するもの含む)のを指す、と一概に言える訳では無い。必ず、他の原因による死亡リスクとの兼ね合いで決まる。

仮想の話。

遠い未来、医療が発展し、交通が完全自動化して寿命が140歳くらいになったとする。甲状腺がんの大人しいものの前臨床期は、実は40・50年かも知れない。それまで隠遁がんとなっていたものが、そうで無くなるかも知れない。

もちろん、通常の議論の範囲では、過剰診断とは、前臨床期が無視できるほど長いものを見つける事を意味する。DPCPを無限大に設定したりする。

過剰診断がほぼ全てであると言えなくとも、検診中止を主張出来る

過剰診断がほぼ全てであるから検診を中止すべきと言えればシンプル。なぜなら、ケースごとに見れば過剰診断と検診有効は両立しないため、集団で過剰診断割合が大きければ、自動的に検診無効が言えるから。しかし、前述のように、福島の検診発見甲状腺がんの内ほぼ全てが過剰診断である、などと現状は言えない(将来もたぶん言えない)。

福島における甲状腺がん検診をすべきで無い理由は、

甲状腺がん検診に有効性は認められていない

からである。これは、過剰診断がほぼすべてだから……と言うよりは、主張として弱く見えるはず。しかし、現在の知見、つまり証拠に従ってものを言うのなら、こう主張するしか無い。ある方策を止めさせるために、自分の志向を押し通すために現状の知見を逸脱する事は、厳に慎まねばならない。

甲状腺がん検診の効果が認められていない事は、間接的だが安定した証拠によって支持されている。RCTという直接的証拠によって示されてはいない(と言うか倫理上、もう出来ない)。だから、小さくても効果はあるのではとの問いは否定出来ない。これは科学の限界とも言える。それを把握した上でなお検診を希望するのであれば、それを止める事は出来ないし、止めるべきでは無い。検診を強制出来ないように、検診しない事を強制も出来ない。社会的観点から、集団検診として甲状腺がん検診を実施すべきで無い(専門的には推奨グレードで表現される)とは言えても、受けたいと言う人を止めてはいけない。

───

ひとまずはこんな所。何だかごちゃごちゃしているな、と思われたかたもあるかも知れません。実際、そもそもごちゃごちゃした議論なのです。全然簡単では無いし、理解には疫学の知識、それも、基本の部分で無く、がん検診の有効性評価や過剰診断の議論にまつわる知識が必要。それをちゃんと整理せずに、色々省略したり用語の共有を疎かにしていたら、議論など出来るはずも無いのです。

*1:それを流行と表現出来るのかの問題もある