検診の議論で重要な論点リスト

箇条書きします。なぜそう言えるのか、等の疑問があれば、コメント欄にお書きください。誤りが判明すれば訂正します。

思いつくままリストアップしたので、カテゴリーごとにまとまっているとは限りません。

  • 検診は、病気を無症状の時に見つける事である
  • 検診の目的は、病気を見つける事そのものでは無い
  • 検診は、検診しない時に比べて寿命を延ばしたり、QOLの下がりかたを抑える事を目指す
  • 検診の効果は通常、生存割合では測らない
  • 生存割合にはリードタイムバイアスが生ずる
  • リードタイムの補正は重要だが、そもそも自然経過が解らないのにリードタイムを設定するのだから難しい
  • 検診の効果は通常、死亡割合で測る
  • 死亡割合は観察開始時点をゼロタイムにするので、リードタイムバイアスがかからない(ゼロタイムシフトが起こらない)
  • 死亡割合は疾患特異的死亡と総死亡がある
  • 総死亡割合での比較には大規模なサンプルが必要なので、総死亡が減らない事をもって検診の無効を説く意見には注意を要する
  • 最近の研究ではQOLも評価する
  • QOLを測る指標はQALYなどである
  • QALYは生存年をQOLで重み付けしたものである
  • QOLは患者報告アウトカムで測る
  • 検診には必ず害の可能性がある
  • 害には誤陽性、誤陰性、侵襲、併発症、偶発症(併発症と同じ意味を指す場合がある)、心理的不安、社会的レッテル、経済的負担等がある
  • 様々の観点からの害が生ずるのは、検診が検査を含んだ多段階のプロセスあるいはプログラムを指す語だからである
  • 害をリスクとは呼ばない
  • 疫学ではリスクは確率や割合を指す
  • 害を英語で表すならハームである
  • 過剰診断は特殊の害である
  • 過剰診断とは症状や死亡の原因にならない病気の発見である
  • 過剰診断は誤診では無い
  • 過剰診断は誤陽性では無い
  • 過剰診断の害は、病気を発見する事で生ずるあらゆる害を起こし得る複合的害である
  • 過剰診断を直接確認する事は極めて困難である
  • 剖検における病気の発見は、過剰診断の起こりえる事を示唆する
  • 過剰診断は直接観察しづらいので、集団的評価で把握する
  • 理想的には完全フォローアップを前提とした反実仮想による発見割合の差を過剰診断とする
  • 仮想を模倣するためRCTをおこなって過剰診断割合を推計する
  • RCTでもアドヒアランス不良やフォローアップ不足、センサー(脱落等)の発生によりバイアスがかかる
  • RCTには倫理的制限が生ずる
  • RCT不能の場合、生態学的研究や時系列的研究、モデリングやシミュレーションに頼る(特にマイクロシミュレーション)
  • 実際の研究では、過剰診断の定義や割合の分母の定義にブレがあるため、推計の幅も広い
  • RCTが実施された検診は少ない
  • 甲状腺がん検診の過剰診断割合推計は、成人のもの以外では乏しい
  • そもそもデータに乏しいため、時系列研究くらいしか出来ない
  • 韓国の成人では、発見甲状腺がんの内90%超が過剰診断と推計されている
  • 成人の例をそのまま小児に補外出来ない
  • 小児甲状腺がんは頻度が小さいため、データに乏しい
  • 現時点で、福島における過剰診断割合がほとんど(たとえば9割)である事は言えない
  • もし具体的に、90%以上は過剰診断である、のような推計から検診の是非を論ずるなら、推計のスタンダードを踏まえた論文を出して、他の研究者による検討と追試を受けるべき
  • 腫瘍径10mm以下のものを微小がんと言う
  • 主に日本の研究により、明らかな転移等の無い甲状腺乳頭がんの微小がんは、即時に処置しなくても予後の変わらない事が示された
  • 即時に処置せず経過観察する事を、アクティブサーベイランス(積極的監視療法、積極的経過観察療法)と言う
  • 福島の検診では、アクティブサーベイランスの知見を参照して判定基準が作られている
  • 福島の検診では、微小がんをなるべく発見しないようにしている
  • 福島で発見されている大部分は微小がん、は間違い
  • 明らかな転移等の無い微小がん(低リスクまたは超低リスク)は見つけないようにしている(感度を下げている)
  • 害のある検診はすべきで無い、は誤り
  • あらゆる検診に害の可能性がある
  • 害は量的に評価する必要がある
  • 害が大きいから検診はすべきで無い、は曖昧
  • 検診では、害と効果が両立する
  • 正確に言うと、検診には効果と両立する害と両立しない害がある
  • 過剰診断は効果と両立しない
  • 侵襲や心理的不安は効果と両立する
  • それらを総合的に集団的観点から評価すれば、効果vs害を比較検討出来る(総合的な効果と害が両立する)
  • 効果は寿命延伸等の狭い意味を指すので、もっと一般的に便益と表現する
  • 検診は、便益と害を比較して正味の便益が認められる場合に推奨される
  • 便益と害の比較は一筋縄ではいかない
  • 便益と害にどう重み付けをするか
  • 正味の便益の大きさによって推奨グレードが変わる
  • 推奨グレードには、おこなわない事の推奨、つまり事実上、おこなってはならないというものがある
  • 推奨グレードには、証拠不充分で評価が定められないというものがある
  • 病気を持つ人の割合が大きいほど、得られる検診の便益はより大きく出来る
  • 治療技術の進歩や病気の人の割合の低下によって、推奨される年齢層などが変わる
  • 甲状腺がん検診にはそもそも、便益の得られる証拠が無い
  • 逆に、便益が得られないであろう証拠がある
  • RCTが無いので間接的な証拠である
  • 間接的だが強固な証拠である
  • 便益の得られない証拠があるため正味の便益を得られず、害を検討するまでも無く推奨されない
  • 成人でその知見があるので、より保有割合が小さい小児においても推奨されない
  • 小児における甲状腺がん検診について、寿命延伸で無くQOL低下抑制を主張する者がいる
  • 甲状腺がん検診でQOLに好影響を与える証拠は無い
  • 介入した場合のQOLの変化は、既に介入しているので、介入を遅らせた場合のそれと比較出来ない
  • アクティブサーベイランスには経過観察の期限は無い
  • 過剰診断で無いからといって害が小さいとはならない
  • 将来に症状が出るものであっても、介入を早める事の効果が無いのであれば、病悩期間延伸に伴う害が発生する
  • アクティブサーベイランスに期限が無いので、病悩期間もその分延び得る
  • QOLへの好影響を主張する者は、QOL定量的評価と得られる効果の見込みについて具体的に言わない
  • 過剰診断の害を声高に主張する者は、有効性評価について詳細に論じない
  • 検診をしても死亡割合が変わらないという事自体は、過剰診断を示唆しない
  • 過剰診断は、時系列的に見て死亡割合の変動が大きく無いのに発見割合が上がり続けている、などの傾向によって示唆される
  • 死亡の大きな変動が無く発見が増え続けるのは、先取り出来ない分を、症状の出ない病気のリザーバーから拾っている可能性がある
  • 時系列研究は様々のバイアスに注意を払うべきである
  • 早く見つけても寿命が変わらないのを見つけたのだから過剰診断である、は間違っている
  • 早く見つけても寿命が変わらないのは、その病気による症状が絶対に出ないのと同じでは無い
  • 検診をして死亡割合が変わらないというのは、まず検診の有効性の観点である
  • 死亡割合の時系列的推移には、治療法の変化や検診の効果なども関わる
  • 病気の流行(通常時より発生率が高い)と過剰診断の評価は別の議論として考える
  • 過剰診断されるような病気が流行する場合もある
  • 流行での超過分における過剰診断割合の評価は困難
  • 過剰診断割合が高いか低いかは一概に言えない
  • 過剰診断割合が高いかどうかは、正味の便益の程度の評価および、社会的な同意によって判断されるものであるべき
  • 乳がん検診でも十数%からの過剰診断割合推計がある
  • よく研究される乳がん検診でさえ、過剰診断割合の推計には大きな幅がある
  • 検診では、便益と害についてのインフォームド・コンセントがなされるべきである
  • 福島のように小児が対象の場合、インフォームド・アセントも重視されるべきである
  • 流行や過剰診断が生じているかを確かめるために、別地域を対照にして調査すべきでは無い
  • 効果が見込めず害の生ずる事が判っているのであれば、その介入は倫理的に許容されない
  • 仮に対照して違いが見出されたとしても、着目している要因によるものとすぐには言えない
  • 地域ごとに背景因子が異なるので、それの違いがバイアスをかける
  • 発生数を推計する場合に、発見する行為そのものがバイアスをかける
  • 検査の閾値を上げる事は、人口に対する過剰診断を抑制し得る
  • 閾値を上げる事は、検診発見に対する過剰診断割合も抑制し得るが、どのくらいかは解らない
  • アクティブサーベイランスは、この閾値下なら過剰診断であろうというものを経過観察するのであって、この閾値上なら過剰診断で無いだろうと正確に判断出来るのでは無い
  • 病気の経過について、何も処置しない場合のそれを、自然史または自然経過と言う
  • 自然経過には、技術的に発見可能になる点から症状が出るまでの期間がある
  • その期間をDPCPと言う
  • 処置によって予後を左右する点をクリティカルポイントと言う
  • 検診が有効であるには、DPCPにクリティカルポイントがなくてはならない
  • クリティカルポイントがDPCPより後にしか無ければ、症状が生じてからの処置で間に合うし検診しなくて良い
  • 処置の要不要は、処置そのものの要不要とDPCP発見の要不要を分けて考えるべき
  • 処置は必要だがDPCPで見つけなくても良い、という場合がある
  • 処置が必要だしDPCPで見つけると更に寿命が延びる、という場合がある
  • DPCPで見つければ、DPCPより後で見つけるより寿命が延びるのなら、それは検診が有効であるのを意味する
  • 過剰診断された病気を処置する事を過剰処置と言う
  • 過剰処置は手術等も含まれるため、場合により大きな侵襲を伴う
  • 過剰診断は便益と両立しないため、その後に続く過剰処置は丸ごと、受ける意味の無い害である
  • 過剰処置が無いからと言って過剰診断の害が無いとは言えない
  • 過剰診断には病悩期間延伸に付随する害が生じ得る
  • 無症状時に転移や浸潤のある事は、過剰診断で無いのをすぐに意味しない
  • 検診発見後に転移や再発の認められる事は、検診がそれらを防げなかったのを示唆する
  • 検診発見後に転移や再発の認められる事は、発見時に既に転移していたのを示唆する
  • 再発は症状発現を意味しない
  • リンパ節転移がクリティカルポイントとは限らない

鈴木眞一氏は誤診の意味で《過剰診断》を使っていない

過剰診断の語について、2021年の『日本内分泌・甲状腺外科学会雑誌』において、その用法を問う特別寄稿が病理方面の専門家から出された事が以前話題になりました。

www.jstage.jst.go.jp

その寄稿で提言されたのは、次のような内容です(私が以前書いた後述の記事より採録)。

  • 病理医は過剰診断を誤診の意味で用いてきた
  • その定義にしたがい、病理診断コンセンサス会議のメンバーは、過剰診断と過剰治療の症例は無かったと報告した
  • 福島における検診を過剰診断と指摘する主張がある
  • その主張は疫学的な意味における過剰診断を強調するものである
  • 病理医の立場から、これを過剰診断と呼ぶのは不適切であり、過剰検査と呼ぶべきである

つまり、病理医が以前よりおこなってきた、過剰診断は誤診の意味として用いるのを踏襲し、いま疫学方面で用いているような概念については、過剰診断では無く過剰検査等の語を充てるべきだ、という事です。

この寄稿については、twitterなどで話題になり、色々の意見が寄せられました。病理方面の人が過剰診断と言った場合は誤診を指していたのだ、と断じてこれまでの主張を解釈し直すものや、そう提言していてもやはり多義的に用いているとしか思えない、といった意見などです。一例として、内科医の名取宏氏の検討を挙げておきます。

natrom.hatenablog.com

このような経緯があったのですが、最近、同じ雑誌で震災後10年を経た福島での甲状腺検査についてなる特集が組まれ、その中で、件の寄稿の著者の1人でもある鈴木眞一氏の論考が掲載されました。その題は福島での超音波検査の立ち上げについてというものです。

www.jstage.jst.go.jp

鈴木氏は寄稿の著者の1人であり、当然その内容、つまり、過剰診断は誤診の意味で用いるべきであるとの提言に賛同していると考えられます。しかるに鈴木氏は、いま挙げた最新の論考において、

誤診の意味で過剰診断を使っていない

事が認められます。抄録から引用します。

本検診としては第一に誤診を避ける精度管理と過剰診断を抑制する基準の遵守さらに受診者への配慮と保護者への十分な説明を心がけて実施した。

はっきり、誤診を避ける精度管理と過剰診断を抑制する基準の遵守と書かれています。つまり、

誤診と過剰診断を分けて表現している

のです。誤診の意味で過剰診断を用いるのなら、敢えて誤診と表現して過剰診断と分ける必要は、どこにもありません。また、5)検診方法のセクションには、

検診での甲状腺超音波検査の導入にあたり,第一に誤診を避ける精度管理,そして過剰診断を制御する精査基準の設定が重要と考えた。

と書いてあります。第一に誤診を避ける精度管理,そして過剰診断を制御する精査基準の設定が重要と書いてあり、やはり誤診と過剰診断を使い分けています。

ここだけ見ると、単に表記のぶれのようなものかも知れない、過剰診断を誤診の意味(病理医が過小診断と呼んできたほうで無い誤診に限定)で使っているのだろう、と言われるかも知れません。では、もう一箇所引用します。

過剰診断に最も関係のある生涯無害なラテント癌の発見を防ぐことができると判断した。

↑このように書いてあります。過剰診断に最も関係のある生涯無害なラテント癌とあります。これは明らかに、疫学で用いられる過剰診断、つまり

症状や死亡の原因にならない疾病を発見する

この意味合いを指しているのは明らかです。もし過剰診断を誤診の意味で使っているのだとしたら、置換しても意味は通るはずですが、実際にやってみると、

誤診に最も関係のある生涯無害なラテント癌

こうなります。生涯無害なラテント癌なのだから、誤診の話であるとすると意味が通りません。がんを見つける事を誤診と表現出来るとでもしなければ整合的な解釈は不能ですが、もちろんそんなはずはありません。

つまり、寄稿の著者の1人であり、福島の甲状腺がん検診に深く関わった立場である鈴木氏は、自身が著者として名を連ねている提言に整合しない用法を自らおこなっている、という訳です。

当該寄稿に対しては、私が以前、詳細に内容を検討し、寄稿の著者らが疫学上の議論を全く踏まえず、的を外した提言をしているのを指摘しました。

interdisciplinary.hateblo.jp

ここでは、鈴木氏の別の論考も検討し、鈴木氏が誤診以外の用法で過剰診断を使っている、という多義性を批判しましたが*1、今回採り上げた最新の論考でも、同じような使いかたをしているのが明らかになった、と言えるでしょう。それどころか、1文中に誤診と過剰診断の両方の語が出てくるという意味で、よりはっきりとした、と評する事が出来ます。

ちなみに、寄稿の別の著者である坂本氏も、新しいほうの特集でも、寄稿と同様の論考を提出しています。

www.jstage.jst.go.jp

診断の詳細を説明している所(これは説明として参考になります)以外の、過剰診断の用語に関する内容は、寄稿とだいたい同じです。

これは“病理診断に誤診がある”という意味にとらえられかねない表現であり,われわれ病理診断に携わる病理医,細胞診専門医にとっては憂慮すべき事態である。診断と検査の違いについての認識不足による用語と思われる。
たとえば過剰検査(overexamination, overtesting)など別な用語を用いることを希望したい

↑相変わらずこのような主張がおこなわれていますが、私が詳細に検討したように、全く疫学の議論を無視した的外れの提言のままである、と言えます。既にoverdiagnosisの語は広く専門的に用いられています。じゃあこれをどのように訳し日本語の用語を充てるべきなのでしょう。英語の用語自体を変更すべきと言うのですか? また、overtestingは既に別の概念に充てられた語です。そういう事情を全く無視し、過剰診断を病理診断における誤診の1つとして用いてきた立場の方がその使用の歴史は長い。と、ただ用法の古さを誇って持説の正当化を図っているに過ぎません。現状で広く使われているスタンダードの用法を無視するこのような姿勢は到底、科学的であるとは言えません。また、寄稿の著者の1人である鈴木氏が誤診の意味で過剰診断を使っていないのは、ここで明らかにした通りです。その事はいったいどのように説明するのでしょう。まずそこの整合性を問うべきではないでしょうか。

*1:私は、余剰発見の意味でのみ用いていると解釈しても矛盾は生じないと考えています。もしそうであれば、多義的ですら無い訳です