高野徹氏による余剰発見(過剰診断)割合の《推計》について──推計になどなっていない

先日、当ブログにおいて、こどもを甲状腺がんの過剰診断から守る医師の会に質問を投げかけました。

↓質問先の会のtwitter

twitter.com

↓質問した記事

interdisciplinary.hateblo.jp

そこでおこなった質問を再掲します。

  • 福島での集団甲状腺がん検診において、overdiagnosisはどのくらいの割合であると考えていますか
  • その割合の推計は、どのような証拠によって支持されますか
  • 高野が著書『福島の甲状腺検査と過剰診断 子どもたちのために何ができるか』のあとがきに書いた、。そして、福島の子どもたちに起こっているのは間違いなく過剰診断であり、それ以外である可能性はありません。との主張は妥当ですか

この質問に対しリアクションがあり、余剰発見の割合については、高野徹氏が論考を提示すると予告されていました↓

interdisciplinary.hateblo.jp

そして本日、高野氏のウェブサイトにおいて、福島の子どもの甲状がん、過剰診断の割合は?と題した論考が上げられました↓

www.med.osaka-u.ac.jp

高野氏は、福島において余剰発見の割合が高いと主張する論者の一人であり、その論考は重要なものと位置づけられますので、本記事では高野氏の論考について、詳しく検討します。高野氏の論考はセクションに分かれていますので、言及の際には、セクション1、セクション2…というように表現し、また、強調は引用者によってほどこされます。

セクション1

まず過剰診断の定義がなされます。過剰診断とは一生無症状のがんを診断してしまうことです。とありますが、正確に書くと、自然史(何も処置をしなければ)ではです。直近に議論を起こした、誤診との区別などの話もありますので、私は余剰発見と表現します。

海外の方々を含め、多くの専門家は福島の若年者で見つかっている甲状腺がんの大部分は過剰診断であると認識しています。具体的な数字を聞くと、”9割がた”という意見がほとんどではないかと思います(ただし、福島やチェルノブイリでの甲状腺検査に関わった方々、すなわち当事者の意見は除きます)。

意見を支持する証拠が提示されていません。

  • 多くの専門家←どのくらいですか?
  • ”9割がた”という意見がほとんどではないか←憶測に過ぎません
これらの事実をもってすれば、未成年で超音波検査をしてたまたま小さな甲状腺がんをみつけてしまった場合は過剰診断の割合が圧倒的に多い、という以外の結論はまず出てこないのです。

成人において発見された甲状腺がんについて、韓国での余剰発見割合が90%程度との推計はあります(Thyroid Cancer Screening (PDQ®)–Health Professional Version - National Cancer Institute)が、20歳未満に関するものはありません。20歳未満での自然史が不明であって、これまで検診を大規模におこなってきた実績が無いからその割合を検討するのが難しい所が重要なのに、成人で見つかったものは20歳未満で発生したものであろう、などという理由で過剰診断の割合が圧倒的に多い、という以外の結論はまず出てこないと評価する事はできません。これがたとえば、

  • 余剰発見の割合が高いとしてもデータと矛盾しない
  • 余剰発見割合が高いと考えてもデータを説明できる

こういった言い回しであれば同意できる所ですが、そうはなっていません。なお、ここで便宜上、割合が高いを、高野氏の主張や韓国の推計を鑑み、90%程度としておきます。

セクション2

ただし、もう少し具体的に数字を詰めようと思うとたちまち困難にぶつかります。それをどのように数え上げるか、となると、たまたま甲状腺がんが見つかった患者を治療せずに一生観察するしかないわけで、そのようなことは非常に困難です。

誤っています。一般に、がん検診における余剰発見割合を推計する場合、

  • RCTをおこなって、検診群と非検診群における発見割合の差を出す
  • 検診をおこなった地域とおこなっていない地域で比較し、割合の差を出す
  • 時系列的検討をおこない、検診をおこなわない場合の期待発見割合を見出し、実発見割合との差を出す
  • モデル化やシミュレーションをおこない、各種指標の割合を算出する

これらの方法が採られます。アプローチとしては、リードタイムアプローチと超過発生率アプローチに分けられる事もあります。余剰発見推計の方法的な説明や整理をおこなったものとして、たとえば下記があります。

たまたま甲状腺がんが見つかった患者を治療せずに一生観察するしかないと、倫理的に実施不可能な方法でしか推計できないのであれば、あらゆる がん検診について、余剰発見割合の推計も不能となります。他のがんで言えば、乳がんなどは、かなり余剰発見割合の推計が進められ議論されています。その議論を知っていれば、引用文のような主張が出てくるはずはありません。甲状腺がん検診の実情では、と返されるかも知れませんが、それは通用しません。甲状腺がんが見つかった患者を治療せずに一生観察するしかないなどと、実施不可能で仮定以外の何ものでも無い想定をして、しかないと言っているのですから。

これらより、高野氏はそもそも、がん検診における余剰発見割合について、疫学研究の実際を知らない事が示唆されます。知見を押さえてそれに基づくのなら、そう書けば良いのですから。

セクション3

がんの成長曲線に基づいて検討しています。ここで前提しているのは、

がんの成長を示すデータで余剰発見を説明できる

という事です。もう少し詳しく書けば、

がん研究一般では、自然史がよく解らないから様々な方法によって余剰発見を推計しているのに、甲状腺がん検診における余剰発見割合を、成長曲線のデータだけで説明できるとしている

のを意味し、更に言えば、

がん検診の余剰発見割合推計のスタンダードに全くしたがっていない

と看做せます。乳がん検診ではRCTがありますが甲状腺がん検診には無いため(将来もおこなえない)、当然RCTに基づく推計は不可能ですが、他の方法として、先にも挙げたように、検診をおこなわない場合の期待発見割合を見出して、それと実際の発見割合との差を出して推計する、といったような事があります。韓国での発見がん(検診発見がんではありません)の内90%くらいが余剰発見であろうとの推計は、このような方法でおこなわれています。もちろんこれは、記述統計的調査データに基づいた研究ですので、様々のバイアスが入り込む可能性があるのを念頭に置かねばなりません。

高野氏は、上記のような検討もおこなっておらず、ただ成長曲線で見出されたデータから、集団検診という医療介入の結果としての余剰発見割合まで補外して見当をつけています。つまり、

余剰発見割合が高いと言えるように理論的考察をおこなっている

に過ぎません。このような立論から余剰発見割合を云々できるのであれば、乳がん検診や前立腺がん検診における余剰発見割合の推計について議論が巻き起こる事などあるはずもありません。話は遥かに簡単になるでしょう。

もしそれらの議論と異なり、甲状腺がん検診の場合は、他の検診の議論を踏襲しなくても良いと主張するのであれば、その根拠をしっかりと示すべきでしょう。当然、他のがんに較べても特殊な自然史ではないかと考えられる(転移等の特徴による予後の予測が複雑であるなど)甲状腺がんに対する検診でなぜそれが言えるのか、を説明できる強い証拠が必要とされます。

セクション4

この推計は極めてシンプルな方法で導きだしたもので、ここから大きく外れることはないと考えています。

前段と後段がつながっていません。方法的にシンプルか否かと推測(予測や推計)が適切なものであるかは違う話だからです。

まず、遠隔転移については諸外国でも甲状腺超音波検査の導入後、遠隔転移の率は増加傾向にあり、これについては我々が「遠隔転移についても過剰診断があり、それが見つかるようになったのが原因だ」との論文を発表しています(文献3)。特に反論はでていませんので、これも国際的に認められている見解と解釈してもらっても良いでしょう。

これより前にも似た主張が出てきますが、特に反論はでていませんので、これも国際的に認められている見解と解釈してもらっても良いとの意見は、単純に意味が解りません。学術的論争に限らず、日常的一般的な文脈で考えても、反論が出ていないので認められる、というのがどう導かれるのか不明です。科学の文脈であれば、追試等で新たにデータが得られた事で学説としてより頑健なものと看做される、のような意見であれば解りますが(あまり深く立ち入ると、科学哲学や科学社会学の議論になるでしょう)。

無症状時に見つけたのなら遠隔転移例であっても余剰発見の可能性は否定できないのは、論理的に妥当です。発見時にどちらであるかを決めるのは不可能であるからです。しかしだからといって、そこからは、無症状時に発見された遠隔転移例がどのくらいの確率で余剰発見か、をすぐに導く事はできません。

ここで論考を示します。

https://acsjournals.onlinelibrary.wiley.com/doi/10.1002/cncr.32425

これは、MidorikawaらやTakanoによる甲状腺がん自然史に関する主張、への反論です。著者は、甲状腺がん検診が余剰発見を惹き起こす事に懸念をいだいているという意味では軌を一にしていますが、しかし、遠隔転移例の解釈については立場が違っており、この論考はそれを強調・指摘するものです。引用します。

However, the large and significant increase in distant differentiated thyroid cancer (ie, disease with extracervical metastases) is incompatible with overdiagnosis being the only factor contributing to the increased incidence of thyroid cancer. Takano suggested that even metastatic thyroid cancer could be overdiagnosed in pediatric patients because cancer cells are likely to stop proliferation after metastasis. However, the survival of patients with pediatric thyroid cancer is worse in the presence of distant metastases, and US guidelines recommend aggressive treatment, namely surgery combined with radioactive iodine. Although a critical evaluation of current guidelines may be warranted to ensure that these patients are not being subjected unnecessarily to treatment-related risks, we disagree that overdiagnosis applies to metastatic differentiated thyroid cancer. The significant increase in pediatric thyroid cancers with regional invasion is more difficult to interpret because these include cases with minimal cervical lymph node involvement that will not become more aggressive and those with significant cervical lymph node involvement that may become more aggressive.

参考に、翻訳サイトで翻訳した文章を引用のかたちで示します。

しかしながら,遠位分化型甲状腺癌(すなわち、子宮頸部外転移を伴う疾患)の大きく有意な増加は,過剰診断が甲状腺癌の発生率増加に寄与する唯一の因子であることと矛盾する。高野教授は、転移性甲状腺癌であっても、小児患者では癌細胞が転移後に増殖を停止する可能性が高いため、過剰診断が可能であることを示唆した。しかしながら,小児甲状腺癌患者の生存率は,遠隔転移が存在する場合に悪化し,米国のガイドラインは,積極的な治療,すなわち,放射性ヨウ素と併用した手術を推奨している。これらの患者が治療関連リスクに不必要にさらされていないことを保証するために、現行のガイドラインの批判的評価が正当化されるかもしれないが、転移性分化型甲状腺癌に過剰診断が適用されることには同意しない。所属リンパ節浸潤を伴う小児甲状腺がんの有意な増加は、より侵攻性にならない最小限の頸部リンパ節転移を認める症例およびより侵攻性になりうる有意な頸部リンパ節転移を認める症例を含むため、解釈がより困難である。お試し翻訳|AI自動翻訳『みらい翻訳』
しかし、遠隔分化型甲状腺癌(すなわち頸部外転移を伴う疾患)の大幅な増加は、過剰診断だけが甲状腺癌の発生率増加の要因であることとは矛盾する。高野は、転移したがん細胞は増殖を止める可能性が高いため、小児では転移性甲状腺がんであっても過剰診断になる可能性があると指摘した。しかし、小児甲状腺がんは遠隔転移があると生存率が悪く、米国のガイドラインでは、手術と放射性ヨウ素の併用という積極的な治療が推奨されています。これらの患者が不必要に治療に関連したリスクにさらされていないことを確認するために、現在のガイドラインを批判的に評価することは正当化されるかもしれないが、我々は過剰診断が転移性分化型甲状腺癌に当てはまるということには同意しない。局所浸潤を伴う小児甲状腺癌の著しい増加については、頸部リンパ節への浸潤が少なく侵襲性が高まらない症例と、頸部リンパ節への浸潤が大きく侵襲性が高まる可能性のある症例が含まれているため、解釈がより困難である。www.DeepL.com/Translator(無料版)で翻訳しました。DeepL Translate: The world's most accurate translator

つまり、転移しても余剰発見になる可能性があるという一般論的な説自体はともかく、遠隔転移例にまでそれを適用する事に慎重になったほうが良い、との意見表明と捉えられるでしょう。

後半では、

これはもちろん、「再発の過剰診断」である可能性もありますが、穿刺吸引細胞診によってがん細胞を散らしてしまうことで、結果として寝た子を起こしている可能性もあるのです。

このように、細胞診の操作自体が がんを広げる(再発という現象を来す)可能性を示唆しています(穿刺経路播種)。しかし、もちろん理論的にはそれが起こっている可能性はありますが、現段階で敢えて取り立てて指摘できるようなものではありません。つまり、

  • 理論的に起こり得る
  • 起こる程度を定量的に評価する

この違いを押さえておくべきです。試しにPubMedにて、needle tract seeding thyroidを組み合わせたクエリで検索しましたが、症例報告などはいくつかあるものの、定量的にその割合を検討したものには乏しいようです。

pubmed.ncbi.nlm.nih.gov

J-STAGEでの検索結果

www.jstage.jst.go.jp

リスクが低くても、規模が大きくなれば人口に対する割合が大きくなってしまう、という意味での懸念は持っておくべきでしょうが、量的評価の少ない現象の危険を指摘するには注意が必要です。

セクション5

前半は、術後の経過をなるべく正確に把握する事の重要性が訴えられており、ここには同意する所です。もちろん、

  • 定量的な評価をバイアス少なくおこなう目的に用いる
  • 当事者のプライバシーに配慮して

これら条件がクリアされるべきなのは、言うまでもありません。

後半では、検診を受けていない人びとの経過を把握する重要さが言われます。これは強く同意します。プライバシーへの配慮をおこなう事、なるべく正確に把握するのが肝腎なのは当然です。

余剰発見推計の方法の所で書きましたが、そういう推計は、集団同士を比較する事が極めて重要です。RCTは、確率的に集団を割り付けてなるべく同質な集団を作り出し、その上で発見割合の違いを見出します。そして、それができない場合には、検診した群としていない群とを後から比較する方法があります。その場合、RCTと同じく、検診したとの条件以外はなるべく同じような集団になっている必要があります。中には、他地域との比較を主張する人もいますが、他の地域という事は、検診受検の有無のみならず、別の様々の要因等が異なる可能性を持ちます。異なる地域での集団同士を比較するのを、生態学的研究や地域相関研究と言いますが、その研究で注意すべきなのは、着目している要因以外が揃わずに、着目している要因の効果等を見誤ってしまう事です。時系列研究の所でも触れましたが、そういう働きをバイアス(偏り)と言います。

その観点から、同じ県内において検診を受けた人と受けていない人とで比較するのは、RCT等の介入がおこなえない情況では最も重要と言えます。当然、同地域であっても、その中での分類(市町村等の地区)での違いは検討すべきですが、検診を受けていない集団全体における発見割合は最重要の証拠です。

推計

ここまで、高野氏の論考をセクションごとに検討しました。余剰発見推計に直接関係の無い記述もあり、そこも検討しましたが、推計部分に改めて着目しましょう。

さて、では実際に高野氏は、

余剰発見の割合を具体的にどの程度と見積もった

でしょう。ここまでの私の検討では触れませんでした。実は、セクション3の中にあります。引用します。

その他、さまざまな要因があるでしょうが、結論を大きく変えるようなものではないと思います。 まとめますと、福島の子どもたちに見つかった甲状腺がんにおける過剰診断の割合の推計値は95%超です。

過剰診断の割合の推計値は95%超と書かれています。これが、高野氏が示した余剰発見割合の数値です。

では、その根拠は何でしょう。と、探してみても、

何も無い

のです。実際に割合の検討をしようとしているのはセクション3ですが、そこでおこなっているのは、先に言及したように、単に成長曲線が云々の話だけです。たとえば、先行研究における推計例や、人口動態やがん登録のデータを用いて期待度数を算出してそれを福島の症例を比較するとか、モデル構築をおこなってリードタイムを推定し、それに照らし合わせるとか、各種パラメータを実データから当てはめ、他死因死亡のデータを生命表から出してきてマイクロシミュレーションをおこなっていくつかのパターンを示してみるとか、推定値を出して信頼区間を与えるとか、そういう事を

一切何もやっていない

のです。何も計算せずに95%と言っています。こんなものは、推計でも何でもありません。そこの計算は無理があるのではとか、そのパラメータの当てはめは的を外しているのではとか、そういう話ですらありません。計算自体をおこなっておらず、95%なる数値を算出した過程も何も無いではありませんか。検算も追試もできません。これは驚くべき事です。

先に示したように、乳がん検診などでは余剰発見推計の研究がいくつもあります。乳がん検診はRCTのおこなわれている検診です。そこでも単純に差を取れば良いというものではありません。何故なら、RCTをおこなったとしても、

  • 全員が死ぬまでフォローアップできない(フォローアップ期間の限定そのものと、センサーの発生)
  • アドヒアランス不良によってクロスオーバーが起こる(検診群だが検診を受けない人、非検診群だが検診を受ける人、が現れる)

これらの理由によってバイアスが生じ得るからです。だから、RCTのデータを元にして様々な調整をしたり、パラメータを設定してマイクロシミュレーションをおこなってパターンを分析してみたり、といった事が実施されます。そして、そのような検討をおこなってさえ、推計のばらつきは大きいのです。たとえば↓

www.ncbi.nlm.nih.gov

これは、なぜ乳がん検診の余剰発見推計において、その推定値が0%から50%のように大きくばらつくのか、との問いを検討した論文です。そこでは、比較的シンプルに推計しやすい神経芽細胞腫のマススクリーニングの議論から始まり、実際におこなわれた乳がん検診の例を検討しています。そこでは、アプローチのしかたが色々ある事、フォローアップ期間等の実際的な限界が重要である事などが検討されています。Conclusion部から引用します。

In conclusion, the estimation of overdiagnosis is a difficult exercise.

シミュレーションを用いた研究には次のようなものがあります。

https://journals.sagepub.com/doi/10.1177/0969141317733294

ここでは、乳がんの自然史についていくつかのモデルを構築し、それに基づいてマイクロシミュレーションをおこなって余剰発見割合を推計しています。自然史が不明な疾病について、モデル構築をおこなって色々のパラメータを入れてマイクロシミュレーションをおこなう事は、最近の研究でも多くなってきています。RCTも倫理的コスト的におこなえないので、今後も有力な方法となるでしょう。最近のシミュレーション研究の実態を調べたもの↓

bmcmedinformdecismak.biomedcentral.com

ここで重要なのは、

RCTがおこなわれている乳がん検診でさえも、マイクロシミュレーション等の、モデル構築やシミュレーションを実施して推計している

所です。最近の論文では、乳がん検診における余剰発見割合が、それまでの研究での推計よりも低いのではないか、とするものもあります。

consumer.healthday.com

以前には、余剰発見割合が30%くらい発生しているのではないか、との研究もありましたが、それは過大評価だったのだろうとする研究が最近は出てきています。たとえば、フォローアップ期間が長くなるほど余剰発見割合は少なくなる傾向があります。フォローアップ完了後でも、検診しない群での発見数が増えてくるからです。そういう事も考慮しながら評価しなくてはならないから、がん検診における余剰発見割合の推計は困難なのです。

高野氏が答えるべき重要の問い

高野氏による推計が、検診に関する疫学の先行研究を参照せず、何ら具体的な計算過程も示さず、推定の幅も出さずに95%などと数値を出し、それは結局の所推計などでは無い事を示しました。割合の推計がどうこうの話自体は、これで充分だろうと思いますが、ここで高野氏は、議論や主張の根幹に関わる次の質問に答える必要があります。それは、私が投げかけた3つの質問の内、最後に提示したものです。再掲します。

高野が著書『福島の甲状腺検査と過剰診断 子どもたちのために何ができるか』のあとがきに書いた、。そして、福島の子どもたちに起こっているのは間違いなく過剰診断であり、それ以外である可能性はありません。との主張は妥当ですか

これです。まず、高野氏が

全て余剰発見である

と読める記述をおこなった、という事実があります。過剰診断であり、それ以外である可能性はありません。と書いてあるので、他に読みようがありません。これは100%を意味します。だいたい100%とか、ほぼ100%とか、そういう日常的に表現されるようなものではありません。それ以外である可能性はありません。としているのだから、文字通りの100%です。ここで再度、その記述は妥当かと問います。

今回言及した高野氏の論考では、余剰発見の推計割合は95%(超)としています。それ自体に根拠が無い(質問2に答えられていない)のはここで措いて、高野氏は、著書では100%としか読めない記述をしています。つまり、ここで主張が不整合を起こしている訳です。注意深いかたは、私が投げかけた質問が全部連動していたのを読み取ってくださったと思いますが、もし質問3が妥当だと答えるのなら質問1は100%にしかできないし、質問1が100%未満であれば、質問3には妥当では無いと答えるしか無かったのです。実際、見落としで無ければ質問3への答えはありません。

改めて問います。

質問1の答えが95%超であるのなら、質問3への答えは妥当で無いとしかならないが、それで良いのか

以上です。