《基準》の性能

感度や特異度の話を解っている前提です。

指標はいつものこちらを↓

screening.iaigiri.com

新型コロナウイルス感染症の検査について議論する際、検査性能を評価する各種指標を理解するのが重要だ、というのは、私も前の記事で触れた通りです(主旨は、過剰診断の誤用の話でしたが)。実際、もう非専門家にも理解必須の話、だと思います(検診の議論にも関わるから)。

で、その流れで、

PCR検査は感度も特異度も高く無い

的な話をしている人がいました(例:室月淳@集英社新書「出生前診断の現場から」17日発売 on Twitter: "新型コロナウイルスの検査は重症者のみという行政の方針は医学的にはまったく正しい。PCRの感度特異度は高くなく、これをローリスクの対象者に行えば大混乱となります。しかしこのことは一般のひとの直感に反するためなかなか理解されません。検査は不安をなくするために行われるものではないのです。")。でも、今流行中のウイルスの検査に関して、感度や特異度を評価するのって、すごく難しいのです。なぜなら、

その検査自体が基準

であるから。

検査の性能は、ある属性を有しているかどうかが解っている対象を基準にして評価します(検診などでは別の評価法があります)。その基準を、ゴールドスタンダード(至適基準)参照基準と言います。

で、新型コロナウイルス感染症(ウイルス保持)の基準はといえば、それは、今考えている検査法(RT-PCR法)そのものです。RT-PCRの結果が陽性の場合に、ウイルス保有の確定診断とする訳ですから(参考:【PDF】https://www.naika.or.jp/jsim_wp/wp-content/uploads/2020/02/Novel-coronavirus-COVID-19-disease.pdf)。

そう考えると、RT-PCR検査の性能を、RT-PCR検査の結果を基準にして評価する、となります。ややこしい話ですが、そもそも対象が新興感染症であり、実態が未知のウイルスなので、そういう困難さがある訳です。

調べてみると、RT-PCRの感度は、複数回検査をおこなって陽性となったものを参照基準として、初回の感度を評価したり、という事がおこなわれているようです。

それで、感度はまだ解りますが、じゃあ特異度はどうやって評価しましょう。その検査で陽性が確定診断なのですから、そこから考えれば、特異度は1のはずです。でも、実際にそうであるかは何とも言えません。真に保有しているかは判らないのですから(判らないから検査をする)。

考えかたとしては、よく実態が研究され実態が知られている他のウイルスに対するRT-PCRにおける特異度を参照する、といった見かたもあるでしょうが、それにも限界があります。だって、今考えているのは、未知のウイルスなのだから。

そういう訳で、感度はまだしも(臨床状態によって感度が変化する、といった見立てが出来る)、特異度が高く無いなどと評価するのは、非常に難しいはずです。であるから、検査数が増えたら誤陽性も増えていく、との主張は、一般論としては言えても、定量的な評価には、相当慎重になる必要があります。

というような事を考えていたら、公衆衛生学者の中澤港氏が、同じような所について、注意喚起なさっていました。

minato.sip21c.org

ところが,COVID-19をリアルタイムRT-PCRで検査するという方法は,確定診断の手段なので,原理的に,既に確定診断がついている患者群を検査することができない。従って感度も特異度も求められない。リアルタイムRT-PCRで2019-nCoVが検出されたらCOVID-19の患者と判定され,検出されなかったらCOVID-19の患者ではないと判定されるのだから,無理矢理計算すれば,感度も特異度も100%になるはずである。症例定義の要件に含まれる検査項目について感度や特異度を考えることは原理的にはおかしい。

ではなぜ,感度が30%から50%だとか,特異度が90%とか99%と言われるのかといえば,時間をおいて何度か検査すると,最初陰性だった人が陽性になる場合が多々あることから,本当は感染していたのに最初はそれを検出できなかったと推論するからだろう。しかし,1回目に測ったときは本当に感染していなくて,後で感染したのかもしれない,という可能性も同等に存在するので,この推論は万全ではない。厳密な感度や特異度は,後付けでは計算できない。もちろん,その推論が正しい可能性もあるが。

↑主旨はこの辺り。こういう所をちゃんと考えておく必要があります。実際、私もこの部分を考えて、論文等の資料を調べたり、ここに言及する意見を探したりしましたが、疑問を持つ人自体がそんなにいないし、疑問を投げる人がいても、そこに対する答えが書かれているものは、ほとんど見られませんでした。基本の検査性能の話まではしても、突っ込んだ所にはあまり注意がいかないし、それをしっかり説明出来る人も、そんなにいないという事なのでしょう。

参考資料:

www.niid.go.jp

国立感染症研究所の資料

twitter.com

↑私と同じ疑問を持った医師が、同じく医師である名郷直樹氏に質問したものへの答え。この医師のかた、幾人かの専門家に質問していて、答えていたのが名郷氏くらいでした(見落としあるかも)。

https://pubs.rsna.org/doi/10.1148/radiol.2020200432pubs.rsna.org

新型コロナウイルス感染症に対する胸部CTの感度を評価した論文。ここに、RT-PCR自体の感度を評価した手順が載っています。

※当該研究について、日本の専門家集団の評価は慎重です↓

jcr.or.jp