はてブ修正履歴――特異度の推測

2020年5月10日

[B!] ひかる(工学趣味)換気中(手洗だけでは不足) on Twitter: "https://t.co/5FvMdDGn89 岩手県の新型コロナウイルスPCR検査では特異度100%ということになります。 世界各国のPCR検査でも特異度99%以上という。 勝手に特異度99%にするのはおかしいです。なぜそん… https://t.co/STLyVndRNu"

東洋経済のページ見ていくつかの県の数値を入れて動かしてみたけど、特異度は99%付近かなとは思う。でも99.9%とかは現時点では言えない。日本全体で見ると、誤陽性が数千人いて感度70%くらいでも、特異度95%付近。

2020/05/09 00:52
b.hatena.ne.jp

東洋経済のページ見ていくつかの県の数値を入れて動かしてみたけど、特異度は99%付近かなとは思う。でも99.9%とかは現時点では言えない。日本全体で見ると、誤陽性が数千人いて感度70%くらいでも、特異度95%付近。

このコメントを修正しました。

分母を検査人数にしていたので、これは明らかに、特異度の過小評価です。分母は検査数とすべきでした。確定時も退院時も合わせると、数回検査が実施される可能性があるので、累積の検査人数と累積の検査回数に、だいぶ隔たりがあります。

見るべき所を誤っており、不用意でした。

それを踏まえて推測し直すと、実績での特異度99.9%付近も射程に入ってくるかも知れません。

もちろん、誤陽性例は、未判明の部分もあるので設定が難しいですが、それでも、誤陽性を数千件などと仮定する合理的な理由は現在の所考えられません。

実績の資料からは(件数が多いから、集計が不正確な部分はあるでしょうが)、先日の記事でも書いたように、100%では無いが(100%未満であるのは判明している)、95%くらいと設定して良い理由は無いであろうと言えると思われますが、99%でも過小評価かも知れません。

toyokeizai.net

【メモ】検査性能指標の言い換え

精度

定義
  • 正判定総数÷総人口
  • (感度×保有割合)+(特異度×非保有割合)

正判定総数は、正陽性数+正陰性数

他の用語
  • 正診率
  • 正確度
  • 正解率
考察
  • そもそもaccuracyを精度と表現するのが良くない
  • 文献によっては正確度で、むしろそちらのほうが適切。精度はprecision
  • 統計学や誤差論の用語とぶつかる

別所で最近、感度と特異度の相加平均を精度と言っているのを見たけど、その量は、疫学や医療統計の文献では見た記憶が無い。分野によっては平均正解率なる指標。正解率平均のほうが良い気もする。

ブクマで見たのは、balanced accuracyなる表現。機械学習方面?で用いられるらしい。

感度と特異度をそれぞれ、保有と非保有を分母にした精度(正診率)と表現する場合がある(後述)。ややこしすぎる。何種類精度があるのか。

言い換え案
  • 正判定割合
  • 総正判定割合

感度

定義

正陽性数÷保有者数

他の用語
  • 有病正診率
  • 真陽性率
  • 精度(の一種)
考察

まず、保有か非保有での正判定の割合を精度や正診率と設定し、それぞれの部分での○○正診率、的に表現する。だから、精度の一つとしての感度、と看做す場合がある。正診率だと有病正診率。紛らわし過ぎ問題。 それだったら、陽性適中度を陽性正診率や陽性精度と表現するのか?

言い換え案

保有正判定割合

誤陰性割合

定義

誤陰性数÷保有者数

他の用語
考察

検査結果は診断とは限らないから、診の字は入れたく無い。判定で良い。確定診断の事を診断としたい場合などに不便だし、テストは診断とは限らない。他の指標にも言える。

言い換え案

保有誤判定割合

特異度・誤陽性割合

考察

感度・誤陰性割合にそれぞれ対応させる

言い換え案

保有正判定割合・非保有誤判定割合

陽性適中度

定義

正陽性数÷総陽性数

総陽性数は、正陽性数+誤陽性数

他の用語
  • 陽性予測値
  • 事後確率
  • 検査後確率
  • 適中の字が的中になる
考察

当たった程度を示すのに、予測値と表現するのはしっくりこない。しかし、PPVはその訳語に対応している。

事後確率・検査後確率の確率が、何の確率かちょっと解りにくい。陽性か陰性か。

言い換え案

陽性後保有割合

陰性適中度

考察

陽性適中度に対応

言い換え案

陰性後非保有割合

言い換え

当たり前ですけど、これは、用語をこのように変更して使うべきだ、て話では無く、説明や学習の際に、要するにこういう量だ、というのを、概念を語にそのまま反映させたかたちで表現して理解を助ける、との目的で作りました。

たとえば、検査数に占める陽性数の割合を、陽性率と表現しますけど(新型コロナウイルス関連でよく出ます)、それを含んだ用語が既にある(真陽性率・偽陽性率)訳で、ものすごく解りづらかったりします。分子も分母もそれぞれ違いますしね。だからたとえば、総陽性割合のような語にするほうが理解しやすいのではないか、と思うのです。

率と割合

率・比・割合は明確に分けたい所。

たとえば感度だと、その指標が割合だと判っていれば、陽性数÷保有数 の陽性数が正陽性数の事だと把握出来るけど(分子は分母の部分集合だから)、そうで無ければ、総陽性÷保有数 も指し得ます。だから、そこを明確にするために、正陽性数÷保有数 のようにする。

他の指標

割合は、比較的直感的に把握しやすく、語にも反映させやすいですが、割合で無い比(割合を比の一種とするなら)が出てくると、途端に難しくなります。オッズ、尤度比など。