統計学のエキスパートでも間違う例
↑この本を読んでいたら、次のような文章がありました(引用は、第1刷のP18・19から。以下、強調は引用者による)。
検査で陽性であった人が疾患を持つ条件付き確率 を検査の感度(sensitivity)という.
検査で陰性だった人が疾患を持たない条件付き確率 を検査の特異度(specificity)という.
最近の検査の議論に触れた人、あるいは、私の記事を読んでくださっているかたならば、上記引用文が明らかに間違っている事は、お解りですよね。
実際の感度は(言葉遣いは本書に合わせます)、
疾患を持つ人が陽性になる条件付き確率
です。つまり、です(※Dは疾患あり。+は陽性)。
同様に、特異度は、
疾患を持たない人が陰性になる条件付き確率
であって、です(※Nは疾患無し。-は陰性)。
そして、引用文で示している概念を指す用語はそれぞれ、
- 感度としているもの
- 陽性適中度(陽性予測値)
- 特異度としているもの
- 陰性適中度(陰性予測値)
上記のようです。
実は、このちょっと前に、
この疾患の有無を調べる検査での陽性を,陰性をで表し,,であるとする.
と書かれているのです。このが感度そのものですね。ちなみに、は、誤陽性割合(偽陽性割合)なる指標です。
ここで言及した箇所は、確率の基本的な計算、条件付き確率の所です。しかし説明として間違っています。
この話の教訓は、
統計学のエキスパートであっても、それを応用する分野の知識(あるいは記述)が正確とは限らない
という事でしょう(著者の岩崎氏は、紛れもなく統計学の超エキスパートです⇒岩崎 学 (Manabu Iwasaki) - マイポータル - researchmap)。ここで、条件付き確率等は、もちろん確率論・統計学の基本である概念ですが、感度や特異度は、診断学や疫学・公衆衛生学等で用いられるものです。引用書では後者の意味の説明を間違ってしまっている訳ですね。
これ、確率・統計を勉強しようとしているが診断方面の知識には疎い人、が読んだとすれば、そういうものか(定義はそうなのか)、と読んで、間違って覚えてしまいかねません。
読む際にも書く際にも、こういう事にはなるだけ気をつけたい所です。