統計学のエキスパートでも間違う例

確率・統計の基礎

確率・統計の基礎

↑この本を読んでいたら、次のような文章がありました(引用は、第1刷のP18・19から。以下、強調は引用者による)。

検査で陽性であった人が疾患を持つ条件付き確率 \rm \displaystyle{Pr(D|+)} を検査の感度(sensitivity)という.
検査で陰性だった人が疾患を持たない条件付き確率 \rm \displaystyle{Pr(N|-)} を検査の特異度(specificity)という.

最近の検査の議論に触れた人、あるいは、私の記事を読んでくださっているかたならば、上記引用文が明らかに間違っている事は、お解りですよね。

実際の感度は(言葉遣いは本書に合わせます)、

疾患を持つ人が陽性になる条件付き確率

です。つまり、\rm \displaystyle{Pr(+|D)}です(※Dは疾患あり。+は陽性)。

同様に、特異度は、

疾患を持たない人が陰性になる条件付き確率

であって、\rm \displaystyle{Pr(-|N)}です(※Nは疾患無し。-は陰性)。

そして、引用文で示している概念を指す用語はそれぞれ、

感度としているもの
陽性適中度(陽性予測値)
特異度としているもの
陰性適中度(陰性予測値)

上記のようです。

実は、このちょっと前に、

この疾患の有無を調べる検査での陽性を\rm \displaystyle{+},陰性を\rm \displaystyle{-}で表し,\rm \displaystyle{Pr(+|D)=0.8}\rm \displaystyle{Pr(+|N)=0.1}であるとする.

と書かれているのです。この\rm \displaystyle{Pr(+|D)=0.8}が感度そのものですね。ちなみに、\rm \displaystyle{Pr(+|N)=0.1}は、誤陽性割合(偽陽性割合)なる指標です。

ここで言及した箇所は、確率の基本的な計算、条件付き確率の所です。しかし説明として間違っています。

この話の教訓は、

統計学のエキスパートであっても、それを応用する分野の知識(あるいは記述)が正確とは限らない

という事でしょう(著者の岩崎氏は、紛れもなく統計学の超エキスパートです⇒岩崎 学 (Manabu Iwasaki) - マイポータル - researchmap)。ここで、条件付き確率等は、もちろん確率論・統計学の基本である概念ですが、感度や特異度は、診断学や疫学・公衆衛生学等で用いられるものです。引用書では後者の意味の説明を間違ってしまっている訳ですね。
これ、確率・統計を勉強しようとしているが診断方面の知識には疎い人、が読んだとすれば、そういうものか(定義はそうなのか)、と読んで、間違って覚えてしまいかねません。

読む際にも書く際にも、こういう事にはなるだけ気をつけたい所です。