割合のはなし――陽性とか陰性とか
こんがらがる
診断の話をする時、陽性とか陰性とか、偽陽性とか陰性的中度とか、そういう馴染みの無い言葉が出てくる上に、特異度=d/(b+d) みたいな式がいきなり沢山あって、訳が解らなくなります。どの言葉が何を指しているのか掴み取れない。頭の中でグルグル回って、把握が困難です。
概念から
私が思うに、こういうものを考える時は、専門用語を憶える事は後回しにして、まずどのような概念があるかを押さえておくのが重要であります。用語を憶えて、その言葉が指す概念を当てはめていく、とやっていると、頭がパンクしてしまうので。
図示
こういうのは、図を手がかりにして憶えるのが良いですね。具体的なイメージを操作しつつ概念を把握していって、それを抽象化していくプロセスをとると。
件数と割合
この種の問題では、「件数」と「割合」が一緒に出てきます。ですから、今着目しているのが単なる件数なのか割合なのかをきちんと押さえる。そして、割合を考える時には、「基準となる量」、つまり「分母」が何であるかをつかむ必要があります。
試みる
ここでは、自分の勉強も兼ねて、今のような文脈で出てくる概念を、図を使いながら勉強しようと試みます。誤っている点や、改善すべき点があれば、ご指摘頂ければ幸いです。
件数
まず、件数そのものを考えます。
全体の数
最初に、対象全体の数を図示します。
四角形が全体を表します。ここで、
- 色で陽性/陰性 を分ける
- ○/× で病気のある/無し を分ける
事にします。そして、
- 陽性:赤
- 陰性:青
- ○:病気がある
- ×:病気が無い
と定義します。
こう考えると、この四角形に属する個人を考えた場合、その人は、2つの属性を持っている事になります。つまり、○/×かという属性と、赤か青かという属性の2つ。
病気ありの数
病気を持つ人は、○で表されます。ですから、○の総数が、病気ありの数です。
今は、検査を受けたら、という情況を考えているので、病気を持つ人には、
- 病気を持っており陽性
- 病気を持っており陰性
になる人がいます。ですので、○の総数は、
- ○かつ赤
- ○かつ青
を合わせたものとなります。
病気無しの数
これは、全体から病気ありの数を引いたものです。検査を受ける人は、病気を持っているか持っていないかのどちらなので、病気を持っていない人は、全体の数 - 病気ありの数 となります。図示します。
先に挙げた、病気ありの図を組み合わせると、過不足なく全体が埋まりますね。
この場合も、病気ありの数を考えた時と同様に、
- 病気を持っておらず陽性
- 病気を持っておらず陰性
によって構成されています。つまり、
- ×かつ赤
- ×かつ青
を合わせた数です。×の総数という事ですね。
陽性の数
ここでは、陽性とは赤になる事と定義しています。という事は、次の図で表されます。
これは、赤全体の数です。で、赤を構成するのは、
- 病気ありで赤
- 病気無しで赤
ですので、図中では、
- ○かつ赤
- ×かつ赤
を合わせたものです。
陰性の数
これも、陽性の時と同じく考えます。陰性は青で示しているので、
- 病気ありで青
- 病気無しで青
つまり、
- ○かつ青
- ×かつ青
を合わせたものです。図は
これです。上の、陽性の数の図と合わせてみて下さい。
ぴったりはまって、全体の四角形に一致しますね。四角形に属する人は、陽性か陰性かのいずれかに判定されるので、それを全部合わせれば、四角形全体に一致する、という寸法です。
陽性であり、病気ありの数
先ほどは、「赤全体の数」を考えました。陽性になる人全体だったからですね。今度は、「病気の人で陽性」の数を考えます。という事は、「○かつ赤」の数となります。図は
こうです。先ほどの陽性全体の数から、「病気無しで赤」つまり「×かつ赤」を除いたものです。図を並べると解りやすいでしょう。
左下の部分が×かつ赤なので、赤全体からそれを除いたものが、○かつ赤です。
陽性であり、病気無しの数
診断の目的の一つはもちろん、病気がある人を正しく陽性と判定する事です。けれどこういうものに間違いはつきもの。で、「陽性だが誤っている」場合を考えます。つまり、
- 陽性だけど、
- ×(病気が無い)
時です。陽性なのに病気が無いのだから、「赤かつ×」です。図はこうです。
これは、「陽性全体」から、「陽性かつ病気があり」の数を除いたものです。図を並べます。
陰性であり、病気ありの数
前は、病気が無いのに陽性となる場合を考えました。病気を持っていないのに検査で陽性となると、受けた人に過剰な不安を懐かせたりといったデメリットがあります。
今度は反対に、「病気があるのに陰性」となる場合です。病気があるのに陰性判定を受けると、病気が無いのだと安心して、適切な対処が遅れる、といったデメリットがあります。ですから、これにも着目する必要があります。
陰性(青)で病気がある(○)のだから、「青かつ○」の数となります。
これは当然、「陰性全体」から、「陰性かつ病気が無い(×)」を除いたものです。
割合
ここからは、割合の話になります。つまり、分数で考えます。ですから、何が基準の量(分母)であるかをきっちり把握する必要があります。
全体の内、病気がある人の割合
病気を持っている人の割合です。つまり、対象の人を全部調べたら、その内どれくらいが病気を持っているか、という観点。
ですから分数は、
病気がある人の数(○全体)
────────────────
全体の数
こうです。図で表すと次のようです。
全体はもちろん、全ての要素を集めたもので、それが分母です。そして分子は、病気がある人の数、つまり、
- ○かつ赤
- ○かつ青
を合わせたものです。
病気がある人の内、陽性の人の割合
病気がある人がちゃんと陽性になるようにする、というのが診断の性能の一つです。それが低いという事は、「病気があるのに陽性にならない(陰性になる)」のを意味し、「病気の見逃し」に繋がります。
病気がある人の内の、陽性の人の割合なので、分母は、「病気の人全体」です。つまり○の数。そして分子は、「赤かつ○」の数です。今考えている全体は、「○全体」ですから、分子には、○かつ赤か、○かつ青のいずれかしかありません(×は入れない)。そして、今考えているのは、病気がある人が正しく陽性になる割合なのですから、
○かつ赤
────────────────
病気がある人の数(○全体)
です。見出しでは、分子は単に「陽性の人」としていますが、これは、「病気があるという条件において」という事です。ですが、四角形全体を基準にすると、単に「陽性」ではありません。何故なら、単に陽性と言ったら、「×かつ赤」も入ってしまうからです。割合なので、分母に含まれないものが分子にあるといけない訳です。
従って、四角形全体を基準にした場合には、分子は「○かつ赤」と考えます。図にすると、
こうです。
病気が無い人の内、陰性の人の割合
今度は、病気が無い人がちゃんと陰性と判断されるか、という観点。ですので割合は、
×かつ青
───────────────
病気が無い人の数(×全体)
となります。これも先ほどと同じく、分子は、四角形全体を基準に考えると、病気が無く陰性と判断される人なので、×かつ青、という事です。図は
陽性の人の内、病気がある人の割合
ある検査を受けたら陽性判定を受けた。どうしよう、自分は重い病気の可能性が高いのではないか。こう不安になるでしょう。けれども、陽性である人全員が病気を持っている訳ではありません。前にも挙げたように、「病気を持たないが陽性になる」という誤りが起こり得るからです。
ですから、診断の性能を見る時、次のような割合を考えます。
○かつ赤
────────────────
陽性の人(赤全体)
分母は赤全体の数です。対して分子は、○(病気がある)かつ赤。先ほどから注意しているように、この分子は、四角形全体を基準と考えた場合には、「○かつ赤」です。単に「病気がある人」とすると、「病気があって陰性」の人、つまり「○かつ青」が入ってしまうからです。図示するとこう。
陰性の人の内、病気が無い人の割合
前とは逆に、陰性と解った場合に、実際に病気を持っていない人は、という割合です。この時には、
×かつ青
────────────────
陰性の人(青全体)
こうなります。図ではこうです。
あわてもの、ぼんやりもの
次の2つはちょっとややこしいです。把握しにくい。
病気が無いのに陽性になってしまう人の割合
病気を持っていないが陽性になってしまう、という事は先程も触れました。余計な心配をしたり、検査のコストや身体への負担もかかりますから、これが大きいのは問題です。ここで分子は、
×かつ赤
であるのはすぐに解ると思います。×は病気が無い、陽性は赤、だから、四角形全体を基準にしたら、×かつ赤となる。
次に分母ですが、これは、「病気が無い人」です。分数で表すと、
×かつ赤
───────────────
病気が無い人の数(×全体)
こうなり、図では
こうです。
品質管理等では、この種の誤りを、「あわてものの誤り」などと言います。何故でしょう。
それは、「あわてて、病気を持たない人を病気だと(つまり陽性と)判定してしまう」からです。何もしていない人を犯人として捕まえてしまう、というような喩えが用いられる場合もあります。
病気があるのに陰性になってしまう人の割合
勘の良い方は、もうお気付きかと思います。そうです、次に考えるのは、病気があるのに陰性となってしまう場合です。前に触れたように、病気を持っているのに陰性と判定されるのは、「見逃し」を意味します。
この場合には、割合の基準つまり分母は、「病気がある人」です。○の総数となります。そして分子は、「○かつ青」です。四角形を基準とすれば、単に陰性とするのでは無く、病気がある(つまり○である)という条件を加える必要がある、というのは前から書いている通りです。
このような誤りは、「ぼんやりものの誤り」などと言われます。それは、「ぼんやりして、病気を持つ人を病気が無いと(つまり陰性と)判定してしまう」事です。図は
表
これで、基本的に押さえておくものは紹介しました。ポイントは、件数と割合を区別して考え、割合を考える時には分母をきちんと捉える事、また、分子を、全ての集まりを基準として考える場合には、適切に条件を付加しておく必要がある、という所でしょうか。「割合」とは、分子が分母に含まれるものである、と憶えておくのが良いでしょう。
これまでは、一つ一つの指標について紹介してきましたが、この種のものは、表としてまとめて描くのも、把握の手助けとなるでしょう。たとえば次のようです。
各指標をリストで示すと以下のようになるでしょう。
- 全体の数:○+○+×+×
- 病気ありの数:○+○
- 病気無しの数:×+×
- 陽性の数:○+×
- 陰性の数:○+×
- 病気ありで陽性:○
- 病気無しで陽性:×
- 病気ありで陰性:○
- 病気無しで陰性:×
同じように、各割合をリストにします。
- ▼全体に対する、病気ありの割合
- ○+○
───────────
○+○+×+× - ▼病気ありに対する、陽性の割合
- ○
──────────
○+○ - ▼病気無しに対する、陰性の割合
- ×
──────────
×+× - ▼陽性全体に対する、病気ありの割合
- ○
──────────
○+× - ▼陰性全体に対する、病気無しの割合
- ×
──────────
○+× - ▼病気無しに対する、陽性――あわてもの――の割合
- ×
──────────
×+× - ▼病気ありに対する、陰性――あわてもの――の割合
- ○
──────────
○+○
専門用語
やっとここで、専門用語を導入します。と言っても、実は貼りつけた画像のタイトルに既に書いてあったのですが。以下、前節でのリストに付け加えてみましょう。
※注意事項としては
- 用語は色々な表現がある:たとえば、「陽性的中度」は、「陽性反応適中度」「陽性反応適中率」等、複数の表現があります。ここではその内の一つを選択しています。
- 「割合」:用語には、本来「割合」概念だが「率」が用いられる場合があります。ここでは、全て「割合」を用いています。
といった所でしょうか。概念を把握するのが先、というのは、このような、同じ概念を表す複数の用語が存在する、という事情も踏まえています。
- ▼有病割合(全体に対する、病気ありの割合)
- ○+○
───────────
○+○+×+× - ▼感度(病気ありに対する、真陽性の割合)
- ○
──────────
○+○ - ▼特異度(病気無しに対する、真陰性の割合)
- ×
──────────
×+× - ▼陽性的中度(陽性全体に対する、真陽性の割合)
- ○
──────────
○+× - ▼陰性的中度(陰性全体に対する、真陰性の割合)
- ×
──────────
○+× - ▼偽陽性割合(病気無しに対する、偽陽性(陽性――あわてもの)の割合)
- ×
──────────
×+× - ▼偽陰性割合(病気ありに対する、偽陰性(陰性――ぼんやりもの)の割合)
- ○
──────────
○+○
まとめ
この種の問題では普通、4種類(病気のある無し*陽性と陰性)の属性全てに別の記号(たとえば a, b, c, d)を与えて説明がなされます。けれども、それではとても把握しにくいと常々感じていました。
そこで、このエントリーでは、病気のある無しに○と×の文字記号を用い、陽性と陰性は色で分けて説明する、という事を試みました。その方が、直感的に把握しやすい場合があると考えたからです。こうすると、「おかしな割合」、つまり、分子が分母に含まれていない場合等に、視覚的にすぐ解るようにも思います。
色で、赤→陽性、青→陰性 としたのは、赤→注意、青→安全 といった諒解が社会的にあるだろうと考えたからです。信号機等もそうですね。
けれど、病気のある無しに○×を使うのは考えた所です。と言うのは、○というのは、肯定的な意味合いが与えられやすいから。病気があるのに○、というのはちょっとムズムズする感じもします。ただ、「当たり」が○で表現される事はよくあるので、そちらの直感を優先しました。
おまけ――NATROMさんのエントリーを見る
2013年3月23日追記:津田氏の物とされる資料がWEB上にアップされていて( http://pics.lockerz.com/s/287518502 )、それを見ると、「10%を(1 - 陽性的中度)」の事だと「断っている」ように見えます(つまり、「ここで言っているのは」という文脈)。もしそれが本当に津田氏の書いた資料であれば(詳細不明)、津田氏が間違っていたのでは無く、聞いた側が余計な情報を補ってしまった可能性があります。とすれば、ここ以降の、津田氏が誤りだという指摘は当たらない事になります。
このインタビューでは、偽陽性率が10%という話に続いて、「10%という割合は、これは100%引く陽性反応的中割合というかパーセントの数字なんですけれどもね。7というのは陽性例ですので、7×0.9で、確率的には6.3例癌である」と津田教授は述べている。しかし、偽陽性率から陽性反応的中割合は計算できない。偽陽性率は、「100%引く陽性反応的中割合」ではなく、「100%引く特異度」である。陽性反応的中割合は「特異度や偽陽性率とは全く性質の異なる指標である」
陽性反応的中割合と「100%引く偽陽性率」を取り違えた甲状腺癌数の - NATROMの日記
強調は外しました。ここでNATROMさんが指摘しているのは(用語はこのエントリーで使っているものに直します)、
という事です。今着目しているのは偽陽性割合なので、その割合を、先ほどの分数から引っ張ってきます。
×
──────────
×+×
で、「100%から何を引けば偽陽性割合になるか」と考えている訳ですね。分母は×+×ですから、
- 分母が同じで、
- 足しあわせれば分母と一致するような分子を持っている
ような分数を探せば良いと(100%とは、分子と分母が同じであるのを意味する)。で、それに対応するのは、×/(×+×)です。という事は、確かに特異度ですね。で、津田氏が言っている、「100%-陽性的中度」というのを考えると、まず陽性的中度は、○/(○+×)です。そして、これに足して1になる分数は、×/(○+×)です。これを言葉に直すと、「陽性(○+×)の内、偽陽性(×)の割合」となります。「病気無し(×+×)の内、偽陽性(×)の割合(偽陽性割合はこれ)」ではありませんね。