偽陽性問題を解く―其ノ壱

問題

陽性陰性の話の続きです。
佐藤吉宗先生の統計学入門(1)−偽陽性問題− - Togetter
専門家がこうして練習問題と出題を出して下さるのはありがたい事です。
さて、例のごとく、これを図を用いて解いてみます。
まず、出題は次のようです(出題関連のつぶやきを2つ繋げた)。

【問題】 人口の5%がある病気に罹っているとします。この病気に罹っているかどうかを確かめる検査があるのですが完全なものではなく、病気に実際に罹っている人が受けると90%の確率で陽性となり、病気に罹っていない人が受けると90%の確率で陰性と出ます。(続く…)
(続き)【質問1】 ある人がこの検査を受けてみると陽性と出ました。この人が実際に病気にかかっている確率はどれだけですか? 【質問2】 ある人がこの検査を受けてみると陰性と出ました。この人が実際に病気にかかっていない確率はどれだけですか?

ここで得られた情報は、

  • 人口の5%が病気に罹っている。
  • 病気の人が検査を受けると90%が陽性になる。
  • 病気が無い人が検査を受けると90%が陰性になる。

というもので、問い(質問1)は、
ある人が検査を受けて陽性になった時、その人が実際に病気に罹っている確率は?
です。

全体の分割

まず、前提を確認します。

  • 検査を受ける人は、ある病気を持つか持たないかである。
  • 検査を受けた人は、陽性か陰性になる。

次に、全体を図で示します(大きな図はクリックで見られます)。

この緑の部分が、検査を受けた全体の集まりであるとします。
出題の情報より、
人口の5%が病気に罹っている
事が解っています。という事は、全体を

  • 病気あり
  • 病気無し

に分割出来ます。図では次のようになります。

これは、左側が病気無し、右側が病気ありです。人口の5%が病気であるという事は、人口の95%は病気無しなので、図の面積を、95:5に分割しました。

病気あり・病気無しの割合

今、図を分割しました。次には、それぞれの部分の割合を考えます。
当然その割合は、

  • 病気無し――95/100
  • 病気あり――5/100

です。で、この割合は、全体を基準にした割合です。ですから、人数で考えると、

  • 病気無し――0.95×全体
  • 病気あり――0.05×全体

となります。

非有病者

これから、分割したそれぞれの部分について考えます。まずは、病気を持たない人の部分です。図で表すと次のようになります。

出題の条件から、
病気が無い人が検査を受けると90%が陰性になる。
事が解っているので、

  • 陽性
  • 陰性

とで塗り分けます。図で表すと、

こうです。今までのエントリーと同じく、陽性で、陰性で表しています。
次は、
病気を持たない人における割合
を考えます。次の図をご覧下さい。

これは、出題の条件を反映させたものです。つまり、

  • 10%が陽性
  • 90%が陰性

という条件。90%が陰性になるという事は当然、残り10%は陽性である訳ですね。
さて、ここで注意する所があります。それは、ここでの割合は、
病気無しの人を基準にした割合
であるという所です。という事はです。
病気が無い人の内の陽性
を出題条件の10%で表すと、
0.1×病気無しの部分
となるのです。
そりゃそうだ、と思われますか? この、何を基準にした割合か、という所を押さえておかないと、こういう問題の時にはとても混乱します。
まとめておくと、

  • 病気無しで陽性
  • 病気無しで陰性

のそれぞれの量を割合を用いて表すと、

  • 0.1×病気無しの部分
  • 0.9×病気無しの部分

となります。

有病者

次は病気を持つ人にクローズアップします。

この部分ですね。そしてこれを、陽性・陰性に色分けします。

更に、出題の
病気の人が検査を受けると90%が陽性になる。
という所を加味すると、

このように表されます。そして、病気を持たない人の時と同じ注意です。つまり、ここにある割合は、
病気ありの人を基準にした割合
です。ですから、

  • 病気ありで陽性
  • 病気ありで陰性

のそれぞれの量を割合を用いて表すと、

  • 0.9×病気ありの部分
  • 0.1×病気ありの部分

となります。

分母

私達の問題を今一度確認しましょう。それは、
ある人が検査を受けて陽性になった時、その人が実際に病気に罹っている確率は?
というものです。ここで確率割合と読み替えます。そうすると、分子と分母が何かを考える必要があります。問題は、ある人が検査を受けて陽性になった時ですので、分母は、
陽性になった人の総数
です。という事は、その分母は、

  • 病気無しで陽性
  • 病気ありで陽性

を足し合わせたものであると言えます。再び図を示すと、


この赤い部分を合わせたものが分母です。
さて、赤い部分の量はどのようにして表したでしょうか。

  • 病気無しで陽性――0.1×病気無しの部分
  • 病気ありで陽性――0.9×病気ありの部分

こうでした。では、この

  • 病気無しの部分
  • 病気ありの部分

はどのように計算したでしょうか。次のようでしたね。

  • 0.95×全体
  • 0.05×全体

これを、赤い部分を計算した式に組み込みます。するとこうなります。

  • 病気無しで陽性――0.1×0.95×全体
  • 病気ありで陽性――0.9×0.05×全体

これを、考えの流れに沿うような順序で書き直すと、

  • 病気無しで陽性――全体×0.95×0.1
  • 病気ありで陽性――全体×0.05×0.9

こう書けます。これを言葉で書けば、

  • 病気無しで陽性――全体の内95%の内10%
  • 病気ありで陽性――全体の内5%の内90%

とでもなるでしょうか。いかにもややこしいですね。直感的には、「全体の半分の半分」→「全体の内50%の内50%」「全体×0.5×0.5」→「0.25」→「25%」というようにやれば解りやすいかも知れません。
今求めた分母を図示すると、次のようになるでしょう。

つまり、

  • 病気無しで陽性――全体×0.95×0.1
  • 病気ありで陽性――全体×0.05×0.9

この2つを足しあわせたものです。

分子

問題には、
その人が実際に病気に罹っている確率は?
とあります。陽性の人の内、実際に病気に罹っているのは、という事ですから、
病気ありかつ陽性
が分子になります。つまり、

この赤い部分です。そして、分母の計算の所で考えたように、分子の量は、
病気ありで陽性――全体×0.05×0.9
こう表されます。

分数・割合

これで準備が整いました。私達が求めるのは割合で、分母も分子も明らかになりました。後は計算すれば良い。
けれどその前に、その割合を図で表してみましょう。

こうです。下半分にあるのが、
陽性全体
で、上半分にあるのが、
病気ありかつ陽性
です。これが割合を表現しています。そして、これまでの考察で、

  • 分子:全体×0.05×0.9
  • 分母:全体×0.95×0.1 + 全体×0.05×0.9

このように判明しているので、後はこの分数を求めれば完了です。
全体×0.045
─────────────
全体×(0.095 + 0.045)

0.045
──────────
0.14

0.045 / 0.14 = 0.321
となりました。