点の数と割合

乗法定理やベイズの定理周りの話がむつかしいのは、

  • 式に標本点と確率が混在している
  • 確率が何を表しているのかよく解らない
  • 確率の基準が解らない
  • 同時確率と条件つき確率の違いが解らない

等の理由があるように思いますね。オイラー図とかベン図とかで説明してあっても、ごっちゃになってさっぱり、と。
私は、この種の概念を説明する文を見る時、確率割合と読み替えると見通しがよくなるのではないかと考えます。試しに、ここら辺をかなり詳しく解説している良書であるホーエルの本でやってみると……

(略)これらの点の中で領域A2にも含まれる点が,A1とA2が両方とも起こることに対応する点である.それらはA1とA2の重複部分にある点である.n(A1)をA1内の点の数,n(A1 and A2)をA1とA2の両方に含まれる点の数とすれば,標本空間をA1内の点の集まりに限定したときのA2の起こる確率は,公式(2)からn(A1 and A2)/n(A1)で与えられる.この確率は,A1が起こったという条件のもとでA2が起こる確率,を意味するものにほかならない.このような条件つき確率を新しい記号P{A2|A1}で表わせば,
(4)
P{A2|A1} = n(A1 and A2) / n(A1).
ホーエル[著]浅井・村上[共訳]『原書第4版 初等統計学』P45・46

説明図はこちら↓

この文の確率割合に替えて……

(略)これらの点の中で領域A2にも含まれる点が,A1とA2が両方とも起こることに対応する点である.それらはA1とA2の重複部分にある点である.n(A1)をA1内の点の数,n(A1 and A2)をA1とA2の両方に含まれる点の数とすれば,標本空間をA1内の点の集まりに限定したときのA2の起こる割合は,公式(2)からn(A1 and A2)/n(A1)で与えられる.この割合は,A1が起こったという条件のもとでA2が起こる割合,を意味するものにほかならない.このような条件つき割合を新しい記号P{A2|A1}で表わせば,
(4)
P{A2|A1} = n(A1 and A2) / n(A1).

今考えているのは、図中の濃い網掛けの部分です。要するに、その部分をどう表現出来るかという事。で、その領域の名前を、A1かつA2:A1 and A2として表し、nを点の数、Pを割合として表す。そうすると、濃い網掛けの部分に属する点の数は、n(A1 and A2)と表現出来ますね。ここで点というのは標本点の事で、事象の最小単位。では割合はどう表すか。
割合というのは分数ですね。で、分子は分母に含まれているものであると。だから、割合を考える時には、何を基準にしているかを意識する必要があります。そして、ここで割合は、

  • 点の数で表す
  • 割合の掛け算で表す

という場合がありますね。
まず、A1 and A2が占める割合を、全体を基準として考え、点の数で表現すると、
A1 and A2に属する点の数 / 全体の点の数
となって――全体の事を(全)と表しましょうか――これに n をつけると、
n(A1 and A2) / n(全)
こうなります。で、今は全体の点の数を基準としましたが、条件つきの割合というのは、その基準が変わってくる訳ですね。ここで、今の要領で、A1 を基準として考えれば、
n(A1 and A2) / n(A1)
こう表せます。このように、A1を基準としたA1 and A2の割合を、P{A2|A1}と表しましょう。右側に書かれている部分を基準とした左側の割合、と見て下さい。上で示した図では、大きな薄い網掛けを基準とした時の濃い網掛け部の割合です。だから、分母がA1になる訳ですね。
次に、先ほど見た、全体を基準とした時の濃い網掛けの部分の割合を、割合の掛け算を使って表してみます。濃い網掛けは、上の大きな薄い網掛けに含まれていますから、まず、全体に対する薄い網掛け部分の割合を考えると、
P{A1}
こうなります。で、先ほど示したようにA1を基準としたA1 and A2の割合はP{A2|A1}でしたが、これを使いつつ全体を基準とすると、
P{A1}×P{A2|A1)
こう表す事が出来ます。割合の掛け算で表現するのは、百分率で考えると解りやすいかも知れません。たとえば、食事でスプーンとフォークを使った人を考えるとします。そして、全体の内、スプーンを使った人が40%で、スプーンを使った人の内20%がフォークも一緒に使っていたとしたら、全体を基準とすると、全体の40%の20%:全体×40%×20%となります。全体を基準とした割合なので、全体は1ですから、それを省略し、百分率を小数で表せば、0.4×0.2 = 0.08 です。先ほどからのPの記号を使った表現をすると、P{スプーン}×P{フォーク|スプーン) ですね。そして、これまでをまとめると、
P{A1 and A2}=P{A1}×P{A2|A1}
こうです。この例を図示してみましょうか。

これが全体。で、それぞれの割合を図示しますと……
↓全体に対する、スプーン&フォークを使った人の割合

↓全体に対する、スプーンを使った人の割合

スプーンを使った人という条件のもとでの、フォークを使った人の割合

こうですね。そして、割合×割合で示すと↓

左辺の分子と右辺の分母は同じだから消せるので↓

結局、この図と同じになります↓

私が最初そうだったのですが、○○and△△の確率と、○○のもとでの△△の確率、の違いがよく解りませんでした。△△の確率を表現しているけれど、計算のしかたが違う。一体何が異なっているのか、と。
要するにこれ、分母が違う訳ですね。先ほどの例を使うと、and の確率(同時確率)の分母は全体で、条件つき確率の分母はスプーンを使った人。だから、確率の計算は違います。確率というのは、着目している事象の起こる標本点の数を全事象の点の数(標本空間)で割ったものではないのか、と思いつつ悩んでいて、ここら辺の考えが解っていなかったのですが、これは結局、条件つき確率は標本空間が変わるという事なのですね。最初にホーエルの本から引用をしましたが、前の部分を略していました。実はそこには、次のように書いてあります。

 本節の目的は,個々の事象の確率を用いて,P{A1 and A2}に対する公式を導くことである.そのためには条件つき確率という概念を導入する必要がある.いま,A1の起こったことはわかっている,またはA1の起こることは確実である,という条件のもとで,A2が起こるかどうかを知りたいとしよう.ここでは,A1とA2は互いに排反でないと仮定されている.この問題を幾何学的に図示したのが図5である.
 A1の起こることが条件になっているから,考えなければならない実験結果はA1が起こることに対応している結果のみでよい.したがってこの問題の標本空間はA1を構成している単一事象の集まりに縮小される.図5ではそれらは領域A1内の点として表される.これらの点の中で(略)
※最初の強調のみ原文のまま