読者です 読者をやめる 読者になる 読者になる

ベイズと日常的な言葉と題意

ふと、そういえば、確率の問題であんなのがあったなあ、と思って探してみました。
(cache) asahi.com(朝日新聞社):後付けの条件で確率は変わる――ベイズの定理 - 勝間和代の人生を変える「法則」 - ビジネス・経済
これは、勝間和代氏による記事の魚拓です。で、話題は確率の話。問題は次の様

 単純な例を考えてみましょう。区別のつかない三つの袋の中に、それぞれ「赤・赤」「赤・白」「白・白」の二つの球が入っているとします。袋を一つ選んで、その中から球を一つ取りだしたところ、赤球であった場合、残りのもう一つの球が白球である確率はどのくらいでしょうか?

 私たちは直感的に、もともとの玉の数が赤と白では同数ですから、最初に赤を選んだ場合、次が白である確率は2分の1だと思いがちです。しかし、実際は3分の1なのです。

強調は私が施しました。
この記事については、コメント欄で結構な反響があったようです⇒勝間和代女史のトークへの反響 「後付けの条件で確率は変わる――ベイズの定理」への ツイートまとめ - Togetter
私は記事のコメント欄はちゃんと見ていなかったのですが、答えは 1/2 なのでは? という反応が沢山あったようです。この種の問題は、ベイズの定理の解説として、また、確率が直感と合わない事の例として、ある意味定番のもので、議論にもなりやすいのですね。
ところで、こういう問題は、日常的な現象を例にして数学的な問いを答えさせる、というものです。そこでは当然、日常的な言葉の表現と数学的な用語とが入り交じります。ですから、問題文を上手く解釈・整理して題意を汲み取る、のが肝要です。
この勝間氏の記事に、次のような批判があったようです⇒wrong, rogue and booklog - ベイズの定理自体は、確率論における比較的単純な定理なのですが、課題は、私たちの直感はどうしても、事後に...
私は、勝間氏の表現がパッと見では掴みにくいな、というのが最初に読んだ時の(そして、改めて確認した時の)印象でした。再び勝間氏の表現を見ると、

その中から球を一つ取りだしたところ、赤球であった場合、残りのもう一つの球が白球である確率

こうです。この、残りのもう一つの球というのが何なのか、が解りにくい。そして、どのような現象が起こっているのか、も掴めない。つまり、

  1. 袋から一つ取り出し、それを戻してまた取るのか
  2. 袋から一つ取り出し、戻さずに取るのか
  3. 実際は二つ同時に取っているのか

と。
3は、勝間氏の文を改めて読むと、それは無いのだろうな、と判断出来ます。何故なら、一つ取りだしたところと敢えて書いているのだから。1も違うでしょう。残りのもう一つと言っているので、戻してもう一つ取るという現象は考えられていないと解釈するのが妥当。
では、勝間氏の言っている事は2だろう、と判断されます。じゃあどこから取るか。
まずどれかの袋から一つ球を取ったら赤だった、というのがこの問題の中心です。で、その後にもう一つ取ると言った場合、

  • 最初に取ったものはそのままにして、再び袋をシャッフルしてもう一回取る
  • 最初に取った袋からもう一つ取る

の二つの可能性があります。それで、勝間氏の文は、残りのもう一つの球となっています。という事は、最初に取った袋からもう一つを取るのを指しているはずです。
これ、問題文がややこしいのです。日常的な行動を例にしているから、読む方は、その現象を頭の中で再現・展開しつつ考える。その過程で、いつ、どの袋から、どのように取り出すのか、というのを色々想像していく。日常的な言葉の表現がなされているから、そこで混乱する。
実はこういう問題では、勝間氏のような表現はあまりなされないように思います。その事は後で書くとして、勝間氏の文から題意を読み取ります。そうで無くては数学的な問題として解答出来ないからです。

  1. 袋の区別がつかない→三つの袋を選ぶ確率はそれぞれ等しい
  2. 袋には赤球と白球が入っている→ある袋を選んだ時、その袋に入っている球が選ばれる確率はそれぞれ等しい

1は、三つの袋を選ぶ確からしさは同じである事を設定しています。2は問題文には明記されていませんが、それぞれの球を選ぶ確率も同じ事が前提されているはずです。注意深い書き手は、それを認識させるように、それぞれの球の大きさや手触りは同じ等と書いたりします。日常的な現象を手がかりにした問題だから、そのような経験的な表現でもって、確率が同じ事を示唆する。
あるいは、もっとダイレクトに、それぞれの球が選ばれる確率は同様に確からしいと書くでしょう。
さて、これで準備が整いましたね。ここで、ちょっと記号で表現します。

  • 赤球が二つの袋:(
  • 赤球が一つ、白球が一つ、の袋:(○
  • 白球が二つの袋(○○)

※フォントによっては○と●の大きさが異なると思いますが、これは取り出される確率とは全く関係が無いとしておいて下さい。
ここで示したのが、そこから球を取り出す対象、つまり三つの袋です。そして、袋から一つ取り出す事の結果は、次の可能性があります。

  1. )からが取られる
  2. )からが取られる
  3. (○)からが取られる
  4. (○)から○が取られる
  5. (○○)から○が取られる
  6. (○○)から○が取られる

この六つの可能性です。そして題意より、これらの可能性はいずれも、同様に確からしい。袋が三つあって、それぞれに球が二つ入っているから、3×2 で6通りの可能性がある、と考えても良いでしょう。
さて、勝間氏の問題です。
そこでは、その中から球を一つ取りだしたところ、赤球であったとあります。つまり、上記の可能性の内、1から3までのどれかが起こった事を示します。言い方を換えると、4と5と6は起こらなかったと表現出来るでしょう。
これを図示するならば、
)(○)(○○)
の三つの袋から取るという可能性から、一つ取ったら赤球だったという情報によって、その赤球が
)(○
ここから取り出されたものである、という可能性に絞られた事を意味します。
勝間氏の問題では、残りのもう一つの球が白球である確率でした。ですから、

(○
のいずれかに白球が入っているのだから、その確率は 1/2 なのではないか、と思いがちなのでしょう。しかし答えは 1/3 です。何故でしょう。
ポイントは、1/2 と考えるのは、白球に注目し過ぎだという事です。二つの袋から取り出された可能性があって、白球はその一方にしか入っていないから、確率は半々だろう、となる。
ところが、実は着目すべきは、赤球です。袋を選んで一つ取り出したら赤球だった、ではその袋に残されている球は何色か、という問題を考える場合には、
赤球はどの袋から取り出されたのか
と言い換える事が出来るのです。
先に私は、この種の問題では勝間氏のような表現はあまりしないように思う、と書きましたが、それがここです。つまり、球を取り出す、というような問題では、残りの球が白である確率というのでは無く、その赤球が(○)から取り出された確率と表現されるのをよく見かける。いま赤球を取った袋の残りが白球である、というのは、いま赤球は、赤球一個と白球一個が入っている袋から取られた、というのと同じ意味なのですから。
続けて考えます。この問題は、一つ取り出したら赤球だった、というものです。その現象(事象)を全部書き出すと、

  1. 赤球二つの袋から赤球が取られた
  2. 赤球二つの袋から赤球が取られた
  3. 赤球一つ白球一つの袋から赤球が取られた

こうです。1と2が同じだと思いますか? 違います。ここで、次のように考えます。

  • 赤球が二つの袋:()を 袋A と名付ける
  • 赤球が一つ、白球が一つ、の袋:(○)を 袋B と名付ける
  • 白球が二つの袋(○○)を 袋C と名付ける

取り出される可能性のある球にユニークな番号を振る、つまり、

  1. 袋Aの赤球:A( )
  2. 袋Aの赤球:A( 
  3. 袋Bの赤球:B( 
  4. 袋Bの白球:B(○ )
  5. 袋Cの白球:C(○ )
  6. 袋Cの白球:C( ○)

こうすると、赤球が取られたという現象(事象)は、1から3までの3通りであると言えます。つまり、球1か球2か球3が取り出された。そして、赤球と白球が入っている袋は袋Bであり、問題は、最初の赤球が袋Bから取り出された=赤球を取った袋の残りの球が白球であるというものだから、それは、最初に取った赤球は球3である事であって、それぞれの起こる可能性の確からしさは同じなので、確率は 1/3 となります。
次のようにも言えます。
分子:袋Bを選んで赤球(球3)を取った
分母:袋Aを選んで赤球(球1)を取った+袋Aを選んで赤球(球2)を取った+袋Bを選んで赤球(球3)を取った
袋を選ぶ確からしさは同等で、袋から球を取る確からしさも同等。従って、6種類それぞれの現象(事象)の起こる確からしも同等なので、それは1/6 であるから(1/3 * 1/2 なので)、
分子:1/6
分母:1/6+1/6+1/6

1/6 * 6/3 = 1/3 となります。
他にも、次のように考えられますか。
A|B|C
||○
|○|○

赤球が取られた

A|B|
|
|○
から取られた可能性に絞られた

A|B|
| 
 |

A|B|
 |
 |
A|B|
 | 
|
の三つの可能性の内、袋の残りが白球=袋Bから赤球が取り出された場合は
A|B|
 |
 |
であるから、1/3 となる。
ところで、勝間氏は、

赤球2個、白球1個の計3個のうちから白球を選ぶわけですから、確率は3分の1になります。

と言っていますが、これはよく解りません。答えは合っているけれど勝間氏は理解していないのではないか、と指摘されたのも、この文が原因なのでしょう。この説明は、一つの袋に赤球二つと白球一つが入っていてそこから一つ取り出す、という現象ですから、そもそもの問題文とシチュエーションが異なります。敢えて白球に着目し、残った袋の球を取り出す事を考えるならば、

  • 最初に取った赤球は袋Aの1だった→次に取られるのは袋Aの2
  • 最初に取った赤球は袋Aの2だった→次に取られるのは袋Aの1
  • 最初に取った赤球は袋Bの3だった→次に取られるのは袋Bの○4

の三つの可能性の内一番下の場合であるので、結局答えは 1/3 である、となるでしょうか。

という訳で、こういう数学の問題、特に、直感に反する事を経験に照らして解らせるようなものの場合、色々と混乱しがちですから、文章をよく読んで題意を読み取る事が大切だな、と思うのでありました。