確率変数は関数3

先のエントリーで紹介した本から、興味深い部分を引用してみます。強調は引用者によります。

 ある実験において確率変数がどのように導入されるかをみるため,第3章の図1で与えた硬貨投げ実験*1の標本空間に戻ることにする.この実験で得られた表の数をxとすれば,この実験の標本空間の各点には,図2で点の上に示したように*2,xの具体的な値が対応する.すなわち,この確率変数xは0,1,2,3のどれか1つの値をとるが,これ以外の値はとりえないことがわかる.
 もう1つの例として,2個の正常なサイコロをころがす実験で出た目の和をxで表わすことにする.この実験の標本空間は第3章の表1*3で与えられた.
この標本空間を図3に再度示すが,ここではサイコロの目を表わす表示(11,12などの)ではなく点で表わしてある.図3で各点の上に書かれた数はこの実験における確率変数xの値である*4.この確率変数xは2,3,…,12のどれか1つの値をとりうることがわかる.
 これら2つの例からわかるように,確率変数xの値は特定の標本点にのみ依存している.つまり,xは標本空間における標本点のある関数であって,その形式的な定義は次のように与えられる.
 定義. 確率変数は標本空間の上で定義された実数値関数である.
この種の変数をとくに確率変数とよぶのは,この変数のとる値が不確定な実験の結果に依存していることを示すためである.
 ところで,われわれに関心があるのは,実験に対して確率変数がとる値であって,実験の可能な結果の全体ではないから,より簡単な新しい標本空間を構成して,元の標本空間をこの空間に切り替えることにする.たとえば硬貨投げの実験では,関心がある事象はx=0,1,2,3が与える複合事象だけである.図2と第3章の定義(1)から,これらの複合事象の確率はそれぞれP{0}=1/8,P{1}=3/8,P{2}=3/8,P{3}=1/8である.これらの複合事象はいま,確率変数xの値に関連する4つの点を含む,新しい標本空間の単一事象とみなすことができる.そして,先に求めたこれら複合事象の確率を新しい標本空間の4つの点に割り当てる.図4はこの新しい標本空間を示すもので,各点にはそれぞれの確率が割り当てられている.
ホーエル[著]浅井・村上[訳]『初等統計学 原書第4版』P76・77

                          • -

「そうですか……もう一つ、質問です。あたしが読んでた数学書では、確率変数を《標本空間Ωから実数ℝ*5への関数》と表現していました。あたしはまだ、どうして確率変数関数*6なのか、わかっていないです」
 これだ。
 テトラちゃんの《わかっていない》という感覚。これが彼女の大きな力だ。彼女は、わかったふりをしない。彼女は、わかっていない状態をキープする心の強さを持っている。
「そうだなあ……確率変数の値がどう決まるかを考えよう。たとえば、1*7という目が出る。このことは、標本空間の1という一点を指定したことに相当する。そして、出た目に応じて確率変数の値が一つ決まる。つまり、見方を変えると、確率変数は《出た目》に応じて《実数値》を一つ対応付けているといってもいい。そういう性質を確率変数が持ってることを、数学的に表現すると《確率変数は、標本空間から実数への関数》となるんだ」
「あ、あの……」
「抽象的すぎる? じゃ、サイコロを投げて賞金をもらう話をしよう」

100倍ゲーム(確率変数の例)
サイコロを投げて、出た目を100倍した賞金がもらえるゲームをしよう。確率変数を使って、賞金をX(ω)円とする。ωは出た目である。
確率変数X(ω)は、標本空間Ω={1,2,3,4,5,6*8}から実数ℝ*9への関数として表せる。

出た目:標本空間Ωの要素ω 1 2 3 4 5 6
賞金:確率変数の値X(ω) 100 200 300 400 500 600

引用者註:この部分の強調は原典のまま。表のサイコロの目の所はサイコロアイコン。表の罫線は少し異なっています。

「あ、この《100倍ゲーム》だと具体的でわかりやすいです」
「そうだね。《標本空間から実数への関数》も、表でイメージできるし」
「はい」
「この表の意味はわかるよね。サイコロの目をωとして、賞金をX(ω)で表したんだよ。たとえば、ω=3のとき、X(ω)=300になる。つまり、X(3)=300ということ。ぜんぜん難しくないよね」
「はい。サイコロの目が決まれば、もらえる賞金も決まります
「うん、それだけのこと。この《100倍ゲーム》で、確率変数X(ω)は……

  • 賞金を表しているという意味では《変数》
  • サイコロの目に応じて、賞金を決めているという意味では《関数》

……なんだよ」
「あの――あたし、難しく考えすぎてました。要するに、
   X(1)=100,X(2)=200,X(3)=300,...,X(6)=600
のように、出た目に賞金を対応させていますよ……ってことなんですね」

結城浩乱択アルゴリズム』P144・145

「確率変数Xの確率分布を考えるときには、もうサイコロの目は考えない。もちろん背後に標本空間はちゃんとあるんだけれど、いったん標本空間を忘れてしまう
「忘れちゃうんですか!」
「つまりね、100倍ゲームの例でいえば、賞金と確率さえわかるなら、サイコロなんてもう考えなくてもいいよといってるんだ。《その賞金がもらえる確率はいくらか?》がはっきりしていれば、サイコロなんかどうでもいい。サイコロを忘れても、確率的には同じ議論ができますよ、ということ」
「えっと……」
「つまりね、
  標本空間と確率分布
を考える代わりに、
  確率変数の値と確率分布
を考えてもいいということなんだ」

結城浩乱択アルゴリズム』P146・147 ※下線は原典のまま

どちらも丁寧な説明ですね。ホーエルの本では、確率分布と確率変数の対応の所で、新しい標本空間を構成すると表現していて、結城さんの本では、標本空間を忘れてしまうと書いています。初学者向けの本ではしばしば、いつの間にか標本空間の話がどこかへ行ってしまって、混乱する場合があるのですが、ここで紹介した本では、そこら辺の所、つまり、確率変数を考える時には、背後に標本空間があるという事をきちんと踏まえさせた上で、それを措いて確率分布を考える事にする、という風に持っていっています。
標本点は基本的に、それをとる確率が同様に確からしくなるように構成されますが、それの関数である確率変数は、別な標本点で同じ値を取り得る。そうすると、実験の結果と対応する値としての確率変数の出現する確からしさは、もはや同様では無くなります。最初の内は、この辺りが混乱しますよね。はじめは同様に確からしいという前提で標本空間の勉強をしていたのに、いつの間にか確率分布の話に入っていて、確率変数の値と確率との対応の所に行っている。あれ、今はどういう事を考えているのだろう……となってしまう。
ここで紹介した本は、その辺りに配慮された内容です。結城さんは、『乱択アルゴリズム』を執筆なさる前までは、確率変数の概念をよく解っていなかったという事なので、同じくその概念を勉強する読者が解りやすいように、工夫して説明なさったのだと思います。

初等統計学

初等統計学

数学ガール 乱択アルゴリズム (数学ガールシリーズ 4)

数学ガール 乱択アルゴリズム (数学ガールシリーズ 4)

*1:引用者註:硬貨を3回投げる実験

*2:図はこんな感じ:
 3
 ●
HHH

*3:6×6の行列に、それぞれの出た目が並べて書かれてある(1と1なら:11)表

*4:1と2が出た標本点なら:
3

2と1が出た場合は別の点に3が対応している

*5:R ※ブラウザやフォントによって表示されない場合用

*6:原典で傍点の部分は em 要素にした

*7:引用書では、サイコロのアイコンの上に数字が書かれてある。以下、同様の文では単に数値を書く

*8:数字つきサイコロアイコン

*9:R