読者です 読者をやめる 読者になる 読者になる

連続と離散2

コメント欄が長くなったので続き。読んでいる人向けなので、特に説明無し。
引用します(強調は引用者による)。
まず、浅野晃さんの講義資料( 2009 年度前期 データ解析序説 第10回 分布を推測する− 度数分布と確率分布,確率分布モデル 統計 )(PDF)より。

ただし,この関係がなりたつためには,前回説明した2つの前提が成り立たなければなりません.この場合,前提1,2は,
1. どのデータも,同じ確率で取り出される
2. 各データが取り出される確率は,いつデータを取り出しても同じである(他にどんなデータが取り出されたかに影響されない)
と言いかえることができます.このようなデータの取り出しかたを無作為抽出といいます.
以上のように考えるとき,母集団の度数分布では各階級値に相対度数が対応しているのと同様に,各階級値に「無作為抽出によって取り出したデータがその値である確率」が対応していると考えることができます.このように,「大小さまざまな値に対して,その値が取り出される確率が対応している」ものを確率分布とよびます.

度数分布における相対度数は「集団の中での,ある特徴を持つデータの数の割合」であるのに対して,確率変数の確率は「将来何度もデータを抽出したときの,ある特徴を持つデータが出てくる機会の数の割合」であり,本質的に違うものです.しかし,無作為抽出という仮定によって,度数分布と確率分布は同等のものとして扱うことができます.

この表現を使うと,「標本」という確率変数は,それが取り出された母集団の相対度数分布(母集団分布)と同じ確率分布にしたがう,ということになります.

次に、田河ら『確率統計』(P74・P75)よりの引用です(原文での強調は strong 要素で、引用者による強調は em 要素で示します。確率変数を示す斜体 X はCSSで斜体に)。

 母集団2,2,3,3,5から大きさ1の標本を無作為抽出するとき,選ばれる数をXとすると,Xとる値が2,3,5である確率変数で,その確率分布は次のように表される.
(引用者注:式を省略)
 このように,母集団から大きさ1の標本Xを抽出するとき,X確率変数となる.Xの確率分布をこの母集団の母集団分布といい,Xの平均,分散,標準偏差をそれぞれこの母集団の母平均母分散標準偏差という.このような母集団の特性値を一般に母数という.
 上の例の母集団では,(1)が母集団分布を表し,母平均は3,母分散は1.2,母標準偏差は√1.2である.

 (略)このとき,抽出される順にX1X2,……,Xnとすると,これらは互いに独立で,各Xi母集団分布に従うから,(略)

母集団として、ある人間の集団に属する各個体の持つ身長なる量に着目し、上で引用したような論理を適用するならば、母集団の確率分布と表現する事が可能である、と私は考えます。上の引用文にあるように、単に母集団分布としても良いのですが、単なる度数分布と確率分布は異なる事を強調するために(浅野さんの文章で説明されているように)、敢えて確率分布と書いています。今は、確率変数として身長を考えていますから、「身長の確率分布」も特に問題は無い、と認識しています。もう一度書くと、敢えて確率分布と書いているのは、単なる度数分布と区別したいからです。前のエントリーで、

有限な集合である母集団に属するそれぞれの要素が持つ身長に着目し、そこからサイズ 1 の標本を無作為抽出する事を考えた時、その母集団の身長の分布は確率分布と看做せますが、

と書いているのは、上記引用文や、他の確率統計の本にある内容を踏まえた上でのものです。