身長なる確率変数

たとえば,まだ会っていない人の身長に関心があるという場合,身長は実数値をとるから,Xを身長の空間として,X=R,あるいは負の値はとらないからX=[0,∞)とするのもよい.そして実現とは,その人物の身長を知らされることと考えればわかりやすいが,厳密に言えば,知らされる必要もなく,その人の身長そのものである.

ここです(P38)、ずっと私が違和感を持ち続けている記述は。たとえば統計検定のテキストにも、連続型確率変数の説明で同じような内容が出てきます。

これは、身長を考える時、まず実数の区間を結果空間と設定して、そこから1つの実数が選ばれる、というように考えています。しかるに、私たちが想定しているのは、会う可能性がある人が有する身長なる属性であるはずです。そうであるなら、まず結果空間として考えるのは、抽象化された実数の区間などでは無く、区別のつく人間の集合であるべきではないでしょうか。

身長を測って統計的に評価する事を考えるのはどういうシチュエーションでしょう。通常それは、学校等でおこなわれる身体測定ですね。たくさんの人を集めて、その人に付随する量を限られた桁数で測る、という行為のはずです。更に、身長に限らず、心理学的や社会調査的の観察なり測定なりは結局、人間の集まりを検討対象とする訳です。

そうであれば、検討対象のベースとしての結果空間は、離散的な、人間の集合として捉えるのが自然です。そして、その上に定義された確率変数なる写像を考える時に、選ばれた人と、その人に対し身長測定で与えられた数値、を対応づけるのが整合的です。プロパティ的に書けば、rv(ω)=ω.MeasuredHeight といった具合です。

私たちは、現象を数理的にモデル化してその論理構造を追究していこうと考えています。それが科学的なアプローチです。そうであるなら、まず現象がいかなる構造を持っているか、と捉えて行くのが順序ではないでしょうか。だからこそ、人間の集まりの中からどのように選ぶか、という確率抽出の観点が重視されます。1人の人間が選ばれるというアウトカムを要素とする事象にどう確率を与えるのか。そこで想定されているのはまだ、人間を選択する具体的な現象です。

しかるに、確率・統計の色々の本で、身長は連続型確率変数の例だとして簡単に紹介してあります。なぜそうしているのか、私はずっと解らないでいます。私たちは、人間から人間を選んで身長を測るのであって、実数の中から身長を選ぼうとするのではありませんから。