確率や統計の入門書の書かれかた

どうやったって、深く考えていくと確率空間の話にならざるを得ないのだから、初学者向けの本であっても、簡単にでも確率空間の概念には触れておくべきでは無いですかね。それと、全事象の概念の省略が早すぎる。二項分布を考える時の全事象は何かとか、意識した事が無い人が多いだろうし、本でも意識させないものが結構ありますけれど、意識する人は、ものすごく困る訳です。あり得る結果の集合を全事象と言っているのに、それがいつの間にか書かれなくなって、確率関数の観点に移行している。いま話している問題においてそれは何が当てはまるのだろう、となる。

確率論の専門書で確率空間の説明をしないのは、そうそう無いでしょうが、確率・統計とか、統計学入門とかが冠されている本で説明していないのはよくあります。私は、索引をまず見たりするので、そこで確認します。

小針の本では、二項分布の説明をする際に、全事象が(前のほうで説明してある)ベルヌーイ列の集合であって、それは、N回の試行ではN次元空間内の格子点を要素とする集合である事を明記しています。そしてそこから二項分布を構成しています。こういうのって、統計学的な問題を考える時にどうしても気になる所なので、説明されている本がある事そのものが重要です。

ちなみに、小針の本は、以前にここで採り上げたような、確率の問題を実現象を通して学ぶ所についてもちゃんと、仮定でありモデルである事を書いています*1。コイン投げや打率を引き合いに出して、

《前回に関係なく出る》という宇宙の大法則があって,それに従って金貨が宙を舞うのではなく,《そう仮定する》のである.
 また,3割打者が4打席で2安打する確率などというとき各回打者は前回の結果の影響を受け,独立な試行ではあり得ないだろう.あくまでモデルなのである.

こう言ってくれています(小針『確率・統計入門』P56)。他には、岡部『確率・統計』などが、この辺りを意識して書かれています。

だいぶ前に、身長なる確率変数は連続型なのかという話を書きました。連続型の確率変数の例として身長と書いてある本が結構あったからです。しかるに、取り扱う現象としての基本的な集合を考えると、それは、有限または可算の人間の集合なのであり、その要素に付随する属性としての身長を考えるのだから、どうしたってそれは離散型です。なのに、身長は連続型の確率変数だとただ書いてある。身長が連続であるというのは、長さという量が連続量である事を指すのであって、実際の現象をモデル化するにあたって、身長を扱う時は必ず確率変数が連続型になる、という話では無い訳です。私はここに気づいたけれど、ちゃんとそれを説明しているものはありませんでした。だって、色々の本で、身長は連続型確率変数の例である、と書いてあるくらいなのですからね。結局は、確率変数の定義(確率空間における全事象の上に定義された、実数値への写像)を把握して、そこから、身長に着目したら連続型確率変数になる、などと単純に言える訳が無い、と考えるに至った訳です。

初学者向けだから必要に応じて省略するのは解るのです。いきなり色々詰め込んだら学習を妨げる事もあるでしょうから。でも、何を省略するかは難しい問題だと思います。私みたいな疑問が生ずる人もいるでしょう。そういう時に、省略された本ばかりだと、ものすごく困ります。かと言って、ゴリゴリの確率論の本を眺めても、そういう、実現象を考える際の細かい話は載っておらず、測度論やらの専門的な説明が書かれてあるからさっぱり解らない。途方に暮れます。

標本調査を考えます。母集団が想定されます。ある地域に住む人々全体、とかそういうの。で、母集団分布を想定する。これって何ですか? 全事象は何? そこから標本を抽出して確率分布を導くと、超幾何分布や二項分布が出て来ますが、これは標本分布です。この分布の全事象は何? 最初に考えた人間の集合はどこに行ったのですか。

確率分布の形状を決める定数を母数と言います。いっぽう、母数は母集団の特性を表す値としても定義されています。じゃあ、二項分布の試行数Nや成功確率πは母数ですか? parameterを母数と単に訳すと、こういう困った事になります*2

数学の本だから、説明は整然としていて用語の関係は整合的であり、厳密で綺麗に書かれてある、と思いたいですが、実際は意外にそうなっていません。冒頭で触れたように、ここまで出して来たような疑問を思いつくような人はそんなにいないのかも知れませんが、思いつく人にとっては、とにかく困る事態なのです。

統計的推測の問題は、基本的に定義された、確率に関する概念があって、それを土台として構築された体系です。なのに、その基本的な所が省略。ほんとうなら、応用的な問題であるからこそきちんと把握させておくべきではないかと思うのです。そこを考えると、全事象を標本空間と表現するのがかなり紛らわしい事などにも思い至ります*3。だから私は、標本空間も標本点も用いません。根元事象なども紛らわしい。事象と言っているのに、全事象の要素の事を指している本がたくさんあります。全事象のシングルトン{ω}だと定義しているほうが少ないかも知れません*4

私が見たテキストの中で、これらの観点から見てとても綺麗に書かれているのは、WIISにおける解説だと思います。確率論の専門書のようにゴリゴリで無く、ほどよく噛み砕いて説明されていて、かつ厳密さを損なわないよう工夫されているように見えて、好感が持てます。良いコンテンツだと思うのに、あまり言及されているのを見ないのが不思議ですが。

wiis.info

*1:小針は、確率空間を確率モデルと表記している

*2:だから、確率分布における定数をパラメータ)と言い、母集団分布におけるそれを母集団パラメータとすべきと今は考えています

*3:河野『確率概論』で、はっきりと触れているけれど、他の本で同じような事に言及しているのは見ません

*4:小針の本は、混乱が生じない事を前提して、{ω}をωと書いている