信頼区間
信頼区間は難しいですねー。
参考資料を紹介します。
岩崎学『確率・統計の基礎』(P75)↓
点推定がひとつの値で を推定するのに対し,区間で を推定する方法を区間推定(interval estimation)という. を小さな確率値とし,確率変数 から と を
(1)
となるように定めるとき,区間 を信頼係数(conficence coefficient) の信頼区間(conficence interval)あるいは簡単に 信頼区間という. は信頼下限(lower limit), は信頼上限(upper limit)とよばれる. が離散型の場合は(1)の等号は一般には達成されず「 」となる.この場合は,信頼係数 以上の信頼区間とよぶべきであるが,その場合も信頼係数 の信頼区間ということが多い.
信頼区間では,信頼係数が高いほどその区間は信頼が置け,区間幅が狭いほど精密な推定ができるので,それらが両方とも成り立つのが望ましいが,それはできない.すなわち,データ数 が一定であるとき,信頼係数を高めると区間幅が広くなり,区間幅を狭くすると信頼係数が低くなる.そこで信頼係数を とした 信頼区間を求めるのが一般的である.
通常の確率計算では,たとえば確率変数 に対し は が区間 に含まれる確率を表す.ところが,信頼区間の定義式(1)では区間の両端が確率変数となっている.すなわち,「 個の観測値を得て信頼区間 を求める」という作業を多数回繰り返したとき,その区間がパラメータ値 を含む確率が であることを保証するものである.観測値 を得て, および の実現値 と を計算して具体的な信頼区間 を得たとき,区間 が を含む「確率」が ,というのではない.したがって,区間 が を含む確率が でるといわずに信頼係数が であるというのである.
強調は引用者によります。
「 個の観測値を得て信頼区間 を求める」という作業を多数回繰り返したとき,その区間がパラメータ値 を含む確率が であることを保証する
↑ここでの信頼係数は、2つの推定量から構成される区間が得られる確率。
観測値 を得て, および の実現値 と を計算して具体的な信頼区間 を得たとき,区間 が を含む「確率」が ,というのではない.