信頼区間は難しいですねー。
参考資料を紹介します。
岩崎学『確率・統計の基礎』(P75)↓
点推定がひとつの値で
を推定するのに対し,区間で
を推定する方法を区間推定(interval estimation)という.
を小さな確率値とし,確率変数
から
と
を
(1)
となるように定めるとき,区間
を信頼係数(conficence coefficient)
の信頼区間(conficence interval)あるいは簡単に
信頼区間という.
は信頼下限(lower limit),
は信頼上限(upper limit)とよばれる.
が離散型の場合は(1)の等号は一般には達成されず「
」となる.この場合は,信頼係数
以上の信頼区間とよぶべきであるが,その場合も信頼係数
の信頼区間ということが多い.
信頼区間では,信頼係数が高いほどその区間は信頼が置け,区間幅が狭いほど精密な推定ができるので,それらが両方とも成り立つのが望ましいが,それはできない.すなわち,データ数
が一定であるとき,信頼係数を高めると区間幅が広くなり,区間幅を狭くすると信頼係数が低くなる.そこで信頼係数を
とした
信頼区間を求めるのが一般的である.
通常の確率計算では,たとえば確率変数
に対し
![]()
は
が区間
に含まれる確率を表す.ところが,信頼区間の定義式(1)では区間の両端が確率変数となっている.すなわち,「
個の観測値を得て信頼区間
を求める」という作業を多数回繰り返したとき,その区間がパラメータ値
を含む確率が
であることを保証するものである.観測値
を得て,
および
の実現値
と
を計算して具体的な信頼区間
を得たとき,区間
が
を含む「確率」が
,というのではない.したがって,区間
が
を含む確率が
でるといわずに信頼係数が
であるというのである.
強調は引用者によります。
「個の観測値を得て信頼区間
を求める」という作業を多数回繰り返したとき,その区間がパラメータ値
を含む確率が
であることを保証する
↑ここでの信頼係数は、2つの推定量から構成される区間が得られる確率。
観測値を得て,
および
の実現値
と
を計算して具体的な信頼区間
を得たとき,区間
が
を含む「確率」が
,というのではない.