ふと思い立って

調べてみた。

調べたのは、統計学の概念、「標準偏差」について。このエントリー、多少の統計の知識があること前提です。特に説明もしません。

前からよく書いてることですが。
母分散の不偏推定量は、通常の分散の式の分母を自由度にしたものですが(不偏分散)、ではその正の平方根は母標準偏差の不偏推定量になるかと言えば、ならない訳ですね。
ここの所が曖昧になっているテキストが散見されるので、色々なテキストを見て、どう説明されているのか調べてみた次第。

やり方は、書店や手元の本で索引を見て、標準偏差や不偏推定量などのワードを探し、そこから解説を確かめてみた、という具合。

で、どんな感じだったかというと。。。

※このエントリーでは、不偏分散の正の平方根を、直接に「ルート不偏分散」と書きます。
○医療統計・疫学 関連の本、十数冊・ほとんどは、ルート不偏分散を単に「標準偏差」として説明している。初学者にとっては圧倒的に不親切だと思う。
・ルート不偏分散を「不偏標準偏差」と説明しているのが三冊。
・ルート不偏分散は母標準偏差の不偏推定量ではない、と説明している本はゼロ。

○心理統計系、十冊弱
・そもそもルート不偏分散という量を説明している本がほぼなかった。医療統計系ではほぼ載っていたのと対照的。研究目的にもよるのだと思う。

○一般的な分野としての統計学書。数学書の書架にあるようなもの。六十冊くらい?
・こちらも、それ自体がほとんど解説されていない。採り上げているものでも、単に「標準偏差」と説明しているものあり。
・一冊、ルート不偏分散を「不偏標準偏差」と説明している本あり。
・片平の本で、ルート不偏分散が不偏推定量にはならないことを説明。その本では、近似として、分母を「n-1.5」にしているものを紹介。※片平の本は、分野的には医療統計系

○工学系。二冊しか調べられなかった。
・大村 『統計のはなし』で詳しく説明。まず不偏分散を説明し、その流れで、ではそのルートを取れば、それは母標準偏差の不偏推定量になるのか・・・という風にきちんと説明している。大村の本では、不偏推定値を出すために、サンプルサイズに応じた「水増し係数」というものが紹介されている。

ーーーーーーーーーーー

とこんな感じでした。数十冊調べましたが、多くの本では、紹介自体されていなかったですね。不偏分散くらい。それにしても、「不偏標準偏差」とするのはなあ。。。誤りですからね。