統計検定――2級

以前、YJSZKさんに教えて頂いた、

日本統計学会公式認定 統計検定2級対応  統計学基礎

日本統計学会公式認定 統計検定2級対応  統計学基礎

この本を読みました。
結論から言って、なかなか良いテキストだと思います。
内容については、こちらに目次がありますのでご覧下さい⇒東京図書株式会社 統計検定2級対応 統計学基礎
これを見れば解ると思いますが、結構幅広いです。分析には R の使用が想定されていて、簡単な使い方も説明されています。

検定向けのテキストだけあって、記述はかなり簡潔です。文もそれなりに硬い。ですから、いわゆる読み物的に面白い、というのではありません。そして、統計を初めて勉強する、という人が読むような本では全く無いと思います。もちろんこれは、当たり前と言えば当たり前の事で、検定用の本であまり紙面を割いて長々説明すると、却って冗長に感じられて向かない、となるでしょう。
とはいえ、ステレオタイプ的な「教科書」風の本ともちょっと違います。具体的な例もある程度用いて説明されていますし、統計の用法について注意すべき点、あるいは用語の使い方などに関して、ポイントが押さえられています(後でたくさん引用します)。
数式の導出や証明は、ほぼ書かれていないです。これは良し悪しですね。いわゆる「統計の考え方」や重要概念を押さえてもらう事が主眼で、細かい数理は他書に譲る、という事なのだと思います。だから、数理的な厳密さも同時に勉強したい、という人には物足りないでしょう。

先に、簡潔な記述である事を言いましたが、初めて勉強するので無く、今勉強中である、という人にとっては、懇切丁寧な説明を企図した本というのは、時として、表現が回りくどい、冗長、といった評価を受けるでしょう。たとえば、Excelの便利な使い方、みたいな本を開いてみると、1ページにあまりに色々な事がごちゃごちゃ書かれていて、却って何が何だか解らない、と感ずる場合があります。初学者にとっては情報過多で何を押さえれば良いか解らないし、ある程度勉強した人には冗長で面倒である、というように。
だから、そういう本よりは、ドリルやワークブック、本書のようにポイントを押さえて簡潔に説明した検定向けの本の方が解りやすい、という事もある訳ですね。と言っても、これも先ほど触れたように、いわゆる「教科書」として想像されるような、定義や証明、導出の羅列、的な本では無く(というか、証明や導出はほぼ無い)、具体例も所々入れて統計の考えを理解させようという工夫が見えます。

ここで、統計を勉強するにあたって注意すべきポイントについて触れられている所を引用してみます。なお、数学記号については、適宜変更したり省略したりします。前後を見れば補えると思います。統計の話をある程度知っている人向けの引用という事で、ご了承下さい。
※色つけ は引用者による。
※文章末尾につけた”(P*)”は引用ページを示す。

 このコインの表が出る確率を P(X_i=1)=1/2 として,n回の平均を求めることを多数回行った場合に得られる平均がとる確率を図示すると,これはおおよそベル型の形となる.ここでのベル型とは寺院の釣鐘型ではなく,図0.1のような教会の鐘のように下方に広がっている形をいう。(P9)

正規分布などの分布の形を「釣鐘型」と説明する本がよくありますが、あの形を見て、「釣鐘?」となる人もいるのではないでしょうか。私もそうで、まさに「寺院の釣鐘」をイメージしました。気の利いたテキストでは、「西洋の釣鐘型」などと説明していますが、本書でも、このように、「教会の鐘のように」と表現されています。

統計検定2級では,Rを用いて分析することを前提にしている.(P11)

これはとても良いですよね。

 時系列データの例(交通事故死者数の推移)では,75歳以上の高齢者についてさほど減少が見られなかった.これより,高齢者の交通事故死は減っていないと言っていいのであろうか?
 高齢者に関しては,近年の高齢者の増加も含めて考察する必要がある.実際,平成12年75歳以上の人口は約900万人であったのに,平成22年には約1,430万人に増加している.これより,75歳以上の高齢者についても人口比から見ると減少していることになる.
 このように,対数としての比較も重要であるが,人口比との関係について考えておくことも重要である.(P34)

これは、疫学・公衆衛生 方面の議論でしばしば題材になる所ですね(癌の話など)。単純に絶対数(実数とも言いますか)を比較して増減を言うのでは無く、人口比など、「○○あたり」で較べないと妥当で無い解釈をしてしまう危険がある、と。

標本サイズn(標本数といってはいけない)が十分大きい場合は,(P101)

いつものアレ。「言ってはいけない」と明記してあるものはそんなに無いですよね(鳥居『はじめての統計学』とか)。さすがにここまで書いてるから、サンプルサイズの意味で「標本数」としている所はありませんでした(見落とし無ければ)。

「釣鐘型」,「ベル型」,「カウ・ベル型」等,いろいろな修飾語が用いられているが,日本のお寺の鐘ではなく,キリスト教の教会の鐘を想起してもらいたいため,また,簡潔に表すため,本書ではベル型という修飾語を用いている。(P106)

これも上の話に関連して。こんな風に細かく説明しているのはあまり見た事無いです。

 ここで推定量とは,θハットが確率的に変動することを明示するための表現であり,実際に観測された値を推定値(estimate)とよんで区別することがある.ときに便利な表現であるが,誤解がない限りθハットを推定値とよんでも誤りではない.(P115)

推定量(これは確率変数)と推定値(推定量の実現値)を全然区別していないような記述はしばしば見ます。この概念の違いは相当重要なのに。でも本書では、誤りでは無い、とも書いていますね。

 身長は骨格の各部分の長さの合計であり,各部分の長さは,さまざまな要因によって決定される.遺伝的な要因,幼少期の健康状況など,数万を超える要因があると考えてよい.それぞれの要因は独立ではないだろうが,中心極限定理が成立する可能性が高い.こうして身長の分布が正規分布に近いことが予想され,実際の測定値も正規分布に近いが,こられの現象は中心極限定理を通じて理解できる.
 一方で,体重はよく見ると正規分布ではないし,所得は強い正のゆがみをもった(右の裾が長い)分布である.このように観測値の分布が正規分布とは明らかに異なる例も少なくない.(P118)

このように、現象的な説明を具体的に書いてあるのは、あまり無いものですよね。こういう風に身近の現象と理論的な所を結びつける解説は重要だと思います。もちろんここで言う身長とは、層別に見たものだろうと思われます(そういう所の重要さも別所で説明されている)。

 ところが実際に標本を測定して,たとえば xバー=12.3 という結果を得たとき,
 Pr {12.3 - 1.96σ/√n ≦ μ ≦ 12.3 + 1.96σ/√n | μ} = 0.95
という表現には確率変数は存在しないため,古典的な意味で確率を解釈することは不可能である.
 しかし同じ実験を繰り返し,そのたびに得られる xバー から(4.2.1)式の区間を構成すると,そのうちの95%が真のμを含むことは確率的に保証される.そこで,(4.2.1)式に xバー の実現値を代入した区間を信頼区間(confidence interval)とよび,その信頼係数(confidence coefficient)が95%であると表現する.単に95%信頼区間とよぶこともある.さらに一般に Pr{|z| ≦ z_0} = 1 - α となるように z_0 を選ぶと 100(1-α)% 信頼区間が得られる.以上のように信頼係数は区間推定の信頼性を表現する尺度であるが,確率とは区別される.その意味を正確に理解することが必要である.(P125)

統計的推測の文脈中でもとりわけ重要な話ですが、意外にあまり出てこない所です。ほとんど触れていない本も多いですね。
ちなみにこの後のコラム(P125・126)では、「信頼係数の解釈について」と題して、

 信頼区間は,品質の管理において毎日製造された製品の特性を把握するように,同じ状況が繰り返される場合には自然であり,実際にも長い間効果的に利用されているものである.一方で,繰り返しが想定できないような経済,経営の分野や,科学的な意思決定に関しては,そのままでは使えないとい(原文ママ)指摘もある.信頼係数の解釈を厳密に適用すると,与えられた観測値から計算された信頼区間が実際に母平均を含むかどうかについては確率的な表現ができないことになる.いえるのは,同じ実験を繰り返したときに,そのうちの95%が真のμを含むということであり,現実に与えられた観測値については「何もいえない」(実際,この手法の提案者であるJ. Neymanはそう答えている).
 ベイズ統計を利用した意思決定では,このような難点は理論的に克服されている.その詳細は省略するが,結論として,ベイズ統計でいう「判断確率」を用いれば信頼係数を確率と解釈することができるのである.

このように丁寧に補足が書かれています。こういう配慮があるのは良いと思います。

 検定に利用される標本平均 xバー や標本比率 pハット = x/n を検定統計量とよび,それがある範囲の値を取るときに仮説を棄却するのが一般的な手順である.仮説を棄却する範囲を棄却域(rejection region)とよび,棄却されない領域を受容域(acceptance region)とよぶ.
 伝統的な手順では,仮説を棄却する基準としてあらかじめ固定した有意水準αが用いられるが,関連する判断基準にP-値 がある.P-値 は確率値,または観測された有意水準ともよばれ,その表記も P-辺り,P値,p値,対応した英語も P-value などの変種がある.(P157)

ここで重要なのは2つ。「受容域」と「P-値」です。まず「受容域」ですが、帰無仮説が棄却されない時、帰無仮説を accept する事を、「採択」と言う場合がありますが、このような表現は、帰無仮説が正しい事を支持するという誤解が生ずる虞があるので使用しない方が良いのではないか、という議論があります。本書では、それを踏まえてか、「受容」の表現となっています。P158で、”仮説を棄却できないときは「仮説を受容する」と表現するが,それは仮説が正しいことを意味するのではなく,疑問とする十分な証拠がないことを表す用語である.”と書かれています。
尤も、「受容」も、採択ほど強く無いにしても、帰無仮説を支持する意味合いを感ずるので、個人的には、「保留:maintain」が好ましいのではないか、などと考えています。

P-値については、「観測された有意水準」と表現している所が気になりました。と言うのは、有意水準とはそもそも帰無仮説の 保留/棄却 を判断するための基準として設定されるものだから、「観測された」とついて表現されるのはちょっと違和感があるかな、と思ったのです。
ちなみに、p-value の訳語としてよく用いられる「有意確率」は、その語自体が載っていませんでした。これは珍しいのではないでしょうか。尤も、「有意確率」という語も結構変な構成だと思っていますけれども。

と、こんな具合で、ツボを押さえた説明がなされている本です。非常に細かく書いてあるとか、読み物風の工夫が行き届いている、という類の本では無いですが、簡潔明瞭に書かれた参考書として、よく出来たものではないでしょうか。参照して損は無いと私は思います。