WEBで読める統計関係の良質な資料

私がよく参考にする所を三箇所紹介します。いずれも、説明が極めて明瞭で、論理的な整合性や用語の丁寧な使い方を志向している所に好感が持てるサイトです。

Econom01 Web Site, Sophia University, Tokyo, Japan
上智大学の大西博氏のサイト。私が統計関連で最もよく参照する所です。説明の仕方の明瞭さや、具体例を用いた解説がとても良いと思います。確率統計の一つ一つの概念について、大変丁寧に説明されています。たとえば、「相関(および因果関係)」については、

2つの変数の同時分布と、その条件付き分布は、変数の間の数量的結び付きを示しています。この数量的結び付きは、統計的頻度分布として観察されるものであり、現象の背後にある実態的な「関係」や「構造」から導かれる法則性を必要としません。

例えば、人間の身長と体重とは密接な統計的分布関係を持っていますが、両変数を決定する背後機構は複雑であり、単純な数量法則として理解することは困難です。にもかかわらず、ある人の体重を推測する時に、その人の身長が判れば、条件付き分布に関する経験的知識から、体重の推測が容易になります。

つまり、同時分布が示す変数間の結び付きは、情報と情報との間の頻度的な連関を表わしています。一方、もしも2つの変数間に、構造的な意味での因果関係[注1]が存在すれば、その数量関係は同時分布においても検出可能です。したがって、同時分布が示す変数間の数量的結び付きは、因果関係を含んだより広い関係と考えられます。この関係を相関 (correlation)と呼びます。

      • -

[注1] 因果関係(causality)とは、ある要因が「原因(cause)」で、他のある要因がその「結果(effect)」であるような"関係"をいう。そのため、A と B の間に、数量に関する統計的関係が見られる時は、A が原因であるのか、それとも B が原因であるのかを、さらに決定する必要がある(ただし、C が原因で A と B が共にその結果である場合や、市場経済構造のように A→B、 B→A の両関係が同時に存在する場合などは決定不能)。1960年代には様々な因果律の判定方法が研究されたが、現在では、時間を考慮して、過去のA→現在のB、過去のB→現在のA の両関連度を統計的に判定し比較する方法が使われている。
3 相関と相関係数 ※文字修飾は外した

こういった説明がなされています。(言葉遣いはかたいですが)私がこれまで見た相関概念の説明の中で、最も丁寧で明瞭であり、納得のいくものでした。

ただし、講義用の資料なので、外部の人が参照しやすくはなっていないと思います。
密かに、大西氏の統計学の著作が出ないものか、と思っているのは私だけでしょうか。

おしゃべりな部屋 (プラネタリウム,星,植物,熱帯魚,統計学)
言わずと知れた、ですか。群馬大学青木繁伸氏のサイトです。統計学と R(フリーの統計ソフト)に関心を持っていてWEBを使う人で、青木氏を知らない人はどのくらいいるでしょうか。
とにかく、統計学や、R の操作・プログラミングに関する情報が膨大です。掲示板でも興味深い議論がなされていますし、取り敢えず統計で解らない事があったらここを見る、的な。

浅野 晃の講義
関西大学の浅野晃氏の講義ページです(統計関連は、「これまでの講義」から)。
浅野氏の説明は、とにかく丁寧で、色々な具体的事例を用いて解りやすく解説しようという姿勢がよく見えます。それと同時に、厳密さや正確さをなるべく損なわず、専門用語も丁寧に定義を踏まえて使おうとされている、という所が素晴らしいです。これほど明快に説明する文章が書けるのは、率直に言ってすごいな、と思います*1

これはちょっと余談ですが、血液型性格判断に関心を持ってWEBを検索した人で、浅野氏の 「座観雑感」血液型問題 をご覧になった事がある方もおられるやも知れません。

また、浅野氏が出しておられる著作があります。

要するにそういうことか 統計学の考え方

要するにそういうことか 統計学の考え方

これは、統計関係の入門書の中でもとりわけ良書だと思います。お勧めです。

*1:それと、サイトや、講義資料中の図、のデザインが大変好ましいですね。良いセンスだなあ。