読者です 読者をやめる 読者になる 読者になる

【メモ】読みたい統計本:『調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)』

内容が極めて興味深いです。と言うのも、

 本書のタイトルは「調査観察データの統計科学」である.ただし,データを得る方法としての調査研究や観察研究に関する本ではない.ここで扱う内容をおおまかにいえば「偏りのあるデータから正しい推論を行なうための統計科学」である.「偏りのあるデータ」とは統制実験,あるいは無作為に実験条件への割り当てが行なわれていない研究で得られるデータ,および無作為抽出が行なわれていないデータのことである.
http://www.iwanami.co.jp/moreinfo/0069720/top.html

このようなコンセプトの本であるから。調査論の本は色々ありますが、バイアスがかかっているデータからいかにして正確な推論を試みるか、というのをメインテーマにしたものというのは、なかなか見られないのではないでしょうか。
昨今はWEBによるアンケートも増えてきて、それによって得られたデータを無闇に一般化する向きもしばしば見ますから、そのような類の調査によってどのようなバイアスがかかるか、とか、バイアスがかかったものからどうやって母集団について妥当な推測をしていくか、というのを知っておくのはとても重要だと思います。
この本が属しているシリーズ(「確率と情報の科学」)全体が実に面白そうですね。一覧を見てみると、

  • カーネル多変量解析――非線形データ解析の新しい展開 赤穂昭太郎 
  • 調査観察データの統計科学――因果推論・選択バイアス・データ融合 星野崇宏 
  • データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC 久保拓弥 
  • テキストモデリング――階層ベイズによるアプローチ 持橋大地 
  • 多変量解析と因果推論――「統計入門」の新しいかたち 狩野 裕
  • 帰納推論機械――確率モデルと計算アルゴリズム 田邉国士 
  • 強化学習――理論と実践 石井 信 
  • 確率モデルと知識処理 佐藤泰介・亀谷由隆 
  • 確率モデルのグラフ表現とアルゴリズム 池田思朗 
  • 符号理論と統計物理 田中利幸 
  • 乱数生成と計算理論 小柴健史 
  • 情報幾何入門――エントロピーダイバージェンス 江口真透 
  • 正定値行列の情報幾何――多変量解析・数理計画・制御理論を貫く視点 小原敦美・土谷 隆 
  • マイクロアレイ解析で探る遺伝子の世界 伊藤陽一 
  • 生命のかたちをはかる――生物形態の数理と統計学 三中信宏
  • 機械学習入門――統計モデルによる発見と予測 鹿島久嗣 
  • 高速文字列解析の世界――データ圧縮・全文検索テキストマイニング 岡野原大輔

「シリーズ 確率と情報の科学」
※引用にあたって適宜成形した

こんな感じです。個人的には、狩野氏と三中氏の本に注目しています(強調つけた所)。特に、多変量解析と因果推論は最も興味を持っている分野なので。
一体、全部出揃うのはいつになるか判りませんが……。