time series analysis

基本統計学(第3版)

基本統計学(第3版)

この本に、とても重要な事が書いてあるので、引用してみます。
※P222・223より引用。丸囲み数字は、丸括弧および数字リストに変更。強調は原文、赤字は引用者による

 経済学が分析対象とするデータは,時間に対応して観察されるものが多い。このようなデータを時系列データ(time series data)という。例えば,国民総生産は四半期ごとに観察されるし,『家計調査』の勤労者家計所得は月次ベースで報告されている。
 これに対して,ある時間の1時点をとり,そこで観察されるデータの集合を横断面データ,あるいはクロスセクション・データ(cross-section data)という。2010年の兵庫県の勤労者家計の所得の集合は横断面データの例である。第9章の表9.1の都道府県の消費と所得のデータも横断面データの例である。
 時系列データを分析する主要な目的は,そのデータがどのようなメカニズムで生成されたかを明らかにし,その構造に基づいてさまざまな状況での予測を行うことである。
 データの生成メカニズムを分析する手法はさまざまある。第1に,分析の対象となっている変数と関連しているさまざまな変数間の関係を何らかの経済理論に基づき定式化し,その相互依存関係を推定することにより分析する手法である。例えば,石油危機以降の日本の家計の消費行動を分析する場合には,さまざまな消費者行動の理論に基づき消費(変数)を説明する所得,資産残高,インフレ率といった諸要因を探し出し,消費との関連を回帰分析によって計測することが行われる。
 第2に,背後の経済理論がまだ確立されていない場合や,その生成メカニズム自体よりも予測に関心がある場合には,明示的な理論を仮定することなく過去の観察値の標本に基づき,それらの動きを忠実に描写する関数を当てはめることが考えられる。例えば,消費者行動についての知識が全くない場合でも,過去の消費系列が時間の1次(線形)関数でうまく描写できることがわかれば,将来の予測を行うことは可能である。
 この接近方法では,時系列データ(Xt)が以下の4つの要素から構成されていると仮定されることが多い。

  1. 時間の経過とともに傾向的に変動する部分。トレンドTt, trend)という。
  2. ほぼ一定の周期をもって循環する部分。循環変動Ct, cycle)という。
  3. 毎年同じ時期(季節)に規則的に観察される変動部分。季節変動Ct, seasonality)という。
  4. (1)〜(3)によって説明されない部分。不規則変動It, irregularity)という。

 われわれは,この接近方法を時系列の分解アプローチと呼ぶ。このアプローチではそれぞれの変動を特定化し,それらを総合することにより原系列の変動の特徴を探り,予測に利用する。
 第3のアプローチは,その時系列データの生成過程を確率的に描写し,データの生成された確率的構造を明らかにし,その構造に基づいて予測などを行う。このような接近方法を時系列分析(time series analysis)という。第2の接近方法と同様,生成メカニズムの理論的背景についての知識は必要としない

引用した部分は、時系列分析についての章であり、クロスセクショナル、横断的な分析では無く時系列データの扱いについて書かれています。そして、紹介されているアプローチの内、後の2つが採り上げられています。つまり、理論的考察によって変数間の関連やメカニズムについて分析するというよりは、時間的な変化に着目した「予測」の観点からのアプローチ。現象を作る諸条件がある程度そのままの状態なのであれば、必ずしもその詳細な論理構造が明らかで無くとも、着目している変数のデータについて回帰分析したり、色々の変動を調整したりして予測を行うのは可能、という事ですね。そして、現象を確率的なものとして見るという接近の仕方。
この種の時系列分析的アプローチというのは、心理統計方面ではあまり見ず*1、品質管理や経済統計や医療統計などで詳しく検討されているように感じます。不勉強なので、もうちょっとしっかりやる必要があります。

*1:もちろん回帰分析は必ず触れられていますが、コレログラムとか自己相関係数などによる時系列分析の話はそんなに出てこない気がします。知らないだけかも知れませんが