パス図で考える2時点パネルと因果関係

同じ対象者に対して複数回の調査を実施して得られたデータをパネルデータといいます。パネルデータを分析するときの主要な関心の1つは、変数間の因果関係を特定することにあります。今回は、パス図を使いながら、パネルデータを用いて因果関係を特定したいときに考慮すべきことは何かについて、考えたり勉強したりしたことを記録しておきます。

以下では、ある変数\(X\)と\(Y\)を時点1, 2にわたって測定したとします。このとき、変数\(X\)と\(Y\)の間の因果関係が知りたいとします。

固定効果(fixed-effects)モデル

まず本題に入る前に、パネルデータ分析の手法として最も一般的に用いられている固定効果モデルについて先に記しておきます。以前、「固定効果モデルへの誤解と変化を見るための方策の例」という記事で、固定効果モデルは(それだけでは)因果関係を明らかにするモデルではないということを書きました。このことをもう少し深く掘り下げて考えてみます。

先に述べた2時点のシチュエーションの場合、固定効果モデルは以下のような式で表されます。ただし、切片は省略します(以下、すべての式において切片は省略します)。

$$Y_t = \beta_1 X_t  + u + \varepsilon$$

個人効果\(u\)は変数の個人内平均との差をとって消去した上で推定することが多いです。このモデルはつまり、すべての時点(今回は\(t = 1, 2\))において以下のような関連がある、ということを想定しています。

このパス図から示唆されることは、固定効果モデルの強みは、\(X\)と\(Y\)の両者に影響する\(u\)を統制することによって、(変数間の直接的な関連として)より精確な\(\beta_1\)を得ることができるという点にある一方で、その係数はあくまで同時点における共変関係しか意味していないということです。

したがって、固定効果モデルのもとで\(X\)が\(Y\)の原因であると主張するためには、モデルの外で強い理論的な仮定を置く必要があります1)ちなみに一階差分(first-difference)モデルというのもありますが、2時点パネルの場合、固定効果モデルと一階差分モデルは同じ推定値となり、実質的な違いはありません。2)もちろん、固定効果モデルを次に説明するようなモデルに拡張することによって、よりダイナミックな関係を表現することができるようになります。

交差ラグ効果(cross-lagged effects)モデル

通常の固定効果モデルのように、同じ時点のみの関連を考えるモデルは出発点として重要です。しかし一方で、両方向の矢印(共変関係)ではなく、片方向の矢印(因果関係)を取り出したり、あるいはもっとダイナミックな変数間の関連を明らかにしたいと思うこともあると思います。

2時点にわたってデータを取ったということを考えると、まず思いつくのが以下のようなモデルです3)ところで、今回の記事の図はすべてdraw.ioというwebサービスを使って作成しました。パス図やフローチャートなどを作る際に非常に便利で、おすすめです。

$$Y_2 = \beta_1 Y_1 + \beta_2 X_1 + \varepsilon_1 $$

$$X_2 = \beta_3 X_1 + \beta_4 Y_1 + \varepsilon_2 $$

$$\varepsilon_1 \sim N(0, \sigma^2_1), \ \ \varepsilon_2 \sim N(0, \sigma^2_2), \ \ \mathrm{Corr}(\varepsilon_1, \varepsilon_2) = \rho$$

簡単のため、2つの残差は2変量正規分布にしたがうこととしておきます。なおここでは残差相関(共分散)を認めていますが、これはあってもなくても構いません。

矢印の向きがポイントです。固定効果モデルではXとTのあいだの矢印は両方向を向いていましたが、ここではXからYへの矢印、YからXへの矢印という2つに分割されています。つまり、両者の効果を見比べることで、どちらが主たる原因で、どちらが結果であるのかを判別することができるということです4)もちろんここでは両者の間のループ効果(X → Y → X → Y → …)があることを否定していません。しかしループ効果といっても、まったく同じようにお互いを強め合うというのは考えにくく、どちらかからどちらかへとより大きい流れがあることは十分に考えられます。ここではこうした相対的な意味での因果関係を想定しています。

ここで想定されている因果関係は、前の時点のXが次の時点のYに影響し、前の時点のYが次の時点のXに影響する、というものです。たとえば係数\(\beta_2\)と係数\(\beta_4\)を比較して、\(\beta_4 < \beta_2\)というような結果を得られれば、Xがより重要な先行する原因で、Yが結果であると考えることができそうです。

交差ラグ効果モデルの強み

先の(単純な)固定効果モデルと比べたときのこのモデルの強みは、時間の前後関係を明示的にモデルに組み込んでいるという点にあります。因果関係というとき、そこには原因→結果という時間の前後関係が想定されています。交差ラグ効果モデルは、こうした時間の前後関係をラグによって表現しているといえます5)もちろん時間的な前後関係を組み込んだからといってそれを即座に相関関係でなく因果関係であると主張することはできず、理論的な仮定あるいは解釈が必要となってきます。しかし、XからYへの効果とYからXへの効果の2つを想定する本モデルは、少なくともモデル上は、固定効果モデルよりも因果関係の特定に近づいていると考えることができます。

同時効果(synchronous effects)モデル

次も2時点のXとYの関連について考えますが、先ほどとは少し違う以下のようなモデルを考えてみます。

$$Y_2 = \beta_1 Y_1 + \beta_2 X_2 + \varepsilon_1 $$

$$X_2 = \beta_3 X_1 + \beta_4 Y_2 + \varepsilon_2 $$

$$\varepsilon_1 \sim N(0, \sigma^2_1), \ \ \varepsilon_2 \sim N(0, \sigma^2_2), \ \ \mathrm{Corr}(\varepsilon_1, \varepsilon_2) = \rho$$

先のモデルと異なる点は、同じ時点の\(X\)が同じ時点の\(Y\)に影響し、同じ時点のYが同じ時点のXに影響する、というふうになっている点です。つまり、\(X\)と\(Y\)の間には(モデル上は)時間的なラグが含まれていないということです。この場合もやはり、たとえば係数\(\beta_2\)と係数\(\beta_4\)を比較して、\(\beta_4 < \beta_2\)というような結果を得られれば、\(X\)が先行する原因で、\(Y\)が結果であると考えることができるかもしれません。

同時効果モデルの強み

同時効果モデルは、交差ラグ効果モデルよりも時間的に近い影響関係を想定しています。この違いを明確にするために、交差ラグ効果モデルが不適切かもしれない例を考えてみます。

社会科学分野で行われるパネル調査の多くは、1年に1回くらいのペースです。つまり、ラグをモデルに組み込むということは、「1年前のXの値が現在のYに影響する(1年前のXの値が現在のYに影響する)」と想定するということを意味しています。

このような想定が不適切かもしれない例を挙げてみます。

Question: 外出頻度と抑うつ度の間の因果関係(外出頻度が多いほど抑うつ度が低下するのか、抑うつ度が低いするほど外出頻度が多くなるのか?)を、2010年・2011年の2時点パネルデータを用いて明らかにする。

Result: 交差ラグ効果モデルを用いて分析した結果、時点1(2010年)の外出頻度は時点2(2011年)の抑うつ度に影響していなかったが、時点1(2010年)の抑うつ度は時点2(2011年)の外出頻度と負の関連があった。したがって、両者の関連は抑うつが外出頻度を低めるという因果関係である。

結果はさておいて、「1年前の外出頻度が現在の抑うつ度に影響する」というのは現実的に想定できるでしょうか?実際には、もっと近い時間間隔で両者が影響していると考えるほうがもっともらしい気がします。この点は最後にも少し触れます。

交差ラグ・同時効果モデル

ここまで、2種類のモデルを見てきました。これらを同時に考慮した最も一般的なモデルは、以下のようになります。

$$Y_2 = \beta_1 Y_1 + \beta_2 X_1 + \beta_3 X_2 + \varepsilon_1 $$

$$X_2 = \beta_4 X_1 + \beta_5 Y_1 + \beta_6 Y_2 + \varepsilon_2 $$

$$\varepsilon_1 \sim N(0, \sigma^2_1), \ \ \varepsilon_2 \sim N(0, \sigma^2_2), \ \ \mathrm{Corr}(\varepsilon_1, \varepsilon_2) = \rho$$

残念ながら、この交差ラグ・同時効果モデルはこれだけではパラメータを識別することができません。6つの\(\beta\)を推定するためには、\(X_2\)には影響するが\(Y_2\)には影響しない変数、および\(Y_2\)には影響するが\(X_2\)には影響しない変数、というのをそれぞれ少なくとも1つ以上追加する必要があります6)たとえばもう1時点データを追加した場合、1時点めの変数\(X_1, Y_1\)をそれぞれ2時点目の変数\(X_2, Y_2\)の操作変数とするといったような方法によって交差ラグ・同時効果モデルのパラメータを推定できます。ただしこの場合、1時点めと2時点めの間の因果関係についての分析ができなくなってしまうという欠点があります。

ここまで3種類のモデルを見てきましたが、この交差ラグ・同時効果モデルは大きく分けて3種類の効果からなっていることがわかります。これを示したのが次の図になります。


(1)の黒い実線の矢印(先の数式でいうと\(\beta_1\)および\(\beta_4\))は、同じ変数の前の時点の値が次の時点の値に影響することを意味しています。変数それ自体の自己相関を表すこのパラメータは、変数の時間的な安定化の効果stability effects)を表しているといえます7)具体例として、例えば資産額の時間的な変化を挙げておきます。時点1において多くの資産を持っている者は、時点2においても多くの資産を持っていると考えられます。したがって各時点の資産額には正の自己相関が生まれるわけで、これを安定化の効果と言っています。固定効果モデルの場合、この自己相関は個人効果$u$によって統制されていると考えることができます。このあたりの話は本当はもう少し突っ込んで考える必要があると思いますが、ここでは詳述しません。

(2)の赤い点線の矢印(先の数式でいうと\(\beta_2\)および\(\beta_5\))は、前の時点の\(X\)の値が次の時点の\(Y\)に影響する、あるいは前の時点の\(Y\)の値が次の時点の\(X\)に影響することを意味しています。他の変数が時間的なラグをともなって影響する、交差ラグ効果cross-lagged effects)を表しているといえます。

(3)の青い点線の矢印(先の数式でいうと\(\beta_3\)および\(\beta_6\))は、同じ時点の\(X\)の値が同じ時点の\(Y\)に影響する、あるいは同じ時点の\(Y\)の値が同じ時点の\(X\)に影響することを意味しています。変数間の関連に時間的なラグが伴わないという意味で、これを同時効果synchronous effects)と呼ぶことができます。

これらの効果を部分的に組み合わせることで、いろいろなモデルを作ることも可能です8)ただし、パスが多すぎるとパラメータの識別ができなくなります。。例えば以下のようなモデルです。

$$Y_2 = \beta_1 Y_1 + \beta_2 X_1 + \beta_3 X_2 + \varepsilon_1 $$

$$X_2 = \beta_4 X_1 + \varepsilon_2 $$

$$\varepsilon_1 \sim N(0, \sigma^2_1), \ \ \varepsilon_2 \sim N(0, \sigma^2_2), \ \ \mathrm{Corr}(\varepsilon_1, \varepsilon_2) = \rho$$

まとめ:ラグ効果か同時効果か?

以上のようなモデルを作るときには、変数間の関連がどのような時間的な幅をともなって現れるものであるのかを考えることが必要となると思います。

因果関係というからには、変数間には時間的な前後関係があるはずです。つまり、「同時効果」といっても、「真の因果関係」をもっと細かい時間間隔で「見る」ことができれば、その内実はどちらかが先行するという関係になっているはずです。しかし実際にはこれを測定することはできていないので、より短い時間間隔に近い同時効果モデルを採用するということが選択肢に入ってくるわけです。

1時点前の変数で説明するか、同時点の変数で説明するのかという問題はたとえば適合度で比較してどちらが妥当かを確かめることもできると思いますが、適合度だけでなく、理論的にどのような時間間隔での影響関係を想定できるのかを考えることがより重要と思います。

参考にした文献

Allison, Paul D., Richard Williams, and Enrique Moral-Benito. 2017. “Maximum Likelihood for Cross-Lagged Panel Models with Fixed Effects.” Socius: Social Research for a Dynamic World 3:1–17.

Bollen, Kenneth a and Jennie E. Brand. 2010. “A General Panel Model with Random and Fixed Effects: A Structural Equations Approach.” Social Forces 89(1):1–34. 

Finkel, Steven E. 1995. Causal analysis with panel data (Vol. 105). Sage.

Paxton, Pamela M., John R. Hipp and Sandra Marquart-Pyatt. 2011. Nonrecursive models: Endogeneity, reciprocal relationships, and feedback loops (Vol. 168). Sage.

Notes   [ + ]

1. ちなみに一階差分(first-difference)モデルというのもありますが、2時点パネルの場合、固定効果モデルと一階差分モデルは同じ推定値となり、実質的な違いはありません。
2. もちろん、固定効果モデルを次に説明するようなモデルに拡張することによって、よりダイナミックな関係を表現することができるようになります。
3. ところで、今回の記事の図はすべてdraw.ioというwebサービスを使って作成しました。パス図やフローチャートなどを作る際に非常に便利で、おすすめです。
4. もちろんここでは両者の間のループ効果(X → Y → X → Y → …)があることを否定していません。しかしループ効果といっても、まったく同じようにお互いを強め合うというのは考えにくく、どちらかからどちらかへとより大きい流れがあることは十分に考えられます。ここではこうした相対的な意味での因果関係を想定しています。
5. もちろん時間的な前後関係を組み込んだからといってそれを即座に相関関係でなく因果関係であると主張することはできず、理論的な仮定あるいは解釈が必要となってきます。しかし、XからYへの効果とYからXへの効果の2つを想定する本モデルは、少なくともモデル上は、固定効果モデルよりも因果関係の特定に近づいていると考えることができます。
6. たとえばもう1時点データを追加した場合、1時点めの変数\(X_1, Y_1\)をそれぞれ2時点目の変数\(X_2, Y_2\)の操作変数とするといったような方法によって交差ラグ・同時効果モデルのパラメータを推定できます。ただしこの場合、1時点めと2時点めの間の因果関係についての分析ができなくなってしまうという欠点があります。
7. 具体例として、例えば資産額の時間的な変化を挙げておきます。時点1において多くの資産を持っている者は、時点2においても多くの資産を持っていると考えられます。したがって各時点の資産額には正の自己相関が生まれるわけで、これを安定化の効果と言っています。固定効果モデルの場合、この自己相関は個人効果$u$によって統制されていると考えることができます。このあたりの話は本当はもう少し突っ込んで考える必要があると思いますが、ここでは詳述しません。
8. ただし、パスが多すぎるとパラメータの識別ができなくなります。