*この記事はこちらのウェブサイトに置かれているものです.
従属変数を独立変数およびその2乗項で回帰する以下のモデルを考える.
との個人内平均をとった式は,,を代入して,以下のようになる.
上式から下式をひいて以下を得る.
このように,1乗項と2乗項の両者が同じ変数によって定義されている場合は問題がない.これはたとえばStataを使っているばあいに,xtregの独立変数にc.x##c.xを指定するようなことを意味する.
このように2乗項を投入した固定効果モデルは,連続変数の効果が線形でないことを,個人効果を統制したうえで取り出すモデルである.たとえば被雇用者(正社員)の賃金カーブは年齢の2乗項で表現できることはよく知られている.この関係は個人効果を統制してもなお見られるのかどうかをこのモデルを使って確認することはできる.
ただしその解釈はクロスセクションの分析とはかなり異なってくることに注意が必要である.というのも,個人内平均からの偏差の意味が人によって異なってくるからだ.というのは,ある人にとっては30歳からの偏差かもしれないし,ある人にとっては40歳からの偏差かもしれない.なので,先の例で言うと,ここでの係数およびを「真の」年齢による賃金カーブとして解釈できるのは,個人内平均がサンプル内のすべての個人について同一あるいは無視できるくらい小さい場合に限られるだろう.したがってほとんどの場合,固定効果モデルにおいて,とそれ自体を積極的に解釈するのは避けたほうがよいと思う.
しかしながら,以外の独立変数の係数に関心があり,かつ,母集団における関係が(1)式のように(2次の関係によって)表せる,と想定できるのであれば,当然,とのいずれも独立変数として投入すべきである.この点はクロスセクションのときと同じである.
しかし,2乗項を表す変数が別の変数として定義されている場合は問題があるかもしれない.これを確認してみたい.
たとえば,変数を2乗した(あるいは,2乗して100で割ったりした)変数を作成したとする.
各変数の個人内平均をとった式は以下のようになる.
上式から下式をひいて以下の式を得る.
ここで問題かもしれないように感じるのは,は成り立たないということである.一般的にいって,2乗の平均値は平均値の2乗には一致しないからだ.このことを簡単な数値例で確認してみよう.
i | t | X | Z | mean of X | squared mean of X | mean of Z |
---|---|---|---|---|---|---|
1 | 1 | 1 | 1 | 3 | 9 | 11 |
1 | 2 | 2 | 4 | 3 | 9 | 11 |
1 | 3 | 3 | 9 | 3 | 9 | 11 |
1 | 4 | 4 | 16 | 3 | 9 | 11 |
1 | 5 | 5 | 25 | 3 | 9 | 11 |
2 | … |
ここから明らかなように,の平均値の2乗(squared mean of X)と,の平均値(mean of Z)は異なっている.この事実は,係数の推定値にバイアスをもたらすのだろうか.
(2)式と(3)式では同じ係数を得ることができるのだろうか.(2)式と(3)式をくらべると,以下の条件が成り立っているとき,係数およびとなるといえる.
が成り立っている.
(は定数)が成り立っている.このとき,は個人効果に吸収される(切片になる).
このことをふまえて,先ほどの数値例にあらたに列を追加したものが以下となる.
i | t | X | Z | mean of X | squared mean of X | mean of Z | X^2 - bar(X)^2 | Z - bar(Z) |
---|---|---|---|---|---|---|---|---|
1 | 1 | 1 | 1 | 3 | 9 | 11 | -8 | -10 |
1 | 2 | 2 | 4 | 3 | 9 | 11 | -5 | -7 |
1 | 3 | 3 | 9 | 3 | 9 | 11 | 0 | -2 |
1 | 4 | 4 | 16 | 3 | 9 | 11 | 7 | 5 |
1 | 5 | 5 | 25 | 3 | 9 | 11 | 16 | 14 |
2 | … |
たしかにの平均値の2乗(squared mean of X)と,の平均値(mean of Z)は異なっているものの,両者を使って計算されるとの間にはつねにという関係が成り立っている.つまり,先ほどの条件2が成り立ち,およびとなる.
したがって,(2)と(3),いずれの式を用いたとしても,を統制したうえでの係数およびが得られることとなる.