• 2乗項を投入した固定効果モデル
  • 解釈
  • 2乗項を別のかたちで表現してみる
  • 2つの場合の比較

*この記事はこちらのウェブサイトに置かれているものです.

2乗項を投入した固定効果モデル

従属変数Yitを独立変数Xitおよびその2乗項Xit2で回帰する以下のモデルを考える.

(1)Yit=β0+β1Xit+β2Xit2+ui+εit

XitYitの個人内平均をとった式は,Xit=X¯i.Yit=Y¯i.を代入して,以下のようになる.

Y¯i.=β0+β1X¯i.+β2X¯i.2+ui+ε¯i.

上式から下式をひいて以下を得る.

(2)YitY¯i.=β1(XitX¯i.)+β2(Xit2X¯i.2)+(εitε¯i.)

このように,1乗項と2乗項の両者が同じ変数によって定義されている場合は問題がない.これはたとえばStataを使っているばあいに,xtregの独立変数にc.x##c.xを指定するようなことを意味する.

解釈

このように2乗項を投入した固定効果モデルは,連続変数の効果が線形でないことを,個人効果uiを統制したうえで取り出すモデルである.たとえば被雇用者(正社員)の賃金カーブは年齢の2乗項で表現できることはよく知られている.この関係は個人効果を統制してもなお見られるのかどうかをこのモデルを使って確認することはできる.

ただしその解釈はクロスセクションの分析とはかなり異なってくることに注意が必要である.というのも,個人内平均からの偏差の意味が人によって異なってくるからだ.XitXi.というのは,ある人にとっては30歳からの偏差かもしれないし,ある人にとっては40歳からの偏差かもしれない.なので,先の例で言うと,ここでの係数β1およびβ2を「真の」年齢による賃金カーブとして解釈できるのは,個人内平均Xi.がサンプル内のすべての個人について同一あるいは無視できるくらい小さい場合に限られるだろう.したがってほとんどの場合,固定効果モデルにおいて,β1β2それ自体を積極的に解釈するのは避けたほうがよいと思う.

しかしながら,X以外の独立変数の係数に関心があり,かつ,母集団における関係が(1)式のように(2次の関係によって)表せる,と想定できるのであれば,当然,XitXit2のいずれも独立変数として投入すべきである.この点はクロスセクションのときと同じである.

2乗項を別のかたちで表現してみる

しかし,2乗項を表す変数が別の変数として定義されている場合は問題があるかもしれない.これを確認してみたい.

たとえば,変数Xitを2乗した(あるいは,2乗して100で割ったりした)変数Zitを作成したとする.

Zit=Xit2
これはStataだと,generate xsq = x^2で変数を作成したうえで,xtregの独立変数としてx xsqを指定するようなことを意味する.具体的には独立変数XitおよびZitYitを回帰するモデルは以下のようになる.

Yit=β0+β1Xit+β2Zit+ui+εit

各変数の個人内平均をとった式は以下のようになる.

Y¯i.=β0+β1X¯i.+β2Z¯i.+ui+ε¯i.

上式から下式をひいて以下の式を得る.

(3)YitY¯i.=β1(XitX¯i.)+β2(ZitZ¯i.)+(εitε¯i.)

ここで問題かもしれないように感じるのは,Z¯i.=X¯i.2は成り立たないということである.一般的にいって,2乗の平均値は平均値の2乗には一致しないからだ.このことを簡単な数値例で確認してみよう.

i t X Z mean of X squared mean of X mean of Z
1 1 1 1 3 9 11
1 2 2 4 3 9 11
1 3 3 9 3 9 11
1 4 4 16 3 9 11
1 5 5 25 3 9 11
2

ここから明らかなように,Xitの平均値の2乗(squared mean of X)と,Xit2=Zitの平均値(mean of Z)は異なっている.この事実は,係数の推定値にバイアスをもたらすのだろうか.

2つの場合の比較

(2)式と(3)式では同じ係数を得ることができるのだろうか.(2)式と(3)式をくらべると,以下の条件が成り立っているとき,係数β1=β1およびβ2=β2となるといえる.

  1. Xit2X¯it2=ZitZ¯itが成り立っている.

  2. Xit2X¯it2=ZitZ¯it+ααは定数)が成り立っている.このとき,αは個人効果uiに吸収される(切片になる).

このことをふまえて,先ほどの数値例にあらたに列を追加したものが以下となる.

i t X Z mean of X squared mean of X mean of Z X^2 - bar(X)^2 Z - bar(Z)
1 1 1 1 3 9 11 -8 -10
1 2 2 4 3 9 11 -5 -7
1 3 3 9 3 9 11 0 -2
1 4 4 16 3 9 11 7 5
1 5 5 25 3 9 11 16 14
2

たしかにXitの平均値の2乗(squared mean of X)と,Xit2=Zitの平均値(mean of Z)は異なっているものの,両者を使って計算されるXit2X¯i.2ZitZ¯i.の間にはつねにXit2X¯i.2=ZitZ¯i.+2という関係が成り立っている.つまり,先ほどの条件2が成り立ち,β1=β1およびβ2=β2となる.

したがって,(2)と(3),いずれの式を用いたとしても,uiを統制したうえでの係数β1およびβ2が得られることとなる.