決定係数の要因分解

以前に、以下のような記事を書きました。
決定係数や標準化偏回帰係数が高いと「影響力が強い」といえるのか?
このあと、もう少しフォーマルに考えた結果、決定係数は(1) 独立変数の限界効果、 (2) 独立変数の分散および共分散、(3) 従属変数の分散、の3つの要因に左右されることがわかりました。
このことを利用すれば、2つの異なるサンプル間で決定係数を比較したい(ふつうはすべきでない、あるいはしてもあまり意味がないと言われている手続きです)場面において、それらの決定係数の違いが上記の3つの要因のうちどれによって生じているかを要因分解によって確かめることができます。 数式が多いので(Wordpressのバージョンを久しぶりに更新したら数式が入れにくくなった…)、以下の場所にそのアイデアをまとめた記事を置きました。興味がある方は参照いただければと思います。

決定係数の要因分解(2019/9/6公開)

Stataコード(2019/9/12公開)