おすすめの計量分析の教科書(社会学向け)
はじめに
自分の所属している大学院では基本的に研究方法については独学で身につけることが期待されています。なので、これまでに自分でいろいろと教科書を調べて読みました。もしかしたら同じようにどのような教科書を読むべきか悩んでいる人がいるかもしれないので、何かの役に立つことを期待して、自分が読んでみて良いと思ったテキストを挙げておきます。
挙げているテキストはすべて英語です。もちろん日本語で書かれたテキストにもいいものはたくさんあるのですが、英語のテキストは基本的に日本語のテキストよりも長い分量で丁寧に書かれているので、独学には適していると思うからです。
社会調査法などをとおして基本的な方法(度数分布、平均・分散などの要約統計量、クロス集計、平均値の比較、相関係数などの2変量の分析、統計的推測、仮説検定など)をすでに学習した、社会学系の大学院生を想定しています。もしこれらをまだ勉強していないという場合には、先にこちらを勉強しておくほうがいいと思います。
計量分析の基礎
計量分析の基本はOLS回帰分析なので、まずは計量経済学の基礎的なテキストから入るのが一番良いと思います。
Introductory Econometrics: A Modern Approach
分厚いので時間がかかると思いますが、これ一冊きちんと読めていれば回帰分析に関しては他にテキストはいらないのではないかと思います。
ふつうのクロスセクションのOLS回帰分析のほか、時系列分析、パネルデータ分析、操作変数法、同時方程式、制限従属変数、カテゴリカルデータ分析、サンプル・セレクションモデルなどが扱われていますが、割かれている紙幅はさほど多くないので、このあたりは他のテキストを使うほうがいいと思います。
ただし、数式慣れしていない場合は、これでも少し難しいと感じるかもしれません。そういう場合は、以下の教科書を読んでから本書にチャレンジするといいかもしれません。
Regression Analysis for the Social Sciences
米国留学中の友人から教えてもらった本で、実際の論文例や統計ソフトの出力結果などが豊富に載っており、実際にどのようなことをするのか、イメージがわきやすいつくりになっています。計量分析の経験が少ないとか、数式が苦手だという人はこれを読んでからWooldridgeに進むとよいと思います。
社会学の場合は、連続変数よりもカテゴリカル変数を扱うことのほうが多いです。もちろんOLSによる回帰分析が多変量解析の基本なので、これはきちんと押さえたうえで、別途カテゴリカル変数を用いるモデルについても勉強する必要があります。
カテゴリカル・データの分析
Regression Models for Categorical and Limited Dependent Variables
自分が読んだので一番良かったのはこれです。ロジットモデル、プロビットモデル、順序ロジットモデル、多項ロジットモデル、条件つきロジットモデル、Type-1, Type-2トービット・モデル、ポアソン回帰・負の二項回帰モデルが扱われています。
Regression Models for Categorical Dependent Variables Using Stata
Stataを使う人であれば、この本も評判がいいです。前述の本は出版が1997年と若干古いので、こちらのほうがより新しいです。とくに結果の解釈のしかたについて、Marginal effectの算出なども含めてかなり紙幅を割いているので、読んでおくとより説得的な議論ができるかもしれません。
生存分析/イベントヒストリー分析
こちらの記事をご覧ください。
階層線形モデル/マルチレベル・モデル
マルチレベル・モデルはざっくり言ってしまえば、
- 個人のなかに複数の観察時点が入れ子になっている、いわゆる縦断データの分析=同一個人のなかの複数時点における観察値どうしが相関する。
- 学校、職業、地域、国などのより大きな単位のなかに個人が入れ子になっている=大きな単位を共有する個人の観察値どうしが相関する。
Applied Longitudinal Data Analysis: Modeling Change and Event Occurrence
時間による値の変化を捉えるための2つのモデル(成長曲線モデリングと、イベントヒストリー分析)を扱っています。前半が成長曲線モデリング、後半がイベントヒストリー分析です。以下の日本語訳もでています。
Multilevel and Longitudinal Modeling Using Stata, Third Edition
Stataを使うのであればこの教科書がほとんどすべての方法を網羅しています。
https://www.amazon.com/Multilevel-Longitudinal-Modeling-Using-Volumes/dp/1597181080/ref=pd_lpo_14_t_0/136-8893746-1050030?_encoding=UTF8&pd_rd_i=1597181080&pd_rd_r=4f4ee516-e66f-49c3-a68f-36af9df115cd&pd_rd_w=2ct2v&pd_rd_wg=f4plR&pf_rd_p=7b36d496-f366-4631-94d3-61b87b52511b&pf_rd_r=WACQ4B0ZXS0JY1X2YYTB&psc=1&refRID=WACQ4B0ZXS0JY1X2YYTBHierarchical Linear Models: Applications and Data Analysis Methods
先に挙げた2.の場面を想定したマルチレベル・モデルであれば、このRaudenbush and Brykの本はとても評判がよいと思います。第2版が2002年なので少し古いというところもありますが、なぜ中心化をするのかとか、どういうときに切片にランダム項を入れるのか、あるいは傾きにランダム項を入れるのか、どのように解釈をするべきかといった細かいところまで扱っていておすすめです。
Applied Panel Data Analysis for Economic and Social Surveys
パネルデータの分析を念頭に置いた本です。データの作り方から記述的な分析、固定効果モデル、ランダム効果モデル、一階差分モデル、イベントヒストリー分析までカバーしており、オーソドックスではありますが非常に分かりやすく説明されています。Stataのコードもあります。
その他
その他、バラバラと思いつくものを挙げておきます。興味関心に応じて参考にしていただければと思います。
【因果推論】Counterfactuals and Causal Inference: Methods and Principles for Social Research
自分自身は操作変数法、傾向スコア法などの因果推論的な分析を行ったことはないので、あくまでも論文を読むうえで押さえておいたほうがいいだろうという程度の距離感で因果推論と付き合って(?)います。
この本はデータ分析のhow to的な教科書ではありませんが、社会学者の書いた因果推論本であるということで、社会学を専攻している人にとっては読みやすいと思います。この本を読んで因果推論をするというよりはむしろ、モデルを組み立てるにあたってどのようなことを気をつければよいか、ということを学ぶという感じになるのではないかと思います。
【因果推論】Mostly Harmless Econometrics: An Empiricist’s Companion
同じく因果推論ものとしてもう一冊。今は計量分析の方法についても、理想的な因果効果を測定できる実験からの差分で考えることが多くなっていて、本書はその火付け役に位置する教科書と認識しています。日本語訳も出ていますが、どちらでも好きな方を選べばよいと思います。
【多重代入法】Flexible Imputation of Missing Data
欠損値を補正する方法として現在主流な方法である多重代入法についてのテキストです。自分でも一応論文(報告書)で使用したこともあるのですが、まだなんとなく手探りの状態です。アメリカなんかでは、社会学でもImputationはやって当たり前というふうになっているようです。
Rのコードがたくさん乗っているので、手を動かしながら勉強することができます。Stataでのやり方については[Stata multiple imputation]とかで検索するといい感じのウェブサイトにたどり着けると思います。
【要因分解法】論文をいくつか
2つの集団で回帰分析を推定して、2つの集団における変数の分布の違いがどの程度両者の間の従属変数の差を説明するのかを検討する、というのが要因分解法です。社会学でもときどき使われます。これは教科書は見当たらないのですが、いわゆるBlinder-Oaxaca decompositionにかんしては以下の論文がわかりやすくまとめていると思います。
もう少し発展的な方法まで扱っている論文は以下になります。
この論文はChapter 1–Chapter 7まであるのですが、正直数式がたくさんあって難しいので、Blinder-Oaxaca decompositionだけ知りたいのならChapter 1と3だけ読むといいと思います。より発展的な方法についてはChapter 4以降に書かれています。
【分位点回帰】Quantile Regression
経済学ではよく使われる分位点回帰分析ですが、最近は社会学でも使われることが増えてきたように思います。とりわけ社会的・経済的な格差を問題にするときには通常の(平均への)回帰分析だけでなく、分位点回帰分析についても押さえておくと選択肢が広がります。この本はSageの緑本ですが、分かりやすくまとまっており、おすすめです。
また、この本をよむ前に以下の本を読んでおくと、よりスムーズに読めると思います。
【そのほか】
ここまで取り上げてこなかった手法としては、因子分析系、対応分析、クラスター分析、共分散構造分析、ネットワーク分析まわり、潜在クラス分析、潜在成長曲線モデル、シークエンス分析、対数乗法連関モデルなどの発展的なログリニア・モデル、質的比較分析(QCA)、時系列分析などがあります。このあたりは自分では使ったことがなかったり、詳しくなかったりするので、紹介することはしません。