機械学習×計量経済学:Double/Debiased Machine Learning
Chernozhukov, Victor, Denis Chetverikov, Mert Demirer, Esther Duflo, Christian Hansen, Whitney Newey, and James Robins (2018a). “Double/Debiased Machine Learning for Treatment and Structural Parameters”, Econometrics Journal, 21, pp.C1–C68.
矢田紘平
機械学習と計量経済学
本稿では、計量経済学モデルの推定に機械学習の手法を応用する方法を提案した論文Chernozhukov et al.(2018a)を紹介する。ここでは、機械学習をLASSO、ランダムフォレスト、勾配ブースティング、ニューラルネットワーク等に代表される「予測・分類アルゴリズム」と捉えて議論する(厳密に「機械学習」とは何かを定義するのは、かなりハードな問題である)。
さて、機械学習と計量経済学の違いの1つとして、機械学習は予測精度を高めることを目的とするのに対し、計量経済学はモデルのパラメータの推定を目的とするということがしばしば挙げられる。たとえば、個人の賃金$Y$と特徴$X$のデータがあるとしよう。機械学習は、データに存在しない別の個人の賃金$Y$をその人の特徴$X$から高精度で予測する手法(たとえば、平均二乗誤差$E[(Y-f(X))^2]$が小さい$f$を求めるアルゴリズム)の開発を行う。とりわけ、$X$が高次元(データサイズと比して$X$の次元が大きい)の場合でも性能がよいことが求められる。一方、計量経済学は、変数間の関係を記述するモデルを立て、そのモデルのパラメータを推定することを目的とする。たとえば、モデルを$Y=X_1\beta_1+X’_2\beta_2+U$ ($X_1$は教育年数、$X_2$はそれ以外の特徴を示す変数が入ったベクトル、$U$は「能力」等の観察できない$Y$の決定因子)とし、教育のリターンを表す$\beta_1$を推定したい、といった具合である。
このように、機械学習と計量経済学は異なった問題に取り組むが、近年、計量経済学モデルの推定に機械学習の手法を応用する試みが進展している。本稿はその中からChernozhukov et al.(2018a)を取り上げて紹介しよう。