一般化モーメント法(いっぱんかモーメントほう、英: generalized method of moments, GMM)とは、計量経済学において統計モデルのパラメーターを推定するための一般的な方法である。通常、セミパラメトリックモデルで適用され、そのようなセミパラメトリックモデルにおいて興味のあるパラメーターは有限次元であり、一方データの分布関数の全容は知られていないこともありうる。よってそのようなモデルでは最尤法が適用できない。
一般化モーメント法においては、モデルについてのいくつかのモーメント条件が特定されている必要がある。これらのモーメント条件はモデルのパラメーターとデータの関数である。例えば、真のパラメーターの下で期待値が0となるようなものがある。この時、一般化モーメント法はモーメント条件の標本平均のあるノルムを最小化する。
一般化モーメント法による推定量は一致性、漸近正規性を持つことが知られ、さらにモーメント条件以外の情報を使わないすべての推定量のクラスにおいて統計的に効率的であることも知られている。
利用可能なデータは T 個の観測値 {Yt } t = 1,...,T からなると仮定する。ここでそれぞれの観測値 Yt は n 次元の多次元確率変数であるとする。ここでこのデータはある統計モデルから生成されるとし、その統計モデルは未知パラメーター θ ∈ Θ によって定義されるものとする。この推定問題の目的は真のパラメーター θ0 もしくは少なくとも適度に近い推定量を見つけることである。
一般化モーメント法を適用する為に、モーメント条件を特定する必要がある。つまり以下のようなベクトル値関数 g(Y,θ) が既知でなくてはならない。
![m(\theta _{0})\equiv \operatorname {E} [\,g(Y_{t},\theta _{0})\,]=0,](https://wikimedia.org/api/rest_v1/media/math/render/svg/f6eb50bfdb16db36faaac02093b72fb142e45d30)
ここで E は期待値、Yt は一般的な観測値を表す。加えて関数 m(θ) は θ ≠ θ0 ならば0と異なる値を取らなくてはならない。そうでなければパラメーター θ は識別不可能である。
一般化モーメント法の基本的なアイデアは理論的な期待値 E[⋅] を実証的なもの、つまり標本平均に置き換えることである。

そして、この時、この表現のあるノルムを θ について最小化する。ノルムを最小化する θ が θ0 の推定量である。
大数の法則により、十分大きな T について
であり、 よって
が成り立つことが予想される。一般化モーメント法はできるだけ
を0に近づけるような
を探す。数学的にはこの方法は
のあるノルムを最小化することと同値である(m のノルムを ||m|| と表し、m とゼロの間の距離を測るものとする)。結果として得られた推定量の持つ性質はノルム関数の選択にもよるので、ゆえに一般化モーメント法の理論はノルム全体の族を考慮する。以下を定義する。

ここで W は正値定符号である加重行列で m′ は転置を表す。実践上、加重行列 W は利用可能なデータセットに基づいて計算され、そのようにして計算された加重行列を
とする。よって一般化モーメント法による推定量は以下のように書ける。

適切な条件の下で、一般化モーメント法による推定量は一致性と漸近正規性を持つ。そして加重行列
を正しく選択すれば効率的な推定量となる。
一致性とは、推定量の持つ統計的な性質であり、十分に多くの観測値がある場合、推定量は真の値に任意に近づいていくということである。

(確率収束を参照)。一般化モーメント法による推定量が一致性を持つ必要十分条件は以下の通りである。
を満たす。ただし W は正値定符号行列である。
である時に限り
を満たす。
- パラメーターが値を取りうる集合
はコンパクト集合である。
は θ について確率1で連続である。
![\operatorname {E} [\,\textstyle \sup _{\theta \in \Theta }\lVert g(Y,\theta )\rVert \,]<\infty](https://wikimedia.org/api/rest_v1/media/math/render/svg/f3d89ceca2219737614e336294d013028345017b)
第二の条件(大域的識別条件と呼ばれる)はしばしば確かめるのが難しい。非識別問題を調べるのに用いられる、必要条件ではあるが十分条件ではない簡単な条件がある。
- オーダー条件 m(θ) の次元が少なくともパラメーターベクトル θ の次元より大きい。
- 局所識別 g(Y,θ) が
の近傍で連続微分可能であるならば、行列
は列フルランクである。
実証計量経済学者は実際に大域的識別条件を確かめずに、それが成立していると単に仮定することがしばしばある[1]。
漸近正規性編集
漸近正規性は有用な性質であり、漸近正規性により推定量の信頼区間を計算することや仮説検定を行うことができる。一般化モーメント法による推定量の漸近分布について述べる前に、以下の2つの補助的な行列を定義する。
![G=\operatorname {E} [\,\nabla _{\!\theta }\,g(Y_{t},\theta _{0})\,],\qquad \Omega =\operatorname {E} [\,g(Y_{t},\theta _{0})g(Y_{t},\theta _{0})'\,]](https://wikimedia.org/api/rest_v1/media/math/render/svg/b231207779ee763d3e383041be66845f729d8618)
以下の1から6までの条件の下で、一般化モーメント法による推定量は漸近正規性を持つ。
![{\sqrt {T}}{\big (}{\hat {\theta }}-\theta _{0}{\big )}\ {\xrightarrow {d}}\ {\mathcal {N}}{\big [}0,(G'WG)^{-1}G'W\Omega W'G(G'W'G)^{-1}{\big ]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4965e5bc0d2d0e2c4dfb376d44fe34c9f90b25b0)
は一致性を持つ。
- パラメーターが値を取りうる集合
はコンパクト集合である。
は確率1で
のある近傍 N において連続微分可能である。
![\operatorname {E} [\,\lVert g(Y_{t},\theta )\rVert ^{2}\,]<\infty](https://wikimedia.org/api/rest_v1/media/math/render/svg/b87d524c0698df91cf0035de5307bcee4a782839)
![\operatorname {E} [\,\textstyle \sup _{\theta \in N}\lVert \nabla _{\theta }g(Y_{t},\theta )\rVert \,]<\infty](https://wikimedia.org/api/rest_v1/media/math/render/svg/7e2c36ae3d3aa4f31dc1b653564b770321aab8e0)
- 行列
は正則行列である。
ここまで行列 W の選択については、それが半正値定符号で無くてはならないということを除き何も述べてこなかった。実際、どのような半正値定符号行列であっても一般化モーメント法による推定量は一致性と漸近正規性を持つ。唯一の違いはその推定量の漸近分散にある。加重行列を以下のように取る。

すると、一般化モーメント法による推定量はすべての漸近正規的な推定量の中で最も効率的となる。この場合の効率性は、推定量が可能な限り最小の分散行列(ある行列 A が行列 Bより小さいとは B-A が半正値低符号であるということである。)を持つという意味である。
この場合、一般化モーメント法による推定量の漸近分散についての公式は以下のように単純化される。
![{\sqrt {T}}{\big (}{\hat {\theta }}-\theta _{0}{\big )}\ {\xrightarrow {d}}\ {\mathcal {N}}{\big [}0,(G'\,\Omega ^{-1}G)^{-1}{\big ]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ccbf6c8792f60a7923a74ef6e67a661cf7491625)
このような加重行列を選ぶことが最適になるという証明は、しばしば他の推定量の効率性を証明する時の証明を少しばかり模倣したものを取り入れる。大雑把に言えば、加重行列を分散についての"サンドイッチ公式"が単純な表現になるように選べば、その加重行列は最適となる。
証明 加重行列を任意の W とした時と とした時の漸近分散の差について考える。もし、その差がある行列 C についての対称な積の形式 CC' に分解できれば、それはその差が非負値定符号であることを意味し、ゆえに定義より は最適になる。 |
 |  |
|  |
|  |
|  |
ここで行列 A と B を記法の単純化のために導入している。I は単位行列である。行列 B は対称かつ冪等な行列であることが分かる。これは I-B もまた対称かつ冪等であることを意味する。つまり が成り立つ。ゆえに以前の表現を以下のように分解することが可能である。
|
|  |
今まで述べてきた方法を実装するにあたっての一つの難しい点は W = Ω−1 として加重行列を取ることである。なぜならば Ω の定義より、それを計算するためには θ0 の値が既知でなければならず、θ0 はまさに未知であり、そもそも推定しようとしている量である。
この問題を解決するための方法がいくつか存在する。以下であげるものうち、2段階GMMが最も一般的である。
- ステップ1
(単位行列)とし、事前の一般化モーメント法による推定量
を計算する。この推定量は θ0 についての一致推定量ではあるが、効率的ではない。
- ステップ2

- とする。ただし、ステップ1における推定量
を用いた。この行列は Ω−1 に確率収束し、ゆえにこの加重行列を用いて推定量
を計算すれば、その推定量は漸近的に効率的である。
- 行列
を複数回計算することを除けば、本質的には2段階GMMと同じ方法である。つまりステップ2で得た推定量を加重行列として再び用いて推定量を計算し、これを繰り返す。このような推定量は、
と記すが、以下のシステム方程式を解いた場合と同値になる[2]。 
- このような繰り返しを行っても漸近的な改善は達成できないが、あるモンテカルロ実験では有限標本における推定量の振る舞いが若干よくなる[要出典]。
- 連続更新GMM(英: Continuously updating GMM CUGMM もしくは CUE)
を加重行列 W と同時に推定する。つまり、
- として推定する。モンテカルロ実験において、この方法は伝統的な2段階GMMよりよいパフォーマンスを見せている。連続更新GMMは(裾が厚くなるが、)中位点のバイアスが小さくなり、そして多くの場合における過剰識別制約のためのJ検定がよりもっともらしい結果となる[3]。
最小化の手続きの実装におけるもう一つの重要な問題は、(高次元であることもありうる)パラメーター空間 Θ を探索し、目的関数を最小化する θ の値を見つけるということになっているということである。このような手続きについて一般的に推奨される方法は存在せず、それは個々の場合による問題となる(数理最適化)。
- Faciane Jr., Kirby Adam (2006), Statistics for Empirical and Quantitative Finance, Philadelphia: H.C. Baird, ISBN 0-9788208-9-4
- Hall, Alastair R. (2005), Generalized Method of Moments (Advanced Texts in Econometrics), ISBN 0-19-877520-2
- Hansen, Lars Peter (1982), “Large Sample Properties of Generalized Method of Moments Estimators”, Econometrica 50 (4): 1029–1054, JSTOR 1912775
- Hansen, Lars Peter (2002), “Method of Moments”, in Smelser, N. J; Bates, P. B, International Encyclopedia of the Social and Behavior Sciences, Oxford: Pergamon
- Hansen, Lars Peter; Heaton, John; Yaron, Amir (1996), “Finite-sample properties of some alternative GMM estimators”, Journal of Business & Economic Statistics 14 (3): 262–280, doi:10.1080/07350015.1996.10524656, JSTOR 1392442
- Imbens, Guido W.; Spady, Richard H.; Johnson, Phillip (1998), “Information theoretic approaches to inference in moment condition models”, Econometrica 66 (2): 333–357, JSTOR 2998561
- Newey, W; McFadden, D (1994), “Large sample estimation and hypothesis testing”, Handbook of Econometrics, Elsevier Science
- Special issues of Journal of Business and Economic Statistics: vol. 14, no. 3 and vol. 20, no. 4.
0 Comments:
コメントを投稿
<< Home