NAMs出版プロジェクト: 最小二乗法(直線)の簡単な説明
http://nam-students.blogspot.jp/2017/10/blog-post_6.html@最小二乗法(直線)の簡単な説明 | 高校数学の美しい物語
http://mathtrain.jp/leastsquares
| /
| 。 /
| ⇧ /
| ⇩/
| /
| /
| /
| /
| /
|/⇧
/ ⇩
。 /| 。
⇧ / |
__⇩/__|_______________
/ | x
。 | 。が与えられたときに
/ | ⇧⇩の二乗和を最小化する
| 直線を求めたい
最小二乗法について
最小二乗法による直線フィッティングの基礎的な説明です。最小二乗法はデータの組 が
二つセットのデータの組(xi,yi) x i y i が n 個与えられた状況を考えています。そして
と に直線的な関係があると推察できるときに,ある意味で最も相応しい直線を引くのが最小二乗法です。
…
直線フィッティングの複雑な式を導出します。考え方は非常に単純です。
y
| /
| 。 /
| ⇧ /
| ⇩/
| /
| /
| /
| /
| /
|/⇧
/ ⇩
。 /| 。
⇧ / |
__⇩/__|_______________
/ | x
。 | 。が与えられたときに
/ | ⇧⇩の二乗和を最小化する
| 直線を求めたい
もっともらしい直線の式を とおくと, とその直線との 方向の誤差(ズレ)は, です。この誤差の二乗和が最小になるのが最もらしい直線であると考えるのが最小二乗法の流儀です。
つまり, を最小化するような を求める問題となりました。変数が でそれ以外は定数である(データによって与えられている)ことに注意して下さい。
これは,二変数の二次関数で紹介したいずれの手法で解くこともできます。数式がやや複雑ですが頑張って計算すると冒頭の直線フィッティングの式を得ます。
___
参照:
畠中 道雄,鈴木 篤; -
一般化モーメント法 - Wikipedia
一般化モーメント法(いっぱんかモーメントほう、英: generalized method of moments, GMM)とは、計量経済学において統計モデルのパラメーターを推定するための一般的な方法である。通常、セミパラメトリックモデルで適用され、そのようなセミパラメトリックモデルにおいて興味のあるパラメーターは有限次元であり、一方データの分布関数の全容は知られていないこともありうる。よってそのようなモデルでは最尤法が適用できない。
一般化モーメント法においては、モデルについてのいくつかのモーメント条件が特定されている必要がある。これらのモーメント条件はモデルのパラメーターとデータの関数である。例えば、真のパラメーターの下で期待値が0となるようなものがある。この時、一般化モーメント法はモーメント条件の標本平均のあるノルムを最小化する。
一般化モーメント法による推定量は一致性、漸近正規性を持つことが知られ、さらにモーメント条件以外の情報を使わないすべての推定量のクラスにおいて統計的に効率的であることも知られている。
一般化モーメント法はラース・ハンセンにより1982年に、カール・ピアソンが1894年に導入したモーメント法の一つの一般化として提案された。ハンセンはこの業績により2013年のノーベル経済学賞を受賞した。
利用可能なデータは T 個の観測値 {Yt } t = 1,...,T からなると仮定する。ここでそれぞれの観測値 Yt は n 次元の多次元確率変数であるとする。ここでこのデータはある統計モデルから生成されるとし、その統計モデルは未知パラメーター θ ∈ Θ によって定義されるものとする。この推定問題の目的は真のパラメーター θ0 もしくは少なくとも適度に近い推定量を見つけることである。
一般化モーメント法の一般的な仮定はデータ Yt が弱定常かつエルゴードな確率過程であることである(独立かつ同一分布に従う確率変数 Yt はこの条件の特殊ケースである)。
一般化モーメント法を適用する為に、モーメント条件を特定する必要がある。つまり以下のようなベクトル値関数 g(Y,θ) が既知でなくてはならない。
ここで E は期待値、Yt は一般的な観測値を表す。加えて関数 m(θ) は θ ≠ θ0 ならば0と異なる値を取らなくてはならない。そうでなければパラメーター θ は識別不可能である。
一般化モーメント法の基本的なアイデアは理論的な期待値 E[⋅] を実証的なもの、つまり標本平均に置き換えることである。
そして、この時、この表現のあるノルムを θ について最小化する。ノルムを最小化する θ が θ0 の推定量である。
大数の法則により、十分大きな T について であり、 よって が成り立つことが予想される。一般化モーメント法はできるだけ を0に近づけるような を探す。数学的にはこの方法は のあるノルムを最小化することと同値である(m のノルムを ||m|| と表し、m とゼロの間の距離を測るものとする)。結果として得られた推定量の持つ性質はノルム関数の選択にもよるので、ゆえに一般化モーメント法の理論はノルム全体の族を考慮する。以下を定義する。
ここで W は正値定符号である加重行列で m′ は転置を表す。実践上、加重行列 W は利用可能なデータセットに基づいて計算され、そのようにして計算された加重行列を とする。よって一般化モーメント法による推定量は以下のように書ける。
適切な条件の下で、一般化モーメント法による推定量は一致性と漸近正規性を持つ。そして加重行列 を正しく選択すれば効率的な推定量となる。
/|
y / |ε
_____/__|_______
/ / | s /
/ / | /
/ / ^y↗︎ /
/ / /
/_______________/
モーメントについて成立しているはずの条件が、私たちの手元にある標本に
ついて計算されるモーメントにおいても同様に成立されるはずだ、という
ことから推定する手法だ。
…
今、目的変数yをいくつかの説明変数によって構成される平面(世界)Sに
写し取って推定値^yを得ることを考える。この場合、もっとも適切な^yは、
yから平面Sに対して垂線εを下ろすことで得られるだろう。とすれば、yの
推定値^yの特徴は、^yとεとが直角に交わることに見出だせる。これが直交
条件だ。OLS(=最小二乗法)の場合であれば、残差と説明変数とが無相関という
あとは、この直交条件を満たすような形で連立方程式を解けば、パラメータの
推定値が得られる。
実証分析入門 データから「因果関係」を読み解く作法 #27
操作変数法 - Wikipedia
操作変数法(そうさへんすうほう、英: method of instrumental variables, IV)とは、統計 学、計量経済学、疫学、また関連分野において、統制された実験が出来ない時、もしくは 処置がランダムに割り当てられない時に、因果関係を推定するための方法である。
返信削除/|
y / |ε
_____/__|_______
/ / | s /
/ / | /
/ / ^y↗︎ /
/ / /
/_______________/