Identification in Parametric Models
Thomas J. Rothenberg
Econometrica
Vol. 39, No. 3 (May, 1971), pp. 577-591
パラメトリックなモデルにおける識別とはなにか?どういった条件が識別を担保するのか?という問題をきれいにまとめた良論文。
まずセットアップ
- Y:観察可能なデータ。n次元の実数空間の要素。
- Yの分布関数はKnownな分布族 に属しているとする。
以上の下でまず色々定義
構造Sとは、ユニークな分布 をImplyする仮説の集合として定義する。A prioriにわかっている可能な構造の集合を とする。
定義:観察上の同値性
に含まれる2つの構造S,S'があったとき、F(S)=F(S')であるならばSとS'は観察上同値であるという。
定義:識別
に含まれる構造Sがについて、 に含まれるようなどのようなS'もSと観察上同値でないとき、Sは識別されるという。
識別とはそもそも、観察者がデータの分布を完全にしっているような仮想的な状況においての性質である。
もしデータの分布が完全にわかったとしても、その分布を生み出すような仮説が複数ある場合、その仮説たちをデータから区別することはできない。ある仮説が識別されるとは、他のどんな仮説もその仮説と同じ振る舞いをするデータを生み出さないということである。
たぶん上の定義は一般的な定義なのだけど、ここではパラメトリックなモデルにおける識別を考えたいので、有限次元(m次元)で構造がIndexできるとする。
つまり、Sがm次元の実数の部分集合Aで記述されるような状況を考え、F(S)をf(y,α)とかく。(αはAの要素)
あともう一個定義をひとつ。
定義:局地的な識別(Local Identification)
パラメータαを含む開集合が存在して、その開集合内のどの要素もαと観察上同値でないとき、αは局地的に識別されるという。
というわけで、きちんと識別を定義しておいてから定理に入る。そのまえにいくつか仮定を
仮定たち
- 構造パラメータ空間Aは開集合で、R^mに含まれる。
- f(y,α)はProper density functionである。
- Aのどの要素に関しても、f(y,α)の台は同じである。
- f(y,α)はαに関して滑らか。(fとlog(f)が微分可能)
- 情報行列が存在して、各要素はαに関して連続
最後にもうひとつ定義。
定義:Regularity
M(α)をαに関してすべての要素が連続な行列とする。あるα0において、α0を含むような開集合が存在して、その開集合内のすべての要素においてM(α)のランクが一定であるとき、α0をRegular pointとよぶ。
いよいよ定理。
定理
αを情報行列のRegular pointとする。αが局地的に識別されることと、情報行列が正則行列であることは同値である。
証明は簡単なので、興味があると読むといいと思います。実は計量ランチミーティングでこれ発表した人がいたんだけど、そのときはFacultyの人たちは、「じゃあ、Regularityの条件とかはないの?」って質問してました。たしかに気になるけど、みたことないですね。
あと、このペーパーではいろいろグローバルな識別のための条件を出したりしてるけど、きれいに条件を出せないみたいです。一般にも、局地的な識別が示せればOKっていう雰囲気はあると思います。
最後に
Structure and Reduced Form
仮定5:構造パラメータαは、φ_i(α)=0(i=1,・・・,k)という制約を満たすとする。
仮定6:r次元の誘導系パラメータθが存在し、θ_i=h_i(α)(i=1,・・・,r)を満たし、f(y,α)=f*(y,θ)となるf*が存在するとする。
仮定7;θは識別される。
以上の条件のもとで、αが識別される条件を与えている。
を定義する。(わかりにくくてあれですが、全部行列です。r×m、k×m、(r+k)×mの。)
定理:
もしhとφが線形なら、αが識別されることとWのランクがmであることは同値である。
定理:
α*がW(α)のRegular Pointであるとする。このとき、α*が局地的に識別されることとW(α*)のランクがmであることは同値である。
例として同時方程式が挙げられているが割愛。