Conditional Choice Probabilities and the Estimation of Dynamic Models

Conditional Choice Probabilities and the Estimation of Dynamic Models
V. Joseph Hotz and Robert A. Miller
The Review of Economic Studies, Vol. 60, No. 3 (Jul., 1993), pp. 497-529

この論文では離散的な動学モデルを推定するためのCCP Estimatorを提案している。
注：離散でなく、連続ならばFOCから容易に推定できるみたいなことが書いてあるんですけど、連続の動学はよく知らないです。マクロなどでは常識なのでしょうか？

この推定方法を使えば、Value Functionを実際に解く必要がない。
Valuation Functionを、(1)Utility Payoff、(2)Choice Probability、(3)Probability Transitions of Choices and Outcomesで表現することがCCP推定関数の基礎になっている。

まずFrameworkについて。ノーテーションは適当なので、適宜理解してください。

Transition Probability:
$F_j(H_{t+1} \mid H_t)$
Period Utility:
$u_{tj} \equiv E(u_{tj} \mid H_t)+\epsilon _{tj}= u_j^* (H_t)+ \epsilon _{tj}$
Distribution function of epsilon:
$G(\epsilon_t \mid H_t)$

Objective:
$\max E_0 ( \sum _t \sum _j d_{tj} (u_j^*(H_t)+\epsilon_{tj}))$
conditional valuation function given optimal choice:
$v_j(H_t) = E ( \sum _t \sum _j d_{tj}^0 (u_j^*(H_t)+\epsilon_{tj}) \mid H_t, d_{tj}=1 )$
ちなみにこの　v はJ番目のAlternativeでNormalizeされている。つまり、UtilityのLocationの標準化をPeriod Utilityではなくて、各期のJ番目の選択肢を基準に行っている。
Scaleについては書いてないけど、普通誤差項の分散でScaleを標準化するものだと思います。LogitとかProbit的な。
conditional choice probability:
$p_k(H_t)= Pr\{ k= argmax (u_{tj}^*+\epsilon_{tj}+v_{tj}) \mid H_t \}$

PはPeriod UtilityとValueが与えられれば、Gのインテグラルの形でかける。積分の範囲はその選択肢が一番いい選択肢である範囲
$p_k(H_t)= E(d_{tk}^0=1 \mid H_t) \int 1\{ \text{k is the best choice} \} dG(\epsilon\mid H_t)$

一方で、適当なValueの値が与えられたときに、同じインテグラルの計算をすることができる。
任意のValue,ｖにたいして
$Q_j(v, H_t)= \int 1\{ \text{j is the best choice} \} dG$
を考える。（仮想のValueのもとでのChoice Probabilityになっている）

Proposition 1:QはそれぞれのHにおいて、vについての逆関数が存在する。

これによって、選択確率が与えられればValue Functionの値を求めることができる。
これを駆使して、Value FunctionをChoice Probability, transition probability, expected payoffs associated with future historyで書きなおすことがゴールになる。

まず、 $E\big( \epsilon _k \mid d_k =1 \big) \equiv W_k(p, H)$ を定義する。これは単にインテグラル。Wのなかにpが入っているのは、インテグラルの範囲がValueに依存するので、それをQのインバースを使って求めるから。

すると、Expected Period Utilityは、
$U=\sum _k (u_k^* + W_k(p, H))$
として表せる。
また、移行確率は、
$Pr(H_s\mid d_{tj}) = F_j (H_{t+1} \mid H_t) \Pi_r (\sum_k p_{rk}F_k (H_{r+1}\mid H_r))$
として表せるので、
$V_j (H_t, p(H_t)) =\sum _s \sum_{H_s} \{ U_s(F_{tj}\Pi_r (\sum _k p_{rk}F{rk})) \}$
としてValue Functionが書き表せた。
当然 $V_j (H_t, p(H_t)) =v_j(H_t)$ が成り立つ。Value Functionは今までの操作の不動点になっている。

いよいよCCP推定関数（CCP estimator）を求める。
直観的には、まずChoice ProbabilityとTransition ProbabilityをNonparametricに推定して、それをぶちこんでモーメントコンディションから推定する感じ。
上のVを使って求められるChoice Probabilityと実際のChoice Probabilityは一致するはずなので、前者＝後者という式が得られる。これがMoment Conditionのもとになる。
パラメタの次元をQとすると、R×１のInstrument、ｚ、と適当なWeighting Matrix（Q×（J-1）R）を用いて、
$\pi_{1n}(\theta, \ro(H_{nt}) \equiv \alpha _N (z_{nt} \otimes ( d_{nt} - P))$
というOrthogonality Conditionを導けるので、GMMで推定できる。
Instrumentは
$E(z_{nt} \otimes ( d_{nt} - P))=0$
となるように選ぶ。

実際には選択確率や移行確率のノンパラメトリックな推定にもちょっと議論があるが、そこは省略。
論文後半の具体的な実証部分も省略。