公共入札メモ3

今まで何?…自販機設置入札にしたら増収12倍 (読売新聞)
 宇都宮市が市有施設に設置する飲料自動販売機について、設置業者の選定に条件付き一般競争入札を導入したところ、年間契約額が全体で567万1000円となり、従来の12・5倍となることが25日、分かった。

 市管財課は、「予想外の増収となり、ありがたい」とうれしい悲鳴を上げている。

 自販機の入札導入は、栃木県や足利市で行われており、いずれも増収となっている。20日に行われた入札では、河内総合運動公園や夜間休日救急診療所など7か所19台を対象とし、8事業者が参加した。

 自販機の使用料はこれまで、設置場所の土地や建物の評価額に応じて1台当たり平均2万4000円(総額45万3000円)だったが、今回の入札で、1台あたり従来の12・5倍の29万8000円となった。最高契約額は67万9000円で、最低は2万5000円だった。

 市管財課は「増収を図り、業者選定の公正・公平性を高めるためにも、そのほかの自動販売機についても入札の導入を検討していきたい」と話している。



[ 2010年5月27日7時24分 ]

Sequential estimation of dynamic discrete games

V Aguirregabiria, P Mira - Econometrica, 2007

この論文は、動学ゲームの構造推定の手法を提示している。
セットアップは以下。

Basic Setup

N : プレイヤーの数
 x_t\equiv(d_t, x_{1t}, ..., x_{Nt}) : State Variable。Common Knowledge。dは共通の状態変数
 a_t\equiv (a_{1t}, ..., a_{Nt}), a_{it}\in A=\{ 0,1, ...,J\} : Decisions
 \epsilon_t \equiv (\epsilon_{1t},...,\epsilon_{Nt}) Private Information。各戦略、各プレイヤーごとにあるので、次元はN×(J+1)。
 p(x_{t+1},\epsilon_{t+1}|a_t, x_t, \epsilon_t) : 移行確率。これもCommon Knowledge
そのもとで、各プレイヤーは以下の目的関数を最大化する。
 E\Bigg(  \sum_{s=t}^{\infty} \beta^{s-t} \tilde{\Pi} _i (a_s, x_s, \epsilon_s) | x_t, \epsilon_{it} \Bigg)
これだけだとどうしようもないので、いつもの仮定を置く。

  • 仮定1:Additive Separability

 \tilde{\Pi} _i (a_s, x_s, \epsilon_s)= \Pi_i(a_t, x_t) +\epsilon_{it}(a_{it})

  • 仮定2:Conditional Independence

 p(x_{t+1},\epsilon_{t+1}|a_t, x_t, \epsilon_t)= p_{\epsilon}(\epsilon_{t+1})f(x_{t+1}|z_t,x_t)

  • 仮定3:Independent Private Values

 p_{\epsilon}(\epsilon_{t})=\Pi_{i=1}^N g_i(\epsilon_{it})

  • 仮定4:x_tのサポートは有限

これらを置くことで、HMとかRustとかで扱ってるような状況と同じになる。

Strategies and Bellman Equations

Game自体がMarkov構造を持っている(という風に仮定している)ので、戦略もマルコフストラテジーに限って分析する。これをしないと、動学は基本的にはなんでもありになってしまうので、どうしようもなくなる。
 \sigma=\{ \sigma_i (x, \epsilon_i) \}
をストラテジー(状態変数から行動への関数)のセットとする。
戦略をGivenとして、条件確率(Conditional Choice Probability)を以下のように定義する。
 P^{\sigma}_i(a_i| x) \equiv Pr(\sigma_i(x,\epsilon_i)=a_i|x)
いちいち書くのがめんどいので、以下εが出てこなかったら上のようにIntegrate outしてるか、期待値をとってると思ってください。お察しください。
あと、Πに関しても、相手の戦略を所与とした時の期待値とって
 \pi^{\sigma}_i (a_i,x)
を定義する。
同じように、
 f^{\sigma}_i (x'|a_i,x)
も定義できる。
すると、いわゆるベルマン方程式が
 \tilde{V}^{\sigma}_i(x, \epsilon) =\max \left( \pi^{\sigma}_i(x,a_i) +\epsilon (a_i)+\beta \sum_x (\int \tilde{V}^{\sigma}_i(x', \epsilon') g(\epsilon') d\epsilon' ) f^{\sigma}_i(x'|a_i,x) \right)
とかける。
HMやRustでもやったけど、εにかんして積分して、
 V^{\sigma}_i(x)= \int \max \{ v^{\sigma}_i(a_i, x) + \epsilon(a_i) \} g_i (d\epsilon)
とかける。vは、チョイススペシフィックなバリューファンクション(Choice-Specific value function)
 v^{\sigma}_i(a_i,x) \equiv \pi^{\sigma}_i(a_i,x)+ \beta V^{\sigma}_i(x') f^{\sigma}_i (x'|a_i,x)

これはコントラクションになってるから、ユニークなバリューファンクションが常に存在する。(σを所与とすれば)

Markov Perfect Equilibria

MPEを定義する。けどめんどいから飛ばす。
 \Lambda _i(a_i| x; P_i) =\int I \left( a_i \text{is the best response}\right) g_i (\epsilon) d\epsilon
という写像を考えたときに、MPEはこれのFixed Pointになっている。これをBest Response Probability Functionsと呼ぶ。
Browerの不動点定理から、これには不動点があることが言えるが、複数あるかもしれない。

以上より、均衡における選択確率は上の二つの不動点の問題をとく。
Given Pにおいて、N個のValue Functionsが計算できる。それをBRPFにぶちこむことで、P'が出てくる。PがMPEであれば、P=P’となっているということだ。

ただ、これを繰り返していけば均衡でのP*に収束するのだろうか?っていう疑問を持った。どうなんですかね?本文には書いてなかったです、たぶん。そうじゃない方法を提示してる論文だしね。

An Alternative Best Response Mapping

この論文では、N個のValue Functionを計算しなくてもいい方法を提示している。P^*を均衡とすると、それに付随する各プレイヤーのVFは
 V_i^{p^*}(x)=\sum P^*_i(a_i|x)\{ \pi_i^{p^*}(a_i,x)+e_i^{p^*}(a_i,x)\} +\beta \sum V_i^{p^*}(x')f^{p^*}(x'|x)
とかける。ここで、eの項はε(a_i)のa_iが選択されたという条件付での期待値を表す。HMとかでも出てきた、おなじみの項です。ロジットタイプの誤差項だと、
 e_i^p= \text{Euler's Constant} -\sigma \ln (P_i(a_i|x))
って簡単に書けることが知られているし、正規分布だったりすると解析的に書ける。

両者の違いを一言でいうと、前者では毎期最適行動するプレイヤーを想定している一方、後者では今期最適に行動する一方次期からはPに沿って行動するプレイヤーを想定している。どちらの場合でも、均衡では不動点になっていて、不動点の集合は一致するっていうのがレンマの内容。

均衡でのCCPを所与とすると、VFは以下の線型方程式の解になっている。
 (I-\beta F^{p^*})V_i^{p^*}=\sum P_i^{p^*}(a_i) * \{ \pi_i^{p^*}(a_i) +e_i^{p^*}(a_i)  \}
F^{p^*}はf^{p^*}の移行確率行列。*はElement by elementの掛け算。
ここで、Γ_i(P^*)をこの解とする。
 \Gamma _i(P^*) \equiv \{ \Gamma_i(x; P^*):x\in X   \} , V_i^{p^*}(x)=\Gamma_i(x;P^{p^*})
同様に、均衡確率でなくても、任意の確率Pに関して以下のようなMappingが定義できる。
 \Gamma_i(P) \equiv (I-\beta F^P)^{-1} \{ \sum P_i(a_i) * (\pi_i^P (a_i)+e_i^P(a_i) )\}
これは、
全プレイヤーが確率Pに従ってプレイするもとで、状態がxであったときのプレイヤーiのバリューの期待値
として解釈できる。

これを使うと、MPEを以下で定義する写像Ψの不動点として特徴付けることができる。
 \Psi_i(a_i|x, P) =\int 1\left( a_i=\arg \max \{ \pi_i^P(a,x)+\epsilon_i(a)+\beta \sum \Gamma_i(x':P)f_i^P(x'|x,a)\} \right) dG(\epsilon_i)

Representation Lemma

仮定1から3が成り立っているとする。
このとき、ΛとΨの不動点の集合は一致する。

このレンマをつかうと、Ψの不動点だけを計算すればいいことになるが、これはPだけに依存しているし、バリューファンクションの不動点を求める代わりに線型方程式を解くだけでいいので、より簡単なもんだいである。

Estimation

M個のマーケット
T期間分各マーケットでObservationがある

ようなパネルデータにおける推定を考える。M→∞、TはSmallっていう普通のパネルのセッティング。

仮定5:

  • 各マーケットで同じMPEが実現している。
  • プレイヤーは将来にわたっても同じMPEがプレイされると信じている。
  • Identification Condition
  • ObservationはIndependent across markets

という仮定を置いて推定する。
ナイーブには
  Q_M(\theta, P) =\frac{1}{M} \sum ^M\sum^T \sum^N \ln \Psi_i (a_{imt}|x_{mt};P, \theta)
という目的関数を
 P=\Psi(\theta, P)
という制約の元で最大化するθを推定量としたい。

しかし、これは現実にはかなり難しい最大化問題である。

Presudo Maximum Likelihood Estimation

仮に、実際のPopulation CCPを知ってるとする。(P^0とおく)
その場合、
 \hat{\theta}\equiv \arg\max Q_M(\theta, P^0)
はルートM一致推定量で、漸近正規性があることが示せる。
しかし、実際にはP^0は未知なので、これはInfeasible。

そこで、P^0の(たとえば、Nonparametricな)一致推定量が存在して、それがルートM一致推定量だとする。
すると、
1.まずP^0の推定量P'を求める。
2.Q_M(θ, P')を最大にするようなθの値を推定量とする
という2-step推定量を考える。制約を考えなくていいから、わりと楽になるってことかと思います。

Proposition 1はその推定量の性質について示している。
結果は、
今までの主な仮定+p'のルートM-Consistency、漸近正規性を仮定すれば、この二段階推定量の漸近正規性や√M-consistencyが示せる。

Nested Pseudo Likelihood Method

NPLはRecursive Extension of the two-step PML estimatorである。
この方法では、さっきのステップ1で必要だった一致推定量が必要ない。
適当なInitial GuessをP_0とおく。すると、
 \hat{\theta}_k=\arg\max Q_M (\theta, P_{k-1})
が求められるし、
 P_k=\Psi (\hat{\theta}_k,P_{k-1})
が定義できる。各Pに関して、θが一意に決まる限り、このシークエンスはWell-definedである。

これを収束するまで繰り返すとする。そこで得られる推定量とPの性質を知りたい。
問題は、

  • そもそも収束するのか?

収束したとする。それが、Ψの不動点になってるとする。

  • 一致性があるのか?
  • Initial valueによって、複数不動点が存在するかもしれないが、どう扱うか?

っていうあたりでしょうか。

それらの問いに対する答えは、

  • 収束するかどうかは証明できなかったが、実際にやってみたら必ず収束した
  • 不動点の存在自体は証明できる
  • 複数の不動点は存在しえる
  • 複数存在した場合は、Pseudo Likelihoodを最大にするθ、Pのペアを選ぶ

Proposition 2で、それらの結果をまとめている。
そして、√M-consistencyと漸近正規性を示している。

Unobserved Heterogeneity

ある種の、観察されない異質性をモデルに入れてもこの手法は使える。・・・らしい。
めんどくさくなって読まなかった。


同様の理由で、モンテカルロシュミレーションの部分と、実際のアプリケーション、Exampleは省略。

A dynamic oligopoly game of the US airline industry: Estimation and policy experiments

V Aguirregabiria, CY Ho 2009 Working Paper

航空産業における路線への参入・退出を動学ゲームとして構造推定した論文
論文の要点はテクニカルには二つ

  • ネットワークをState Variableにしたいが、次元が大きくなりすぎるという点を解決する
  • Counterfactualを見るときに、複数ある均衡からどれを選ぶべきかという問題を解決する

内容的にはひとつ

  • ハブ空港の参入障壁としての役割。というかハブシステムの役割を分析する

という感じ。実際の推定結果とかはあまりよく読んでないので、よくわからない。

状態変数の次元のリダクション

全米55大都市における路線ネットワークの構築を扱いたいが、都市間のネットワークの構築の仕方は膨大にある。全組み合わせをState Variableにして動学ゲームを構造推定したい。しかし、それはInfeasible。なぜなら、各航空会社が、全米55大都市間に路線を持っているかどうかを状態変数とすると、状態変数空間Xは、(ネットワークの組み合わせの数をM=55×54÷2、航空会社の数をN=22とすると)
 X=\{ 0,1 \} ^{55\times 54 /2 \times N} , |X|=2^{NM}\simeq 10^{10,000}
つまり、ナイーブにマルコフ戦略を定義すると、
 \sigma_i: X\rightarrow \{ 0,1 \} ^M
を考えなければいけない。(iは航空会社を表す)しかしこれは、
1.他のプレイヤーを所与としたとしても、最適反応の計算が複雑。チョイスが2のM乗個あるから。
2.そもそもXが大きすぎてIntractable
という問題がある。

そこで、元のゲームに仮定をおいて、Tractableなゲームに置き換える。


仮定1:
路線への参入・退出は、路線ごとに意思決定が行われる。

仮定2:
路線ごとの意思決定は、その路線を含むようなルート全ての利益を最大化するように決定される。


仮定1は、今まではN個(航空会社の数)の意思決定主体が存在していたが、それをNM個の意思決定主体がいるようなゲームに置き換えている。今までは、デルタ航空が、一元的にNY-ボストンをつなげるかと、シカゴとサンフランシスコを繋げるかを意思決定していたが、NY−ボストン間はそこにいるマネージャーが、シカゴとサンフランシスコ間はそこにいる別のマネージャーが別々に意思決定するということ。
つまり、新しいゲームでのマルコフ戦略は
 \sigma_{im}: X\rightarrow \{ 0,1 \}
となる。意思決定主体の数は増えるが、各意思決定主体は2個しかチョイスがないので、最適反応は計算しやすくなる。

仮定2についてだが、NonstopとOne stopしか飛行機のルートはないと仮定しているので、「NYとボストンの間のネットワークをつなげるかは、サンフランシスコとシカゴが繋がっているかによる影響をうけない」ということ。ただ、NYとボストンをつなげるかは、NYとシカゴがつながってるかには影響される。その意味で、自分の路線をつなげるかどうかの航空会社内での外部性は考慮している。
仮定2により、
 \sigma_{im}: X'\rightarrow \{ 0,1 \}
となる。XのサブセットX’を適切に選ぶことで、Tractableなゲームに再構成しなおしている。

つまり、航空会社の各都市間のネットワークをつなげるかどうかは、ネットワークの組み合わせ全体の部分集合にしか依存しないという仮定をおいて、状態変数空間が大きすぎるという問題を解決している。
本来のセッティングでは各航空会社が全路線に関して一元的な意思決定をするが、そこにある種限定合理性のような仮定を入れて、自分の路線の外部性は考慮するが路線ごとに独立した意思決定がされるようなモデルに置き換えて状態変数の次元を減らしているわけだが、つっこみどころは満載。

均衡選択

Counterfactualなパラメータの値の元でのOutcomeを観察したいとする。しかし、その仮想的な状況下では複数の均衡が存在しえるが、どの均衡が実現するかはアプリオリにはわからない。そのため、この論文では、仮想的なパラメータのもとでの均衡選択ルールを提示している。

ここで、均衡選択とは π:パラメータの値→CCP のことである。

πがスムーズ(Taylor展開ができるという意味で)だと仮定する。元のパラメータをθ、仮想的なパラメータをθ^*とする。すると、
 \pi(\theta^*)=\pi(\theta)+\frac{\partial \pi(\theta)}{\partial \theta} (\theta^* -\theta) +O(|\theta -\theta^*|^2)
とかける。推定したパラメータ値においては、
 \pi(\hat{\theta}) =\hat{P}=\Delta (Z,\hat{\theta},\hat{P})
が成り立つ。Δはポリシーファンクション。ここから、πのθに関するヤコビアンを求める。
それらをぶち込めば、Up to最後のビッグオーの項で正確な近似をすることができる。

その誤差項の部分が無視できない可能性もある。仮想的なパラメータの近傍でテーラー展開が正確であることを仮定すれば、上の作業+そこで得た選択確率をΔに繰り返しぶち込む作業でより正確な近似ができる。

結論・疑問

  • 元のセッティングでの均衡と新しいセッティングでの均衡の関係。

新しいセッティングでは航空会社内で各意思決定者間のコーディネーションの問題があるように思う。直感的に思ったのは、元のセッティングの均衡は新しいセッティングの均衡に含まれているのではないかと思った。そして、適切な均衡選択をすれば、新しいセッティングの均衡から元のセッティングの均衡を復元することができるのではないかとも思った。

この論文のSpecificationでは、元のゲームの均衡と新しいゲームの均衡の間には一般的にはなんにも関係がない。でも、ネットワークの構造をうまくつかって適切なSpecificationとModelingをすることで、ゲームの構造をTractableなゲームに変えつつも、両者の間に均衡の包含関係を保つことができそうにも思う。

それができれば、新しいゲームの均衡条件からIdentifyされるパラメータは元のゲームの均衡条件からIdentifyされるパラメータと一致するはずなので、Consistentな推定ができるはずである。

っていうことを数日真剣に考えたものの、なにも思いつかなかったです。

  • 実際の推定では、Aguirregabiria and Mira(2007)の手法を使っている。そのため、M個の市場全てで同じMPEが実現していると仮定しているのだが、この仮定は明らかに元のゲームの本質を損なっている。各ネットワークをつなげるかどうかには、コーディネーションの問題があるから。
  • πのスムースネスの前に、そもそも均衡がパラメータに関してスムーズなのか。

たとえば、あるパラメータのうえでは、どの選択も厳密に1より小さい均衡が複数あるが、その近傍の点ではチョイス1を確率1でとるような均衡しかないということはありえないのか?でも、誤差項に極値分布を仮定しているから、そこからスムースネスが保証されているような気もする。

  • 実証産業組織論って、結局ゲームの構造って全く推定に使ってないよなぁ。

ゲームの構造を推定にうまく生かすことができるような方法を考えたいと思った。特に、この論文とか、ネットワークの話って理論的には色々結論出てそうなのに、全く使ってない。

公共入札メモ2

http://www.asahi.com/national/update/0430/TKY201004300526.html

財務省所管の独立行政法人(独法)の国立印刷局から今年度の国会議事録の印刷事業を企画競争で受注した印刷会社7社が、事前に連絡を取り合い、価格調整をしていた疑いがあることが分かった。7社の担当者がやり取りしたとみられるメールの記録を朝日新聞が入手した。7社側は上限の99%以上の金額を提示しており、印刷局は「事実であれば看過できない」として調査に乗り出す方針を決めた。

 印刷局が発注したのは、国会の本会議や委員会の速記録をもとに議事録を印刷する事業で、2010年度の予算額は1億7千万円(約71万部、約700万枚)。印刷局は昨年12月、一般競争入札を公告したが参加者がなかったため、翌1月、予算額を公表し、公募で見積額などを記した企画書を提出させる企画競争を公告した。

 朝日新聞が入手したメールの記録によると、7社の担当者は、社用の電子メールアドレスを使って互いに送受信を繰り返していた。応募前の2月18日、7社のうちA社とB社がそれぞれ、1枚あたりの単価を見積もって各社に示した。各社の意見がA社案とB社案に分かれたため、23日、B社が「そろそろ時間もないので、A社の案でいきたいと思います」という内容のメールを各社に送り、他社にはA社より少し高い見積額を出すよう呼びかけた。

 その後、7社はそれぞれ企画書を印刷局に提出。7社以外に応募はなく、最も低かったA社の見積額は予算額の99.95%にあたる1億6992万円で、印刷局はこれを契約額とし、応募した7社に示した。7社ともA社の見積額で請け負うことができると回答し、印刷局は25日、事業を7等分して7社とそれぞれ契約を結んだ。7社すべてと契約したことについて印刷局は「議事録を短い納期で大量に印刷する必要があり、なるべく多くの業者に委託したかった」と説明する。印刷局によると、今回の印刷事業は07年度まで随意契約で、独法の整理合理化計画などを受けて08、09年度は企画競争に変更したが、いずれも随契時と同じ7社が受注を続けているという。

朝日新聞の取材に対し、7社のうち1社の社長はメールでのやり取りを認めた上で、「いつも顔を合わせる業者同士の雑談みたいなものだが、価格調整と誤解されかねないので今後はやらない」と話した。別の社の関係者は「受注量が減少する厳しい状況の中、印刷業者にとって議事録は何としても取りたい仕事だ。印刷局も、気心の知れた業者に頼みたい事情があったのではないか」と説明した。

 7社は東京都や長野、群馬、石川の各県にそれぞれ本社を置き、08年決算期の売上高は2億〜20億円。官公庁や印刷局などからの受注が多く、印刷局からの売上高がかつて全体の7割を占めていた会社や、印刷局OBが役員の会社もある。(奥田薫子、中村信義)

■メールでのやりとり(一部表現を変更)

【2月18日】

A社「どこが最低ラインを出しますか? (1枚あたりの単価を)23.1円にしてみました」

B社「案を作成してみました。総額にあわすようにして単価を上げていきました」

C社「A社の案で異論はありません」

D社「私のところはB社の単価と同額です。予算総額からしてこれしか算出のしようがないと思います」

【同19日】

B社「案が2通りでました。どちらかに賛同していただくか、また他によい案がある方はご連絡を」

【同23日】

B社「そろそろ時間もないので、A社の案でいきたいと思いますがいかがでしょう? A社より多少高くして見積もりを提出していただければ良いと思います」

Identification and Estimation of a Nonparametric Panel Data Model with Unobserved Heterogeneity

K Evdokimov - 2009, JMP

Yaleを2010年卒業予定の学生のJob Market Paper。今年のスターで、うちはもちろん、シカゴ大などからもオファーをもらい、結局Princetonに二年間ティーチングなしの条件付で就職。
ペーパー自体は、非線型モデルのパネルデータで固定効果やランダム効果があるとき、ノンパラメトリックな識別&推定の話。かなり直感的かつ分かりやすい一方、これが今までやられていなかったのが不思議なほど素直な論文だと思う。

識別の部分だけまとめる。識別も建設的に議論をしてるので、その議論をそのまま推定にも用いる。Rate of Convergenceはめんどくて読まなかった。

基本的なモデルと仮定

 Y_{it}=m(X_{it},\alpha _i)+U_{it}
で、mがUnknownの場合を考える。主なIdentification Assumptionsは以下。

  •  f_{U_{it}|X, \alpha, U_{i-t}} = f_{U_{it}|X_{it}}
  •  E(U_it | X_it=x)=0
  •  f_{X}(x,x)>0
  • m(x、α)はαに関して弱増加関数
  • Uの特性関数はR上で0にならない。

最初の仮定は、Uがその期、その個人以外の変数と独立ということ。二つ目の仮定は普通のMean Independence。3個目の仮定はIdentificationで重要になってくる。4つ目の仮定も識別で重要。5個目の仮定も微妙に使う。UがUniformだったりすると、無限回0になるので、識別の手順でちょっと困る。

あと、大事になってくるレンマ。

  • (Y_1,Y_2)=(A+U_1,A+U_2) とする。AとUが互いに独立(+ちょっと仮定)ならYのジョイントDistributionから、AとUの分布は識別できる。

Random Effectの場合

上以外に

  • αとXは独立
  • αはU(0,1)として分布している

という仮定をおく。二つ目はNormalizationなので、一つ目だけ重要。まぁ、Random Effect的な仮定ですね。

識別は以下の手順で行う。

  1. レンマから、xが変化しないIndividualを使って、UをIdentifyする
  2. Yの特性関数は、mの特性関数とUの特性関数の積で書けるが、データとステップ1から、mの特性関数を識別できる。(Uの特性関数が0にならないことを使う)
  3. mの特性関数が識別できると、そこからmの分布が識別できる。mはαに関して増加関数なので、xをとめてmのQuantileをみれば、その値とαの値は一致する。よって、m(x、α)が識別できる。

Correlated Random Effect(Fixed Effect?)

上では、αとXの独立性を仮定したが、ここでは任意の同時分布のもとでの識別を考える。
仮定として

  • mはαに関してStrictな増加関数
  • For some x',m(x',α)=α
  • サポートの仮定(詳しくは論文を)

をおく。二番目の仮定はさっきとは別の標準化。ノンパラのリテラチャーではよくある標準化だと思う。

同じような手順で識別できる。

  1. レンマから、xが変化しないIndividualを使って、UをIdentifyする
  2. 二期目の観察されたXがx'であるようなサンプルから、さっきと同じように、αの特性関数と、m(x,α)の特性関数を識別できる
  3. 上で識別されたものたちはあくまで、(x,x')が観察されたという条件付のものだが、m(x,α)自体は、それら+上でつかってQuantileのテクニックで識別できる。ここではさらにX=xの条件付でのαの分布も識別できる。

ざっくばらんにはこんな感じ。
UのSerial Correlationは著者自体が拡張を書いてるが、Lagged Dependent Variableのケースや、誤差項が線形で入ってこない場合についてはFutuer Researchを待っている感じだと思う。

うんこを漏らすことについて

僕昔、
「一番最近うんこ漏らしたのいつ?」
って聞かれたときに
「全然記憶にないから相当昔だと思う」
って答えたことがあります。

そのときは正直に答えたつもりだったのですが、その後気になってうんこを漏らしたらできるだけ覚えておくように意識して過ごしてみたら、一年に一回くらいはうんこ漏らしてることに気づきました。
物事を客観的にみることの難しさと、いかに事実が主観に勝るかを実感しました。
それが今経済学を学んでいる理由かも知れません。

僕もうんこ漏らしたら日記にして記録していったほうがいいんでしょうか。
http://www.nakamurahiroki.com/2010/04/31.html

PANEL DATA MODELS: SOME RECENT DEVELOPMENTS

M Arellano, B Honoré - Handbook of econometrics, 2001

なんか読んでしまった。実は何度も同じ内容を読んでるんだけど、読むたびに忘れるので、Nonlinearの部分だけでもまとめておこうとおもう。
Linearの場合は差をとればだいたい解決。


Nonlinearの場合の問題はIndividual SpecificなUnobserved Heterogeneityがあると、それは推定できないのはもちろん、他のパラメータもIdentifyされなかったり、Biasがある推定しかできなかったりするという部分だ。
Random Effect的なモデルを仮定すれば、Unobservedな項の分布をパラメトライズしたりして解決できる部分もあるんだけど、より一般的なFixed Effectにどう対処するかっていうのが問題になることが多いと思う。

Conditional Likelihood

上手いことコンディションすると上手いこといくっていう例を二つ。

まず、ロジット。
T=2の場合を考える。(パネルの縦が2で横が無限に行く場合)
普通のLogit的なモデルでのChoice Probabilityは(y=1,0)
 Pr(y_{jt}=1 | \alpha_j, x_{j1},x_{j2}) = \frac{exp(\beta x_{jt} +\alpha_j)}{1+exp(\beta x_{jt} +\alpha_j)}
なわけだけど、一期にも二期にも同じチョイスをした人はUnobserved Heterogeneityが+∞か-∞とすることで説明できちゃう。だから、パラメータの識別や推定に意味を持つデータは
 y_{j1}+y_{j2}=1
の条件を満たすデータのみ。このとき、
  Pr(y_{jt}=0, y_{j2}=1 | \alpha_j, x,y_{j1}+y_{j2}=1) = \frac{1}{1+\exp(\beta (x_{j1}-x{j2} ) }
が成り立つので、これを使ってパラメータを推定する。

T>2のときも、(少し工夫が必要だが)同じようにLikelihoodをαなしで書くことができる。ちょっと一般的に言うと、Σyがαの十分統計量になっているということが言える。See:Chamberlain (1980)
Tが大きい場合のコンピュテーションを楽にする方法も少し紹介されてる。


次にポワソン回帰。
 y_{it} \sim Po(\exp(\alpha_i +\beta x_{it}))
ポワソン分布に従う変数の和は二項分布になるので、その辺をうまく使うと、ロジットと似た感じでαがないLikelihoodを書ける。

Discrete choice models with "fixed" effects

いきなりManski(1987)が引用されててテンションがあがる。maximum score estimator Manski(1975)にFixed Effectを入れた感じなのだが、モデルは以下。
 y_{it}=1\{  x_{it}\beta + \alpha_i +\epsilon_{it} \geq 0 \}
 P(y_{i2} =1 | x, y_{i1}+y_{i2}=1) \geq \leq 1/2
の不等号が下の不等号の向きと一致することが示せる。
 (x_{i1}-x_{i2}) \geq \leq 0
なので、後はマキシマムスコアと同じ方法で推定ができる。

マキシマムスコアはかなり緩い誤差項への仮定の下でもConsistentである一方、ルートnConsistentではないし、漸近分布も正規分布ではない。Chamberlain (1993)で、PanelのBinary ChoiceではLogit以外の誤差項ではルートnConsistentなEstimatorはないことが示されているらしい。

Tobit-type models with "fixed" effects

トービットモデルにはあんまり興味ないので省略。
ざっくばらんに言うと、基本的には線形のモデルだから、Differencing outできるように上手いこと考えればいいって感じ。

Models with lagged dependent variables

Lagged Dependent Variablesが説明変数に入ってると、initial conditions problemって呼ばれてる問題が生じる。一番最初の項がUnobservableだからだ。たとえそれが観察された(もしくは最初のデータを使わない)としても、最初の項はUnobserved Heterogeneityにも依存してるし、他の説明変数の分布にも依存してるし、とにかく複雑になってしまう。

解決策として、「対象とするプロセスが始まる時点から観察してる」と仮定して、最初の項はある意味他の要素から”独立”であると仮定するっていう方法がある。Heckman (1981)とか。


それだとつまらないので、他の方法も書かれてるが、
Very little is known about how to deal with general predetermined variables in the models
らしいので、研究の余地まだまだあるのかもね。

たとえば、
 y_{it}=1\{  x_{it}\beta +y_{it-1}+ \alpha_i +\epsilon_{it} \geq 0 \}
みたいなモデルを考える。そうすると、前に紹介したようなテクニックは使えない。前のテクニックは誤差項のシリアルディペンダンスがあるとうまくいかないから。
まぁ、前回はT=2でうまくいったんだけど、実は今回も上手いこと考えるとT=4より大きければなんとかなるっぽい。
Chamberlain (1978)とか、Magnac (1997)とか、Kyriazidou (2000)とか。同じテクニックはマキシマムスコアにも使える。

Dynamic Tobitとか、Dynamic Sample Selection Modelとかでも少し結果は出てるようだ。



以上、かなり適当になってしまった。細かい話が多くてちょっと読む気がしない部分が多い。