Identification in Parametric Models

Thomas J. Rothenberg

Econometrica
Vol. 39, No. 3 (May, 1971), pp. 577-591

パラメトリックなモデルにおける識別とはなにか?どういった条件が識別を担保するのか?という問題をきれいにまとめた良論文。

まずセットアップ

  • Y:観察可能なデータ。n次元の実数空間の要素。
  • Yの分布関数はKnownな分布族  \mathcal{F} に属しているとする。

以上の下でまず色々定義
構造Sとは、ユニークな分布  F(S) \in \mathcal{F} をImplyする仮説の集合として定義する。A prioriにわかっている可能な構造の集合を  \mathcal{S} とする。

定義:観察上の同値性
 \mathcal{S} に含まれる2つの構造S,S'があったとき、F(S)=F(S')であるならばSとS'は観察上同値であるという。

定義:識別
 \mathcal{S} に含まれる構造Sがについて、  \mathcal{S} に含まれるようなどのようなS'もSと観察上同値でないとき、Sは識別されるという。


識別とはそもそも、観察者がデータの分布を完全にしっているような仮想的な状況においての性質である。
もしデータの分布が完全にわかったとしても、その分布を生み出すような仮説が複数ある場合、その仮説たちをデータから区別することはできない。ある仮説が識別されるとは、他のどんな仮説もその仮説と同じ振る舞いをするデータを生み出さないということである。


たぶん上の定義は一般的な定義なのだけど、ここではパラメトリックなモデルにおける識別を考えたいので、有限次元(m次元)で構造がIndexできるとする。
つまり、Sがm次元の実数の部分集合Aで記述されるような状況を考え、F(S)をf(y,α)とかく。(αはAの要素)


あともう一個定義をひとつ。
定義:局地的な識別(Local Identification)
パラメータαを含む開集合が存在して、その開集合内のどの要素もαと観察上同値でないとき、αは局地的に識別されるという。



というわけで、きちんと識別を定義しておいてから定理に入る。そのまえにいくつか仮定を

仮定たち

  1. 構造パラメータ空間Aは開集合で、R^mに含まれる。
  2. f(y,α)はProper density functionである。
  3. Aのどの要素に関しても、f(y,α)の台は同じである。
  4. f(y,α)はαに関して滑らか。(fとlog(f)が微分可能)
  5. 情報行列が存在して、各要素はαに関して連続

最後にもうひとつ定義。
定義:Regularity
M(α)をαに関してすべての要素が連続な行列とする。あるα0において、α0を含むような開集合が存在して、その開集合内のすべての要素においてM(α)のランクが一定であるとき、α0をRegular pointとよぶ。


いよいよ定理。

定理

αを情報行列のRegular pointとする。αが局地的に識別されることと、情報行列が正則行列であることは同値である。


証明は簡単なので、興味があると読むといいと思います。実は計量ランチミーティングでこれ発表した人がいたんだけど、そのときはFacultyの人たちは、「じゃあ、Regularityの条件とかはないの?」って質問してました。たしかに気になるけど、みたことないですね。

あと、このペーパーではいろいろグローバルな識別のための条件を出したりしてるけど、きれいに条件を出せないみたいです。一般にも、局地的な識別が示せればOKっていう雰囲気はあると思います。


最後に

Structure and Reduced Form

仮定5:構造パラメータαは、φ_i(α)=0(i=1,・・・,k)という制約を満たすとする。
仮定6:r次元の誘導系パラメータθが存在し、θ_i=h_i(α)(i=1,・・・,r)を満たし、f(y,α)=f*(y,θ)となるf*が存在するとする。
仮定7;θは識別される。

以上の条件のもとで、αが識別される条件を与えている。
 H(\alpha) =\left( \frac{\partial h_i}{\partial \alpha_j} \right)
 \Phi(\alpha) =\left( \frac{\partial \phi_i}{\partial \alpha_j} \right)
 W(\alpha) =\left( H(\alpha)' \Phi(\alpha)' \right)'
を定義する。(わかりにくくてあれですが、全部行列です。r×m、k×m、(r+k)×mの。)

定理:
もしhとφが線形なら、αが識別されることとWのランクがmであることは同値である。

定理:
α*がW(α)のRegular Pointであるとする。このとき、α*が局地的に識別されることとW(α*)のランクがmであることは同値である。


例として同時方程式が挙げられているが割愛。

Voluntary Export Restraints on Automobiles: Evaluating a Trade Policy

Steven Berry, James Levinsohn and Ariel Pakes

The American Economic Review
Vol. 89, No. 3 (Jun., 1999), pp. 400-430

実はいわゆるMicro BLPといわれてる、マイクロデータを使ってBLPモデルを推定する論文(Berry, Levinsohn and Pakes(2004))を読んだことがなかったので読もうと思ってついでに読んだ論文。


1980年代のアメリカで、外交圧力で日本の通産省に自発的な日本産自動車の輸出総量規制を認めさせたらしい。その効果(消費者余剰、生産者余剰、政府の収入など)についてBLPモデルを用いて数値的に導出している論文。

テクニック的なものかと思って読み始めたものの、テクニックはBLP(1995)のままでむしろ内容が面白い系の論文でした。AERってとこで気づけって話ですが。


なので実はあまり書くことがないです。
ただ少し面白いと思ったのは、普通寡占市場の分析ってベルトランかクールノーか談合っていうBehavioralな仮定の下で推定するんだけど、ここでは基本的にはベルトランでやりつつ、この2こ+Mixed Nashっていう概念でも推定して頑健性をチェックしていた。
Mixed Nashとは、数量を戦略変数にしているプレイヤーと価格を戦略変数にしているプレイヤーが混在しているような状況での均衡コンセプトで、Feenstra and Levinsohn(1995)でも使われているらしい。ただ、どのプレイヤーが何を戦略変数にしているかはエコノメトリシャンに分かっているというような仮定をおいている。

実は、マーケットデータから誰が何を戦略変数として使っているか識別するようなことができないかと考えたことがあります。なにかアイディアがある人いたら一緒に論文書きませんか?笑

The winner's curse, reserve prices, and endogenous entry: empirical insights from eBay auctions

P Bajari, A Hortacsu - RAND Journal of Economics, 2003

オークション参加人数の仮定に関して文献調べてて読みました。実は昔読んだんだけど、内容を思いだせなかったので反省の意味もこめてブログ記事にします。


この論文では、e-bayに出品されているコインのオークションのデータを使って、

  • 共有価値(Common Value
  • Endogenous Entry

なモデルを構造推定している。

まずこのオークションがCommon Value Auctionであることを、Reduced Formのリグレッションで示している。
2ndプライスオークションでは、Independent Valueであれば入札は自分の真の価値をそのまま入札するのが弱支配戦略でありオークション参加人数と独立である一方、Common Valueの場合はオークション参加人数が増えると(Winner's Curseを避けるために)弱支配戦略での入札額は下がる。

よって、入札額を実際の入札人数に回帰して、その係数が負か0かみることでオークションが独立価値か共有価値かを判断できる。実際結果は有意に負になっている。

イーベイはSequentialなオークションだが、オークションが共有価値だったら最初の方に入札するのは無駄だろう。実際、ほとんどの入札が終了直前に行われる。なので、理論的に直前にみんなが同時に入札するのが対称なBayesian Nash均衡になっていることを示して、フォーマルに封印入札第二価格オークションで分析することを正当化するようなPropositionを用意している。



実際の構造推定にはいる。

  1. 潜在的な入札者をN(=∞)とする。
  2. 各Potential Bidderは入札を決意するとコストを払う。
  3. コストを払ったのちに私的情報を得る。
  4. 実際の参加人数の分布を考慮しつつ弱支配戦略をBidする

というようなモデルで、Potential Biddersは事前の期待利益が0になるまで参入するような内生的なエントリーを考える。

入札者は事前には対称なので、「コスト=オークションからの期待利益」という条件がなりたつように全員が「確率pで参加する」というような混合戦略均衡を考える。
pはオークションのキャラクタリスティックスで決まってくる。

上のようなモデルは実際の参加人数に関してポアソン分布を当てはめるのと同じである。もちろんポアソン分布のパラメータがオークションのキャラクタリスティックスで決まってくるわけで、構造推定ではそこを推定する。

実際には「コスト=オークションからの期待利益」という部分からポアソン分布のパラメータは解析的に特徴づけられるが、複雑なのでこの論文では誘導系でポアソン回帰的に推定している。

そこでの推定値を用いつつ、財の価値の事前分布を正規分布と仮定する。また私的情報にも正規分布を仮定する。
あとは、入札額の分布から私的情報の分布への一対一の対応があることを示して、尤度を書いて、MLEで推定というお決まりのパターン。

結果も興味深いが省略。

Bounding Revenue Comparisons across Multi-Unit Auction Formats under ε-Best Response

Bounding Revenue Comparisons across Multi-Unit Auction Formats under ε-Best Response
JTE Chapman, D McAdams, HJ Paarsch - The American Economic Review, 2007

まぁ、上の論文と基本は一緒なんだけど、上の論文の手法をつかって価値の分布のBoundを推定して、それをつかって
「みんながTruthtellingな入札をするようなオークションメカニズムのもとで、どの程度オークショニアの収入に差があるか」
というCounterfactualを実際にやっている。

Bounding Best-Response Violations in Discriminatory Auctions with Private Values

Bounding Best-Response Violations in Discriminatory Auctions with Private Values
JTE Chapman, D McAdams, HJ Paarsch - Typescript. Iowa City, 2006

論文の要点は、

  • Independent Private Value
  • Discriminatory Auction(Pay-as-bid)
  • Multiunit Auction(複数財オークション?)

というセッティングで、

  • Non-increasing Marginal Value

という仮定のもとで

  • プレイヤーはBest Responseをプレイしているのか?

という仮説を検証している。

複数財(分割可能財)で、入札者が自分のDemand Scheduleを入札するようなオークションは、セッティングをシンプルにしても均衡を計算するのは難しい。そこで、もっとゆるい条件をつかって色々推定できたら均衡が複雑なことを無視して考えられて嬉しい。

まず、Non-increasing Marginal Valueという仮定をおく。これは
「追加的に得られる財の価値はNon-increasing」というもので、まぁ、妥当かと思う。限界効用が逓減する的な感じ。複数財なので、1個目の価値と2個目の価値を比べたら後者は前者より大きくないっていうこと。
何の仮定もなしには、観察されるどんな入札にもそれをRationalizeするような価値の分布が存在してしまって、何も言えないらしい。それを避けるために何かしらの仮定をおく必要があるのだが、この論文では上記のような仮定をおいているという訳だ。


基本的なストラテジーは、

Best-Responseの仮定の下では、

  1. みんながBest Responseをプレイしている
  2. ということはベイジアンナッシュ均衡が実現している
  3. 現在の戦略からのどんな逸脱も得にならない

というロジックが成立する。

そのロジックから、理論的に、Best-Responseであれば成り立っていないといけないような性質を求める。
そして実際に観察される入札から、
「各プレイヤーが微妙に各自の入札から逸脱したときに何が起こるか」
ということを計算して、そこから価値の分布のBoundを求めたり、理論的に求めた性質が実際に満たされているかをチェックしたりする。

というもの。まぁ、直感的だしわりと普通のアイディアだと思う。Pakes Porter Ho Ishiiの論文のアイディアとも同じだし、何が新しいのかはよくわからなかったけど、Best-ResponseのTestableなインプリケーションを導出できている部分と、複雑なオークションのセッティングでもわりと簡単な推定方法を提示しているところがいいのだと思う。


データとして、カナダの中央銀行が短期に現金を供給している市場のデータを使っている。
推定結果として、60%ぐらいのプレイヤーはBest Responseから逸脱しているがその逸脱具合は非常に小さいということがいえている。

マイメモ:オークション関連でよみたいけど読んでない論文

誰か読んで解説してくれたら一件あたり500円は払ってもいいと思ってます。

Mechanism choice and strategic bidding in divisible good auctions: an empirical analysis of the Turkish treasury auction market
A Hortacsu


Bidding behavior in divisible good auctions: theory and evidence from the Turkish Treasury auction market
A Hortacsu


Asymmetric information, adverse selection and online disclosure: The case of eBay motors
G Lewis


Auctions of shares
R Wilson - The Quarterly Journal of Economics, 1979


Supply function equilibria in oligopoly under uncertainty
PD Klemperer, MA Meyer - Econometrica, 1989


Auctions of divisible goods: On the rationale for the treasury experiment
K Back, JF Zender - Review of Financial Studies, 1993


IPO Auctions: English, Dutch,... French, and Internet* 1
B Biais, AM Faugeron-Crouzet - Journal of Financial Intermediation, 2002


An optimal IPO mechanism
B Biais, P Bossaerts, JC Rochet - Review of Economic Studies, 2002