Introduction

生産関数(Production Function)を推定するのは以下のような目的がある。
1.多くの経済学のモデルの中に生産関数がはいっている
2.効率性(Efficiency)を評価したい
3.生産性(Productivity)を分析したい

1に関しては、例えば構造推定をするときに生産関数を推定したくなるなど、補助的な目的で生産関数を推定する要請が生じやすいということ。2に関しては、規模の経済・範囲の経済、インプットの補完性・代替性、シナジー・合併の効果、学習効果(learning by doing)などを評価するために生産関数を推計する必要があるということ。3については、時間や場所のバリエーションを使って政策や、R&D、新しい技術の導入の効果を測りたいときに生産関数を推定する必要があるということ。

Data

・Output Measure
・Input Measure
が必要で、理想的にはパネルデータがあるとよい。

Common Data Source (in US)

・Compustat:北米企業の財務諸表などわりと基本的で一般的なデータ。大学がアクセス権を買ってればアクセスできる。
・Longitudinal Research Database (LRD):政府により提供されるデータベースで、工場レベルの詳細なデータが利用可能。ただ、利用には許可が必要で、許可には申請から数カ月かかるらしい。また、Census data centerまで行って、そこで作業することが要求される。詳細は以下のリンク http://www.census.gov/econ/overview/ma0800.html
・規制産業:電機や航空などの規制産業は政府が個別にデータを収集・公開していることが多い。

他にもいいデータソースがあれば随時、編集・追加していきます。

Model

なんでかコブダグラス型の生産関数を仮定するのが一般的みたいです。特になんのJustificationもないんじゃないでしょうか。ただ分析しやすいだけでしょう。
なので
 Q_{it}=e^{\alpha} L_{it}^{\beta_l}K_{it}^{\beta_k}e^{u_{it}}
という形の生産関数を仮定して、パラメタを推定するのが主流でしょう。
もちろん、Logをとって
y_{it}=\alpha +\beta_l l_{it}+\beta_k k_{it} +u_{it}
の式をリグレッションする感じです。よりFlexibleなFunctional Formで推定する文献もあるし、ノンパラメトリックにやってもいいんだろうけど、”何を分析したいか”に応じた仮定を置くのが楽な便利で、コブダグラスがその点一番わかりやすいんだろう。

ここで  u_{it} とは
・(企業間の)技術、マネジメント能力の差
・外生的な要因のヴァリエーション
・測定誤差
などが考えられる。
ただ、当然内生性の問題が存在する。(いい技術を持ってる会社はいっぱい人(資本)を使う。Positive Shockと労働力(資本)に正の相関がある。など)

内生性を解決するために、
・IVを使う
・Panel Dataを使う
・etc
必要がある。

以下パネルデータを使う際の手法をいくつかまとめる。

M. Arellano, S. Bond, “Some Tests of Specification for Panel Data: Monte Carlo Evidence and an Application to Employment Equations,” Restud, 1991,

ペーパー自体はPanel DataにおいてSerially CorrelatedなノイズとWhite NoiseがあるときにどんなIVを使うかというような内容。
先のモデルにおいて、
 u_{it}=a_i +\omega _{it}+\epsilon_{it}
であり、  a_i, \omega_{it} はtransmitted (correlated with l) であるという状況を考える。オメガの項はエルとの相関を通じてSerially Correlatedになる。
直観的には、差を取ることでFirm Specificな項を除いて、かつ、Lagged InputをIVとして使うことでオメガと独立変数との相関を除く手法だ。つまり、
 y_{it}-y_{it-1}=\beta_l(l_{it}-l_{it-1})+\beta_k(k_{it}-k_{it-1})+(\omega_{it}-\omega_{it-1})+(\epsilon_{it}-\epsilon_{it-1})
という式を
 E(u_{it}-u_{it-1}|(l_{it},k_{it})_{t=1}^{t-2})=0
というモーメントコンディションを使ってGMMで推計するということだ。

\omega のシリアルコリレーションは労働投入との相関のみからきており、それ自体にはないということが仮定として効いていて、また、労働投入との相関自体も短期的であるという仮定も重要になっている。(No Serial Correlation, No Dynamic Transmittion)
これらの仮定が現実的かどうかという点が、この手法を使う上での問題だろう。
また、別の実用上の問題として、Lagged InputがWeak IVであって、上手く推定できないという点も挙げられる。

ちなみに、この手法はStataだと1コマンドで実行できる。笑
実際やったことはないので、詳しくは知らないが。(自分でやった時は上のMoment Conditionから、実際にOptimal IVとかを考えたわけではなく、緩い条件にして単にIV Regressionした。)

No Serial Correlationの仮定を弱めたのが次の手法だ。

R. Blundell and S. Bond, “GMM Estimation with Persistent Panle Data: An Application to Production Functions,” Econometric Reviews, 2000,

Initial conditions and moment restrictions in dynamic panel data models, R Blundell, S Bond - Journal of econometrics, 1999

上の論文とほとんど同じセッティングで、オメガに
 \omega_{it}=\rho \omega_{it-1} +\nu_{it}
という形のSerial Correlationを入れたもの。そのため、さっきとは少し変形の形が違って、以下のモーメントコンディションを用いる。
 E\left( (u_{it}-\rho u_{it-1})-(u_{it-1}-\rho u_{it-2})|(l_{it},k_{it})_{t=1}^{t-2}) \right) =0