Measurement Error Models with Auxiliary Data
Xiaohong Chen, Han Hong and Elie Tamer
The Review of Economic Studies, Vol. 72, No. 2 (Apr., 2005), pp. 343-366

ちゃんとは読んでいないけど、ざっくりと内容だけ。将来必要になった時に思い出せるように。

Moment Condition
  E(m(X^*, \beta _0))=0
を満たすとする。しかし、実際に観察されるのは X であり、Measurement Errorを含んでいる場合に  \beta _0 をConsistentに推定する問題を考える。

Primary Data-Set  \{ X_{pi} : i=1,2,\cdot \cdot \cdot , n_p  \} があり、補助的なデータとして  \{ (X^*_{vj} , X_{vj} ) : j=1,2,\cdot \cdot \cdot , n_v  \} が観察されるとする。
つまり、全体のデータは測定誤差を含んでしか観察されないが、そのうちの一部(もしくは全く別のデータでもよい)は真の値と測定誤差を含んだ値が観察されるときの推定が問題になる。

例として、所得のデータが挙げられている。所得データを(アンケートなどで)集めると、通常そのデータには測定誤差が含まれている。(正直に申告しなかったり、忘れていたり、etc)
その一方で、回答者にSSN(ソーシャルセキュリティーナンバー)も回答させ、SSNが正しく回答されていればSSR(Social Security Record)から、より正しいと言える所得データを得ることができる。
上記の状況などで一部のデータに関しては真の値と測定誤差を含んだ値が観察されるという状況は起こりえる。

Main Assumptionとして
 f_{X^*_v \mid X_v=x}=f_{X^*_p \mid X_p=x} for all x in the support
という仮定を置いている。

Primary DataとAuxiliary Dataの分布は必ずしも同じでなくてもよく、測定誤差と真の値にもどんな相関があってもよい点が現実の推定への応用上は重要そうだ。
もちろん両方のデータの分布が同一だと、Efficiency Gainがある。

ざっくばらんに方法を解説すると、
1.補助的データから、測定誤差の分布をノンパラメトリックに推定
2.それを元のデータにぶち込んでMoment Conditionから一致的に推定
という感じっぽい。ちゃんとは読んでない。