这个作业是使用OLS从非实验数据估计移民获得的收入
ECONS 529/543 Econometrics
Lab 1: Matching and OLS Treatment Effects Estimators
该实验室的目的是演示使用OLS和倾向得分匹配从非实验数据估计因果关系的效果,其中利息的影响是从移民获得的收入。首先要考虑的是,几个观察到的变量可能与移民有关,因此OLS和PSM都提供了一种控制可能掩盖感兴趣因果关系的变量的方法。虽然估计量使用相同的信息,但是PSM更加灵活,并且在紧密匹配的未处理(非移民)观测值上赋予了更大的权重,而OLS对其进行了平均加权。当然,使用OLS或匹配法的问题是忽略的,未被观察到的特征与工资和移民决定相关,并且这些因素可能导致移民收入增加的估计值出现偏差。
使用OLS
使用以下命令,从OLS估算从迁移获得的原始收入中开始,
注册工作收入迁移
reg工作收入移民年龄男性年龄结婚男性身高出生汤加塔普
您如何解释每个系数?在估算治疗效果时,为什么必须控制潜在的混杂因素?
除了这些可观察到的背景特征之外,雇主可能还可以观察到工人的一些属性,即使计量经济学家(或我们依赖其数据的调查制定者)也无法观察到。因此,与非移民样本相比,移居工人的汤加过去收入可能在系统上有所不同。您可以通过估算另外两个回归模型来进行检查
reg过去的收入迁移
reg pastomeome迁移agepa男性岁已婚heightpa出生Tongatapu
尽管证据有些薄弱(由于我抽取了整个数据集的子样本),但足以表明,在汤加,与未移民相比,他们的收入保持不变,他们在汤加的收入要高于非移民。这将与在劳动力市场上具有更高价值的,具有“更好”的不可观察特征的移民相一致,因此,表面上的移民回报部分可能只是对这些不可观察因素的回报(我们将在下周再次讨论这一主题)。目前,还可以控制过去的收入,因此继续进行以下估算:
reg workincome迁移agepa男性岁已婚heightpa出生Tongatapu pastincome
请注意,这种回归带来的移民对工作收入的经协变量调整的影响只是我们可以控制观察到的特征(年龄,性别,受教育程度,婚姻状况,身高(作为衡量人力资本,和背景位置)。尤其是,这迫使控制变量对移民和非移民的工资影响相同,这具有很大的局限性(例如,新西兰劳动力市场对价值特征的评价与汤加劳动力市场不同)。通过“回归调整”的治疗效果估算器可以放宽它,可以从下拉菜单或通过发出以下命令获得:
teffects ra (workincome agepa male years married heightpa bornTongatapu pastincome) (migrate), aequations atet
The options given after the “,” tell the estimator to report the auxiliary equations that lie behind the estimate, and also that we are wanting the average treatement effect on the treated (Stata refers to the ATT as atet). Note that you could reproduce these equations using separate OLS regressions of work income on the X variables, for the migrants and the non-migrants.
What has happened to the apparent income gain from migration once you use a (slightly) more flexible estimator?
The Treatment Effects menu also opens up several other options, in addition to regression adjustment. One we will focus on is propensity score matching, where the “official” Stata command implements this with the following command:
teffects psmatch (workincome) (migrate agepa male years married heightpa bornTongatapu pastincome) , atet
Another way to estimate the propensity score matching estimate of the ATT is to use the pscore.ado file which can be downloaded from the web. Making sure that you have previously set your PLUS directory to h: drive, you can check if it is already installed by typing: help pscore or findit pscore and if it is not there, by using webseek pscore you should be able to download it from within Stata