惊! 露天排遗(bian)会让孩子长不高！非参数再加权方法做反事实分析, 元分析！

Original 计量经济圈计量经济圈 2022-05-11

收录于合集 #实证研究中常用计量方法小集子 107个

凡是搞计量经济的，都关注这个号了

稿件：econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

正文

以下文字作者：程继鹏，德克萨斯大学奥斯汀分校经济系，通信邮箱：chengjp@utexas.edu

批注：做得非常好，建议为其点赞。

Exposure to open defecation can account for the Indian enigma of child height, Journal of Development Economics.
Physical height is an important measure of human capital. However, differences in average height across developing countries are poorly explained by economic differences. Children in India are shorter than poorer children in Africa, a widely studied puzzle called “the Asian enigma.” This paper proposes and quantitatively investigates the hypothesis that differences in sanitation — and especially in the population density of open defecation — can statistically account for an important component of the Asian enigma, India's gap relative to sub-Saharan Africa. The paper's main result computes a demographic projection of the increase in the average height of Indian children, if they were counterfactually exposed to sub-Saharan African sanitation, using a non-parametric reweighting method. India's projected increase in mean height is at least as large as the gap. The analysis also critically reviews evidence from recent estimates in the literature. Two possible mechanisms are effects on children and on their mothers.

摘要：在发展经济学的相关研究中，身高是衡量人力资本的重要指标。然而，各发展中国家间的经济差异却往往很难对其国民间的平均身高差异做出有效解释，例如印度儿童的身高为何低于比其经济发展更差的非洲的儿童的身高便一个公认的研究难题，即所谓的“亚洲之谜”。该文定量地提出并考察了“卫生系统上的差异(尤其是露天排遗密度)能够在统计上部分解释印度儿童相对于撒哈拉以南非洲儿童的身高差异”这一假设，以回应前文所述的“亚洲之谜”。该文的主要工作在于利用一种非参数再加权的方法(Non-parametric reweighting method)来预测如果印度儿童能够反事实地(counterfactually)生活在撒哈拉以南非洲的卫生系统下，其平均身高所能提高的程度。该文也回顾了近期文献中的相关研究并做了对应的元分析(Meta-analysis)。该文也同时考察了两种可能的影响渠道：恶劣的卫生系统会通过儿童本身或通过儿童的母亲来影响儿童身高。

1 简介

由于身高是一个很容易衡量、与人力资本强相关且是经济生产率风向标的指标(Case & Paxson, 2008)，其已受到了经济学家们的广泛关注(Steckel, 2009)。在关于身高、人力资本和经济福利方面的研究中，为何各发展中国家间的经济差异难以解释其国民间的平均身高差异是一个长期存在的难题(Deaton, 2007; Jayachandran & Pande, 2017)。这一问题在研究印度儿童和撒哈拉以南非洲(Sub-Saharan Africa，后称SSA)儿童间的身高差异时更加显著，也因而被称为“亚洲之谜”(Ramalingaswami et al., 1996)。具体来说，印度的身高不足要比非洲严重得多：非洲的平均城乡间身高差异只有非洲的5分之2，其受教育母亲所抚养的儿童与文盲母亲所抚养儿童的平均身高差距也只有印度的4分之1。鉴于世界上19%的儿童都出生在印度，在印度发生的规模性身高不足无异是一个值得关注的人口健康问题。

为了解决这一“谜题”，作者主要考察了露天排遗(Open Defecation，或者更为通俗地理解为随地大小便，此后以缩写OD指代这一现象)在其中的作用。在卫生系统匮乏的发展中国家，卫生系统本身能够成为人力资本的关键决定因素。这主要是因为人类排泄物中的各类细菌能够引起痢疾(diarrhea)等疾病，从而引起人体能量的消耗并使成长中的儿童们和孕有或哺育他们的母亲流失营养。医学研究表明，长期接触排泄物细菌是身高或成长不足的重要诱因。该文实证得到了一个足够大且稳健的关于接触OD强度和儿童身高的系数，从而表明卫生系统能够解释收入因素或其他维度的发展因素所不能解释的国际间儿童身高差异。鉴于如果印度儿童能够反事实地接触非洲OD密度就能够至少长得跟非洲儿童一样高这一统计预测结果，该文给出了其主要结论：OD能够在统计上解释大部分乃至于全部的印-非平均年龄别身高(height-for-age)差距(注：年龄别身高，即按一定标准得出的儿童在某一年龄应有的身高)。

世界范围内有超过十亿的人口只在露天场合排便(即不使用任何厕所)，而他们当中的大多数生活在印度(Coffey & Spears, 2017)。由于历史因素和种姓制度的长期影响，印度的卫生系统极其落后，使之成为一个大多数人OD的人口密集国家。应该说，OD在印度比在其他经济状况相似的国家要流行得多。考虑到OD在印度之流行以及印度各地卫生系统差距之大，很难想象经济学家们在关于印度的营养不良和生长萎缩问题的广泛研究中并没有给到卫生系统问题足够的关注(如Deaton, 2007; Tarozzi, 2008; Jensen, 2012; Panagariya, 2013)。

该文在发展经济学、人力资本和健康研究中做出了如下的贡献。首先，该文提出并分析了一个能有效解决“亚洲之谜”且受到忽视的统计假设。其次，该文关注了人力资本在幼年的积累(Cunha et al., 2010; Gertler et al., 2014)。在相关文献中，身高一直是一个关键变量；尤其是考察发展中国家的情况时，健康水平是儿童人力资本的一个关键维度(Maluccio et al., 2009; Currie and Vogl, 2013; Hoddinott et al., 2013)。最后，通过实证研究论证卫生系统和公开排便在发展中国家(尤其是印度)中的的重要性，该文也强调了减少公开排便这一典型具有负外部性的公共行为的政策优先度。

文章的第二部分则详细叙述了什么是亚洲之谜，以及引述了论证卫生系统和儿童身高关系相关的经济学乃至生物学文献，且回顾了为何OD成为印度人难改的积习。为了能够使用OD来解释印-非身高差距，有两点需要明确：首先，身高和OD之间的相关性必须足够大到足够解释印-非身高差距，这一点通过文章中的再加权方法来保证；其次，这种相关性必须反映出身高和OD接触之间的因果关系，尤其是要排除其他可能相关变量的干扰，这一点则在本文中通过综合其他相关研究的结果来考察和保证。

文章第三部分讲述了具体的实证方法。第四部分报告了研究结果：印度儿童能够反事实地接触非洲OD密度，其平均身高所能提高的程度。第五部分报告了两个拓展研究：一是通过线性回归将非参数估计所不能包含到的众多控制变量引入以作为稳健性检验；二是通过综述相关研究提出了另一种可能的机制，即通过影响怀孕中的母亲而非儿童本身来影响儿童身高。最后，第六部分通过综合相关的研究结果，给出了一个元估计(meta-estimate)的结果，这一结果对于解释印-非身高差距是足够显著的。

2 背景

2.1 "亚洲之谜"：有待解释的身高差异谜题

尽管已有大量的成果研究了印度的国民健康状况和其发展成就的不匹配，但关于儿童身高的研究仍然有所欠缺。通过利用USAID(美国国际开发署)所主导的DHS(Demographic and Health Surveys，人口健康调查)提供的混合截面数据和2005年的印度NFHS(National Family Health Surbey，国家家庭卫生研究)统计数据，该文得到了图1以体现所谓的“亚洲之谜”。

图1的(a)部分展示了用年龄别身高的Z分数(z-score,即样本数值减去平均数后除以标准差得到的结果)对0到60个月的月度年龄进行局部回归(local regression)得到的结果，反映了印度和非洲在年龄别身高上的差距。其中，实线所代表的印度儿童身高(后文中会以“身高”代指年龄别身高或年龄别身高Z分数，请读者根据上下文甄别)一直低于虚线所代表的非洲儿童身高，代表印度儿童的身高比SSA地区儿童的身高更多地低于样本平均数，从而体现出了印非之间显著的儿童平均身高差异。值得注意的是，由于SSA地区较高的儿童死亡率，样本中印度儿童的平均年龄要高于非洲儿童。

图2的b部分则利用DHS数据构建了两幅直方图对应的拟合曲线。作者通过将DHS数据中所包含的印度和SSA地区家庭拥有电力、广播、电视、冰箱、自行车、摩托车和汽车情况的数据合并为一个衡量家庭财产的指标并进行排名，形成所谓的资产财富排位(asset wealth rank)变量。通过将样本中的资产财富排位从低到高分为122组，并将每组的平均儿童身高或本地OD强度与之匹配，得到了上述的两幅直方图拟合曲线。其中，左图的纵坐标仍然是儿童年龄别身高的Z分数，而右图的纵坐标则是本地OD(local open defecation)强度的Z分位数。本地OD强度等于调查每个儿童状况时所采取的PSU(Primary Sampling Unit,初级抽样单位)中的OD的家庭数目占其所在PSU家庭总数的比例；而在DHS的统计中，往往是出于便于计数的目的来选取地理上就近的几户家庭组成一个PSU。根据观察，显然可知更富有的家庭中出生的儿童身高距离样本平均身高更近，即相对而言长得更高；而更富有的家庭也更少的进行OD的行为，或者说更多生活在不流行OD的社区。然而，在各个财富水平下，印度儿童都要在平均意义上比非洲儿童矮，且印度家庭都在平均意义上进行更多的OD行为。

作者强调，由于文章的主要目的是定量地研究卫生系统的差异能否解释“亚洲之谜”，因而有三个比较印度地区儿童与其他发展中地区的要素必须要考虑：儿童身高差距的大小，卫生系统对于儿童身高发育的影响，接触恶劣卫生系统强度差距的大小。关于第一个要素，作者通过将身高对一个体现居住于印度还是SSA地区的虚拟变量进行回归，得到了两地区儿童的身高差异相当于0.146个样本数据标准差的结果。关于第二个要素，主要体现在对于一个系数的估计：

当我们将第三个要素，也即上述系数的分母通过将DHS数据的对应项相减得为%31.2时，可得约为0.47。而通过将印度各个村庄本地OD强度对于儿童身高的影响系数进行平均，作者得到了约为0.5的具体数值，这两个数值的接近很好的支持了作者的行将论证的统计假设，即如果印度儿童能够反事实地接触非洲OD密度就能够至少长得跟非洲儿童一样高。当然，在后续具体的实证工作中，作者更多地选用了印非间接触OD密度(exposure to open defecation density)的差距作为的分母。这主要是为了强调恶劣卫生系统的负外部性，以及相比非洲儿童，印度儿童生活是在人口更为稠密的区域中与OD产生接触这两点因素。

2.2 为何OD会影响儿童身高

由于此前并没有直接利用卫生系统解释各国身高差异影响的文献，故作者引述了大量关于卫生系统对于儿童健康影响、恶劣卫生系统引起的疾病对于人力资本和经济产出影响以及疾病对于人口平均身高影响的文献来佐证这一影响的存在。根据经济学、医学等相关学科的文献，作者认定至少存在两个接触OD能够减少人口平均身高的渠道：一种是通过儿童直接接触OD，这种情况下儿童易患上影响营养吸收的疾病，从而导致身高不足；另一种则是通过影响母亲们的体格与营养吸收来影响儿童身高，这一渠道又可细分为母亲们是在短期内即怀孕期间接触OD还是在长期内一直生活在OD的环境中这两种情况。尽管文章的实证研究主要着眼于第一种渠道，但基于这一事实，文章也在后续考察了第二种渠道的相关研究以完善结论。作者也指出，由于印度内部OD情况的地域差异改变的非常缓慢，第二种机制很有可能会通过长期生活在这种卫生状况下的母亲们影响她们的孩子。

2.3 为何OD风行印度及其对于相关研究的影响

为何印度的经济发展不能够有效减少OD行为？作者依据文献指出(Coffey et al., 2014; Clasen et al., 2014)，贫穷并不是OD的原因：OD在许多(相对印度)更贫穷的国家并不流行；搭建简易的厕所也并不昂贵；而且，许多生活于印度农村的人即使家里有厕所也会选择OD。为了解答这一问题，作者援引其过往的一项研究(Coffey & Spears, 2017)结果：这一现象的深层次原因实际上来自于印度的种姓制度及“不可接触”和“洁与不洁”等相关概念。简言之，由于清理粪便这一行为在宗教上是“不洁”的，因而无人愿意承担这份工作，继而导致厕所建设的苦难。Spears & Throat (2017)利用IHDS(India Human Development Survey, 印度人类发展调查)的相关数据进一步证实了这一情况。IHDS中有一项有趣的调查结果：生活于农村的印度人会更积极地贯彻“不可接触”原则，即严禁“不洁”的人接触其他四个种姓(婆罗门、刹帝利、吠舍、首陀罗)。Spears & Throat的相关实证结果则显示，这些严格执行“不可接触”的印度村民会更多地选择OD。

上述的关于种姓制度的种种现象不仅导致了OD在印度的流行，同时也导致了相关研究的困难：即一项单纯的干预实验往往很难直接降低印度村镇一级的OD现象，而这也是采用如RCT等方法进行研究所必需的第一步。因此，这一特点就限制了RCT等方法在这一研究上的应用。作者也指出，应用RCT研究研究印度的身高和OD关系的问题还存在其他困难或局限性，如该如何体现印度人口稠密的特征在这一问题上的影响、缺少对照组(存在大规模OD现象的国家越来越少)、对照研究只能研究卫生系统改善而非OD现象本身对于身高的影响。此外，即使上述问题能够解决，对于通过使母亲长期接触恶劣的卫生系统而影响其后代身高这一渠道仍然无法在RCT研究中体现。因而，在尽善尽美的新方法出现之前，总体水平上的观测分析(population-level observational analysis)仍然有其独特的作用。

3 实证策略

这篇文章的实证工作主要是基于Oaxaca-Blinder分解的思路来回答这样一个问题：如果印度儿童能够反事实地在SSA地区的OD密度下生活，那么他们能够长得跟SSA地区儿童一样高吗？更具体地来说，作者运用了DiNardo et al.(1996)中的非参数再加权方法来预测了在面对与非洲儿童相同的OD密度的分布情况下印度儿童的平均身高。这一方法主要优点包括：给印度儿童所匹配的是非洲儿童所面对的OD密度的整体分布而非仅仅是平均数；且不需要假设相关分布的具体函数形式。

3.1 数据与描述性统计

该文依照Jayachandran & Pande (2013, 2017)构建样本的方式，将DHS中2005年的印度数据与27组SSA地区的截面数据混合。其中，一个关键的解释变量是OD密度(Oepn Defecation Density)，其对数形式依下式构建：

其中，本地OD强度(local open defecation)的定义已于前文所述，即其等于调查每个儿童状况时所采取的PSU中的OD的家庭数目占其所在PSU家庭总数的比例，对应值域为[0,1]；而人口密度(population)则等于区域内人口数除以以平方千米计的区域面积(其中，印度数据从州级统计数据得到，SSA数据则从国级统计数据得到)。同时，作者也强调，由于本地OD强度这一变量仅衡量了进行调查时的状况，亦即相对于早早出生于调查开展前的儿童来说，这一变量实际上更好地描述了在调查开展前刚刚出生儿童所面临的疾病卫生状况。当然，由于印度OD状况变化得非常缓慢(Coffey & Spears, 2017)，故这种干扰实际上是非常小的。更具体地说，Coffey & Spears (2018)计算得到2011年印度人口普查数据和2015年到2016年NFHS数据中农村地区区级OD率的相关系数高达0.93，体现了这一状况在五年内(五年或者说60个月正是文章中身高数据的时间跨度)，尤其是这期间印度还出台了一项非常高调的国家级卫生政策，都没有发生非常实质的改变。

表1给出了样本数据的描述性统计结果。显然，印度地区的儿童身高在各个年龄段都平均意义上低于非洲儿童的身高，这在某种程度上暗示了差距在儿童出生之前就开始了，呼应了前文的所述的第二种机制。作者同时还按月度年龄划分了三个分样本(sub-sample)。作者在后文运用不同的分样本开展了研究，并在此简单论述了划分样本的意义。如前文所述，0到5月大儿童的相关数据最忠实地反映了这一年龄段儿童所面临的幼儿生长环境，从而使得利用这组样本开展的实证工作能够有效解决OD情况随时间变动带来的干扰。对应的，利用年长儿童数据开展实证工作则能够在某种意义上避免年龄本身对于身高的干扰：由于发展中国家普遍存在的生长萎缩(stunting)问题，即随着年龄增长，发展中国家儿童的年龄别身高会越来越小(换言之，由于营养不足等种种原因，印度和SSA地区儿童的生长会随着年龄增长而减慢乃至停止)，年龄与年龄别身高间的相关性逐渐减少。这一非常不幸的现实情况非常讽刺地为计量经济学家们的研究提供了便利。

表1同时也揭示了一些重要的现象。首先是印度与SSA地区的OD密度差距是非常大的，因而前文所述的系数的估计值不会太大，但考虑到两地区人口密度的差异(后文5.1部分排除了人口密度本身解释两地儿童身高差距的可能性)，即使是较小的估计值也足以成为一个有解释力的反事实估计。其次，数据也显示印度富裕家庭往往不会生育那么多孩子；且相对SSA地区儿童来说来说，印度儿童往往拥有一个受教育水平更高的父亲和水平更低的母亲，反映了印度地区女性的低下地位。

3.2 非参数再加权方法

该方法的具体过程如下：

这一方法也可以纳入其他协变量，从而达到回归分析中引入其他控制变量的作用。具体来说，为了控制依据某个性质对样本进行分组U的效应(如此前是依据本地OD强度对样本进行了分组G，可类比在回归分析引入了该性对应的控制变量)，我们需要比照上述过程重复两次：

首先，根据非洲样本内基于该性质进行的分组方式所对应的分布U进行一次非参数再加权以构建反事实印度儿童身高。
其次，再仅依据U和前文所述11个分组对应分布的交集的组构建一个新的反事实印度儿童身高。
预测的印度儿童平均身高增长就等于两次再加权方法所得身高平均值的差。

4 主要结果：OD密度与“亚洲之谜”

为了更为直观地描述OD密度与印非儿童身高差的关系，作者基于样本数据绘制了图2，其横纵坐标分别为OD密度的对数与平均年龄别身高Z分数。图中两个大黑圆点代表SSA与印度两地样本关于横纵坐标变量的均值，其位置差距直接体现了相比非洲而言，印度儿童更矮且在更高的OD密度下生活。同时，作者通过与前文相似的数据分组方法，将所有样本按照图2的横坐标变量从小到大均分为75组，并一一计算了这75组对应的横纵坐标变量的平均值，再将各组(横纵坐标变量的)平均值绘制成散点图。由于整体上这75个散点呈向下的趋势，说明平均而言更高的OD密度将会拉低儿童的平均身高。

此外，作者也分别用两地对应的样本数据进行了相应的局部核回归(local kernel regression)，从而得到两条曲线以更为精准地反映横纵坐标对应变量间的非线性关系。作者强调了三点：首先，两条曲线都不出意外的向下倾斜；其次，SSA地区OD密度的最大观测值只有印度地区的四分之三；第三，当横坐标为SSA地区样本平均值水平时，印度曲线要高于SSA地区的曲线，这表明了当面对SSA地区平均水平的OD密度时，印度儿童在平均意义上是至少和SSA地区儿童一样高的。总而言之，这幅图再次佐证了文章此前的许多假设。

4.1 图示总结

基于DiNardo et al.(1996)再加权方法能够计算出变量的整个分布而非仅仅是均值这一特点，作者在图3中绘制了印度儿童、SSA地区儿童、以及基于SSA地区OD密度再加权的印度地区儿童三者的身高的CDF(累积分布函数)图像。显然，不论是全样本还是分性别样本，通过非参数再加权法得到的反事实印度儿童身高CDF都相对于原分布右移了，从而再次论证了本文的核心结论。

此外，作者还关注了母亲的生育能力对于儿童身高的影响。在运用非参数再加权法进行正式研究前，作者通过绘制图4简单考察了这两者的关系。其中，母亲的生育能力由调查时其所生育的孩子数量衡量。根据panel(a)和panel(b)可以明显地观察到拥有更强生育能力的印度母亲，换言之生了更多孩子的印度母亲，其孩子身高会更低，而非洲母亲身上则没有体现这么强的负相关关系。

4.2 完整结果

表2到表4报告了文章的主要结果：即如果印度儿童能够反事实地接触非洲OD密度，则其预估所能增长的高度将大于现有的印非儿童身高差距。表2报告了全样本的结果，表3和表4则分别代表利用6到24月大儿童和25月到50月大儿童样本数据进行非参数再加权法所得到的结果。如前文所述，表4的结果在一定程度上避免了年龄因素对于身高的干扰。各表格中不同行的结果分别是通过对不同协变量的再加权得到的，以体现控制变量的作用；表格中打勾的前几列说明了每行的报告结果是通过再加权哪些协变量得到的。而表格中间的7列则是作者依据与儿童身高高度相关的一些人口统计特征(如出生次序、兄弟姐妹数量、性别等)划分出7组分样本后所对应得到的实证结果，具体数值代表了反事实预测的印度儿童身高增长。最后一列则通过双边Kendall 检验来验证各行依据同一分样本所得到的反事实预测身高增长与印非OD密度差距的相关性，并给出对应p值。简言之，通过划分3大组7小组总计21组分样本，并按不同控制变量进行非参数再加权所分别得到的462个反事实预测身高增长不仅绝大多数显著，且其值都大于现实观测到的印非身高差距。这一结果显著地证明了主要结论的成立。

5 拓展

5.1 稳健性检验：线性回归的结果

第4部分所采用的非参数再加权方法存在所谓“维数诅咒”的问题，即当参与控制的协变量过多时，有大量的观测值将被遗漏。具体来说，这一问题在试图控制年龄时尤其严重，因为两地区样本并不能做到每个月度年龄的分组数据都相互匹配以符合非参数再加权法的要求。因此，作者使用传统的线性回归来进行进一步的稳健性检验从而允许控制更多的变量。具体的回归模型则为

表5报告了线性回归的结果，其分样本策略与4.2部分类似。值得注意的是，第7列仅用人口密度而非OD密度进行了回归，由于该次回归所得到的与第1列相比差异极小，进一步说明了人口密度本身无法影响儿童身高。总而言之，各分样本的回归结果都支持了OD密度对于儿童身高有负面影响这一假设。

5.2 对通过母体影响儿童身高机制的考察

文章此前的工作在某种意义上仅研究了OD影响儿童身高的第一种机制，即直接通过儿童接触来影响。在这一部分，作者主要是通过利用母亲的体重作为被解释变量来研究第二种机制即通过母体营养影响儿童身高的可能性。但Coffey & Spears (2018)也说明了本研究中存在的数据缺陷：由于母亲们的体重是在DHS开展期间称量并获取的，而非是在怀孕期间获取的，因此研究结论将无法区分第二种机制究竟是在怀孕期间还是在哺育儿女期间发挥作用。

表6报告了以母亲的BMI(Body Mass Index,体重指数)为被解释变量的线性回归结果。其中第2列的结果显示OD密度是能够解释一部分母亲BMI下降的，尽管才是主要的解释变量，这也从侧面印证了相对于SSA地区女性来说印度女性地位更加底下、受到更重歧视等社会现状。

作者同时还指出了表6对应工作的另一个缺陷：如果OD密度是在母亲们的童年成长期而非怀孕期发挥作用，则这项实证工作结果就会是不准确的。尽管印度OD实际状况变化非常缓慢，但女孩们成长为母亲的时间或许足够其发生了一定变化，且大部分印度女性未必就嫁在了她们所成长的地方。此外，BMI也只是一个衡量近期或短期营养摄入的指数，从而还可能会受到如痢疾等疾病的干扰。上述都是引起结果不准确的潜在因素。

6 元分析及相关实证研究

作者指出，如果想要完美地验证本文的假设，事实上还需要考虑额外的两个重要因素：一是外部性，即印度儿童实际上受到邻近区域OD的影响远比受到自家人OD影响要大得多；二是参数的异质性，尤其是基于不同的人口密度，例如在人口密集的印度乡村地区，OD所带来的负外部性会大得多。显然目前并不存在这样完美的研究，但作者采取了元分析的方法，综合分析了许多相关实证研究的结果，以求考察上述的两个因素。

表7报告了作者所引述的各种研究，并按研究方法做了大致分类。这些实证工作的主要解释变量如非特殊说明，都为局部地区的住户OD的比例而非此前按PSU为单位计算的本地OD强度。当然，其中所涉及的许多研究并不能直接回答本文所提出的假设：一方面，许多研究根本不以印度为研究对象；另一方面，没有研究考虑到人口密度的影响。这也是为何这些文献的统计结果只能参与元统计的原因。

表格最后三行报告了作者利用另一支文献所提出的(Hedges and Olkin, 1985; Bini et al. ,2001; Becker and Wu ,2007)一种加权最小二乘法(weighted least squares approach)所进行的元估计。这一方法的主要特点是以各估计中抽样误差(sampling error)方差的倒数作为其权重。应该说，这一方法仍然忽视了前文所提到的参数异质性问题，因而其估计结果将低估相应的效应。倒数第3行的结果与Jayachandran & Pande(2013)结果接近，这主要是因为Jayachandran & Pande(2013)中的样本量过大，从而拥有了更高的权重；但是，由于该研究并未考虑到邻近区域OD的外部性，且样本主要来自于低人口密度的地区，故其结果并不能做到理想的因果推断。通过去除该项研究和去除两项横截面分析的结果所得到的元估计结果则都与Gertler et al.(2015)的估计结果十分接近，从而再次佐证了本文结论。作者在此也指出了在实证研究中实验研究和人口统计研究具有一定的互补性：通过比对实验方法所得到的估计数值与人口统计直接得到的对应数值，我们可以增强实验结果的说服力。

7 总结

文章通过深入分析“印度之谜“背后的生物学、社会学等相关学科机制，并利用了描述性统计以及绘制多种统计图示的方式给出了OD密度将能够有助于解释”印度之谜“的假设。文章主要工作是运用了DiNardo et al.(1996)中的非参数再加权方法预测了在面对与非洲儿童相同的OD密度的分布情况下印度儿童的平均身高，以求回答这样一个问题：如果印度儿童能够反事实地在SSA地区的OD密度下生活，那么他们能够长得跟SSA地区儿童一样高吗？所得到结果的回答是肯定的，即在面对SSA地区的OD密度时，印度儿童的预计身高能够比观测到的身高样本数据高0.14个标准差。作者采用了多种方式来佐证自己的结论，包括在实证研究时根据可能干扰结果可信度的因素进行分样本和引入控制变量、利用线性回归进行了稳健性检验、通过元估计援引了大量相关研究的结果并比对数值大小三种方式。同时，作者也强调了OD密度影响印度儿童身高存在两种机制：直接影响儿童本身和通过影响母亲来影响儿童。本文主要关注了第一种机制，但也通过上述的各种方式，尤其是以母亲BMI为解释变量进行线性回归的方式论证了第二种机制存在的可能性。作者同时也敏锐地指出，尽管OD密度能够有效解释“亚洲之谜”，但其并不是影响儿童身高的唯一因素，严重的社会不平等、女性地位低下及母亲营养不良等因素都会使得印度儿童身高不足长期存在。

关于一些计量方法的合辑，各位学者可以参看如下文章：①“实证研究中用到的200篇文章, 社科学者常备toolkit”、②实证文章写作常用到的50篇名家经验帖, 学者必读系列、③过去10年AER上关于中国主题的Articles专辑、④AEA公布2017-19年度最受关注的十大研究话题, 给你的选题方向，⑤2020年中文Top期刊重点选题方向, 写论文就写这些。后面，咱们又引荐了①使用CFPS, CHFS, CHNS数据实证研究的精选文章专辑！，②这40个微观数据库够你博士毕业了, 反正凭着这些库成了教授，③Python, Stata, R软件史上最全快捷键合辑！，④关于(模糊)断点回归设计的100篇精选Articles专辑！，⑤关于双重差分法DID的32篇精选Articles专辑！，⑥关于合成控制法SCM的33篇精选Articles专辑！⑦最近80篇关于中国国际贸易领域papers合辑！，⑧最近70篇关于中国环境生态的经济学papers合辑！⑨使用CEPS, CHARLS, CGSS, CLHLS数据库实证研究的精选文章专辑！⑩最近50篇使用系统GMM开展实证研究的papers合辑！

下面这些短链接文章属于合集，可以收藏起来阅读，不然以后都找不到了。

2.5年，计量经济圈近1000篇不重类计量文章，

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

圈内疯传某谣言

不要放过这些人渣

“辣条二哥”直追卫龙，麻辣王子工厂遇洪受关注

中金跳楼女生诡异之处。

惊! 露天排遗(bian)会让孩子长不高！非参数再加权方法做反事实分析, 元分析！

1 简介

2 背景

2.1 "亚洲之谜"：有待解释的身高差异谜题

2.2 为何OD会影响儿童身高

2.3 为何OD风行印度及其对于相关研究的影响

3 实证策略

3.1 数据与描述性统计

3.2 非参数再加权方法

4 主要结果：OD密度与“亚洲之谜”

4.1 图示总结

4.2 完整结果

5 拓展

5.1 稳健性检验：线性回归的结果

5.2 对通过母体影响儿童身高机制的考察

6 元分析及相关实证研究

7 总结

您可能也对以下帖子感兴趣

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

圈内疯传某谣言

不要放过这些人渣

“辣条二哥”直追卫龙，麻辣王子工厂遇洪受关注

中金跳楼女生诡异之处。

生成图片，分享到微信朋友圈

惊! 露天排遗(bian)会让孩子长不高！非参数再加权方法做反事实分析, 元分析！

1 简介

2 背景

2.1 "亚洲之谜"：有待解释的身高差异谜题

2.2 为何OD会影响儿童身高

2.3 为何OD风行印度及其对于相关研究的影响

3 实证策略

3.1 数据与描述性统计

3.2 非参数再加权方法

4 主要结果：OD密度与“亚洲之谜”

4.1 图示总结

4.2 完整结果

5 拓展

5.1 稳健性检验：线性回归的结果

5.2 对通过母体影响儿童身高机制的考察

6 元分析及相关实证研究

7 总结

您可能也对以下帖子感兴趣