倾向性评分加权方法介绍及 R 软件实现

中国循证医学杂志 2023-06-15

在观察性研究中，病例组和对照组的协变量分布通常是不均衡的，即存在混杂因素，如忽视组间混杂因素的不均衡性，将其等同于随机对照试验，直接利用均值对平均处理效应进行估计，得到的结果将存在偏倚甚至出现 Simpson 悖论。倾向性评分作为一种混杂因素处理的分析方法已在观察性研究中得到广泛应用。倾向性评分（propensity score，PS）的概念最早于 1983 年由 Rosenbaum 和Rubin 提出，是指在一定协变量的条件下，研究对象接受处理因素的概率。倾向性评分最大的优势是将多个混杂因素的影响用一个综合的值来表示，即倾向性评分值，从而降低了协变量的维度，因此该方法尤其适用于协变量较多的情况。目前该方法已广泛应用到医学、经济学、社会学等领域的研究中。利用倾向性评分方法进行分析的步骤为：① 估计 PS 值；② 利用 PS 值均衡协变量分布；③ 均衡性检验及模型评价；④ 处理效应估计。其中，PS 值的估计是以处理因素作为因变量，其他混杂因素作为自变量，通过建立一个回归模型来估计每个研究对象接受处理因素的可能性。目前用于估计 PS 值的方法有 logistic 回归，Probit 回归、神经网络、支持向量机、分类与回归数、Boosting 算法、SuperLearner 等方法。其中 logistic 回归是最早提出的估计 PS 值的方法，也是目前最常用的方法。利用 PS 值均衡组间协变量分布的方法有匹配（matching）、分层（stratification）、协变量调整（covariate adjustment）和加权（weighting）等。4 种方法均有各自的特点和局限。其中基于倾向性评分的匹配、分层及协变量调整已早有介绍，本文主要介绍倾向性评分加权的分析方法。

引用本文

涂博祥, 秦婴逸, 吴骋, 等. 倾向性评分加权方法介绍及 R 软件实现. 中国循证医学杂志. 2022, 22(3): 365-372. DOI: 10.7507/1672-2531.202111101

免费获取全文请复制链接在浏览器中打开、或扫描下方二维码、或联系本刊官邮editor@cjebm.com。

原文链接：

http://www.cjebm.com/article/10.7507/1672-2531.202111101

二维码：

点击下方“阅读原文”查看我刊更多内容

抗洪靠嘴，堵漏靠沙？印度官员真是绝了！

这样的洞庭湖决堤，实在让人同情不起来

有的人走了，却永远活着

圈内疯传某谣言

不要放过这些人渣

倾向性评分加权方法介绍及 R 软件实现

您可能也对以下帖子感兴趣

抗洪靠嘴，堵漏靠沙？印度官员真是绝了！

这样的洞庭湖决堤，实在让人同情不起来

有的人走了，却永远活着

圈内疯传某谣言

不要放过这些人渣

生成图片，分享到微信朋友圈

倾向性评分加权方法介绍及 R 软件实现

您可能也对以下帖子感兴趣