查看原文
其他

R和Stata软件meta分析操作详细攻略, 对研究再开展研究的利器!

凡是搞计量经济的,都关注这个号了

稿件:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

之前,我们引荐过“Meta分析是什么? 计量软件如何做, 如何解读呢”。今天,在此基础上,我们进一步引荐Meta分析(荟萃分析)相关内容,重点介绍用R和Stata软件操作meta分析的步骤和技巧。
荟萃分析,又称“Meta分析”,Meta意指较晚出现的更为综合的事物,而且通常用于命名一个新的相关的并对原始学科进行评论的学问,不但包括数据结合,而且包括结果的流行病学探索和评价,以原始研究的发现取代个体作为分析实体。荟萃分析产生的主要的理由是:对于多个单独进行的研究而言,许多观察组样本过小,难以产生任何明确意见。

荟萃分析概念

荟萃分析的概念最早是由Light和Smith于1971 年提出的。当时针对大量发表的科学论文中,对于同样的研究却得出截然不同的结果的问题,他们提出应该在全世界范围内收集对某一疾病各种疗法的小样本、单个临床试验的结果,对其进行系统评价和统计分析,将尽可能真实的科学结论及时提供给社会和临床医师,以促进推广真正有效的治疗手段,摈弃尚无依据的无效的甚至是有害的方法。
1976 年Glass首次将这一概念命名为Meta-analysis(荟萃分析),并定义为一种对不同研究结果进行收集、合并及统计分析的方法。这种方法逐渐发展成为一门新兴学科--“循证医学”的主要内容和研究手段。荟萃分析的主要目的是将以往的研究结果更为客观的综合反映出来。研究者并不进行原始的研究,而是将研究已获得的结果进行综合分析。

荟萃分析分类

通常概念下的文献综述是对有关文献的内容或结果进行罗列、简单的描述和初步的讨论,而荟萃分析则完全上了一个台阶。根据荟萃分析所依据的基础或数据来源可以将其分为三类:文献结果荟萃分析(Meta-analysis based on literature,MAL);综合或合并数据荟萃分析(Meta-analysis based on summary data,MAS);独立研究原始数据荟萃分析(Meta-analysis based on individual patient data,MAP or IPD Meta-analysis)。它们的区别在于:MAL的文献检索局限于已经发表的研究,然后将这些研究的结果合并进行分析;MAS不仅要得到相关的发表的文献,同时还有作者进行的相关统计学数据的总结;而IPD荟萃分析除了要检索所有已发表的相关文献,还要寻找存在于各科学团体中的未发表的有关研究,在MAS基础上更进了一步。所有临床试验不管是否已经发表,必须能够从研究者处得到单个患者原始的,以及各效应指标的数据。这一点对于肿瘤病因或疗效研究方面的分析来说较为重要。因为多数的关于肿瘤病人预后的III期临床试验,主要的研究指标大多为生存时间或生存率,或疾病无进展时间等,在多数情况下,不同的出版物中所得到的信息不足以进行一项真正的事件(如肿瘤死亡)发生时间全过程的分析。这使得以已经发表的文献作为基础的MAL和MAS变得较为困难。同时,考虑到有统计学意义的阳性结果较阴性结果更易发表等能够造成偏倚发生的情况存在,故MAL和MAS有一定的不足。相对来讲,IPD荟萃分析不存在上述的弊端或受有关偏倚的影响较小。因此,在肿瘤生存或疗效研究领域中,当要求进行这方面的分析时,IPD荟萃分析是唯一推荐使用的分析方法,尽管它比其它两种方法要耗费更长的时间,以及人力和物力。

分析优劣

荟萃分析的优劣
荟萃分析的应用,避免了单个小样本临床试验的局限性,使分析的结果更为全面和可靠,从而为医学决策提供了良好的依据。但是,许多人为的因素可能会对分析结果产生影响。如试验的选择、研究终点的确定,试验同质性的认可程度等。要想克服这些不利因素,应严格按照荟萃分析的有关规定,并逐渐形成相对固定的标准,如将生存指标作为规定的研究效应指标等。同时要认识到荟萃分析并不是包治百病的良药,它不能代替大型的单个的临床随机试验,也不应该作为进行一些小的、没有多大说服力的、意义不大的临床试验的借口。它和大型的随机临床试验应该是相互补充、各取所长的关系。我们不应该把荟萃分析只当作是一个统计分析的工具,而要把它和临床观察或对数据的批判性回顾结合起来,从而帮助我们来评价一些临床试验的质量,研究不同试验间疗效的差异及造成的原因,以及为进一步的研究提供方向和证据等。
荟萃分析的未来
荟萃分析在近20年来得到了迅速的发展,每年发表的此类文章已经从80年代的几十篇到2000年的将近500篇左右。更有人认为,IPD荟萃分析应该系统的进行,定期的更新。世界Cochrane协作网正在进行一项庞大的工作,即将全世界所有的随机临床试验进行注册,然后进行相应的荟萃分析。同时,随着信息技术的发展和大型临床试验数据库的不断完善,还出现了从回顾型荟萃分析向前瞻型荟萃分析转换的趋势,因为后者能更好的避免出版偏倚,更早得到分析结果和医学决策的依据。这一点,相信应能更好的推动荟萃分析的进一步发展。荟萃分析-健择治疗非小细胞肺癌荟萃分析实例 在刚刚结束的第十届世界肺癌会议(加拿大,2003年)上,Le Chevalier T教授及其同事们向大会报告了一份关于健择治疗进展期非小细胞肺癌(NSCLC) 生存资料荟萃分析的结果,引起了与会代表极大的兴趣。
该项荟萃分析的研究的目很明确,比较健择联合其他药物治疗进展期非小细胞肺癌与其他化疗方案的疗效,看健择/铂类较其他铂类为基础的方案是否能轻度提高病人的总生存率和TTP,所以观察指标的包括总生存率和无进展生存率。对2002年12月前发表的所有有关文献进行了综合性的回顾,检索了主要的肿瘤方面资料库、注册的临床试验数据库、会议摘要及发表的综述,各独立研究的设计特征定义为头对头(head to head)随机化临床试验,各试验目的是比较健择加铂类与其它铂类为基础的方案的疗效。15个临床试验被研究者检索到,2个试验被排除在本次荟萃分析外,原因是其中1个试验因为生存资料报道不足,1个试验因为患者的随机化程度较差。在剩余的13个试验中,7个试验的资料由研究者提供,仅11个试验同时报道了无进展生存率和总生存率。研究者主要的分析是全部铂类为基础的比较方案,共计13个试验,约4500例患者。试验的规模从76 例至超过1100例患者分析分为2个亚组进行,第一组包括所有第一代或第二代铂类方案,包括长春花碱、异环磷酰胺、足叶乙甙和米托蒽醌。第二组为第三代药物加铂类。分析指标为危险率、总生存率和生存率差、无疾病进展生存率,危险率直接取自研究者的报道有7个试验,或从发表的生存资料进行推算的有6个试验。若未进行报道,生存率从Kaplan-Meier 生存曲线估算,利用Parmar 等于1998年发表的方法来进行计算。各组资料还进行明显发表偏倚和异质性的检验,分别采用线性回归随机效应模型
无疾病进展1年生存率差(绝对受益)估计值为4.2%,合并危险率比(HR) 为0.87,有统计学意义(P<0.001)。所有试验的合并危险率比(HR)为0.90,1年总生存率的差(绝对受益)估计值为3.9%。对照组的1 年生存率约为35%,健择治疗组约为39%。合并危险率比0.90的95%可信区间为0.84-0.96,有统计学意义(P<0.001)。亚组分析表明,顺铂单药或第一或二代铂类方案无进展生存率的合并危险率比为0.85,总生存率的合并危险率比为0.89,均有统计学意义。第三代药物/铂类方案无进展生存率的合并危险率比为0.84,总生存率的合并危险率比为0.93,前者有统计学意义,后者95%可信区间为0.86-1.01,接近统计学意义P=0.05水平。结果为第二个亚组在总生存率方面试验组和对照组无显著性差异,这是唯一不利于健择的数据。
研究者还报告了敏感性分析的结果,显示益处的方向是一致的。其潜在缺陷或不足包括以下几个方面:一是分析是基于总结的资料;二是由于试验对照组的数量,无法就单独的某一药物与健择进行比较;三是因为没有获得单独试验的资料,无法就性别、行为状态等预后因素进行分层分析。
总之,该荟萃分析结果显示,总体上健择/铂类联合与其它铂类方案比较,患者能获得轻微但有统计学意义的改善(总生存率和无疾病进展生存率),但无法就单独药物进行比较。结果同时显示,健择方案较传统方案更有效;与其他三代药物联合至少疗效相当。研究者最后还提醒各位,治疗决定的选择必须遵从疗效好坏,还要考虑到其他在这里没有进行讨论或研究的一些临床预后因素的作用。

分析的步骤

计划阶段
首先要确定研究的主题,然后明确本方案的目的,试验的入选标准和排除标准,计划的分析指标,以及准备应用的统计学方法等。一篇荟萃分析最好只研究一个主要问题,但在研究的主要目的明确后,还可以同时研究其他的次要问题。
寻找和选择临床试验
理想情况下,所有与研究主题相关的文献都应该包括在荟萃分析之内,不管它是否已经发表。必须考虑到文章出版、语言和引用上的偏倚。一般情况下,显示有统计意义的试验更易被某些杂志刊登,这些论文的发表周期较短,他们有最高的点击指数。通常会用英语发表,他们比未显示出统计学意义的试验被更多的参考和引用。单单使用计算机进行检索是不够的,尽管这样比较方便。因为即便是象MEDLINE或EMBASE这样的大型数据库,其所收录的也都是在各类杂志上发表的文献,且分别是1966年和1974年以后的文献。还要通过人工检索一些会议资料,或直接同研究者和制药公司进行个人接触,来保证文献的全面性。
试验的质量
确保每一个试验的质量是很关键的,因为它会影响整个荟萃分析的质量。不充分的随机化,随机分组后将患者排除在外,治疗组之间不能平行的随访,以及对研究终点的主观评价都会使试验的结果发生偏差。因此各独立研究的质量是不同的。在进行荟萃分析时,各研究结果就不应该被平等的对待,而应根据各个独立研究质量的高低给予不同的处理。比如对单个随机对照临床试验的质量进行评分,将分值纳入荟萃分析的入选标准,或将其作为合并检验时的权重。
对试验进行描述
在对各试验结果进行荟萃分析前,每一个试验必须被记录和描述。包括对试验设计的评价,治疗组间进行比较的特性,患者人群特征,试验质量的评估和试验结果的定量总结等。这个过程使研究者可以发现相似的试验而将其合并,了解入组患者的类型和评价数据的可靠性。被排除在荟萃分析之外的试验,以及被排除的原因也应该进行描述。
分析
在荟萃分析中,齐性检验是重要的一环,目的是检查各个试验结果是否具有一致性。一般来讲,仅仅由于抽样误差造成的各试验间结果不同,不会影响荟萃分析结果的可靠性。但若发现不一致性的原因是某种特殊因素所致,如某个研究失访病例过多,则不应该将这个试验结果列入荟萃分析。常用的齐性检验方法主要有χ2或Q检验。
对数据结果进行汇总合并分析是荟萃分析的精华,应用于此的统计学方法较多。如随机效应模型,Cochrane 法,Glass法和Fisher-Z转换法等。在肿瘤生存或疗效研究领域,较多的是对生存率或死亡风险比(Hazard Ratio,HR)指标的分析。通常,要对每个入选试验的数据进行统计计算,得出主要的三个值:O=试验组所观察到的事件发生数;E=假设试验组和对照组事件发生的几率相同,预期试验组的事件发生数;Var(O-E)=(O-E)的方差,用来衡量试验中治疗差异估计的精确度。计算单个试验风险比的公式为:HR=Exp[(O-E)/Var(O-E)]。多个试验总风险比的计算为:HRc=Exp[Σ(O-E)/ ΣVar(O-E)]。风险比95%的可信区间可通过下列公式计算:上限=Exp[(O-E)/Var(O-E) +1.96/ Var(O-E)1/2];下限= Exp[(O-E)/Var(O-E)-1.96/ Var(O-E)11/2]。分析得出的数据最终可以用林图(Forest Plot)来直观显示。
两个治疗组间的绝对生存率或无病生存差异是疗效研究中的主要分析指标,通过采用一定的统计方法,同样可获得某一时点(如5年)生存率合并估计值,以及该时点两组生存率差的合并估计值,具体的公式可参见有关的文献。

用R软件做meta分析的程序:

https://cran.r-project.org/web/views/MetaAnalysis.html


用Stata软件做meta分析操作详细攻略


长按以上二维码可以看Meta分析视频教程

Source: 计量经济圈社群、百科资料、B站等

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存