公卫百科 >> 倾向性评分 >> 历史版本
编辑时间历史版本内容长度图片数目录数修改原因
07-30 22:44 最新历史版本 4696 0 5 新增内容
上一历史版本 |   返回词条

倾向性评分

 倾向性评分(propensity score)

目录

什么是propensity score

A propensity score is the probability of a unit (e.g., person, classroom, school) being assigned to a particular treatment given a set of observed covariates. Propensity scores are used to reduce selection bias by equating groups based on these covariates.

在RCTs中,试验参加者被随机分配到试验组或对照组,可以有效地消除两组之间的差异。但是在非随机的观察性研究如病例对照研究,如何处理干扰因素一向是很重要的问题。如果有治疗组和未治疗组的病人,其基本特性是不同的,两组就无法直接比较治疗效果。

要解决这个问题,多变量分析和propensity score分析是其中的两种方法。大家熟知的多变量分析,即是在分析药物治疗是否影响结果时,同时调整其他的干扰因素。Propensity score则是一个概率(0~1),代表一个病人在其既有的基本特性(或干扰因素)下,得到药物治疗的机会。计算propensity score的方法,其实就来自一个logistic regression model:将得到治疗与否当做因变量,把基本特性的各个因子当做自变量。所以,两种方法的基本差异在于,多变量分析注意的是基本特性和结果的关系,而propensity score则是聚焦在基本特性和有无药物治疗的关系。换句话说,propensity score企图再造一个类似随机分配的情境。在随机试验中,每一个受试者得到治疗的propensity score应该是0.5。在非随机的观察性研究,propensity score就会因病人的基本特性而异。

如何使用propensity score

 一旦计算出propensity score,就可以使用在各种分析方法:

 1、配对(matching):将接受药物的病人与没有接受药物的病人按照propensity score配对。与传统配对方式比较,这样做最大的特点是,不会因为配对因子过多而找不到适当的对象。

2、分层分析(stratification):因为propensity score用一个数字来总结所观察到的基本特性,根据propensity score来分层,可以平衡两组干扰因子分布的差异。它的好处在于当基本特性因子很多时,可以避免分太多层。

3、回归调整(regression adjustment):上述两种使用的主要目的是在使两组可以有效地比较。而在回归分析探讨治疗组与对照组对结果的影响时,propensity score也可以被当作是“唯一”的干扰因素。

propensity score的优点

1、减少非随机观察性研究的偏倚(bias)。

2、 一般运用某种多变量分析法来控制干扰因素是否得当,需视这些资料是否符合这种方法的一些前提假设(例如,线性相关)。而propensity score不会受到这种影响,因而能做出较准确的估计。

3、当要比较的结果不只一项时,通常需依情況运用不同的models,如logistic或proportional hazard regression。Propensity score则没有这种限制,同样的score可以使用于个别的结果分析。

4、 当结果发生的很少(rare outcome),而要探讨的暴露或干扰因素很多时,回归分析就有很多限制(这是一个重要、但常被忽视的“维度困惑”)。Propensity score被认为是处理这种情况比较好的分析方法。

propensity score的缺点

1、与所有非随机研究的分析方法一样,propensity score只能控制已知的干扰因子,对未测量到的和未知的因子则束手无策(这正是随机试验最大的优势)。
2、propensity score在样本量太小时,也无法完全发挥平衡干扰因素的功能。
3、当结果发生数够多时(平均每一個个干扰因素至少有8-10个结果),一个设计理想的回归分析可能比propensity score更能控制干扰因素所产生的偏倚。 


多元回归和处理效应的区别

Effect estimate interpretations when you use weighting are marginal effect in the target population. When you adjust for covariates in a regression model, you are interpreting a conditional effect, that is, the effect of the exposure holding (conditional on) the covariates being constant. Conditional estimates are troublesome with time-varying covariates because we run into collider bias and conditioning on mediators, thus weights are preferable. In simpler situations, using weights over multivariable regression can help with convergence issues.(参考文献12)

参考文献

1、http://www.stroke.org.tw/newpaper/2008Dec/paper_4.asp

2、http://en.wikipedia.org/wiki/Propensity_score_matching

3、Rosenbaum, Paul R.; Rubin, Donald B. (1983). "The central role of the propensity score in observational studies for causal effects". Biometrika 70 (1): 41–55. doi:10.1093/biomet/70.1.41.

4、Implementing Propensity Score Matching Estimators with STATA. Lecture notes 2001