效应量
效应量(effect size,ES)是衡量处理效应大小的指标,与显著性检验不同,这些指标是不受样本容量影响的。它表示不同处理下的总体均值之间差异的大小,可以在不同研究之间进行比较。一般用于针对某一研究领域内的元分析中,经常见于心理,教育,行为研究等。
在一般统计分析中,一般我们只报告统计量F或t值,与p-value;实际上这些统计量对数据的描述只是描述了一小部分;传统的描述还应包括样本量,样本均数与标准差;但这些传统的描述量基本只是对单变量分布的描述,而对两组变量或处理效应的描述,则用effect size更加直观。它在平均数检验中表示的是两组样本分布的总体的非重叠程度;ES越大,重叠程度越小,效应明显;ES越小则相反。可以这样理解,不管你取哪种样本,ES是作为为一种标准的均数差异的估计,它与当前样本无关。显然,传统的推断统计量F及p-value只是说明均数差异,但这种差异脱离样本推广到不同的抽样群体,差异究竟有多大,需要用ES来描述。(可以这样来形容F值与ES值:F值表示的是样本1与样本2之间的显著性;而ES值是表示在样本1的总体与样本2的总体中随便抽取两个样本,这种差异显著性出现的可能性)一个很好的例子:
见:http://en.wikipedia.org/wiki/Effect_size#Distribution_of_effect_sizes_based_on_means
如果说平均水平,男性比女性身高要高;而这种均数的ES则可以这样来解释,ES越大则更容易在实际中看到男性要高,越小则看到男性要高的可能性会小些。应该说,ES更能说明实践中我们所关心的差异,而不是数据上的差异显著问题。ES是帮助我们知道观测到的差异是不是事实上的差异。相关系数和方差分析中的ES原理与均数比较相同,只是样本和总体分布不同。
此外,ES与统计效力1-beta有所区别,它们是正向相关,1-beta受样本容量影响较大,而ES不受样本容量影响。具体的函数关系见:
图:http://www.power-analysis.com/effect_size.htm
及:甘怡群等编著.心理与行为科学统计.北京大学出版社,2005,p109.