logo
天地变化的道理
使用率很高网站
生活要常常分享
您身边百科全书
辛普森悖论
辛普森悖论(),是概率和统计中的一种现象,其中趋势出现在几组数据中,但当这些组被合并后趋势消失或反转。 这个结果在社会科学和医学科学统计中经常遇到, 当频率数据被不恰当地给出因果解释时尤其成问题。当干扰变量和因果关系在统计建模中得到适当处理时,这个悖论就可以得到解决。 辛普森悖论已被用来说明统计误用可能产生的误导性结果。 该现象于20世纪初就有人讨论,但一直到1951年,爱德华·H·辛普森在他发表的论文中阐述此一现象后,该现象才算正式被描述解释。后来就以他的名字命名此悖论,即辛普森悖论。此悖论的最终原因和、幸存者偏差、以及一样,是源自对撞因子(存疑!应为混淆变量(confounder))。 举例. 一所美国高校的两个学院,分别是法学院和商学院。新学期招生,人们怀疑这两个学院有性别歧视。现作如下统计: 法学院 商学院 根据上面两个表格来看,女生在两个学院都被优先录取,即女生的录取比率较高。现在将两学院的数据汇总: 在总评中,女生的录取比率反而比男生低。 借助一幅向量图可以更好的了解情况(右图) 这个例子说明,简单的将分组数据相加汇总,是不能反映真实情况的。 就上述例子说,导致辛普森悖论有两个前提。 为了避免辛普森悖论的出现,就需要斟酌各分组的权重,并乘以一定的系数去消除以分组数据基数差异而造成的影响。同时,我们必需清楚了解情况,以综合考虑是否存在造成此悖论的潜在因素。 参考文献. "Skript zur Statistik in der Naturwissenschaften(Gerhard Osius, Universität Bremen)"
辛普森悖论
生成维基百科快照图片,大概需要3-30秒!
如果网站内容有侵犯您的版权
请联系:pinbor@iissy.com
Copyright ©2014 iissy.com, All Rights Reserved.