卡方分布
卡方分布(, "χ"²---,或写作"χ"²分布)是概率论与统计学中常用的一种概率分布。k个独立的标准正态分布变量的平方和服从自由度为k的卡方分布。卡方分布是一种特殊的伽玛分布,是统计推论中应用最为广泛的概率分布之一,例如假说检定和置信区间的计算。
由卡方分布延伸出来皮尔森卡方检定常用于:
数学定义.
若"k"个随机变量"formula_11"、……、"formula_12"是相互独立且符合标准正态分布的随机变量(数学期望为0、方差为1),则随机变量"Z"的平方和
formula_13
被称为服从自由度为 "k" 的卡方分布,记作
formula_14
formula_15
性质.
可以在文章右上角的表中看到更多卡方分布的性质。
概率密度函数.
卡方分布的概率密度函数为:
formula_16
其中formula_17,当formula_18时formula_19。这里Γ代表Gamma函数。
累积分布函数.
卡方分布的累积分布函数为:
formula_20,
其中γ(k,z)为不完全Γ函数
在大多数涉及卡方分布的书中都会提供它的累积分布函数的对照表。此外许多表格计算软件如OpenOffice.org Calc和Microsoft Excel中都包括卡方分布函数。
自由度为"k"的卡方变量的平均值是"k",方差是"2k"。
卡方分布是伽玛分布的一个特例,它的熵为:
formula_21
其中formula_22是双伽玛函数。
卡方变数与Gamma变数的关系.
当Gamma变数 频率(λ)为1/2时,α的2倍为卡方变数之自由度。
即:
formula_23
formula_24
formula_25
卡方变数之期望值=自由度
卡方变数之方差=两倍自由度
可加性.
由定义可得,独立卡方变量之和同样服从卡方分布。特别地,若formula_26分别独立服从自由度为formula_27的卡方分布,那么它们的和formula_28服从自由度为formula_29的卡方分布。
偏差的平方和.
若"k"个随机变量"formula_11"、……、"formula_12"是相互独立,符合标准正态分布的随机变量,则它们与均值之间偏差的平方和
formula_32
其中均值
formula_33
它的平方正比于自由度为1的卡方分布,即
formula_34
卡方分布表.
p-value = 1- p_CDF.
χ2越大,p-value越小,则可信度越高。通常用p=0.05作为阈值,即95%的可信度。
常用的χ2与p-value表如下:
图片快照过大,请您耐心等候,如果加载失败请稍后再试!