协方差矩阵
在统计学与概率论中,协方差矩阵(covariance matrix)是一个方阵,代表著任两列间的协方差,是协方差的直接推广。
定义.
定义 —
设 formula_1 是机率空间, formula_2 与 formula_3 是定义在 formula_4 上的两列实数随机变量序列
若二者对应的期望值分别为:
formula_5
formula_6
则这两列随机变量间的协方差矩阵为:
formula_7
将之以矩形表示的话就是:
formula_8
formula_9
根据测度积分的线性性质,协方差矩阵还可以进一步化简为:
formula_10
矩阵表示法.
以上定义所述的随机变数序列 formula_11 和 formula_12 ,也可分别以用行向量 formula_13 与 formula_14 表示,换句话说:
formula_15 formula_16
这样的话,对于 formula_17 个定义在 formula_4 上的随机变数 formula_19 所组成的矩阵 formula_20 , 定义:
formula_21
也就是说
formula_22
那上小节定义的协方差矩阵就可以记为:
formula_23
所以协方差矩阵也可对 formula_24 与 formula_25 来定义:
formula_26
术语与符号分歧.
也有人把以下的 formula_27 称为协方差矩阵:
formula_28
但本页面沿用威廉·费勒的说法,把 formula_29 称为 formula_11 的方差(variance of random vector),来跟 formula_31 作区别。这是因为:
formula_32
换句话说, formula_29 的对角线由随机变数 formula_34 的方差所组成。据此,也有人也把 formula_31 称为方差-协方差矩阵(variance–covariance matrix)。
更有人因为方差和离差的相关性,含混的将 formula_31 称为离差矩阵。
性质.
formula_37 有以下的基本性质:
尽管共变异数矩阵很简单,可它却是很多领域里的非常有力的工具。它能导出一个变换矩阵,这个矩阵能使数据完全去相关(decorrelation)。从不同的角度看,也就是说能够找出一组最佳的基以紧凑的方式来表达数据。(完整的证明请参考瑞利商)。
这个方法在统计学中被称为主成分分析(principal components analysis),在图像处理中称为Karhunen-Loève 变换(KL-变换)。
复随机向量.
均值为formula_52的复随机标量变量的方差定义如下(使用共轭复数):
formula_53
其中复数formula_54的共轭记为formula_55。
如果formula_56 是一个复列向量,则取其共轭转置,得到一个方阵:
formula_57
其中formula_58为共轭转置, 它对于标量也成立,因为标量的转置还是标量。
估计.
多元正态分布的共变异数矩阵的估计的推导非常精致. 它需要用到谱定义以及为什么把标量看做formula_59矩阵的迹更好的原因。参见共变异数矩阵的估计。
生成维基百科快照图片,大概需要3-30秒!