logo
天地变化的道理
使用率很高网站
生活要常常分享
您身边百科全书
免费为您秀产品
矩阵
矩阵 !style=" text-align: left; background: #DCF0FF; font-size: 90%;"|线性空间与线性变换 线性空间 · 线性变换 · 线性子空间 · 线性生成空间 · 基 · 线性映射 · 线性投影 · 线性无关 · 线性组合 · 线性泛函 · 行空间与列空间 · 对偶空间 · 正交 · 特征向量 · 最小二乘法 · 格拉姆-施密特正交化 数学上,一个formula_1的矩阵是一个有formula_2-{zh-cn:行; zh-tw:列;}-(row)formula_3-{zh-cn:列; zh-tw:行;}-(column)元素的矩形阵列。矩阵里的元素可以是数字或符号甚至是函数。 formula_4 大小相同(行数列数都相同)的矩阵之间可以相互加减,具体是对每个位置上的元素做加减法。矩阵的乘法则较为复杂。两个矩阵可以相乘,当且仅当第一个矩阵的-{zh-cn:列; zh-tw:行;}-数等于第二个矩阵的-{zh-cn:行; zh-tw:列;}-数。矩阵的乘法满足结合律和分配律,但不满足交换律。 矩阵的一个重要用途是解线性方程组。线性方程组中未知量的系数可以排成一个矩阵,加上常数项,则称为增广矩阵。另一个重要用途是表示线性变换,即是诸如formula_5之类的线性函数的推广。设定基底后,某个向量formula_6可以表示为formula_7的矩阵,而线性变换formula_8可以表示为-{zh-cn:列; zh-tw:行;}-数为formula_2的矩阵formula_10,使得经过变换后得到的向量formula_11可以表示成formula_12的形式。矩阵的特征值和特征向量可以揭示线性变换的深层特性。 矩阵是高等代数学中的常见工具,也常见于统计分析等应用数学学科中。在物理学中,矩阵在力学、电路学、光学和量子物理等领域中都有应用;计算机科学中,三维动画制作也需要用到矩阵。矩阵的运算是数值分析领域的重要问题。将矩阵分解为简单矩阵的组合可以在理论和实际应用上简化矩阵的运算。对一些应用广泛而形式特殊的矩阵,例如稀疏矩阵和准对角矩阵,有特定的快速运算算法。关于矩阵相关理论的发展和应用,请参考矩阵理论。在天体物理、量子力学等领域,也会出现无穷维的矩阵,是矩阵的一种推广。 词源. 中文中矩阵的概念最早见于1922年。1922年,北京师范大学附属中学数学老师程廷熙在一篇介绍文章中将矩阵译为“纵横阵”。1925年,在科学名词审查会算学名词审查组刊登于《科学》第十卷第四期的审定名词表中,矩阵被翻译为“矩阵式”,方块矩阵翻译为“方阵式”,而各类矩阵如“正交矩阵”、“伴随矩阵”中的“矩阵”则被翻译为“方阵”。1935年,中国数学会审查后,中华民国教育部审定的《数学名词》(并“通令全国各院校一律遵用,以昭划一”)中,“矩阵”作为译名首次出现。1938年,曹惠群在接受科学名词审查会委托就数学名词加以校订的《算学名词汇编》中,认为应当的译名是“长方阵”。1949年中华人民共和国成立后编订的《数学名词》中,则将译名定为“(矩)阵”。1993年,中国自然科学名词审定委员会公布的《数学名词》中,“矩阵”被定为正式译名,并沿用至今。 发展. 作为解决线性方程的工具,矩阵也有不短的历史。成书最迟在东汉前期的《九章算术》中,已经出现过以矩阵形式表示线性方程组系数以解方程的图例,可视为矩阵的雏形。矩阵正式作为数学中的研究对象出现,则是在行列式的研究发展起来后。逻辑上,矩阵的概念先于行列式,但在历史上则恰好相反。日本数学家关孝和(1683年)与微积分的发现者之一戈特弗里德·威廉·莱布尼茨(1693年)近乎同时独立建立了行列式论。其后行列式作为解线性方程组的工具逐步发展。1750年,加布里尔·克拉默发现了克莱姆法则。 进入十九世纪后,行列式的研究进一步发展,矩阵的概念也应运而生。奥古斯丁·路易·柯西是最早将行列式排成方阵并将其元素用双重下标表示的数学家。他还在1829年就在行列式的框架中证明了实对称矩阵特征根为实数的结论。其后,詹姆斯·约瑟夫·西尔维斯特注意到,在作为行列式的计算形式以外,将数以行和列的形式作出的矩形排列本身也是值得研究的。在他希望引用数的矩形阵列而又不能用行列式来形容的时候,就用“matrix”一词来形容。而在此之前,数学家已经开始将增广矩阵作为独立的对象引用了。西尔维斯特使用“matrix”一词是因为他希望讨论行列式的子式,即将矩阵的某几行和某几列的共同元素取出来排成的矩阵的行列式,所以实际上“matrix”被他看做是生成各种子式的“母-{}-体”: 阿瑟·凯莱被公认为矩阵论的奠基人。他开始将矩阵作为独立的数学对象研究时,许多与矩阵有关的性质已经在行列式的研究中被发现,这也使得凯莱认为矩阵的引进是十分自然的。他说:“我决然不是通过四元数而获得矩阵概念的;它或是直接从行列式的概念而来,或是作为一个表达线性方程组的方便方法而来的。”他从1858年开始,发表了《矩阵论的研究报告》等一系列关于矩阵的专门论文,研究了矩阵的运算律、矩阵的逆以及转置和特征多项式方程。凯莱还提出了凯莱-哈密尔顿定理,并验证了3×3矩阵的情况,又说进一步的证明是不必要的。哈密尔顿证明了4×4矩阵的情况,而一般情况下的证明是弗罗贝尼乌斯于1898年给出的。 此后更多数学家开始对矩阵进行研究。埃尔米特证明了如果矩阵等于其复共轭转置,则特征根为实数。这种矩阵后来被称为埃尔米特矩阵。弗罗贝尼乌斯对矩阵的特征方程、特征根、矩阵的秩、正交矩阵、矩阵方程等方面做了大量工作。1878年,在引进了不变因子、初等因子等概念的同时,弗罗贝尼乌斯给出了正交矩阵、相似矩阵和合同矩阵的概念。同年,他探讨了矩阵的最小多项式(最小方程)问题。1894年的论文中,他讨论了矩阵理论和四元数理论的关系。1896年,他给出了凯莱-哈密尔顿定理的完整证明。矩阵理论在19世纪沿着两个方向发展,分别是作为抽象代数结构和作为代数工具描述几何空间的线性变换。矩阵理论为群论和不变量理论的发展。 无限维矩阵的研究始于1884年。庞加莱在两篇不严谨地使用了无限维矩阵和行列式理论的文章后开始了对这一方面的专门研究。1906年,希尔伯特引入无限二次型(相当于无限维矩阵)对积分方程进行研究,极大地促进了无限维矩阵的研究。在此基础上,施密茨、赫林格和特普利茨发展出算子理论,而无限维矩阵成为了研究函数空间算子的有力工具。 正式定义. 直观上就是用两个数码去标记一堆数学实体(如数字、函数),实际上是有限序列的一种推广。 formula_13 被暱称为矩阵 formula_14 里的元素,通常简记为formula_15、formula_16或formula_17。除此之外也会用小写字母 formula_18 表示元素,来跟矩阵 formula_14 本身做区别。但不知 formula_14 的具体形式却想强调 formula_18 为 formula_14 的元素的话,可以 formula_23 或 formula_24 表示。 如果表达式 formula_25(严格来说是合式公式,其中 formula_26 为一个包含变数 formula_27 的项)可以唯一决定一个矩阵 formula_14 ,那会将它记成 formula_29 。如: formula_30 且 formula_31 就可以表达为 formula_32 。 根据公理化集合论,可以定义一个函数的集合 formula_33 ,它囊括所有定义在 formula_34 上的 formula_1 矩阵,也就是说: formula_36 行与列. 以下的 formula_37 矩阵: formula_38 一般会如下排列成为矩形来表示: formula_39 英文将横向的元素组统称为「row」,纵向统称为「column」;但两岸对此却以不同的称呼;在中国大陆,横向的元素组称为「-{行}-」,纵向称为「-{列}-」,而在台湾则相反,横向称为「-{列}-」,纵向称为「-{行}-」。 行数是1或列数是1的矩阵又可分别称为行向量和列向量,在有限维的情况下,向量可用其分量表示成行数或列数是1的矩阵。 范例. formula_40是矩阵 formula_41 的简写。要注意的是,计算机编程中,由于数组的首项是第0项,故编程者可能会将第1行/列称为第0行/列,从而对矩阵的写法产生影响,比如矩阵formula_42就要改写成formula_43。 矩阵的元素可以是数字、符号或数学表达式。一般为了支援矩阵的运算,矩阵的元素之间应当能做加减法和乘法,所以是某个环里的元素。最常见的是元素属于实数域或复数域的矩阵,简称为实矩阵和复矩阵。更一般的情况下,矩阵的元素可以是由一个环中的元素排成。给定一个环formula_44,所有由formula_44中元素排成的formula_1矩阵的集合写作formula_47或formula_48。若formula_49,则通常记以formula_50或formula_51,称其为formula_3维矩阵或方阵。 矩阵的基本运算. 矩阵的最基本运算包括矩阵加(减)法,数乘和转置运算。被称为“矩阵加法”、“数乘”和“转置”的运算不止一种,其中最基本最常用的定义如下: 矩阵的加法运算满足交换律:formula_53。矩阵的转置和数乘运算对加法满足分配律: formula_54 formula_55 矩阵加法和数乘两种运算使得formula_56成为一个formula_57维的实数线性空间。而转置和数乘运算满足类似于结合律的规律: formula_58 矩阵也有类似行列式的初等变换,即对矩阵的某些行和某些列进行三类操作:交换两行/列,将一行/列的每个元素都乘以一个固定的量,以及将一行/列的每个元素乘以一个固定的量之后加到另一行/列的相应元素上。这些操作在求其逆矩阵时有用。 矩阵乘法. 两个矩阵的乘法仅当第一个矩阵formula_14的-{zh-cn:列; zh-tw:行;}-数(column)和另一个矩阵formula_42的-{zh-cn:行; zh-tw:列;}-数(row)相等时才能定义。如formula_14是formula_1矩阵和formula_42是formula_64矩阵,它们的乘积formula_65是一个formula_66矩阵,它的一个元素 formula_67 其中formula_68'。 例如 formula_69 矩阵的乘法满足结合律和对矩阵加法的分配律(左分配律和右分配律): 矩阵的乘法与数乘运算之间也满足类似结合律的规律;与转置之间则满足倒置的分配律。 formula_73 formula_74 矩阵乘法不满足交换律。一般来说,矩阵formula_14及formula_42的乘积formula_65存在,但formula_78不一定存在,即使存在,大多数时候formula_79。比如下面的例子: formula_80。 这一特性使得矩阵代数与常见的一些数域(有理数、实数、复数)以及环(多项式环、整数环)都不同。给定一个formula_3维的方块矩阵formula_14,与formula_14交换的所有方块矩阵构成一个环,称为formula_14的交换子环。这些矩阵也构成formula_85的一个子空间,称为formula_14的可交换空间。与formula_85中所有矩阵交换的矩阵只有形如formula_88的矩阵(称为数乘矩阵)。其中的formula_89是单位矩阵,也就是主对角线上的元素为1,其它元素为0的矩阵。任意矩阵formula_90乘以单位矩阵都得到自身:formula_91。 除了最常见的矩阵乘法定义以外,也有一些较不常见的矩阵乘法,比如阿达马乘积和克罗内克乘积。 线性方程组. 矩阵乘法的一个基本应用是在线性方程组上。线性方程组是方程组的一种,它符合以下的形式: formula_92 其中的formula_93以及formula_94等等是已知的常数,而formula_95等等则是要求的未知数。运用矩阵的方式,可以将线性方程组写成一个向量方程: formula_96 其中,formula_14是由方程组里未知量的系数排成的formula_1矩阵,formula_99是含有formula_3个元素的-{zh-cn:行; zh-tw:列;}-向量,formula_101是含有formula_2个元素的-{zh-cn:行; zh-tw:列;}-向量。 formula_103 这个写法下,将原来的多个方程转化成一个向量方程,在已知矩阵formula_14和向量formula_101的情况下,求未知向量formula_99。 线性变换. 矩阵是线性变换的便利表达法。矩阵乘法的本质在联系到线性变换的时候最能体现,因为矩阵乘法和线性变换的合成有以下的联系: 以formula_107表示所有长度为formula_3的-{zh-cn:行; zh-tw:列;}-向量的集合。每个formula_1的矩阵formula_14都代表了一个从formula_107射到formula_112的线性变换。反过来,对每个线性变换formula_113,都存在唯一"m"×"n"矩阵formula_114使得对所有formula_107中的元素formula_116,formula_117。这个矩阵formula_114第formula_119-{zh-cn:行; zh-tw:列;}-第formula_120-{zh-cn:列; zh-tw:行;}-上的元素是正则基向量formula_121(第"j"个元素是1,其余元素是0的向量)在formula_8映射后的向量formula_123的第formula_119个元素。 也就是说,从formula_107射到formula_126的线性变换构成的向量空间formula_127上存在一个到formula_56的一一映射:formula_129 以下是一些典型的2维实平面上的线性变换对平面向量(图形)造成的效果,以及它们对应的2维矩阵。其中每个线性变换将蓝色图形映射成绿色图形;平面的原点(0, 0)用黑点表示。 设有formula_130的矩阵formula_42代表线性变换formula_132,则矩阵积formula_78代表了线性变换的复合formula_134,因为 formula_135 矩阵的秩是指矩阵中线性无关的行/列向量的最大个数,同时也是矩阵对应的线性变换的像空间的维度。秩-零化度定理说明矩阵的-{zh-cn:列; zh-tw:行;}-数量等于矩阵的秩与零空间维度之和。 方块矩阵. 行数与列数相同的矩阵称为方块矩阵,简称方阵。所有formula_3维的方块矩阵构成一个线性空间,这个空间对矩阵乘法也是封闭的,因此也是一个代数。方阵formula_14称为可逆或非奇异的,如果存在另一个方阵formula_42,使得 formula_139 成立。这时候可以证明也有formula_140成立,可将矩阵formula_42称为formula_14的逆矩阵。一个矩阵formula_14的逆矩阵如果存在的话,就是唯一的,通常记作formula_144。 矩阵formula_14的元素formula_146称为其主对角线上的元素。方块矩阵formula_14的所有主对角线元素之和称为它的迹,写作formula_148。尽管矩阵的乘法不满足交换律,方阵相乘时交换顺序会导致乘积变化,但它们的迹不会变,即formula_149。除此以外,矩阵转置的迹等于其自身的迹,formula_150。 如果一个方阵只有主对角线上的元素不是0,其它都是0,那么称其为对角矩阵。如果主对角线上方的元素都是0,那么称为下三角矩阵;反之如果主对角线下方的元素都是0,那么称为上三角矩阵。例如formula_151的时候,这些矩阵分别写作: formula_152(对角矩阵),formula_153(下三角矩阵)和formula_154(上三角矩阵)。 行列式. 方块矩阵formula_14的行列式是一个将其映射到标量的函数,记作formula_156或formula_157,反映了矩阵自身的一定特性。一个方阵的行列式等于0当且仅当该方阵不可逆。系数是实数的时候,二维(三维)方阵formula_14的行列式的绝对值表示单位面积(体积)的图形经过formula_14对应的线性变换后得到的图形的面积(体积),而它的正负则代表了对应的线性变换是否改变空间的定向:行列式为正说明它保持空间定向,行列式为负则说明它逆转空间定向。 2×2矩阵的行列式是 formula_160 。 3×3矩阵的行列式由6项组成。更高维矩阵的行列式则可以使用莱布尼兹公式写出,或使用拉普拉斯展开由低一维的矩阵行列式递推得出。 两个矩阵相乘,乘积的行列式等于它们的行列式的乘积:formula_161。将矩阵的一行/列乘以某个系数加到另一行/列上不改变矩阵的行列式,将矩阵的两行/列互换则使得其行列式变号。用这两种操作可以将矩阵变成一个上三角矩阵或下三角矩阵,而后两种矩阵的行列式就是主对角线上元素的乘积,因此能方便地计算。运用行列式可以计算线性方程组的解(见克莱姆法则)。 特征值与特征向量. formula_162的方块矩阵formula_14的一个特征值和对应特征向量是满足 formula_164的标量formula_165以及非零向量formula_166。特征值和特征向量的概念对研究线性变换很有帮助。一个线性变换可以通过它对应的矩阵在向量上的作用来可视化。一般来说,一个向量在经过映射之后可以变为任何可能的向量,而特征向量具有更好的性质。假设在给定的基底下,一个线性变换对应着某个矩阵formula_14,如果一个向量formula_99可以写成矩阵的几个特征向量的线性组合: formula_169 其中的formula_170表示此向量对应的特征值是formula_171,那么向量formula_99经过线性变换后会变成: formula_173 可以清楚地知道变换后向量的结构。 另一个等价的特征值定义是:标量formula_165为特征值,如果矩阵formula_175是不可逆矩阵。根据不可逆矩阵的性质,这个定义也可以用行列式方程描述:formula_165为特征值,如果 formula_177这个定义中的行列式可以展开成一个关于formula_165的"n"阶多项式,叫做矩阵A的特征多项式,记为formula_179。特征多项式是一个首一多项式(最高次项系数是1的多项式)。它的根就是矩阵formula_14特征值。哈密尔顿-凯莱定理说明,如果用矩阵formula_14本身代替多项式中的不定元formula_165,那么多项式的值是零矩阵: formula_183。 对称. 转置等于自己的矩阵,即满足formula_184的方块矩阵formula_14叫做对称矩阵。满足formula_186的矩阵称为反对称矩阵。在复系数矩阵中,则有埃尔米特矩阵的概念:满足formula_187的方块矩阵称为埃尔米特矩阵,其中的formula_188表示formula_14的共轭转置矩阵。 根据谱定理,实对称矩阵和复埃尔米特矩阵拥有特征基,即由矩阵的特征向量组成的基底。因此任何向量都能表示成矩阵特征向量的线性组合。此外,这两类矩阵的特征值都是实数。 正定性. formula_162的实对称矩阵formula_14如果满足对所有非零向量formula_192,对应的二次型 formula_193 函数值都是正数,就称formula_14为正定矩阵。类似地还有半正定矩阵、负定矩阵、不定矩阵等概念。对称矩阵的正定性与其特征值密切相关。矩阵是正定的当且仅当其特征值都是正数。 矩阵的计算. 矩阵在许多学科领域中都有应用,在很多时候,除了需要知道矩阵的理论性质以外,还需要计算矩阵的数值。为了矩阵的计算能够足够精确与快捷,数值线性代数中专门有研究矩阵的数值计算方法。与其它的数值计算一样,矩阵的数值计算注重的主要也是算法的复杂度和数值稳定性。矩阵的数值计算可以使用直接计算,也可以用迭代算法,例如在计算方块矩阵的特征值时,可以从一个非零向量formula_195开始,通过特定迭代方法得到一个逼近某个特征向量的向量序列。 测量一个算法的复杂度是指估计此算法需要的基本运算如数字的加法和乘法的次数,或者找出它的一个上界。例如按照定义计算的话,两个formula_3阶方阵的乘法需要formula_197次数字乘法计算,因为其乘积是一个formula_3阶方阵,有formula_199个元素,计算每个元素需要formula_3次数字乘法。如果使用施特拉森算法的话,可以将数字乘法的次数减低到大约formula_201次。此外,编程语言或环境本身对算法的复杂度也会有影响。 某些特殊类型的矩阵携带的数据量比一般矩阵要少,同时带来的信息量比一般矩阵多。一个重要的例子是稀疏矩阵,这类矩阵中绝大部分的元素是零。有关稀疏矩阵的计算,如计算稀疏矩阵formula_14的线性方程组formula_203时,可以使用一些专用于稀疏矩阵的特殊算法(比如共轭梯度法),减低计算复杂度。 算法的数值稳定性是指输入值的小变化不会让计算结果产生很大偏差。例如计算矩阵的逆时,可以用以下的算法(其中formula_204表示formula_14的伴随矩阵,formula_206表示formula_14的行列式) formula_208 这个算法在formula_14的行列式接近0的时候会引起很大的舍入误差。而如果使用全选主元的高斯消去法求逆,则在复杂度降低的同时能够避免舍入误差,保证数值稳定性。 矩阵分解. 矩阵研究的一大方向是将一般的矩阵用一些比较“简单”的矩阵来表示。这种表示方式称为矩阵的变换与分解。矩阵变换与分解的方法有很多,它们的目的都是希望化简后的矩阵保持原矩阵的某些性质,比如行列式、秩或逆矩阵,而形式相对简单,因而能用容易地进行讨论和计算,或者能使得某些算法更易执行。 LU分解将矩阵分解为一个下三角矩阵formula_210和一个上三角矩阵formula_211的乘积。分解后的矩阵可以方便某些问题的解决。例如解线性方程组时,如果将系数矩阵formula_14分解成formula_213的形式,那么方程的求解可以分解为求解formula_214和formula_215两步,而后两个方程可以十分简洁地求解(详见三角矩阵中“向前与向后替换”一节)。又例如在求矩阵的行列式时,如果直接计算一个矩阵formula_14的行列式,需要计算大约formula_217次加法和乘法;而如果先对矩阵做formula_218分解,再求行列式,就只需要大约formula_197次加法和乘法,大大降低了计算次数。这是因为做formula_218分解的复杂度大约是formula_197次,而后注意到formula_210和formula_211是三角矩阵,所以求它们的行列式只需要将主对角线上元素相乘即可。 高斯消去法也是一种矩阵分解方法。通过初等变换操作,可以将任何矩阵变为阶梯形矩阵,而每个操作可以看做是将矩阵乘上一个特定的初等矩阵。奇异值分解则是另一种分解方法,将一个矩阵表示成3个矩阵的乘积:formula_224。其中formula_211和formula_226是酉矩阵,formula_227是对角矩阵。 特征分解是将一个矩阵formula_14写成formula_229的形式,其中formula_230是一个可逆矩阵,formula_227是对角矩阵。如果formula_14的特征分解存在,就称它是可对角化的矩阵。不能对角化的矩阵,也有类似的分解方式。任意的矩阵formula_14都可以写成formula_234的形式,其中的矩阵formula_235是若尔当标准型。若尔当标准型是矩阵的一种,它与对角矩阵类似,只不过主对角线上的元素不是数值,而是若尔当块:主对角线上为同一元素formula_171,主对角线右上一行的次对角线上都是1,其它元素都是0的矩阵(见右图)。特征分解可以方便计算矩阵的幂次和多项式,如要计算formula_237: formula_238 而其中对角矩阵的幂次formula_239要比formula_237容易计算得多。同理还可计算矩阵指数:formula_241(在线性微分方程中有应用)、矩阵对数和矩阵的平方根。为了提高算法的数值稳定性,还有舒尔分解等矩阵分解方法。 矩阵的推广. 矩阵的元素除了可以是实数和复数以外,也可以任意环或域中元素。在线性代数中,矩阵的性质可以经由有限维的线性空间中的线性变换定义。更广泛的,无限维空间中的线性算子,则可以定义更广泛的无穷维矩阵。矩阵的另一种推广是张量。标量可以看成零维方式排列的数据(只有一个“点”),向量可以看成是一维方式排列的数据(若干个“点”排成的“线段”),矩阵可以看成是二维方式排列的数据(若干个“线段”排成的“矩形”),而张量的概念则包括了这几种排列方式。在张量的概念中,标量是零维张量,向量是一维张量,矩阵是二维张量,而更高维方式排列的数据方式就是高维张量。 一般域和环上的矩阵. 矩阵的元素除了可以是实数和复数以外,还可以是任何能够使得矩阵的运算律成立的元素。首先,矩阵的元素可以是任意一个域(即能够进行“加减乘除”运算的集合)中元素。例如编码理论中会出现系数为有限域中元素的矩阵,以及有理数系数的矩阵。如果矩阵的系数所在域formula_242不是代数闭域,那么在求矩阵的特征值时,由于特征值是相应的特征多项式的根,可能不在系数域formula_242中,而是在系数域的某个扩域L中。反过来,如果考虑扩域formula_244,以及formula_210中的一个元素formula_246,以及formula_210中线性变换formula_248,那么由于formula_249也是一个formula_242-线性变换,它可以表示成一个formula_162的formula_242系数矩阵formula_253,其中的formula_3是扩域formula_244的阶数。formula_246是这个矩阵的特征值,这个矩阵的特征多项式formula_257是formula_246在formula_242中的最小多项式formula_260的幂次: formula_261。其中的formula_262是扩域formula_244 formula_264的阶数。 更一般的情况是矩阵的元素属于某个环formula_44。环是比域更广泛的概念,只要求其中元素能够进行加减法和乘法运算(不一定能定义除法)。给定一个环formula_44,formula_47中的矩阵之间可以相互加减以及相乘,所以formula_47关于矩阵的加法和乘法也构成一个环,称为矩阵环。formula_3维方阵的环formula_270与左formula_44-模formula_272的自同态环同构。 若formula_44是交换环,则formula_50是一个带单位元的formula_44-代数,满足结合律,但不满足交换律。其中的矩阵仍然可以用莱布尼兹公式定义行列式。一个矩阵可逆当且仅当其行列式为环formula_44中的可逆元(域上的矩阵可逆只需行列式不等于0)。 矩阵与线性变换. 前面已经提到,所有formula_277的线性变换都对应着一个formula_47中的矩阵。更一般地,给定了基底后,任意两个有限维线性空间之间的线性映射formula_279也对应着一个矩阵formula_280。设空间formula_226和formula_282的基底分别是formula_283和formula_284,那么 对任意 formula_285,formula_286 矩阵formula_114实际上“记录”了formula_226中每个基底向量经过变换后得到的formula_282中的像在基底formula_290下的形式。要注意矩阵的内容取决于基底的选择。可以说,矩阵是线性变换"f"在特定“角度”(基底)下的“素描”。不同的“角度”下,描述formula_8的矩阵是不同的,但这些矩阵都是相似矩阵。与矩阵有关的基本概念都可以用线性变换的层面来解释,比如一个矩阵的转置可以用"f"的对偶变换"formula_292"来表示。 当矩阵的元素是带单位元的环formula_44中的元素时,formula_1的formula_44-矩阵对应的则是formula_44-自由模formula_297和formula_272之间的formula_44-线性变换。formula_300的时候,这些formula_44-线性变换可以相互复合,因此formula_3维的formula_44-矩阵环能够与formula_44-自同态环formula_272同构。 矩阵群. 群是比环更宽泛的代数结构,只需要集合配备一个满足结合律的二元运算,即将两个群内元素映射到群内一元素的运算。矩阵群是指矩阵关于矩阵乘法组成的群。显然,只有方块矩阵才能构成乘法群。所有formula_3维的可逆方阵构成一个群,称为formula_3阶一般线性群。由于群内每个元素都必须是可逆的,任意的矩阵群都必然是一般线性群的子群。 能够在矩阵乘法和求逆矩阵运算下保持的性质都可以用来刻画一定的矩阵群。例如所有行列式为1的矩阵可以构成一个群,称为formula_3阶特殊线性群。所有formula_3维的正交矩阵,即满足: formula_310 的矩阵formula_90也构成一个群,称为formula_3阶正交群。正交矩阵得名于它在formula_272中对应的线性变换具有保角性,也就是说对基本的点积,满足 formula_314 每个有限群都同构于一个矩阵群。实际上,每个有限群都同构于某个置换群的子群,而每个置换群都同构于一个矩阵群(见置换群的正则群表示)鉴于矩阵群的性质可以通过与矩阵相关的更多手段更好地理解,常常通过研究矩阵群来研究一个有限群。相关的理论称为群表示论。 无限维矩阵. 无穷维矩阵可以指行数或列数无穷大,或两者都是无穷大的矩阵。尽管这样的矩阵无法完整写出,但只要知道每行每列的元素的值,仍然可以对它进行矩阵操作和运算。这里矩阵的行数和列数甚至不一定需要是可数集。需要注意的是,无穷维矩阵的乘法涉及到无穷级数求和,因此只有在相关的无穷级数收敛的时候,才能定义矩阵的乘积。无限维矩阵也可以是方块矩阵,定义为行标记集合与列标记集合相同的矩阵(如formula_315)。 无限矩阵无法定义通常意义上的行列式,因此可逆矩阵不一定是方块矩阵,同理,酉矩阵也不一定要是方块矩阵。 空矩阵. 空矩阵是指行数或列数为零的矩阵。空矩阵的定义可以完善一些关于零维空间的约定。包括约定一个矩阵与空矩阵相乘得到的也是空矩阵,两个formula_316和formula_317的空矩阵相乘是一个formula_64的零矩阵(所有元素都是零的矩阵)。0×0的空矩阵的行列式约定为1,所以它也可以有逆矩阵,约定为它自己。 分块矩阵. 分块矩阵是指一个大矩阵分割成“矩阵的矩阵”。举例,以下的矩阵 formula_319 可分割成4个2×2的矩阵 formula_320 formula_321。将矩阵分块可以使得矩阵结构清晰,在某些时候可以方便运算、证明。两个大小相同、分块方式也相同的矩阵可以相加。行和列的块数符合矩阵乘法要求时,分块矩阵也可以相乘。将矩阵分块相乘的结果与直接相乘是一样的。用分块矩阵求逆,可以将高阶矩阵的求逆转化为多次低阶矩阵的求逆。 应用. 矩阵在许多领域都应用广泛。有些时候用到矩阵是因为其表达方式紧凑,例如在博弈论和经济学中,会用收益矩阵来表示两个博弈对象在各种决策方式下的收益。文本挖掘和索引典汇编的时候,比如在TF-IDF方法中,也会用到文件项矩阵来追踪特定词汇在多个文件中的出现频率。 复数可以用实系数的2×2矩阵表示: formula_322 这种表示法与复数的加减法、乘法都相兼容。比如,2×2的旋转矩阵可以用来表示模长为1的复数,一个向量乘以此旋转矩阵可以视作一个复数乘以该模长为1的复数。对四元数也有类似的矩阵表达。 早期的密码技术如希尔密码也用到矩阵。然而,矩阵的线性性质使这类密码相对容易破解。计算机图像处理也会用到矩阵来表示处理对象,并且用放射旋转矩阵来计算对象的变换,实现三维对象在特定二维屏幕上的投影。多项式环上的矩阵在控制论中有重要作用。 化学中也有矩阵的应用,特别在使用量子理论讨论分子键和光谱的时候。具体例子有解罗特汉方程时用重叠矩阵和福柯矩阵来得到哈特里-福克方法中的分子轨道。 图论. 图论中可以用矩阵描述一个有限图。这个矩阵叫做相关矩阵的邻接矩阵,记录了图的每两个顶点之间是否有边连接。对简单图来说,邻接矩阵的元素只取两个值:0和1,第formula_119-{zh-cn:行; zh-tw:列;}-第formula_120-{zh-cn:列; zh-tw:行;}-上取值为0,表示没有从第formula_119个顶点连到第formula_120个顶点的边,取值为1则说明有。如果是一般情况的话,第formula_119-{zh-cn:行; zh-tw:列;}-第formula_120 -{zh-cn:列; zh-tw:行;}-上的取值是从第formula_119个顶点连到第"j"个顶点的边的数目。距离矩阵则是表示图中各顶点之间距离的矩阵。在研究互联网等复杂网络的时候,邻接矩阵常常会是稀疏矩阵。因此网络理论中有专门研究稀疏矩阵的方面。 数学分析. 在多元函数微积分学中,对二阶偏导数存在的函数formula_330,可以定义其海森矩阵: formula_331。 严格来说,仅当函数在某一点上的二阶偏导数存在,才能定义这一点上的海森矩阵。海森矩阵给出了函数在这一点的变化率方面的信息。当给定的点formula_332是函数平稳点(即函数formula_8在这一点上的一阶偏导数formula_334都是0)时,就需要利用海森矩阵来查看函数在这一点周围的增长特性。多元函数在点formula_99的泰勒展开是: formula_336 如果函数在点x的一阶偏导数都是0,那么formula_337,所以函数在x附近的变化率取决于海森矩阵formula_338的性质。如果formula_338是正定矩阵,那么函数在点x取得局部最小值,如果是负定矩阵,则函数在x取得局部最大值。在这类情况下,关于函数"f"的条件最优化问题可以转变为关于海森矩阵的二次规划问题。 矩阵在多元函数微积分中的另一个应用是雅可比矩阵。函数formula_340在某一点x上的一阶偏导数存在时,可以定义它在这点上的雅可比矩阵: formula_341。如果formula_342,而formula_343又是满秩矩阵(秩等于formula_2)的话,根据反函数定理,可以找到函数formula_8在x附近的一个局部的反函数。 偏微分方程理论中,二阶拟线性偏微分方程可以根据最高次偏导项系数构成的矩阵的正定性分类。假设有一个二阶拟线性偏微分方程: formula_346 并假设formula_347 记矩阵formula_348。如果矩阵formula_14是正定或负定矩阵,那么就称方程formula_350为椭圆形偏微分方程;如果formula_14不可逆,就称formula_350为抛物形偏微分方程,如果formula_14可逆而且恰有formula_354个特征值同号,就称formula_350为双曲型偏微分方程。其它情况下也称formula_350为超双曲形偏微分方程。不同类型的方程解的形式也不一样。 用数值方法解偏微分方程时更需要用到矩阵。一个重要的方法是有限元方法,在求解各种物理中遇到的偏微分方程时广泛使用。有限元方法的基本思想是用一系列“简单”函数的线性组合来“逼近”偏微分方程的精确解。这些“简单”函数通常是指将求解区域分割成一定数量的“小块”后,仅在某一“小块”上非零的分段线性函数。选定了网格和“简单”函数后,可以求解关于刚度矩阵的方程得到近似解。有限元理论中证明了在满足一定的条件下,近似解将随着网格趋于精细而弱收敛到精确解。 概率论与统计. 概率论中常用到随机矩阵,即-{zh-cn:行; zh-tw:列;}-向量是概率向量(即所有的元素都在0和1之间,并且加起来等于1的向量)的矩阵。随机矩阵可用来定义有限概率空间中的马尔可夫链。设随机变量formula_357是某个马尔可夫链在formula_358时刻的状态,所有可能的状态formula_359称为状态空间,那么随机矩阵formula_360则记录了假设已知formula_357的可能情况下formula_362做各种取值的可能性。formula_360的第formula_119-{zh-cn:行; zh-tw:列;}-第formula_120-{zh-cn:列; zh-tw:行;}-上的元素表示当formula_366的时候,formula_367的可能性。formula_360的第formula_120-{zh-cn:行; zh-tw:列;}-记录了从formula_366转移到formula_371各种状态的可能性。所以formula_360叫做formula_358时刻的转移矩阵。如果马尔可夫链的转移矩阵不随时刻变化,则称为齐次马尔可夫链。这时马尔可夫链的吸引态可以通过计算转移矩阵的特征向量得到。 统计学中也会用到各种不同的矩阵。描述统计学中常常需要用矩阵的形式来描述数据样本,显得更为紧凑。几个随机变量的协方差矩阵表示它们之间的协方差关系,在某种程度上表示了它们相互间的关联程度(但不绝对)。 统计学中用到矩阵的另一个地方是线性回归中的最小二乘法分析。当观测到随机样本formula_374时,线性回归法的目标是希望找到以下的线性关系: formula_375 即将变量formula_376表示成formula_377的分量的线性组合与一个已知的随机误差的和。这个表示可以写成矩阵的形式,并利用矩阵的奇异值分解来分析。 另一种随机矩阵(-- )是指每个元素都是随机变量的矩阵,这些随机变量可以都遵循同一个分布,或各自遵循不同的分布。一个常见的例子是全部元素都是相互独立的标准正态分布随机变量的随机矩阵。这种随机矩阵在数论和物理中也有应用。 物理学上的对称性及线性变换. 线性变换及其所对应的对称,在现代物理学中有着重要的角色。例如,在量子场论中,基本粒子是由狭义相对论的洛伦兹群所表示,具体来说,即它们在旋量群下的表现。内含泡利矩阵及更通用的狄拉克矩阵的具体表示,在费米子的物理描述中,是一项不可或缺的构成部分,而费米子的表现可以用旋量来表述。描述最轻的三种夸克时,需要用到一种内含特殊酉群SU(3)的群论表示;物理学家在计算时会用一种更简便的矩阵表示,叫盖尔曼矩阵,这种矩阵也被用作SU(3)规范群,而强核力的现代描述──量子色动力学的基础正是SU(3)。还有卡比博-小林-益川矩阵(CKM矩阵):在弱相互作用中重要的基本夸克态,与指定粒子间不同质量的夸克态不一样,但两者却是成线性关系,而CKM矩阵所表达的就是这一点。 量子态的线性组合. 1925年海森堡提出第一个量子力学模型时,使用了无限维矩阵来表示理论中作用在量子态上的算子。这种做法在矩阵力学中也能见到。例如密度矩阵就是用来刻画量子系统中“纯”量子态的线性组合表示的“混合”量子态。 另一种矩阵是用来描述构成实验粒子物理基石的散射实验的重要工具。当粒子在加速器中发生碰撞,原本没有相互作用的粒子在高速运动中进入其它粒子的作用区,动量改变,形成一系列新的粒子。这种碰撞可以解释为结果粒子状态和入射粒子状态线性组合的标量积。其中的线性组合可以表达为一个矩阵,称为S矩阵,其中记录了所有可能的粒子间相互作用。 简正模式. 矩阵在物理学中的另一类泛应用是描述线性耦合调和系统。这类系统的运动方程可以用矩阵的形式来表示,即用一个质量矩阵乘以一个广义速度来给出运动项,用力矩阵乘以位移向量来刻画相互作用。求系统的解的最优方法是将矩阵的特征向量求出(通过对角化等方式),称为系统的简正模式。这种求解方式在研究分子内部动力学模式时十分重要:系统内部由化学键结合的原子的振动可以表示成简正振动模式的叠加。描述力学振动或电路振荡时,也需要使用简正模式求解。 几何光学. 在几何光学里,可以找到很多需要用到矩阵的地方。几何光学是一种忽略了光波波动性的近似理论,这理论的模型将光线视为几何射线。采用近轴近似,假若光线与光轴之间的夹角很小,则透镜或反射元件对于光线的作用,可以表达为2×2矩阵与向量的乘积。这向量的两个分量是光线的几何性质(光线的斜率、光线跟光轴之间在的垂直距离)。这矩阵称为光线传输矩阵,内中元素编码了光学元件的性质。对于折射,这矩阵又细分为两种:「折射矩阵」与「平移矩阵」。折射矩阵描述光线遇到透镜的折射行为。平移矩阵描述光线从一个主平面传播到另一个主平面的平移行为。 由一系列透镜或反射元件组成的光学系统,可以很简单地以对应的矩阵组合来描述其光线传播路径。 电子学. 在电子学里,传统的或节点分析会获得一个线性方程组,这可以以矩阵来表示与计算。 很多种电子元件的电路行为可以用矩阵来描述。设定formula_10为输入向量,其两个分量为输入电压formula_379与输入电流formula_380。设定formula_381为输出向量,其两个分量为输出电压formula_382与输出电流formula_383。这电子元件的电路行为可以描述为formula_384;其中,formula_385是2×2矩阵,内有一个阻抗元素formula_386、一个导纳元素formula_387、两个无量纲元素formula_388与formula_389。这样,电路的计算可以约化为矩阵计算。 注释与参考. 参考文献. 外部链接. -{H|zh-hans:重定向;zh-hant:重新导向;}--{H|zh-cn:字符;zh-tw:字元;}--{H|zh-hans:文件; zh-hant:档案;}--{H|zh-hans:快捷方式; zh-hant:捷径;}--{H|zh-hans:项目;zh-hant:专案;zh-tw:计划;zh-hk:计划;zh-mo:计划;}--{H|zh-cn:计算机; zh-sg:电脑; zh-tw:电脑;}-
矩阵
本站由爱斯园团队开发维护,感谢
那些提出宝贵意见和打赏的网友,没有你们的支持,
网站不可能发展到今天,
继往开来,善终如始,我们将继续砥砺前行。
Copyright ©2014 iissy.com, All Rights Reserved.