请问画红线的地方表示的是什么意思?高等代数 pdf题目

当前位置: >>
行列式-高等代数(线性代数)
矢量矢量(拉丁语: Vector)是数学、物理学和工程科学等多个自然科学中的基本概念, 指一个同时具有大小和方向的几何对象,因常常以箭头符号标示以区别于其它量而 得名。直观上,矢量通常被标示为一个带箭头的线段(如右图)。线段的长度可以 表示矢量的大小,而矢量的方向也就是箭头所指的方向。物理学中的位移、速度、 力、动量、磁矩、电流密度等,都是矢量。与矢量概念相对的是只有大小而没有方 向的标量。 在数学中,矢量也常称为向量,即有方向的量。并采用更为抽象的矢量空间(也称 为线性空间)来定义,而定义具有物理意义上的大小和方向的向量概念则需要引进 了范数和内积的欧几里得空间表示方法在文字表述时,如果已知矢量的起点和终点分别是 A 和 B,那么这个矢量可以记为 。如果是为了和其他量区别,则在符号顶上加上箭头表示矢量,如 。注:过往在排版过程中,要在字母上加上箭头比较困难,不像手写那么容易。所以 在以往的书本印刷中,矢量多数会用粗体字母表示,如 ,但这样做却增加了阅读 困难,因为要区分是否粗体字有时不容易,例如 和 肉眼看很易混淆。但随着 时代和技术进步,在加上电脑辅助排版,为求清楚明确起见,书籍中用粗体字母代 表矢量的情况也越来越少了。矢量的直观图形表示则一般使用带箭头的线段。而遇到某些特殊情况需要表示与记 载纸面垂直的矢量,则会使用圆圈中打叉或打点的方式来表示(如右图)。圆圈中 带点的记号(⊙)表示由纸下方指向纸上方的矢量,而圆圈中带叉的记号(?)则表 示由纸的上方指向纸下方的矢量。由于这种记号不表示矢量的大小,所以必须时需 要在旁边或其它地方另外注明。 在直角坐标系中,定义有若干个特殊的基本矢量,其它的矢量可以通过这些基本矢 量来表示。在常见的三维空间直角坐标系 Oxyz 里,基本矢量就是以横轴(Ox)、 竖轴(Oy) 以及纵轴(Oz) 为方向的三个单位矢量 、 、 。这三个矢量取好 以后,其它的矢量就可以通过三元数组来表示,因为它们可以表示成一定倍数的三 个基本矢量的总合。比如说一个标示为(2,1,3)的矢量就是 2 个矢量 量 加上 3 个矢量 得到的矢量。 加上 1 个矢在进行矩阵运算时,矢量也可以表达成列矢量和行矢量(如下例)。简介物理学和一般的几何学中涉及的矢量概念严格意义上应当被称为欧几里得矢量或几 何矢量,因为它们的定义是建立在通常所说的欧几里得空间上的。按照定义,欧几 里得矢量由大小和方向构成。在线性代数中,矢量是所谓矢量空间中的基本构成元 素。矢量空间是基于物理学或几何学中的空间概念而形成的一个抽象概念,是满足 一系列法则的元素的集合。欧几里得空间便是线性空间的一种。矢量空间中的元素 就可以被称为矢量,而欧几里得矢量则是特指欧几里得空间中的矢量。 在一些上下文中,会假设矢量有确定的起点和终点,当起点和终点改变后,构成的 矢量就不再是原来的矢量。这样的矢量也被称为固定矢量。在另一些时候,会认为 矢量的起点和终点并不那么重要。两个起点不一样的矢量,只要大小相等,方向相 同,就可以称为是同一个矢量。这样的矢量被称为自由矢量。在数学中,一般只研 究自由矢量。一些文献中会提到矢量空间带有一个特定的原点,这时可能会默认矢 量的起点是原点。[1]基本性质矢量的大小是相对的,在有需要时,会规定单位矢量,以其长度作为 1。每个方向 上都有一个单位矢量[2]。 矢量之间可以如数字一样进行运算。常见的矢量运算有:加法,减法,数乘矢量以 及矢量之间的乘法(数量积和矢量积)。加法与减法矢量的加法满足平行四边形法则和三角形法则。具体地,两个矢量 到的是另一个矢量。 这个矢量可以表示为 和 和 相加,得的起点重合后, 以它们为邻边构成的平行四边形的一条对角线(以共同的起点为起点的那一条,见下图左),或者表 示为将 的终点和 的起点重合后,从 的起点指向 的终点的矢量:两个矢量和的相减,则可以看成是矢量 和加上一个与 和大小相等,方向相反 的起点重合后,的矢量。又或者, 从 的终点指向的相减得到的矢量可以表示为的终点的矢量: 当这两个矢量数值、方向都不同,基本矢 量 时,矢量和计算为并且有如下的不等关系:此外,矢量的加法也满足交换律和结合律。[2]反矢量和零矢量与数字一样,一个矢量也有反矢量。一个矢量 反,一般记作 。如果矢量 是矢量 的反矢量与它大小相等,但方向相 也是 的反矢量[2]。的反矢量,那么零矢量是指大小为零的矢量。零矢量实质上是起点与终点重合的矢量,它的方向是 不确定的,可以根据需要假设其方向。两个反矢量的和就是零矢量[2]。标量乘法一个标量 k 和一个矢量 之间可以做乘法,得出的结果是另一个与 方向相同或 [2] 相反,大小为 的大小的|k|倍的矢量,可以记成 。-1 乘以任意矢量会得 到它的反矢量,0 乘以任何矢量都会得到零矢量 。数量积主条目:数量积数量积也叫点积、内积,它是矢量与矢量的乘积,其结果为一个标量。几何上,数 量积可以定义如下: 设 、 为两个任意矢量,它们的夹角为 ,则他们的数量积为:[3]数量积被广泛应用于物理中,如做功就是用力的矢量点乘位移的矢量, 即 。矢量积主条目:矢量积 矢量积也叫叉积,矢量积,外积,它也是矢量与矢量的乘积,不过需要注意的是, 它的结果是个矢量,但由于其结果是由坐标系确定,所以其结果被称为伪矢量。 设有矢量 、 ,则其矢量积的矩阵表达式可写作:混合积主条目:混合积三个矢量、和的混合积定义为:线性相关性对于 m 个矢量 , ,……, ,如果存在一组不为零的 m 个数 、 、……、,使得,那么,称 m 个矢量 , =,……, = …… =线性相关。如果 = 0 时才能成立,这样的 m 个数不存在,即上述矢量等式仅当 就称矢量 , ,……, 线性无关。[4]矢量与基矢量空间分为有限维矢量空间与无限维矢量空间。在有限维矢量空间中,可以找到 一组(有限个)矢量 组矢量的线性组合: ,使得任意一个矢量 都可以唯一地表示成这其中的标量 是随着矢量 而确定的。这样的一组矢量称为矢量 空间的基。给定了矢量空间以及一组基后,每个矢量就可以用一个数组来表示 了[5]。两个矢量 和 相同,当且仅当表示它们的数组一样。 两个矢量和的和:它们的数量积为:[3]而标量 k 与矢量 v 的乘积则为:[3]矢量的模长主条目:范数 矢量的大小也叫做范数或模长,记作 以知道它的模长:[3]。有限维空间中,已知矢量的坐标,就可矩阵数学上,一个 m×n 的矩阵是一个由 m 行 n 列元素排列成的矩形阵列。矩阵里的元 素可以是数字、 符号或数学式。 以下是一个由 6 个数字符素构成的 2 行 3 列的矩阵:大小相同(行数列数都相同)的矩阵之间可以相互加减,具体是对每个位置上 的元素做加减法。矩阵的乘法则较为复杂。两个矩阵可以相乘,当且仅当第一 个矩阵的列数等于第二个矩阵的行数。矩阵的乘法满足结合律和分配律,但不 满足交换律。 矩阵的一个重要用途是解线性方程组。线性方程组中未知量的系数可以排成一 个矩阵,加上常数项,则称为增广矩阵。另一个重要用途是表示线性变换,即 是诸如之类的线性函数的推广。设定基底后,某个向量 v 可以表示为 m×1 的矩阵,而线性变换 f 可以表示为行数为 m 的矩阵 R, 使得经过变换后得 到的向量 f(v)可以表示成 Rv 的形式。矩阵的特征值和特征向量可以揭示线性变 换的深层特性。 矩阵是高等代数学中的常见工具,也常见于统计分析等应用数学学科中。在物 理学中,矩阵于电路学、力学、光学和量子物理中都有应用;计算机科学中, 三维动画制作也需要用到矩阵。 矩阵的运算是数值分析领域的重要问题。将矩 阵分解为简单矩阵的组合可以在理论和实际应用上简化矩阵的运算。对一些应 用广泛而形式特殊的矩阵,例如稀疏矩阵和准对角矩阵,有特定的快速运算算 法。关于矩阵相关理论的发展和应用,请参考矩阵理论。在天体物理、量子力 学等领域,也会出现无穷维的矩阵,是矩阵的一种推广。译名矩阵的概念最早于 1922 年见于中文。1922 年,程廷熙在一篇介绍文章中将矩阵译 为“纵横阵”。1925 年,科学名词审查会算学名词审查组在《科学》第十卷第四期刊 登的审定名词表中,矩阵被翻译为“矩阵式”,方块矩阵翻译为“方阵式”,而各类矩阵 如“正交矩阵”、“伴随矩阵”中的“矩阵”则被翻译为“方阵”。1935 年,中国数学会审查 后, 中华民国教育部审定的 《数学名词》 (并“通令全国各院校一律遵用, 以昭划一”) 中,“矩阵”作为译名首次出现。1938 年,曹惠群在接受科学名词审查会委托就数学 名词加以校订的《算学名词汇编》中,认为应当的译名是“长方阵”。中华人民共和 国成立后编订的《数学名词》中,则将译名定为“(矩)阵”。1993 年,中国自然科 学名词审定委员会公布的《数学名词》中,“矩阵”被定为正式译名,并沿用至今[1]。定义将一些元素排列成若干行,每行放上相同数量的元素,就是一个矩阵。这里说的元 素可以是数字,例如以下的矩阵:排列成的形状是矩形,所以称为矩阵。在中国大陆,横向的元素组称为“行”,纵 向称为“列”,而在台湾则相反,横向称为“列”,纵向称为“行”[2] 。矩阵一般用大 写拉丁字母表示,需要具体写出其中元素时,一般用方括号或圆括号括起。以 上的矩阵 A 是一个 4 行 3 列的矩阵。 行数是 1 或列数是 1 的矩阵又可分别称为行向量和列向量。这是因为一个向量 可以表示成行数或列数是 1 的矩阵形式。矩阵的任一行(列)都是一个行(列) 向量,例如矩阵 A 的第一行就是一个行向量。行(列)向量可以看成一个向量,因此可以称矩阵的两行(列)相等,或者某一行等于某一列, 表示其对应的向量相等。标记一个矩阵 A 从左上角数起的第 i 行第 j 列上的元素称为第 i,j 项,通常记为 、 、 或 。在上述例子中 。如果不知道矩阵 A 的具体元素,通常也会将 它记成 或 。反之,如果 A 的元素可以写成只与其行数 i 和列 数 j 有关的统一函数 f, 那么也可以用 作为 A 的简写。 例如 是矩阵的简写。要注意的是,一些计算机编程语言中,会将第 1 行(列)称为第 0 行 (列),从而对矩阵的写法产生影响,比如矩阵 B 就要改写成 。 矩阵的元素可以是数字、符号或数学表达式。一般为了支持矩阵的运算,矩阵 的元素之间应当能做加减法和乘法,所以是某个环里的元素。最常见的是元素 属于实数域或复数域的矩阵,简称为实矩阵和复矩阵。更一般的情况下,矩阵 的元素可以是由一个环中的元素排成。 给定一个环 R,所有由 R 中元素排成的 m×n 矩阵的集合写作 以 或 或 。若 m = n,则通常记,称其为 n 维矩阵或方阵。矩阵的基本运算主条目:矩阵加法、转置矩阵和初等矩阵矩阵的最基本运算包括矩阵加(减)法,数乘和转置运算。被称为“矩阵加法”、“数 乘”和“转置”的运算不止一种[3],其中最基本最常用的定义如下: 运算 定义 例子m×n 矩阵 A 和 B 的和(差) :A±B 加(减) 为 一 个 m×n 矩 阵, 其中每个元素 法 是 A 和 B 相应元 素的和(差) , (A ± B)i,j = Ai,j± Bi,j, 其中 1 ≤ i ≤ m , 1 ≤ j ≤ n.标量 c 与矩阵 A 的数乘:cA 的每 个元素是 A 的相 数 应元素与 c 的乘 乘 积, (cA)i,j = c ?Ai,j. m×n 矩阵 A 的转 置是一个 n×m 的 T 矩阵, 记为 A(有 些书中也记为 Atr 或 tA、A') ,其中 的第 i 个行向量是 转 原矩阵 A 的第 i 置 个列向量;或者 说,转置矩阵 AT 第 i 行第 j 列的元 素是原矩阵 A 第 j 行第 i 列的元素, (AT)i,j = Aj,i. 矩阵的加法运算满足交换律:A + B = B + A[4]。矩阵的转置和数乘运算对加法满足 分配律: (A + B)T = AT + BTc(A + B) = cA + cB 矩阵加法和数乘两种运算使得 转置和数乘运算满足类似于结合律的规律: c(AT) = (cA)T 矩阵也有类似行列式的初等变换,即对矩阵的某些行和某些列进行三类操作:交换 两行(列) ,将一行(列)的每个元素都乘以一个固定的量,以及将一行(列)的每 个元素乘以一个固定的量之后加到另一行(列)的相应元素上。这些操作在求矩阵 成为一个 mn 维的实数线性空间。而的逆之时有用。 矩阵乘法主条目:矩阵乘法矩阵 A 和 B 相乘得到 AB 的示意图两个矩阵的乘法仅当第一个矩阵 A 的列数和另一个矩阵 B 的行数相等时才能定义。 如 A 是 m×n 矩阵和 B 是 n×p 矩阵, 它们的乘积 AB 是一个 m×p 矩阵, 它的一个元 素其中 1 ≤ i ≤ m, 1 ≤ j ≤ p[5]。 例如矩阵的乘法满足结合律和对矩阵加法的分配律(左分配律和右分配律):? ? ?结合律:(AB)C = A(BC), 左分配律: (A + B)C = AC + BC, 右分配律: C(A + B) = CA + CB.矩阵的乘法与数乘运算之间也满足类似结合律的规律; 与转置之间则满足倒 置的分配律。 c(AB) =(cA)B = A(cB) (AB)T = BTAT 矩阵乘法不满足交换律。一般来说,矩阵 A 及 B 的乘积 AB 存在, 但 BA 不一定存在,即使存在,大多数时候 AB ≠ BA。比如下面的 例子:这一特性使得矩阵代数与常见的一些数域(有理数、实数、复数) 以及环(多项式环、整数环)都不同。给定一个 n 维的方块矩阵 A, 与 A 交换的所有方块矩阵构成一个环,称为 A 的交换子环。这些矩 阵也构成 的一个子空间,称为 A 的可交换空间[6]。与 中所有矩阵交换的矩阵只有形如 的矩阵 (称为数乘矩阵) 其中的 是单位矩阵, 。 也就是主对角线上的元素为 1, 其它元素为 0 的矩阵。任意矩阵 M 乘以单位矩阵都得到自 身: 。除了最常见的矩阵乘法定义以外,也有一些较不常见的矩阵乘法, 比如阿达马乘积和克罗内克乘积[7]。线性方程组主条目:线性方程组矩阵乘法的一个基本应用是在线性方程组上。线性方程组是方程组的一种,它符合 以下的形式:其中的以及等等是已知的常数,而等等则是要求的未知数。运用矩阵的方式,可以将线性方程组写成一个向量方程:其中,A 是由方程组里未知量的系数排成的 m×n 矩阵,x 是含有 n 个元素 的行向量,b 是含有 m 个元素的行向量[8]。 这个写法下, 将原来的多个方程转化成一个向量方程, 在已知矩阵 向量 的情况下,求未知向量 。和线性变换主条目:线性变换矩阵是线性变换的便利表达法。 矩阵乘法的本质在联系到线性变换的时候最能体现, 因为矩阵乘法和线性变换的合成有以下的连系: 以 表示所有长度为 n 的行向量 的集合。每个 m×n 的矩阵 A 都代表了一个从 射到 的线性变换。反过来,对 每个线性变换 x, ,都存在唯一 m×n 矩阵 。这个矩阵 使得对所有 中的元素第 i 行第 j 列上的元素是正则基向量 (第 j 个元素是 1,其余元素是 0 的向量)在 f 映射后的向量 也就是说,从的第 i 个元素。 射到 的线性变换构成的向量空间 上存在一个到的一一映射: 以下是一些典型的 2 维实平面上的线性变换对平面向量(图形)造成的效果,以及 它们对应的 2 维矩阵。其中每个线性变换将蓝色图形映射成绿色图形;平面的原点 (0, 0)用黑点表示。 水平错切变换, 幅度 m=1.25. “挤压”变换, 放缩变换, 旋转变换,左转 压缩程度 r=3/2 3/2 倍 30°水平反射变换 设有 k×m 的矩阵 B 代表线性变换 g : Rm -& Rk, 则矩阵积 BA 代表了线性变换的复 [9] 合 g o f ,因为 (g ? f)(x) = g(f(x)) = g(Ax) = B(Ax) = (BA)x 矩阵的秩是指矩阵中线性无关的行(列)向量的最大个数[10],同时也是矩阵对 应的线性变换的像空间的维度[11]。秩-零化度定理说明矩阵的列数量等于矩阵 的秩与零空间维度之和[12]方块矩阵主条目:方块矩阵行数与列数相同的矩阵称为方块矩阵,简称方阵。所有 n 维的方块矩阵构成一个线 性空间,这个空间对矩阵乘法也是封闭的,因此也是一个代数。方阵 A 称为可逆或 非奇异的,如果存在另一个方阵 B,使得 AB = In 成立。这时候可以证明也有 BA = In 成立[13],可将矩阵 B 称为 A 的逆矩阵[14]。 一个矩阵 A 的逆矩阵如果存在的话,就是唯一的,通常记作 A?1。 矩阵 A 的元素 Ai,i 称为其主对角线上的元素。方块矩阵 A 的所有主对角线元素 之和称为它的迹,写作 tr(A)。尽管矩阵的乘法不满足交换律,方阵相乘时交换 顺序会导致乘积变化,但它们的迹不会变,即 tr(AB) = tr(BA)[15]。除此以外,矩 阵转置的迹等于其自身的迹,tr(A) = tr(AT)。 如果一个方阵只有主对角线上的元素不是 0, 其它都是 0, 那么称其为对角矩阵。 如果主对角线上方的元素都是 0,那么称为下三角矩阵;反之如果主对角线下方 的元素都是 0,那么称为上三角矩阵。例如 n = 3 的时候,这些矩阵分别写作:(对角矩阵) ,(下三角矩阵) 和(上三角矩阵) 。行列式主条目:行列式R 里的一个线性变换 f 将蓝色图形变成绿色图形,面积不变,而顺时针排布的向量 x1 和 x2 的 变成了逆时针排布。对应的矩阵行列式是-1.2方块矩阵 A 的行列式是一个将其映射到标量的函数,记作 det(A) 或 |A|,反映了 矩阵自身的一定特性。一个方阵的行列式等于 0 当且仅当该方阵不可逆。系数是实 数的时候,二维(三维)方阵 A 的行列式的绝对值表示单位面积(体积)的图形经 过 A 对应的线性变换后得到的图形的面积(体积),而它的正负则代表了对应的线 性变换是否改变空间的定向:行列式为正说明它保持空间定向,行列式为负则说明 它逆转空间定向。 2×2 矩阵的行列式是3×3 矩阵的行列式由 6 项组成。更高维矩阵的行列式则可以使用莱布尼兹公式 写出[16],或使用拉普拉斯展开由低一维的矩阵行列式递推得出[17]。 两个矩阵相乘,乘积的行列式等于它们的行列式的乘积:det(AB) = det(A)? det(B)[18]。将矩阵的一行(列)乘以某个系数加到另一行(列)上不改变 矩阵的行列式,将矩阵的两行(列)互换则使得其行列式变号[19]。用这两种操 作可以将矩阵变成一个上三角矩阵或下三角矩阵,而后两种矩阵的行列式就是 主对角线上元素的乘积,因此能方便地计算。运用行列式可以计算线性方程组 的解(见克莱姆法则)[20]。特征值与特征向量主条目:特征向量 n×n 的方块矩阵 A 的一个特征值和对应特征向量是满足[21]的标量 以及非零向量 。特征值和特征向量的概念对研究线性变换很有帮助。 一个线性变换可以通过它对应的矩阵在向量上的作用来可视化。一般来说,一 个向量在经过映射之后可以变为任何可能的向量,而特征向量具有更好的性质 [22] 。假设在给定的基底下,一个线性变换对应着某个矩阵 A,如果一个向量 可 以写成矩阵的几个特征向量的线性组合:其中的 成:表示此向量对应的特征值是 ,那么向量 经过线性变换后会变可以清楚地知道变换后向量的结构。 另一个等价的特征值定义是:标量 为特征值,如果矩阵 是不可逆矩阵。根据不可逆矩阵的性质,这个定义也可以用行列式方程描述: 为特征值,如果[23]这个定义中的行列式可以展开成一个关于 的 n 阶多项式, 叫做矩阵 A 的特征多项式,记为 。特征多项式是一个首一多项式(最高次 项系数是 1 的多项式)。它的根就是矩阵 A 特征值[24]。哈密尔顿- 凯莱定理说明, 如果用矩阵 A 本身代替多项式中的不定元 , 那么多 [25] 项式的值是零矩阵 :对称主条目:对称矩阵转置等于自己的矩阵,即满足 A = AT 的方块矩阵 A 叫做对称矩阵。满足 A = - AT 的矩阵称为反对称矩阵。在复系数矩阵中,则有埃尔米特矩阵的概念:满足 A = A* 的方块矩阵称为埃尔米特矩阵,其中的 A*表示 A 的共轭转置矩阵。 根据谱定理,实对称矩阵和复埃尔米特矩阵拥有特征基,即由矩阵的特征向量组成 的基底。因此任何向量都能表示成矩阵特征向量的线性组合。此外,这两类矩阵的 特征值都是实数[26]。 正定性矩阵表达式正定性不定矩阵正定矩阵对应二次型取值图像说明主条目:正定矩阵正定矩阵对应的二次型的取值范围永远是正的, 不定矩阵对应的二次型取值则可正可负n×n 的实对称矩阵 A 如果满足对所有非零向量 x ∈ Rn,对应的二次型 Q(x) = xTAx 函数值都是正数,就称 A 为正定矩阵。类似地还有半正定矩阵、负定矩阵、不 定矩阵等概念[27]。对称矩阵的正定性与其特征值密切相关。矩阵是正定的当且 仅当其特征值都是正数[28]。矩阵的计算矩阵在许多学科领域中都有应用,在很多时候, 除了需要知道矩阵的理论性质以外, 还需要计算矩阵的数值。为了矩阵的计算能够足够精确与快捷,数值线性代数中专 门有研究矩阵的数值计算方法[29]。与其它的数值计算一样,矩阵的数值计算注重的 主要也是算法的复杂度和数值稳定性。矩阵的数值计算可以使用直接计算,也可以 用迭代算法,例如在计算方块矩阵的特征值时,可以从一个非零向量 开始,通过 特定迭代方法得到一个逼近某个特征向量的向量序列[30]。 测量一个算法的复杂度是指估计此算法需要的基本运算如数字的加法和乘法的次 数,或者找出它的一个上界。例如按照定义计算的话,两个 n 阶方阵的乘法需要 次数字乘法计算, 因为其乘积是一个 n 阶方阵, 有 个元素, 计算每个元素需要 次 数字乘法。如果使用施特拉森算法的话,可以将数字乘法的次数减低到大约[31]次。此外,编程语言或环境本身对算法的复杂度也会有影响。某些特殊类型的矩阵携带的数据量比一般矩阵要少,同时带来的信息量比一般矩阵 多。一个重要的例子是稀疏矩阵,这类矩阵中绝大部分的元素是零。有关稀疏矩阵 的计算,如计算稀疏矩阵 A 的线性方程组 Ax = b 时,可以使用一些专用于稀疏矩 阵的特殊算法(比如共轭梯度法[32]),减低计算复杂度。 算法的数值稳定性是指输入值的小变化不会让计算结果产生很大偏差。例如计算矩 阵的逆时,可以用以下的算法(其中 adj(A)表示 A 的伴随矩阵) A?1 = Adj(A) / det(A) 这个算法在 A 的行列式接近 0 的时候会引起很大的舍入误差[33]。而如果使用全 选主元的高斯消去法求逆,则在复杂度降低的同时能够避免舍入误差,保证数 值稳定性。矩阵分解主条目:矩阵分解、对角化、高斯消去法和巴莱斯算法矩阵研究的一大方向是将一般的矩阵用一些比较“简单”的矩阵来表示。这种表示方 式称为矩阵的变换与分解。矩阵变换与分解的方法有很多,它们的目的都是希望化 简后的矩阵保持原矩阵的某些性质,比如行列式、秩或逆矩阵,而形式相对简单, 因而能用容易地进行讨论和计算,或者能使得某些算法更易执行。 LU 分解将矩阵分解为一个下三角矩阵 L 和一个上三角矩阵 U 的乘积[34]。分解后的 矩阵可以方便某些问题的解决。例如解线性方程组时,如果将系数矩阵 A 分解成 A = LU 的形式,那么方程的求解可以分解为求解 Ly = b 和 Ux = y 两步,而后两个 方程可以十分简洁地求解(详见三角矩阵中“向前与向后替换”一节)。又例如在求 矩阵的行列式时,如果直接计算一个矩阵 A 的行列式,需要计算大约 (n + 1)! 次加 法和乘法;而如果先对矩阵做 LU 分解,再求行列式,就只需要大约 法,大大降低了计算次数。这是因为做 LU 分解的复杂度大约是 次加法和乘次,而后注意到L 和 U 是三角矩阵,所以求它们的行列式只需要将主对角线上元素相乘即可。 若尔当矩阵,其中灰色框内的是若尔当块高斯消去法也是一种矩阵分解方法。通过初等变换操作,可以将任何矩阵变为阶梯 形矩阵,而每个操作可以看做是将矩阵乘上一个特定的初等矩阵[35]。奇异值分解则 是另一种分解方法,将一个矩阵表示成 3 个矩阵的乘积:A = UDV。其中 U 和 V 是 酉矩阵,D 是对角矩阵。 特征分解是将一个矩阵 A 写成 PDP?1 的形式, 其中 P 是一个可逆矩阵, 是对角矩 D [36] 阵 。如果 A 的特征分解存在,就称它是可对角化的矩阵。不能对角化的矩阵,也 有类似的分解方式。任意的矩阵 A 都可以写成 PJP?1 的形式,其中的矩阵 J 是若尔 当标准型。若尔当标准型是矩阵的一种,它与对角矩阵类似,只不过主对角线上的 元素不是数值,而是若尔当块:主对角线上为同一元素 ,主对角线右上一行的次 对角线上都是 1,其它元素都是 0 的矩阵(见右图)[37]。特征分解可以方便计算矩 阵的幂次和多项式,如要计算 An: An = (PDP?1)n = PDP?1PDP?1...PDP?1 = PDn P?1 而其中对角矩阵的幂次 Dn 要比 An 容易计算得多。同理还可计算矩阵指数:eA (在线性微分方程中有应用)、矩阵对数和矩阵的平方根[38]。为了提高算法的 数值稳定性,还有舒尔分解等矩阵分解方法[39]。矩阵的推广矩阵的元素除了可以是实数和复数以外,也可以任意环或域中元素。 在线性代数中, 矩阵的性质可以经由有限维的线性空间中的线性变换定义。更广泛的,无限维空间 中的线性算子,则可以定义更广泛的无穷维矩阵。矩阵的另一种推广是张量。标量 可以看成零维方式排列的数据(只有一个“点”),向量可以看成是一维方式排列的 数据(若干个“点”排成的“线段”),矩阵可以看成是二维方式排列的数据(若干个“线 段”排成的“矩形”),而张量的概念则包括了这几种排列方式。在张量的概念中,标 量是零维张量,向量是一维张量,矩阵是二维向量,而更高维方式排列的数据方式 就是高维张量[40]。一般域和环上的矩阵矩阵的元素除了可以是实数和复数以外,还可以是任何能够使得矩阵的运算律成立 的元素。首先,矩阵的元素可以是任意一个域(即能够进行“加减乘除”运算的集合) 中元素。例如编码理论中会出现系数为有限域中元素的矩阵,以及有理数系数的矩 阵。如果矩阵的系数所在域 K 不是代数闭域,那么在求矩阵的特征值时,由于特征 值是相应的特征多项式的根, 可能不在系数域 K 中, 而是在系数域的某个扩域 L 中。 反过来,如果考虑扩域 L/K,以及 L 中的一个元素 ,以及 L 中线性变换 , 那么由于 也是一个 K-线性变换, 它可以表示成一个 n×n 的 K 系数矩阵 特征多项式,其中的 n 是扩域 L/K 的阶数。 是这个矩阵的特征值,这个矩阵的 是 在 K 中的最小多项式 的幂次:其中的 是扩域 L/K的阶数[41]。更一般的情况是矩阵的元素属于某个环 R[42]。环是比域更广泛的概念,只要求 其中元素能够进行加减法和乘法运算(不一定能定义除法)。给定一个环 R, 中的矩阵之间可以相互加减以及相乘,所以 矩阵的加法和乘法也构成一个环,称为矩阵环。n 维方阵的环 R-模 Rn 的自同态环同构[43]。 若 R 是交换环,则 是一个带单位元的 R-代数,满足结合律,但不满 关于 与左足交换律。其中的矩阵仍然可以用莱布尼兹公式定义行列式。一个矩阵可逆当 且仅当其行列式为环 R 中的可逆元(域上的矩阵可逆只需行列式不等于 0)[44]矩阵与线性变换前面已经提到,所有 Rn → Rm 的线性变换都对应着一个 中的矩阵。更一般地,给定了基底后,任意两个有限维线性空间之间的线性映射 f: V → W 也对 应着一个矩阵 Af= (aij)。设空间 V 和 W 的基底分别是 v1, ..., vn 和 w1, ..., wm,那么对任意,矩阵 Af 实际上“记录”了 V 中每个基底向量经过变换后得到的 W 中的像在基底 (w1, ..., wm)下的形式。要注意矩阵的内容取决于基底的选择。可以说,矩阵是 线性变换 f 在特定“角度”(基底)下的“素描”。不同的“角度”下,描述 f 的矩阵是 不同的,但这些矩阵都是相似矩阵[45]。与矩阵有关的基本概念都可以用线性变 换的层面来解释,比如一个矩阵的转置可以用 f 的对偶变换 f* : W* → V*来表示 [46] 。 当矩阵的元素是带单位元的环 R 中的元素时,m×n 的 R-矩阵对应的则是 R-自 由模 Rm 和 Rn 之间的 R-线性变换。n = m 的时候,这些 R-线性变换可以相互复 合,因此 n 维的 R-矩阵环能够与 R-自同态环 Rn 同构。矩阵群 主条目:矩阵群群是比环更宽泛的代数结构,只需要集合配备一个满足结合律的二元运算,即将两 个群内元素映射到群内一元素的运算。矩阵群是指矩阵关于矩阵乘法组成的群[47]。 显然,只有方块矩阵才能构成乘法群。所有 n 维的可逆方阵构成一个群,称为 n 阶 一般线性群。由于群内每个元素都必须是可逆的,任意的矩阵群都必然是一般线性 群的子群。 能够在矩阵乘法和求逆矩阵运算下保持的性质都可以用来刻画一定的矩阵群。例如 所有行列式为 1 的矩阵可以构成一个群,称为 n 阶特殊线性群[48]。所有 n 维的正交 矩阵,即满足: MTM = I 的矩阵 M 也构成一个群,称为 n 阶正交群[49]。正交矩阵得名于它在 Rn 中对应 的线性变换具有保角性,也就是说对基本的点积,满足 (Mv) ?(Mw) = v ?w.[50] 每个有限群都同构于一个矩阵群。实际上,每个有限群都同构于某个置换群 的子群,而每个置换群都同构于一个矩阵群(见置换群的正则群表示[51])鉴 于矩阵群的性质可以通过与矩阵相关的更多手段更好地理解, 常常通过研究 矩阵群来研究一个有限群。相关的理论称为群表示论。无限维矩阵主条目:无限维矩阵无穷维矩阵可以指行数或列数无穷大,或两者都是无穷大的矩阵[52]。尽管这样的矩 阵无法完整写出,但只要知道每行每列的元素的值,仍然可以对它进行矩阵操作和 运算。这里矩阵的行数和列数甚至不一定需要是可数集。需要注意的是,无穷维矩 阵的乘法涉及到无穷级数求和,因此只有在相关的无穷级数收敛的时候,才能定义 矩阵的乘积[53]。无限维矩阵也可以是方块矩阵,定义为行标记集合与列标记集合相 同的矩阵(如 )[54]。 无限矩阵无法定义通常意义上的行列式,因此可逆矩阵不一定是方块矩阵,同理, 酉矩阵也不一定要是方块矩阵[55]。空矩阵主条目:空矩阵空矩阵是指行数或列数为零的矩阵。空矩阵的定义可以完善一些关于零维空间的约 定。包括约定一个矩阵与空矩阵相乘得到的也是空矩阵,两个 n×0 和 0×p 的空矩阵 相乘是一个 n×p 的零矩阵(所有元素都是零的矩阵)。0×0 的空矩阵的行列式约定 为 1,所以它也可以有逆矩阵,约定为它自己[56]。分块矩阵 分块矩阵是指一个大矩阵分割成“矩阵的矩阵”。举例,以下的矩阵可分割成 4 个 2×2 的矩阵。 将矩阵分块可以使得矩阵结构清晰,在某些时候可以方便运算、证明。 两个大小相同、分块方式也相同的矩阵可以相加。行和列的块数符合矩 阵乘法要求时,分块矩阵也可以相乘。将矩阵分块相乘的结果与直接相 乘是一样的。用分块矩阵求逆,可以将高阶矩阵的求逆转化为多次低阶 矩阵的求逆[57]。应用矩阵在许多领域都应用广泛。有些时候用到矩阵是因为其表达方式紧凑,例如在博 弈论和经济学中,会用收益矩阵来表示两个博弈对象在各种决策方式下的收益[58]。 文本挖掘和索引典汇编的时候,比如在 TF-IDF 方法中,也会用到文件项矩阵来追 踪特定词汇在多个文件中的出现频率[59]。 复数可以用实系数的 2×2 矩阵表示:这种表示法与复数的加减法、乘法都相兼容。比如,2×2 的旋转矩阵可以用来 表示模长为 1 的复数,一个向量乘以此旋转矩阵可以视作一个复数乘以该模长 为 1 的复数。对四元数也有类似的矩阵表达[60]。 早期的密码技术如希尔密码也用到矩阵。然而,矩阵的线性性质使这类密码相 对容易破解[61]。计算机图像处理也会用到矩阵来表示处理对象,并且用放射旋 转矩阵来计算对象的变换,实现三维对象在特定二维屏幕上的投影[62]。多项式 环上的矩阵在控制论中有重要作用。 化学中也有矩阵的应用,特别在使用量子理论讨论分子键和光谱的时候。具体 例子有解罗特汉方程时用重叠矩阵和福柯矩阵来得到哈特里-福克方法中的分 子轨道。 图论一个无向图的邻接矩阵图论中可以用矩阵描述一个有限图[63]。这个矩阵叫做相关矩阵的邻接矩阵,记录了 图的每两个顶点之间是否有边连接。对简单图来说,邻接矩阵的元素只取两个值:0 和 1,第 i 行第 j 列上取值为 0,表示没有从第 i 个顶点连到第 j 个顶点的边,取值为 1 则说明有。 如果是一般情况的话, i 行第 j 列上的取值是从第 i 个顶点连到第 j 个 第 顶点的边的数目。距离矩阵则是表示图中各顶点之间距离的矩阵[64]。在研究互联网 等复杂网络的时候,邻接矩阵常常会是稀疏矩阵。因此网络理论中有专门研究稀疏 矩阵的方面。数学分析在多元函数微积分学中,对二阶偏导数存在的函数 f: Rn → R,可以定义其海森矩阵 [65] :n=2 时,海森矩阵 处有一个鞍点(红色点)的特征值一正一负,说明函数 f(x,y) = x ? y 在 (x = 0, y = 0)22 严格来说,仅当函数在某一点上的二阶偏导数存在,才能定义这一点上的海森 矩阵。海森矩阵给出了函数在这一点的变化率方面的信息。当给定的点 x = (x1, ..., xn)是函数平稳点(即函数 f 在这一点上的一阶偏导数 都是 0)时,就需要利用海森矩阵来查看函数在这一点周围的增长特性。多元函数在点 x 的 泰勒展开是:如果函数在点 x 的一阶偏导数都是 0,那么 变化率取决于海森矩阵 的性质。如果,所以函数在 x 附近的 是正定矩阵,那么函数在点 x 取得局部最小值, 如果是负定矩阵, 则函数在 x 取得局部最大值。 在这类情况下,关于函数 f 的条件最优化问题可以转变为关于海森矩阵的二 次规划问题[66]。 矩阵在多元函数微积分中的另一个应用是雅可比矩阵。 函数 f: Rn → Rm 在某 一点 x 上的一阶偏导数存在时,可以定义它在这点上的雅可比矩阵[67]:如果 n&m,而又是满秩矩阵(秩等于 m)的话,根据反函数定理,可以找到函数 f 在 x 附近的一个局部的反函数[68]。 偏微分方程理论中,二阶拟线性偏微分方程可以根据最高次偏导项系数 构成的矩阵的正定性分类。假设有一个二阶拟线性偏微分方程:并 假 设 记矩阵 。如果矩阵 A 是正定或负定矩阵,那么就称方程(E)为椭圆形偏微分方程; 如果 A 不可逆, 就称(E)为抛物形偏 微分方程,如果 A 可逆而且恰有 n - 1 个特征值同号,就称(E)为双 曲型偏微分方程。其它情况下也称(E)为超双曲形偏微分方程。不同 类型的方程解的形式也不一样[69]。 用数值方法解偏微分方程时更需要用到矩阵。一个重要的方法是有 限元方法,在求解各种物理中遇到的偏微分方程时广泛使用。有限 元方法的基本思想是用一系列“简单”函数的线性组合来“逼近”偏微分 方程的精确解。 这些“简单”函数通常是指将求解区域分割成一定数量 的“小块”后,仅在某一“小块”上非零的分段线性函数。选定了网格和 “简单”函数后,可以求解关于刚度矩阵的方程得到近似解。有限元理 论中证明了在满足一定的条件下,近似解将随着网格趋于精细而弱 收敛到精确解[70][71]。概率论与统计概率论中常用到随机矩阵,即行向量是概率向量(即所有的元素都在 0 和 1 之间, 并且加起来等于 1 的向量)的矩阵。随机矩阵可用来定义有限概率空间中的马尔可 夫链。设随机变量 是某个马尔可夫链在 时刻的状态,所有可能的状态 则记录了假设已知称为状态空间, 那么随机矩阵 的可能情况下 的时候, 到 做各种取值的可能性[72]。 的可能性。 叫做的第 i 行第 j 列上的元素表示当 的第 j 行记录了从 转移各种状态的可能性。所以时刻的转移矩阵。如果马尔可夫链的转移矩阵不随时刻变化,则称为齐次马尔可夫链。这时马尔可夫链的吸引态 可以通过计算转移矩阵的特征向量得到[73]。 统计学中也会用到各种不同的矩阵。描述统计学中常常需要用矩阵的形式来描述数 据样本,显得更为紧凑。几个随机变量的协方差矩阵表示它们之间的协方差关系, 在某种程度上表示了它们相互间的关联程度(但不绝对)[74]。 统计学中用到矩阵的另一个地方是线性回归中的最小二乘法分析。当观测到随机样 本 性关系: 时, 线性回归法的目标是希望找到以下的线即将变量 Y 表示成 X 的分量的线性组合与一个已知的随机误差的和。这个表示 可以写成矩阵的形式,并利用矩阵的奇异值分解来分析[75]。 另一种随机矩阵(random matrix)是指每个元素都是随机变量的矩阵,这些随 机变量可以都遵循同一个分布,或各自遵循不同的分布。一个常见的例子是全 部元素都是相互独立的标准正态分布随机变量的随机矩阵。这种随机矩阵在数 论和物理中也有应用[76][77]。物理学上的对称性及线性变换另见:对称性 (物理学)线性变换及其所对应的对称,在现代物理学中有着重要的角色。例如,在量子场论 中,基本粒子是由狭义相对论的洛伦兹群所表示,具体来说,即它们在旋量群下的 表现。内含泡利矩阵及更通用的狄拉克矩阵的具体表示,在费米子的物理描述中, 是一项不可或缺的构成部分,而费米子的表现可以用旋量来表述[78]。描述最轻的三 种夸克时,需要用到一种内含特殊酉群 SU(3)的群论表示;物理学家在计算时会用 一种更简便的矩阵表示,叫盖尔曼矩阵,这种矩阵也被用作 SU(3)规范群,而强核 力的现代描述──量子色动力学的基础正是 SU(3)。 还有卡比博-小林-益川矩阵 (CKM 矩阵):在弱相互作用中重要的基本夸克态,与指定粒子间不同质量的夸克态不一 样,但两者却是成线性关系,而 CKM 矩阵所表达的就是这一点[79]。量子态的线性组合1925 年海森堡提出第一个量子力学模型时, 使用了无限维矩阵来表示理论中作用在 [80] 量子态上的算子 。这种做法在矩阵力学中也能见到。例如密度矩阵就是用来刻画 量子系统中“纯”量子态的线性组合表示的“混合”量子态[81]。 另一种矩阵是用来描述构成实验粒子物理基石的散射实验的重要工具。当粒子在加 速器中发生碰撞,原本没有相互作用的粒子在高速运动中进入其它粒子的作用区, 动量改变,形成一系列新的粒子。这种碰撞可以解释为结果粒子状态和入射粒子状 态线性组合的标量积。其中的线性组合可以表达为一个矩阵,称为 S 矩阵,其中记 录了所有可能的粒子间相互作用[82]。简正模式矩阵在物理学中的另一类泛应用是描述线性耦合调和系统。这类系统的运动方程可 以用矩阵的形式来表示,即用一个质量矩阵乘以一个广义速度来给出运动项,用力 矩阵乘以位移向量来刻画相互作用。求系统的解的最优方法是将矩阵的特征向量求 出(通过对角化等方式),称为系统的简正模式。这种求解方式在研究分子内部动 力学模式时十分重要:系统内部由化学键结合的原子的振动可以表示成简正振动模 式的叠加[83]。描述力学振动或电路振荡时,也需要使用简正模式求解[84]。几何光学在几何光学里,可以找到很多需要用到矩阵的地方。几何光学是一种忽略了光波波 动性的近似理论,这理论的模型将光线视为几何射线。采用近轴近似,假若光线与 光轴之间的夹角很小,则透镜或反射元件对于光线的作用,可以表达为 2×2 矩阵与 向量的乘积。这向量的两个分量是光线的几何性质(光线的斜率、光线跟光轴之间 在主平面的垂直距离)。这矩阵称为光线传输矩阵,内中元素编码了光学元件的性 质。对于折射,这矩阵又细分为两种:“折射矩阵”与“平移矩阵”。折射矩阵描述光线 遇到透镜的折射行为。平移矩阵描述光线从一个主平面传播到另一个主平面的平移 行为。 由一系列透镜或反射元件组成的光学系统,可以很简单地以对应的矩阵组合来描述 其光线传播路径。[85]电子学 在电子学里,传统的网目分析或节点分析会获得一个线性方程组,这可以以矩阵来 表示与计算。 很多种电子元件的电路行为可以用矩阵来描述。 设定 输入电压 出电流 与输入电流 。设定 为输入向量, 其两个分量为 与输为输出向量,其两个分量为输出电压 ;其中, 、两个无量纲元素。这电子元件的电路行为可以描述为 、一个导纳元素是 2×2 矩 与 。这阵,内有一个阻抗元素样,电路的计算可以约化为矩阵计算。方块矩阵方块矩阵,或简称方阵,是行数及列数皆相同的矩阵。由 矩阵组成的集合, 连同矩阵加法和矩阵乘法,构成环。除了 ,此环并不是交换环。 M(n, R),即实方块矩阵环,是个实有单位的结合代数。M(n, C),即复方块矩阵环, 则是复结合代数。 单位矩阵 阵 都有 的对角线全是 1 而其他位置全是 0,对所有 及 。 例如,若 : 矩阵 及 矩单位矩阵是方块矩阵环的单位元。 方块矩阵环的可逆元称为可逆矩阵或非奇异方阵。 当存在矩阵 使得 。 此时 称为 的逆矩阵,并记作 。 所有 矩阵在乘法上组成一个 矩阵 是可逆当且仅群(亦是一个李群),称为一般线性群。 若数字 和非零向量 满足 ,则 为 的一个特征向量, 是其对 可逆,又当且仅当应的特征值。数字 为 的特征值当且仅当 。这里,是 的特征多项式。特征多项式是一个 次多项式,有 个复根(考虑重根),即 有 个特征值。 方块矩阵 的行列式是其 个特征值的积,但亦可经由莱布尼茨公式计算出 来。可逆矩阵正好是那些行列式非零的矩阵。 高斯-若尔当消元法非常重要,可以用来计算矩阵的行例式,秩,逆矩阵, 并解决线性方程组。 矩阵的迹是 矩阵的对角线元素之和,也是其 个特征值之和。所有正交矩阵都是方块矩阵。方块矩阵的等价命题线性代数中,下列关于方块矩阵 A 的命题是等价的(同时成立,或同时不成立): 1. A 可逆;A 的反矩阵存在。 2. det(A)≠ 0. 3. rank(A)= n. 4. Null(A) = 0. 5. A 的特征值中没有 0。 6. 对任意 b 属于 Fn,Ax = b 有唯一解。 7. Ax = 0 只有平凡解。 8. ATA 可逆。 9. A 与单位矩阵行(列)等价。 10. A 的行向量或列向量张成 Fn. 11. A 的零空间只有零向量。 12. A 的值域为 Fn. 13. A 的行(列)向量构成 Fn (Fn)中向量的线性无关集。 这里,F 为矩阵元素所属的域。通常,这个域为实数域或复数域。矩阵范数矩阵范数(matrix norm)是数学上向量范数对矩阵的一个自然推广。矩阵范数的特性以下 代表实数或复数域。 现在考虑 空间, 亦即所有 行与 列的矩阵。 的范数,那上的矩阵范数满足向量范数的所有特性,即若 么:?是矩阵,且等号成立当且仅当。?, 对于所有属于和所有矩阵属于成立。 ?,对于所有矩阵和属于此外,一些定义在 n 乘 n 矩阵上的矩阵范数(但并非所有这类的范数)满足一个或 多个以下与“矩阵比纯粹一个向量有更多东西的事实”有关的条件:? ?,是的共轭转置(实矩阵就是普通转置)一个满足第一个附加特性的矩阵范数被称为服从乘法范数(sub-multiplicative norm)。附上矩阵范数并包含所有 n×n 矩阵的集合,是巴拿赫代数的一个例子。 (在一些书上,术语“矩阵范数”只指服从乘法范数。)诱导范数如果 Km 及 Kn 上向量范数已知(K 是实数或复数域),可在 照下述原则定义相应的“诱导范数”或算子范数: 矩阵空间上按若 m = n 且在定义域和值域上使用相同的范数,则诱导的算子范数是服从乘矩 阵范数。 举例说明, 与向量的 p-范数对应的算子范数是:在且的情况下,其范数可以以下方式计算:这些与矩阵的 Schatten p-范数不同, 也可以用来表示。 若满足 p = 2(欧几里德范数)且 m = n(方阵)此两特殊情况时,诱导 的矩阵范数就是“谱范数”。矩阵 A 的谱范数是 A 最大的奇异值或半正定 矩阵 A*A 的最大特征值的平方根:其中 A* 代表 A 的共轭转置 。 任何矩阵范数满足此不等式其中 ρ(A) 是 A 的谱半径。 事实上, 可以证明 ρ(A) 是 A 的所有 诱导范数的下界。 此外,我们有矩阵元范数这些向量范数将矩阵视为 向量,并使用类似的向量范数。举例说明,使用向量的 p-范数,我们得到:注:不要把矩阵元 p-范数与诱导 p-范数混淆。弗罗贝尼乌斯范数对 p = 2,这称为弗罗贝尼乌斯范数(Frobenius norm)或希尔伯特-施密特范数 ( HilbertCSchmidt norm),不过后面这个术语通常只用于希尔伯特空间。这个范 数可用不同的方式定义:这里 A* 表示 A 的共轭转置,σi 是 A 的奇异值,并使用了迹函数。弗罗贝尼乌 斯范数与 Kn 上欧几里得范数非常类似,来自所有矩阵的空间上一个内积。 弗罗贝尼乌斯范范数是服从乘法的且在数值线性代数中非常有用。这个范数通 常比诱导范数容易计算。极大范范数 极大范范数是 p=∞ 的元素范数,这个范数不服从乘法。Schatten 范数更多资料:Schatten 范数Schaten 范数出现于当 p-范数应用于一个矩阵的奇异值向量时。如果奇异值记 做 σi, 则 Schatten p-范数定义为这个范数与诱导、元素 p-范数使用了同样的记号,但它们是不同的。 所有 Schatten 范数服从乘法。它们也都是酉不变的,这就是说 ||A|| = ||UAV|| 对所有矩阵 A 与所有酉矩阵 U 和 V。 最常见的情形是 p = 1, 2, ∞。p = 2 得出弗罗贝尼乌斯范数,前面已经介绍 过了。p = ∞ 得出谱范数,这是由向量 2-范数诱导的矩阵范数(见下)。 最后, p = 1 得出迹范数,定义为一致范数一个 范数 上矩阵范数 一致,如果 称为与 上向量范数 以及 上向量对所有。根据定义,所有诱导范数是一致范数。范数的等价对任何两个向量范数 ||? α and ||? β,我们有 || ||对某个正数 r 与 s, 中所有矩阵 A 成立。换句话说,它们是等价的范数; 它们在 上诱导了相同的拓扑。 此外,当,则对任何向量范数 ||? ||,存在惟一一个正数 k 使得 k||A||是一个(服从乘法)矩阵范数。 一个矩阵范数 ||? α 称为“极小的”,如果不存在其它矩阵范数 ||? β 满足 || || ||? β≤||?||α。 ||范数等价的例子对矩阵 如下不等式成立[1][2]:? ???这里,||? p 表示由向量 p-范数诱导的矩阵范数。 || 向量范数之间另一个有用的不等式是雅可比矩阵在向量分析中,雅可比矩阵是一阶偏导数以一定方式排列成的矩阵,其行列式称为 雅可比行列式。 还有,在代数几何中,代数曲线的雅可比量表示雅可比簇:伴随该曲线的一个代数 群,曲线可以嵌入其中。 它们全部都以数学家卡尔? 雅可比命名;英文雅可比量&Jacobian&可以发音为[ja ?ko bi ?n]或者[?? ?ko bi?n]。雅可比矩阵雅可比矩阵的重要性在于它体现了一个可微方程与给出点的最优线性逼近。因此, 雅可比矩阵类似于多元函数的导数。 假设 F:Rn→Rm 是一个从欧式 n 维空间转换到 欧式 m 维空间的函数。 这个函数由 m 个实函数组成: y1(x1, ..., xn), ..., ym(x1, ...,xn)。 这些函数的偏导数(如果存在)可以组成一个 m 列 n 行的矩阵(m by n),这就是所谓 的雅可比矩阵: 此矩阵表示为:,或者 这个矩阵的第 i 行是由梯度函数的转置 yi(i=1,...,m)表示的 如果 p 是 Rn 中的一点,F 在 p 点可微分,那么在这一点的导数由 JF(p)给出 (这是求该点导数最简便的方法)。在此情况下,由 JF(p)描述的线性算子即接 近点 p 的 F 的最优线性逼近,x 逼近与 p例子由球坐标系到直角坐标系的转化由 F 函数给出:R × [0,π] × [0,2π] → R3此坐标变换的雅可比矩阵是R4 的 f 函数:其雅可比矩阵为: 此例子说明雅可比矩阵不一定为方矩阵。在动力系统中考虑形为 x' = F(x)的动力系统,F : Rn → Rn。如果 F(x0) = 0,那么 x0 是一个驻点。 系统接近驻点时的表现通常可以从 JF(x0)的特征值来决定。雅可比行列式如果 m = n,那么 F 是从 n 维空间到 n 维空间的函数,且它的雅可比矩阵是一个方 块矩阵。于是我们可以取它的行列式,称为雅可比行列式。 在某个给定点的雅可比行列式提供了 F 在接近该点时的表现的重要信息。例如,如 果连续可微函数 F 在 p 点的雅可比行列式不是零,那么它在该点附近具有反函数。 这称为反函数定理。更进一步,如果 p 点的雅可比行列式是正数,则 F 在 p 点的取 向不变;如果是负数,则 F 的取向相反。而从雅可比行列式的绝对值,就可以知道 函数 F 在 p 点的缩放因子;这就是为什么它出现在换元积分法中。例子设有函数 F : R3 → R3,其分量为:则它的雅可比行列式为:从中我们可以看到,当 x1 和 x2 同号时,F 的取向相反;该函数处处 具有反函数,除了在 x1 = 0 和 x2 = 0 时以外。海森矩阵数学中,海森矩阵(Hessian matrix 或 Hessian)是一个自变量为向量的实值函数 的二阶偏导数组成的方块矩阵,此函数如下: 如果 f 所有的二阶导数都存在,那么 f 的海森矩阵即:其中,即(也有人把海森定义为以上矩阵的行列式) 海森矩阵被应用于牛顿法解 决的大规模优化问题。混合偏导数和海森矩阵的对称性海森矩阵的混合偏导数是海森矩阵非主对角线上的元素。假如他们是连续的,那么 求导顺序没有区别,即上式也可写为在正式写法中,如果 f 函数在区域 D 内连续并处处存在二阶导数,那么 f 的 海森矩阵在 D 区域内为对称矩阵。在→ 的函数的应用,海森矩阵的行列式,可用于分辨 的临界给定二阶导数连续的函数 点是属于鞍点还是极值点。 对于的临界点一点,有,然而凭一阶导数不能判断它是鞍点、局部极大点还是局部极小点。海森矩阵可能解答这个问 题。?H & 0 :若 是局部极大点。,则是局部极小点;若,则? ?H&0 :是鞍点。H = 0 :二阶导数无法判断该临界点的性质,得从更高阶的导数以泰勒公式 考虑。在高维情况下的推广当函数 阶的对称矩阵。? ? ? ?二阶连续可导时, Hessian 矩阵 H 在临界点上是一个当 H 是正定矩阵时,临界点 当 H 是负定矩阵时,临界点 在其余情况下,临界点是一个局部的极小值。 是一个局部的极大值。H=0,需要更高阶的导数来帮助判断。 不是局部极值。行列式行列式是数学中的一个函数, 将一个 或 的矩阵 映射到一个标量, 记作。行列式可以看做是有向面积或体积的概念在一般的欧几里得空间中的推广。或者说,在 维欧几里得空间中,行列式描述的是一个线性变换对“体积”所造成的 影响。 无论是在线性代数、 多项式理论, 还是在微积分学中 (比如说换元积分法中) , 行列式作为基本的数学工具,都有着重要的应用。 行列式概念最早出现在解线性方程组的过程中。十七世纪晚期,关孝和与莱布尼茨 的著作中已经使用行列式来确定线性方程组解的个数以及形式。十八世纪开始,行 列式开始作为独立的数学概念被研究。十九世纪以后,行列式理论进一步得到发展 和完善。矩阵概念的引入使得更多有关行列式的性质被发现,行列式在许多领域都 逐渐显现出重要的意义和作用,出现了线性自同态和向量组的行列式的定义。 行列式的特性可以被概括为一个多次交替线性形式,这个本质使得行列式在欧几里 德空间中可以成为描述“体积”的函数[1]。竖直线记法矩阵 A 的行列式有时也记作 |A|。绝对值和矩阵范数也使用这个记法,有可能和行 列式的记法混淆。不过矩阵范数通常以双垂直线来表示(如: ),且可以使用下标。此外,矩阵的绝对值是没有定义的。因此,行列式经常使用垂直线记法(例 如:克莱姆法则和子式)。例如,一个矩阵:, 行列式 也写作 ,或明确的写作:, 即把矩阵的方括号以细长的垂直线取代[2][3]。直观定义一个 n 阶方块矩阵 A 的行列式可直观地定义如下:其中, 是集合{ 1, 2, ..., n }上置换的全体,即集合{ 1, 2, ..., n }到自身上的一一映 射(双射)的全体;表示对 式中出现一次; 对于每一对满足全部元素的求和, 即对于每个 的数对 ,,在加法算是矩阵 A 的第 i 行第 j 列的元素。 表示置换 的符号差,具体地说,满足 但 对 称为 的一个逆序。 如果 的逆序共有偶数个,则 数个,则 。的有序数 ,如果共有奇举例来说,对于 3 元置换 (即是说 , , )而言,由于 1 在 2 后,1 在 3 后,所以共有 2 个逆序(偶数个),因此 ,从而 3 阶行列 式中项 的符号是正的。但对于三元置换 (即是说 , , )而言,可以数出共有 3 个逆序(奇数个),因此 ,从而 [25][26] 3 阶行列式中项 的符号是负的 。 注意到对于任意正整数 n, 是一个有限多次的求和。 共拥有 n!个元素,因此上式中共有 n!个求和项,即这对于简单的 2 阶和 3 阶的矩阵,行列式的表达式相对简单,而且恰好是每条主对角 线(左上至右下)元素乘积之和减去每条副对角线(右上至左下)元素乘积之和(见 图中红线和蓝线)。? ?2 阶矩阵的行列式: 3 阶矩阵的行列式:[27][28]三阶矩阵的行列式为每条红线上的元素的乘积之和,减去蓝线上元素乘积之和。但对于阶数的方阵 A,这样的主对角线和副对角线分别只有 n 条,由于 的元素个数 因此,行列A 的主、副对角线总条数式的相加项中除了这样的对角线乘积之外, 还有其他更多的项。 例如 4 阶行列式中, 项 就不是任何对角线的元素乘积。不过,和 2、3 阶行列式情况相 同的是,n 阶行列式中的每一项仍然是从矩阵中选取 n 个元素相乘得到,且保证在 每行和每列中都恰好只选取一个元素,而整个行列式恰好将所有这样的选取方法遍 历一次。 另外,n×n 矩阵的每一行或每一列也可以看成是一个 n 元向量,这时矩阵的行列式 也被称为这 n 个 n 元向量组成的向量组的行列式[29]。几何意义:二维和三维欧氏空间中的例子行列式的一个自然的源起是 n-维平行体的体积。 行列式的定义和 n-维平行体的体积 [30] 有着本质上的关联 。二维向量组的行列式行列式是向量形成的平行四边形的面积在一个二维平面上,两个向量和的行列式是:[27]比如说,两个向量和的行列式是:经计算可知,当系数是实数时,行列式表示的是向量 和 形的有向面积,并有如下性质:? ?形成的平行四边行列式为零当且仅当两个向量共线(线性相关) ,这时平行四边形退化成 [29] 一条直线 。 如果以逆时针方向为正向的话,有向面积的意义是:平行四边形面积为 正当且仅当以原点为不动点将 逆时针“转到” 处时, 扫过的地方在平行 四边形里,否则的话面积就是负的。如右图中, 和 边形的面积就是正的[31]。?所构成的平行四行列式是一个双线性映射。也就是说, ,并且[29]。行列式其几何意义是:以同一个向量 v 作为一条边的两个平行四边形的面积之和,等于它 们各自另一边的向量 u 和 u' 加起来后的向量: + u' 和 v 所构成的平行四边形的面 u 积,如左图中所示。三维向量组的行列式在三维的有向空间中,三个三维向量的行列式是:。[28] 比如说,三个向量 (2, 1, 5)、(6, 0, 8)和 (3, 2, 4)的行列式是:当系数是实数时, 行列式表示 、 和 三个向量形成的平行六面体的有向 体积,也叫做这三个向量的混合积。同样的,可以观察到如下性质[32]:?行列式为零当且仅当三个向量共线或者共面 (三者线性相关) ,这时平行 [30] 六面体退化为平面图形,体积为零 。 两个相邻平行六面体的体积之和 ?三维空间中有向体积的定义要比二维空间中复杂,一般是根据右手定则 来约定。比如右图中(u, v, w)所形成的平行六面体的体积是正的,而 (u, w, v)所形成的平行六面体的体积是负的。这个定义和行列式的计 算并不矛盾,因为行列式中向量的坐标都是在取好坐标系后才决定的, 而坐标系的三个方向一般也是按照右手规则来设定的。如果计算开始时 坐标系的定向反过来的话,有向体积的定义也要跟着反过来,这样行列 式才能代表有向体积[30][33]。 这时行列式是一个“三线性映射”,也就是说,对第一个向量有?,对第二、第三个向量也是如此。其几何意义和二维时基本相同,是指 当生成两个平行六面体的每组三个向量中如果有两个是重合的,比如分 别是:(u,v, w)和(u', v, w) ,那么它们的体积之总和等于将 u 和 u' 加 起来后的向量 u + u' 和 v, w 所形成的平行六面体的体积,如右图所示 [30] 。基底的选择在以上的行列式中,我们不加选择地将向量在所谓的正交基(即直角坐标系)下分 解,实际上在不同的基底之下,行列式的值并不相同。这并不是说平行六面体的体 积不唯一。恰恰相反,这说明体积的概念依赖于衡量空间的尺度,也就是基底的取 法。用基底的变换可以看作线性映射对基底的作用,而不同基底下的行列式代表了 基变换对“体积”的影响。可以证明,对于所有同定向的标准正交基,向量组的行列 式的值在绝对值意义上是一样的[34]。也就是说,如果我们选择的基底都是“单位长 度”,并且两两正交,那么在这样的基之下,平行六面体的体积的绝对值是唯一的[35]线性变换 经线性映射后的正方体设 E 是一个一般的 n 维的有向欧几里得空间。一个线性变换把一个向量线性地变为 另一个向量。比如说,在三维空间中,向量 被映射到向量 :其中 a、b、c 是系数。如右图,正方体(可以看作原来的一组基形成的)经线 性变换后可以变成一个普通的平行六面体, 或变成一个平行四边形 (没有体积) 。 这两种情况表示了两种不同的线性变换,行列式可以将其很好地分辨出来(为 零或不为零)。 更详细地说,行列式表示的是线性变换前后平行六面体的体积的变化系数。如 果设左边的正方体体积是一,那么中间的平行六面体的(有向)体积就是线性 变换的行列式的值,右边的平行四边形体积为零,因为线性变换的行列式为零。 这里我们混淆了线性变换的行列式和向量组的行列式,但两者是一样的,因为 我们在对一组基作变换[36]。行列式与空间定向以上二维和三维行列式的例子中,行列式被解释为向量形成的图形的面积或体积。 面积或体积的定义是恒正的,而行列式是有正有负的,因此需要引入有向面积和有 向体积的概念。负的面积或体积在物理学中可能难以理解,但在数学中,它们和有 向角的概念类似,都是对空间镜面对称特性的一种刻画。如果行列式表示的是线性 变换对体积的影响,那么行列式的正负就表示了空间的定向[37]。 如上图中,左边的黄色骰子(可以看成有单位的有向体积的物体)在经过了线性变 换后变成中间绿色的平行六边形,这时行列式为正,两者是同定向的,可以通过旋 转和拉伸从一个变成另一个。而骰子和右边的红色平行六边形之间也是通过线性变 换得到的,但是无论怎样旋转和拉伸,都无法使一个变成另一个,一定要通过镜面 反射才行。这时两者之间的线性变换的行列式是负的。可以看出,线性变换可以分 为两类,一类对应着正的行列式,保持空间的定向不变,另一类对应负的行列式, 颠倒空间的定向[37][38][39]。一般域上的行列式:严格的定义由二维及三维的例子,我们可以看到一般的行列式应该具有怎样的性质。在 n 维欧 几里得空间中,作为“平行多面体”的“体积”的概念的推广,行列式继承了“体积”函数 的性质。首先,行列式需要是线性的,这可以由面积的性质类比得到。这里的线性 是对于每一个向量来说的,因为当一个向量变为原来的 a 倍时,“平行多面体”的“体 积”也变为原来的 a 倍。其次,当一个向量在其它向量组成的“超平面”上时,n 维“平 行多面体”的“体积”是零(可以想像三维空间的例子)。也就是说,当向量线性相关 时,行列式为零。在一般系数域上的线性空间中,行列式也正是由这样的特性所刻 划的:交替多线性形式行列式是系数域为 的有限维线性空间 上射到 的交替 n 线性形式[40]。具体来说,设 E 是一个系数在域 上的有限维线性空间,维数为 n。一个 上的交 替 n 线性形式是指满足以下性质的函数 : 1. n 重线性:2. 交替性: 的时候 所有 上的交替 n 线性形式的集合记作 An(E) 。或者说, 当定理:An(E) 的维度是 1,也就是说,设 所有的交替 n 线性形式是 E 的一组基,那么, 都可以写成 其中是在基 B 下的展开[40][41]。定理的证明定理的证明是对任一个 n 线性形式,考虑将依照多线性性质展开,这时,由交替性, 列,所以有当且仅当是的一个排这里,。向量组的行列式设 义基 的行列式。 定义:E 上的一组基 的行列式是唯一的交替 n 线性形式 使得: 是 E 的一组基,根据上面的定理和线性形式的性质,可以定其中的唯一性是因为如果有两个交替 n 线性形式满足条件,则它们的差在一组基上 为 0,从而等于 0。于是,一组基上的一个向量组的行列式就是: 定义:确定了 E 上的一组基 后,向量组 在 下的行列式是: 其中是在基 B 下的展开[42]。可以见到这个定义与之前直观的定义是吻合的,它有时也被称作莱布尼兹公式。基变更公式设 B 与 B’是向量空间中的两组基, 则将上面定理中的 f 改为 detB’就得到向量组在两 组基下的行列式之间的关系: ,矩阵的行列式设 为所有定义在系数域 上的 矩阵的集合。 将 矩阵 ( 的元素为 )的 n 列写成 , 可以看作是 的正则基上的向量。矩 阵 的行列式定义为向量组 的行列式。这里的向量都在 的正则基 (standard basis)上展开,因此矩阵的行列式不依赖于基的选择。 定义:矩阵 的行列式[43]这样定义的矩阵 的行列式与向量组的行列式有同样的性质。 单位矩阵的行列式为 1,若矩阵的某几行线性相关,则它的行列式为零。 由莱布尼兹公式,可以证明矩阵行列式的一个重要性质:定理:一个矩阵的行列式等于它的转置矩阵的行列式:,[44]也就是说矩阵的行列式既可以看作 n 个行向量的行列式,也可以看作 n 个列向量的 行列式。因此也可以通过行向量组来定义矩阵行列式,并且得到的定义是等价的。证明:矩阵 A 的转置矩阵的行列式是:令,由于每个排列都是双射,所以上式变成: 令,当 取遍所有置换时, 也取遍所有排列。另一方面, ,因此而且 。所以线性映射的行列式设 f 是 n 维线性空间 E 到自身的线性变换(线性自同态),对于给定的一组基,可 以定义线性变换在这组基下的行列式。 定义:设 B 是 E 的一组基。设 f 在 B 下的变换矩阵为 就是: 。 ,那么 f 在 B 下的行列式f 的变换矩阵满足 的向量组 ,也就是说对所有。 可以证明,f 在 E 的任意一组基下的变换矩阵的行列式都是相等的[45]。考虑映射 使得 x1, ..., xn 被映射到 , 是一个交替 n 线性形式,因此由前面证的定理, 。 而由变换矩阵的性质可以知道: 和 只相差一个系数。 也就是说对于另外一组基,运用基变更公式,可以得到:从而可以得出 赖于 f 的数。等于。于是是一个不依赖于基,只依因此线性变换的行列式定义可以修改为不依赖于基的形式: 定义:设线性变换 f 在某组基 B 下的变换矩阵为 ,那么 f 的行列式就是: 。前一节里对正方体做线性变换时, 1, ..., xn 是原来的基, x 因此可以混淆向量组的行列式和线性变换的行列式[45]。,特别地, 行列式为 1 的线性变换保持向量组的行列式, 它们构成一般线性群 GL(E) 的 [46] 一个子群 SL(E) ,称作特殊线性群 。可以证明,SL(E) 是由所有的错切生成的, 即所有具有如下形式的矩阵代表的线性变换: 其中是只在第 i 行第 j 列处取 1,其余系数为 0 的矩阵。也就是说,错切变换保持向量组形成的“平行多面体”的体积[47]。同样,可以证明两个相似矩阵有相等的行 列式[48]。系数的取值以上的定义中都假设矩阵的系数取自域 环 ,这时有限维线性空间变为以 中,实际上矩阵的系数可以是任意的交换 为基的自由 k-模,而相应的关于行列式的定义和性质依然成立(在可定义的范畴内)。如果矩阵系数是非交换环 的话,以上的行列式定义将不再唯一。1845 年,阿瑟? 凯莱首次开始研究非交换环 上行列式定义的问题。他注意到,对于系数是四元数(不可交换)的二阶行列式表达式 和 是不一样的。 1926 年, 阿兰德? 海 廷(Arent Heyting)和 A.理查德森提出了非交换环上的行列式的不同定义。理 查德森将二阶行列式定义为: ,而海廷则提倡使用。两人都用归纳法定义了更高阶矩阵的行列式。1931 年, 奥斯丁? 欧尔在一大类非交换环(后来命名为欧尔环)上定义了行列式的概念。 最著名的非交换环上的行列式的定义当属让? 迪厄多内的定义。迪厄多内是布尔 巴基学派的代表成员之一, 他将除环 中的行列式定义在商域 上, 而不是在 中。这个定义下的行列式有接近交换环中行列式的性质。例如,迪尔 多内的行列式可以保持行列式的乘法定理。而这种行列式与交换环中行列式的 区别是:将矩阵的两行或两列互换后,行列式的值不变。[49]之后菲列克斯? 别列 金(Березин, Феликс Александрович)、佐藤干夫等人对迪厄多内的定义进 行了探究和扩展[50]。行列式的性质行列式的一些基本性质,可以由它的多线性以及交替性推出。?在行列式中,一行(列)元素全为 0,则此行列式的值为 0[51]。 ?在行列式中,某一行(列)有公因子 k,则可以提出 k[51]。?在行列式中,某一行(列)的每个元素是两数之和,则此行列式可拆分 为两个相加的行列式[51]。?行列式中的两行(列)互换,改变行列式正负符号[51]。? 在行列式中,有两行(列)对应成比例或相同,则此行列式的值为0[51]。? 将一行(列)的 k 倍加进另一行(列)里,行列式的值不变[51]。注意:一行(列)的 k 倍加上另一行(列) ,行列式的值改变。 ? 将行列式的行列互换,行列式的值不变,其中行列互换相当于转置[51][52]。这个性质可以简单地记作例如行列式的乘法定理:方块矩阵的乘积的行列式等于行列式的乘积。 。特别的,若将矩阵中的每一行每一列上的数都乘 以一个常数 r,那么所得到的行列式不是原来的 r 倍,而是 rn 倍。[53]。以上的乘法公式还可以进一步推广为所谓柯西C比内公式, 从而使得只要两个矩阵的 乘积是方块矩阵,就有类似于以上的结果:假设 A 是一个 矩阵,而 B 是一 个 矩阵。如果 S 是 中具有 m 个元素的子集 ,我们记 AS 为 A 中列指标位于 S 中的 标位于 S 中的 子矩阵。那么子矩阵。类似地,记 BS 为 B 中行指这里求遍中 m 个元素的所有可能子集 S(共有 C(n,m) 个) 。如果 m = n,即 A 与 B 是同样大小的方块矩阵,则只有一个容许集合 S,柯西C比 内公式退化为通常行列式的乘法公式。如过 m = 1 则有 n 容许集合 S,这个公式退 化为点积。如果 m & n,没有容许集合 S,约定行列式 det(AB) 是零[54]。 若 A 是可逆矩阵,[55]。 由行列式的乘法定理以及 个从一般线性群 到可以知道,行列式定义了一 上的群同态[56]。若将方块矩阵中的元素取共轭,得到的是矩阵的共轭矩阵。共轭矩阵的行列式值等 于矩阵行列式值的共轭:[57]若两个矩阵相似,那么它们的行列式相同。这是因为两个相似的矩阵之间只相差一 个基底变换,而行列式描述的是矩阵对应的线性映射对体积的影响,而不是体积, 所以基底变换并不会影响行列式的值。用数学语言来说,就是: 如果两个矩阵 A 与 B 相似,那么存在可逆矩阵 P 使得 ,所以[48]行列式是所有特征值(按代数重数计)的乘积。这可由矩阵必和其若尔当标准型相 似推导出[58]。特殊地,三角矩阵的行列式等于其对角线上所有元素的乘积[58]。 由于三角矩阵的行列式计算简便,当矩阵的系数为域时,可以通过高斯消去法将矩 阵变换成三角矩阵,或者将矩阵分解成三角矩阵的乘积之后再利用行列式的乘法定 理进行计算。可以证明,所有的矩阵 A 都可以分解成一个上三角矩阵 U、一个下三 角矩阵 L 以及一个置换矩阵 P 的乘积: 。这时,矩阵 A 的行列式 可以写成:[59]分块矩阵的行列式并不能简单地表示成每个分块的行列式的乘积组合。对于分块的 三角矩阵,仍然有类似的结论:,矩阵的行列式等 于对角元素的行列式之乘积。 对于一般情况,若对角元素中有一个是可逆矩阵,比如说 A 可逆,那么矩阵的行列 式可以写做。[60] 矩阵的行列式和矩阵的迹数有一定的关联,当矩阵的系数为域时,在定义了矩阵的 指数函数后,有如下的恒等式:[61]余因式又称“余子式”、“余因子”。参见主条目余因式。 对一个 n 阶的行列式 M,去掉 M 的第 i 行第 j 列后形成的 n-1 阶的行列式叫 做 M 关于元素 mij 的余因式。记作[62]。代数余子式M 关于元素 mij 的代数余子式记作 。[62]。行列式关于行和列的展开一个 n 阶的行列式 M 可以写成一行(或一列)的元素与对应的代数余子式的乘积之 和,叫作行列式按一行(或一列)的展开。这个公式又称拉普拉斯公式, n 维矩阵的行列式计算变为了 n 个 n-1 维的 把 [62][63] 行列式的计算 。另一方面,拉普拉斯公式可以作为行列式的一种归纳定 义: 在定义了二维行列式后, 维矩阵的行列式可以借助拉普拉斯公式用 n-1 n 维的行列式来定义。这样定义的行列式与前面的定义是等价的[30]。行列式的计算 计算行列式的值是一个常见的问题。最简单的方法是按照定义计算或按照拉普拉斯公式进行递归运算。 这样 的算法需要计算 次的加法,复杂度是指数函数。在实际的计算中只能用于计算阶 数很小的行列式。注意到拉普拉斯公式的性质,如果一行或一列里面有很多个 0, 那么就可以把行列式按这一行或一列展开,这时数值为零的系数所对应的代数余子 式就不必计算了,因为最后要乘以 0,这样就可以简化计算。然而更加简便的算法 是利用高斯消去法或 LU 分解法,把矩阵通过初等变换变成三角矩阵或三角矩阵的 乘积来计算行列式的值。这些算法的复杂度都是 度。 如果一个算法可以在 时间内算出矩阵乘法,那么可以构造出一种 时间 级别,远远小于直接计算的复杂内的行列式求值算法。这说明求矩阵的行列式的值和矩阵的乘法有相同的复杂度。 于是,通过分治算法或者其它的方法,可以达到比 复杂度 的行列式求值算法[64][65] 更好的结果。比如,存在行列式函数由行列式的一般表达形式中可以看出,矩阵 A 的行列式是关于其系数的多项式。因 此行列式函数具有良好的光滑性质。单变量的行列式函数设矩阵函数 为 (k 阶连续可导)的函数,则由于行列式函数 的某些系数的乘积,所以也是 的。其对 t 的导只不过是矩阵 数为,其中的每个是矩阵的第 i 个行向量(也可以全部是列向量) [66] 。矩阵的行列式函数函数 是连续的。由此,n 阶一般线性群是一个开集,因为是开区间 的原像,而特殊线性群则是一个闭集,因为是闭集合 的原像[67]。 函数 开为也是可微的,甚至是光滑的()[68]。它在某个矩阵 A 处的展[69]也就是说,在装备正则范数的矩阵空间 Mn( )中,伴随矩阵是行列式函数的梯 度[70]特别当 A 为单位矩阵时,可逆矩阵的可微性说明一般线性群 GLn( )是一个李群[71]。与外代数的关系行列式与外代数有密切的关系, 因为外代数正是在给定的交换环 上最“一般性”的有交替性质的结合代数,记为 而楔积在 V 上的交替性质表现如下(定义): 楔 积 是满 足 结 合律 的双 线 性的 二元 运算 ,使 得 对于 所有 向量 这表示 对于所有向量 当 所有形同 , 线性相关时, ,以及 。 的元素称为 k-向量。所有 k-向量构成了 。行列式函数是 , 上的自由 -模 V。外代数是由楔积构造而成的,的一个子空间,称为 V 的 k-阶外幂,记为 n 重交替线性形式, 所以可以看成是将 n 个 应的 n-阶外幂 这样一个映射。由于里面的向量映射到它们对 的 k-阶外幂 的维数等于组合数 际上同构于 的 n-阶外幂,的维数是,因此实,所以将行列式看做 n 个里面的向量映射到它们对应的映射与之前的行列式定义并没有冲突。外代数理论实际上涵盖了行列式理论。[72][73] 对三维欧几里得空间中 如下:任取可以建立一个线性同构 , ,的右手的标准正交基 , , ,规定 把分别映射为 , , ,则 的定义与右手的标准正交基如何选取无 关。 不难看出,对任意向量 和 ,这个线性同构把楔积 映射为叉积 。这就是叉乘(向量积)的实质。叉积可以用带向量的行列式:来表示,但要注意这个行列式形式并不代表一个“真正”的行列式,因 为第一行的分量不是数,而是向量。这个计算之所以正确是得益于 线性同构 。[73]应用行列式与线性方程组主条目:线性方程组行列式的一个主要应用是解线性方程组。当线性方程组的方程个数与未知数个数相 等时, 方程组不一定总是有唯一解。 对一个有 n 个方程和 n 个未知数的线性方程组, 我们研究未知数系数所对应的行列式。这个线性方程组有唯一解当且仅当它对应的 行列式不为零。这也是行列式概念出现的根源[74]。 当线性方程组对应的行列式不为零时,由克莱姆法则,可以直接以行列式的形式写 出方程组的解。但用克莱姆法则求解计算量巨大,因此并没有实际应用价值,一般 用于理论上的推导[75]。行列式与矩阵主条目:矩阵矩阵的概念出现得比行列式晚,直到十九世纪中期才被引入,然而两者在本质上仍 然有密切关系。通过矩阵,线性方程组可以表示为其中是由方程组中未知数的系数构成的方块矩阵, 。是未知数,而 在矩阵理论中,行列式也有各种用途。多项式称为方块矩阵 的特征值多项式。这是一个由行列式定义的多项式,它的解是矩阵所有 的特征值。换句话说, 是矩阵 的特征值当且仅当 不是可逆矩阵。特 [76] 征值多项式在矩阵理论中有重要的应用 。行列式与多项式早在高斯的时代,行列式就和多项式的研究联系在一起。行列式的一个应用是在所 谓的“结式”上。结式是两个多项式 和 的西尔维斯特矩阵的行列式。两个多项式的 结式等于 0 当且仅当它们有高于或等于一次的公因子多项式。结式还可以判断多项 式是否有重根:如果多项式 和它的微分多项式 的结式不为零,那么这个多项式 没有重根,否则有重根[77]。 行列式在多项式逼近理论中也有出现。给定一组插值点,判别插值多项式的存在性 需要看所谓的范德蒙矩阵,而由于范德蒙矩阵的行列式不为零,因此根据克莱姆法 则,插值多项式唯一存在(次数小于插值点个数)[78]朗斯基行列式主条目:朗斯基行列式朗斯基行列式是函数矩阵的行列式,因此本身也是一个函数。给定 n 个 n-1 次连续 可微函数,f1、...、fn,它们的朗斯基行列式 W(f1, ..., fn) 为:[79]可以证明,如果 f1、...、fn 线性相关,那么它们的朗斯基行列式恒等于零[79]。 在线性微分动力系统理论中,朗斯基行列式用来判别若干个解的线性相关性。 如果 n 个解 f1、...、fn 线性无关,那么它们的朗斯基行列式将总不为零[80]。根据 刘维尔定理,n 维空间上的线性微分方程:的基础解系所构成的朗斯基行列式 ,[79]满足: 同样地,线性微分方 程: 的基础解系所构成的朗斯基行列式[79]满足:行列式与多重积分主条目:雅可比矩阵雅可比行列式是把一个体积元(蓝色)变换成另一个(红色)时两者的体积之比行列式体现了线性变换对于空间体积的作用,对于非线性的函数,其对体积的影响 更为复杂,但对于足够“良好”的函数,在一个微小的范围内,比如说在空间中一点 的附近,可以将函数的效果近似地用线性的变换来代替。由此,对于某些函数,也 可以将它在某一点附近的作用效果用它在这一点上的偏导数构成的矩阵(称为雅可 比矩阵)来表示。这类行列式被称为“雅可比行列式”,即是雅可比矩阵的行列式, 只对连续可微的函数有定义[81]。 在计算“体积”的多重积分中,雅可比行列式应用于换元积分的时候。积分的思想是 将空间割成许多个微小的体积元,称为积分元素,再将每个体积元上的函数值乘以 体积元的体积后相加。将一个积分元素换为另一个积分元素时,实际上作了一次对 空间中体积的度量方式的改变:分划体积元的方式不同了。譬如在二维空间中,将 直角坐标积分换为极坐标积分时,面积元素由方块区域变成扇形区域。因此,要测 量这种体积度量方式的改变,可以将这种变换看成一个非线性的变换函数(实际上 是一个微分同胚): 式来体现[82]。 。而它在每一点的影响可以通过雅可比行列行列式与非线性方程组及分枝理论主条目:牛顿法 主条目:分枝理论 运用雅可比行列式的还有非线性方程组的数值求解。对于一般的非线性方程组,不 存在求解公式,只能够用数值分析的方法求近似解。求近似解的基本思想也是将非 线性问题在局部的地方逐步线性化,化归为线性方程组来求解。设有方程组:其中是连续可微函数,并在解的附近雅可比行列式不为零,那么可以用牛顿法迭代求得近似解。迭代程序为:其中的 次迭代时先求解关于线性方程组是第 k 次迭代时的解的近似数值。 每然后计算新的近似值[83]在实际应用中,还需要考虑带有参数的非线性方程组:其中的 可以代表温度、外力等环境因素。当环境改变时,方程解上的雅可比行列 式可能从非零变为零。雅可比行列式为零的点称为临界点或分支点,是方程的解改 变性质的地方。和线性方程组类似,当雅可比行列式的值为零时,方程组会出现局 部多值的情况。寻找分支点和分支方向的研究是非线性方程求解的一大问题。[84]
行列式题目_数学_自然科学_专业资料。高等代数、线性代数题目 一、单项选择题 1、排列 1 3 ? (2n ? 1) 2 4 ? (2n) 的逆序数是 A、 0 B、 . n(n ...求解高阶行列式的一些常用方法1_数学_自然科学_专业资料。高阶行列式的求解是高等代数和线性代数中行列式部分的重要内容,也是行列式中的难点。纵观近几年的考研试题,...高等代数教案高等代数教案隐藏&& 线性代数 1 《线性代数》序言 线性代数》我们开设...二阶行列式, 即 二阶行列式 a 21 a 22 a 21 a 22 a 21 a 22 其中称...归纳成行列式问题后却又似乎是相同的,这一切使得 行列式成为高等数学领域中的一个极其重要的部分,也促使着行列式成为高等代数特别 是线性代数的一个重要研究对象.国际...它也是线性代数理论中极其重 要的组成部分.在高等代数中,行列式的求解是非常重要的,但是直接计算行列式 往往是困难和繁琐的,特别当行列式的元素是字母时更加明显....承诺人(签名) :年月日 2 行列式的计算方法姓 名 : 鲁兵兵 学号 :
指导老师 :王先超 摘要:行列式是高等代数和线性代数的课程中基本内容,并且其在...重新理解线性代数
线性代数是高等代数的一大分支。 我们知道一次方程...在线性代数中最重要的内容就是行列式和矩阵。 行 重新理解线性代数 ...线性代数是高等代数的一大分支,是研究如何 求解线性方程组而发展起来的。线性代数的主要内容有行列式、矩阵、向量、线性方程组、 线性空间、线性变换、欧氏空间和二次...线性代数是高等代数的一大分支,是研究如何求解线性 方程组而发展起来的。 线性代数的主要内容有行列式、矩阵、向量、 线性方程组、线性空间、线性变换、欧氏空间和二...华北水利水电学院 论行列式的计算方法 课程题目:专业班级:成员组成: 线性代数 ...引言行列式是高等代数课程里基本而重要的内容之一,在数学中有着广泛的应用,懂得...
All rights reserved Powered by
www.tceic.com
copyright &copyright 。文档资料库内容来自网络,如有侵犯请联系客服。}

我要回帖

更多关于 高等代数 pdf 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信