目录 |
行列式是数学中的一个函数,将一个的矩阵A映射到一个纯量,记作det(A)或 | A | 。行列式可以看做是有向面积或体积的概念在一般的欧几里得空间中的推广。或者说,在n维度空间中,行列式描述的是一个线性变换对“体积”所造成的影响。无论是在线性代数、多项式理论,还是在微积分学中(比如说换元积分法中),行列式作为基本的数学工具,都有着重要的应用。
行列式概念最早出现在解线性方程组的过程中。十七世纪晚期,关孝和与莱布尼茨的著作中已经使用行列式来确定线性方程组解的个数以及形式。十八世纪开始,行列式开始作为独立的数学概念被研究。十九世纪以后,行列式理论进一步得到发展和完善。矩阵概念的引入使得更多有关行列式的性质被发现,行列式在许多领域都逐渐显现出重要的意义和作用,出现了线性自同态和向量组的行列式的定义。
行列式的特性可以被概括为一个多线性形式,这个本质使得行列式在欧几里德空间中可以成为描述“体积”的函数[1]。
矩阵A的行列式有时也记作|A|。绝对值和范数|矩阵范数也使用这个记法,有可能和行列式的记法混淆。不过矩阵范数通常以双垂直线来表示(如:),且可以使用下标。此外,矩阵的绝对值是没有定义的。因此,行列式经常使用垂直线记法(例如:克莱姆法则和子式)。例如,一个矩阵:
,
行列式det(A)也写作 | A | ,或明确的写作:
,
行列式的概念最初是伴随着方程组的求解而发展起来的。行列式的提出可以追溯到十七世纪,最初的雏形由日本数学家关孝和与德国数学家戈特弗里德•莱布尼茨各自独立得出,时间大致相同。
关孝和在《解伏题之法》中首次运用行列式的概念。1545年,卡当在著作《大术》中给出了一种解两个一次方程组的方法。他把这种方法称为“母法”。这种方法和后来的克莱姆法则已经很相似了,但卡当并没有给出行列式的概念。[4]
1683年,日本数学家关孝和在其著作《解伏题之法》中首次引进了行列式的概念。书中出现了、乃至的行列式,行列式被用来求解高次方程组。
1693年,德国数学家莱布尼茨开始使用指标数的系统集合来表示有三个未知数的三个一次方程组的系数。他从三个方程的系统中消去了两个未知量后得到一个行列式。这个行列式不等于零,就意味着有一组解同时满足三个方程。[5]由于当时没有矩阵的概念,莱布尼茨将行列式中元素的位置用数对来表示:代表第i行第j列。莱布尼茨对行列式的研究成果中已经包括了行列式行列式的展开和克莱姆法则,但这些结果在当时并不为人所知。[6]
1730年,苏格兰数学家科林•麦克劳林在他的《论代数》中已经开始阐述行列式的理论,记载了用行列式解二元、三元和四元一次方程的方法,并给出了四元一次方程组的一般解的正确形式,尽管这本书直到麦克劳林逝世两年后(1748年)才得以出版。[7]
1750年,瑞士的加布里尔•克拉默首先在他的《代数曲线分析引论》给出了n元一次方程组求解的法则,用于确定经过五个点的一般二次曲线的系数,但并没有给出证明。[8]其中行列式的计算十分复杂,因为是定义在置换的奇偶性上的。[9]
此后,关于行列式的研究逐渐增多。1764年,法国的艾蒂安•贝祖的论文中关于行列式的计算方法的研究简化了克莱姆法则,给出了用结式来判别线性方程组的方法[10]同是法国人的亚历山德•西奥菲勒•范德蒙德则在1771年的论着中第一个将行列式和解方程理论分离,对行列式单独作出阐述。这是数学家们开始对行列式本身进行研究的开端。[11]
1772年,皮埃尔-西蒙•拉普拉斯在论文《对积分和世界体系的探讨》中推广了范德蒙德著作里面将行列式展开为若干个较小的行列式之和的方法,发展出子式的概念。一年后,约瑟夫•拉格朗日发现了的行列式与空间中体积的联系。他发现:原点和空间中三个点所构成的四面体的体积,是它们的坐标所组成的行列式的六分之一。
行列式在大部分欧洲语言中被称为“determinant”(某些语言中词尾加e或o,或变成s),这个称呼最早是由卡尔•弗里德里希•高斯在他的《算术研究》中引入的。这个称呼的词根有“决定”意思,因为在高斯的使用中,行列式能够决定二次曲线的性质。在同一本着作中,高斯还叙述了一种通过系数之间加减来求解多元一次方程组的方法,也就是现在的高斯消元法。
进入十九世纪后,行列式理论进一步得到发展和完善。奥古斯丁•路易•柯西在1812年首先将“determinant”一词用来表示十八世纪出现的行列式,此前高斯只不过将这个词限定在二次曲线所对应的系数行列式中。柯西也是最早将行列式排成方阵并将其元素用双重下标表示的数学家(垂直线记法是阿瑟•凯莱在1841年率先使用的)柯西还证明了行列式行列式的性质(实际上是矩阵乘法),这个定理曾经在雅克•菲利普•玛利•比内的书中出现过,但没有证明。
十九世纪五十年代,凯莱和詹姆斯•约瑟夫•西尔维斯特将矩阵的概念引入数学研究中[12]。行列式和矩阵之间的密切关系使得矩阵论蓬勃发展的同时也带来了许多关于行列式的新结果,例如阿达马不等式、正交行列式、对称行列式等等。[13]
与此同时,行列式也被应用于各种领域中。高斯在二次曲线和二次型的研究中使用行列式作为二次曲线和二次型划归为标准型时的判别依据。之后,卡尔•魏尔斯特拉斯和西尔维斯特又完善了二次型理论,研究了λ矩阵的行列式以及初等因子。行列式被用于多重函数的积分大约始于十九世纪三十年代。1832年至1833年间卡尔•雅可比发现了一些特殊结果,1839年,欧仁•查尔•卡塔兰发现了所谓的雅可比行列式。1841年,雅可比发表了一篇关于函数行列式的论文,讨论函数的线性相关性与雅可比行列式的关系
现代的行列式概念最早在19世纪末传入中国。1899年,华蘅芳和英国传教士傅兰雅合译了《算式解法》十四卷,其中首次将行列式翻译成“定准数”。1909年顾澄在著作中称之为“定列式”。1935年8月,中国数学会审查各种术语译名,9月教育部公布的《数学名词》中正式将译名定为“行列式”。其后“行列式”作为译名沿用至今。
一个n阶方块矩阵A的行列式可直观地定义如下:
其中,Sn是集合{1,2,...,n}上置换的全体,即集合{1,2,...,n}到自身上的一一映射(双射)的全体;
表示对S全部元素的求和,即对于每个σ∈S,在加法算式中出现一次;对每一个满足1≤i,j≤n的数对(i,j),ai,j是矩阵A的第i行第j列的元素。
σ表示置换σ∈Sn的置换的奇偶性,具体地说,满足1≤i<j≤n但σ(i)>σ(j)的有序数对(i,j)称为σ的一个逆序。
如果σ的逆序共有偶数个,则sgn(σ) = 1,如果共有奇数个,则sgn(σ) = − 1。
举例来说,对于3元置换σ=(2,3,1)(即是说σ(1)=2,σ(2)=3,σ(3)=1而言,由于1在2后,1在3后,所以共有2个逆序(偶数个),因此sgn(σ) = 1,从而3阶行列式中项a1,2a2,3a3,1的符号是正的。但对于三元置换σ=(3,2,1)(即是说σ=3,σ=2,σ=1)而言,可以数出共有3个逆序(奇数个),因此sgn(σ) = − 1,从而3阶行列式中项a1,3a2,2a3,1的符号是负号。[14]
注意到对于任意正整数n,S_n共拥有n个元素,因此上式中共有n个求和项,即这是一个有限多次的求和。
对于简单的2阶和3阶的矩阵,行列式的表达式相对简单,而且恰好是每条主对角线(左上至右下)元素乘积之和减去每条副对角线(右上至左下)元素乘积之和(见图1中红线和蓝线)。
2阶矩阵的行列式:
3阶矩阵的行列式: 但对于阶数n≥4的方阵A,这样的主对角线和副对角线分别只有n条,由于A的主、副对角线总条数 = 2n < (n − 1)n < n! = Sn的元素个数
因此,行列式的相加项中除了这样的对角线乘积之外,还有其他更多的项。例如4阶行列式中,项a1,2a2,3a3,1a4,4就不是任何对角线的元素乘积。不过,和2、3阶行列式情况相同的是,n阶行列式中的每一项仍然是从矩阵中选取n个元素相乘得到,且保证在每行和每列中都恰好只选取一个元素,而整个行列式恰好将所有这样的选取方法遍历一次。
另外,n×n矩阵的每一行或每一列也可以看成是一个n元向量,这时矩阵的行列式也被称为这n个n元向量组成的向量组的行列式
行列式的一个自然的源起是n维平行体的体积。行列式的定义和n维平行体的体积有着本质上的关联
行列式是向量形成的平行四边形的面积
在一个二维欧几里得平面上,两个向量X=(a,c)和X'=(b,d)的行列式是:
比如说,两个向量X=(2,1)和X=(3,4)的行列式是:
经计算可知,当系数是实数时,行列式表示的是向量X和X'形成的平行四边形的有向面积,并有如下性质:
行列式为零当且仅当两个向量共线(线性相关),这时平行四边形退化成一条直线。
如果以逆时针方向为正向的话,有向面积的意义是:平行四边形面积为正当且仅当以原点为不动点将X逆时针“转到X'处时,扫过的地方在平行四边形里,否则的话面积就是负的。如图2中,X和X'所构成的平行四边形的面积就是正的。
行列式是一个双线性映射。也就是说,det(λX + μY,X') = λdet(X,X') + μdet(Y,X'),
并且
det(X,λX' + μY') = λdet(X,X') + μdet(X,Y')。
其几何意义是:以同一个向量v作为一条边的两个平行四边形的面积之和,等于它们各自另一边的向量u和u'加起来后的向量:u+u'和v所构成的平行四边形的面积,如图3中所示。
在三维的有向欧几里得空间中,三个三维向量的行列式是: 。 比如说,三个向量(2,1,5)、(6,0,8)和(3,2,4)的行列式是: 当系数是实数时,行列式表示X、X′和X″三个向量形成的平行六面体的有向体积,也叫做这三个向量的三重积。同样的,可以观察到如下性质:
行列式为零当且仅当三个向量共线或者共面(三者线性相关),这时平行六面体退化为平面图形,体积为零。
三维空间中有向体积的定义要比二维空间中复杂,一般是根据右手定则来约定。比如图4中(u,v,w)所形成的平行六面体的体积是正的,而(u,w,v)所形成的平行六面体的体积是负的。这个定义和行列式的计算并不矛盾,因为行列式中向量的坐标都是在取好坐标系后才决定的,而坐标系的三个方向一般也是按照右手规则来设定的。如果计算开始时坐标系的定向反过来的话,有向体积的定义也要跟着反过来,这样行列式才能代表有向体积。
这时行列式是一个“三线性映射”,也就是说,对第一个向量有det(aX + bY,X',X'') = adet(X,X',X'') + bdet(Y,X',X''),对第二、第三个向量也是如此。其几何意义和二维时基本相同,是指当生成两个平行六面体的每组三个向量中如果有两个是重合的,比如分别是:(u,v,w)和(u',v,w),那么它们的体积之总和等于将u和u'加起来后的向量u+u'和v,w所形成的平行六面体的体积,如右图所示。
在以上的行列式中,我们不加选择地将向量在所谓的正交基(即笛卡儿坐标系)下分解,实际上在不同的基底之下,行列式的值并不相同。这并不是说平行六面体的体积不唯一。恰恰相反,这说明体积的概念依赖于衡量空间的尺度,也就是基底的取法。用基底的变换可以看作线性映射对基底的作用,而不同基底下的行列式代表了基变换对“体积”的影响。可以证明,对于所有标准正交基,向量组的行列式的值在绝对值意义上是一样的[15]。也就是说,如果我们选择的基底都是“单位长度”,并且两两正交,那么在这样的基之下,平行六面体的体积的绝对值是唯一的。
设E是一个一般的n维的有向欧几里得空间。一个线性变换把一个向量线性地变为另一个向量。比如说,在三维空间中,向量(x,y,z)被映射到向量(x',y',z'):
其中a、b、c是系数。如图5,正方体(可以看作原来的一组基形成的)经线性变换后可以变成一个普通的平行六面体,或变成一个平行四边形(没有体积)。这两种情况表示了两种不同的线性变换,行列式可以将其很好地分辨出来(为零或不为零)。
更详细地说,行列式表示的是线性变换前后平行六面体的体积的变化系数。如果设左边的正方体体积是一,那么中间的平行六面体的(有向)体积就是线性变换的行列式的值,右边的平行四边形体积为零,因为线性变换的行列式为零。这里我们混淆了线性变换的行列式和向量组的行列式,但两者是一样的,因为我们在对一组基作变换。
以上二维和三维行列式的例子中,行列式被解释为向量形成的图形的面积或体积。面积或体积的定义是恒正的,而行列式是有正有负的,因此需要引入有向面积和有向体积的概念。负的面积或体积在物理学中可能难以理解,但在数学中,它们和角的概念类似,都是对空间镜面对称特性的一种刻画。如果行列式表示的是线性变换对体积的影响,那么行列式的正负就表示了空间的定向。
如图6中,左边的黄色骰子(可以看成有单位的有向体积的物体)在经过了线性变换后变成中间绿色的平行六边形,这时行列式为正,两者是同定向的,可以通过旋转和拉伸从一个变成另一个。而骰子和右边的红色平行六边形之间也是通过线性变换得到的,但是无论怎样旋转和拉伸,都无法使一个变成另一个,一定要通过镜面反射才行。这时两者之间的线性变换的行列式是负的。可以看出,线性变换可以分为两类,一类对应着正的行列式,保持空间的定向不变,另一类对应负的行列式,颠倒空间的定向[16]。
由二维及三维的例子,可以看到一般的行列式应该具有怎样的性质。在n维欧几里得空间中,作为“平行多面体”的“体积”的概念的推广,行列式继承了“体积”函数的性质。首先,行列式需要是线性的,这可以由面积的性质类比得到。这里的线性是对于每一个向量来说的,因为当一个向量变为原来的a倍时,“平行多面体”的“体积”也变为原来的a倍。其次,当一个向量在其它向量组成的“超平面”上时,n维“平行多面体”的“体积”是零(可以想象三维空间的例子)。也就是说,当向量线性相关时,行列式为零。在一般系数域上的线性空间中,行列式也正是由这样的特性所刻划的。
行列式是系数域为K的有限维线性空间E上射到K的多线性形式n-线性形式。
具体来说,设E是一个系数在域K上的有限维线性空间,维数为n。一个E上的交替n-线性形式是指满足以下性质的函数:
n重线性:
交替性:或者说,当ai = aj的时候 所有E上的交替n-线性形式的集合记作An(E)。
定理:
An(E)的维度是1。也就是说,设是E的一组基,那么,所有的交替n-线性形式都可以写成
其中是在基B下的展开[17]。
证明:
对任一个n-线性形式,考虑将D依照多线性性质展开,
这时,由交替性,当且仅当是的一个排列,所以有
这里,。
设是E的一组基,根据上面的定理和线性形式的性质,可以定义B下的行列式。
定义:
E上的一组基的行列式是唯一一个满足:
detB(e1,...,en) = 1的多线性形式n-线性形式。
其中的唯一性是因为如果有两个交替n-线性形式满足条件,则它们的差在一组基上为0,从而恒等于0。于是,一组基上的一个向量组的行列式就是:
定义:
确定了E上的一组基B后,向量组在B下的行列式是:
其中是在B下的展开[18]。
可以见到这个定义与之前直观的定义是吻合的,它有时也被称作莱布尼兹公式。
设B与B′是向量空间中的两组基,则将上面定理中的f改为detB就得到向量组在两组基下的行列式之间的关系:
,
设Mn(K)为所有定义在系数域K上的矩阵的集合。将矩阵M(M的元素记为mi,j)的n列写成,mj可以看作是的正则基上的向量。矩阵M的行列式定义为向量组的行列式。这里的向量都在的正则基上展开,因此矩阵的行列式不依赖于基的选择。
定义:
矩阵M的行列式
这样定义的矩阵M的行列式与向量组的行列式有同样的性质。单位矩阵的行列式为1,若矩阵的某几行线性相关,则它的行列式为零。
由莱布尼兹公式,可以证明矩阵行列式的一个重要性质:
定理:
一个矩阵的行列式等于它的转置矩阵的行列式:。
也就是说矩阵的行列式既可以看作n个行向量的行列式,也可以看作n个列向量的行列式。因此也可以通过行向量组来定义矩阵行列式,并且得到的定义是等价的。
证明:
矩阵A的转置矩阵的行列式是:
令j = σ(i),由于每个排列都是双射,所以上式变成:
令τ = σ − 1,当σ取遍所有置换时,τ也取遍所有排列。另一方面,1 = sgn(σ − 1σ) = sgn(τσ) = sgn(τ)sgn(σ),因此而且sgnσ = sgnτ。所以
设f是n维线性空间E到自身的线性变换(自同态),对于给定的一组基,可以定义线性变换在这组基下的行列式。
定义:
设B是E的一组基。设f在B的变换矩阵为,那么f在B下的行列式就是:
。
f的变换矩阵满足
也就是说对所有的向量组, 。
可以证明,f在E的任意一组基下的变换矩阵的行列式都是相等的
证明:
考虑映射df,B使得被映射到
,
df,B是一个交替n-线性形式,因此由前面证的定理,df,B和detB只相差一个系数。
。
而由变换矩阵的性质可以知道: 也就是说
对于另外一组基B′,运用基变更公式,可以得到:
从而可以得出等于。于是是一个不依赖于基,只依赖于f的数。
因此线性变换的行列式定义可以修改为不依赖于基的形式:
定义:
设线性变换f在某组基B下的变换矩阵为,那么f的行列式就是:
。
前一节里对正方体做线性变换时,是原来的基,,因此可以混淆向量组的行列式和线性变换的行列式。
特别地,行列式为1的线性变换保持向量组的行列式,它们构成一般线性群GL(E)的一个子群SL(E),称作特殊线性群[19]。可以证明,SL(E)是由所有的错切生成的,即所有具有如下形式的矩阵代表的线性变换:
其中Eij是只在第i行第j列处系数取1,其余系数为0的矩阵。也就是说,错切变换保持向量组形成的“平行多面体”的体积[20]。同样,可以证明两个相似矩阵有相等的行列式。
以上的定义中都假设矩阵的系数取自域中,实际上矩阵的系数可以是任意的交换环k,这时有限维线性空间变为以为基的自由k-模,而相应的关于行列式的定义和性质依然成立(在可定义的范畴内)。如果矩阵系数是非交换环的话,以上的行列式定义将不再唯一。1845年,阿瑟•凯莱首次开始研究非交换环上行列式定义的问题。他注意到,对于系数是四元数(不可交换)的二阶行列式
表达式a11a22 − a12a21和a11a22 − a21a12是不一样的。1926年,阿兰德•海廷和A.理查德德森提出了非交换环上的行列式的不同定义。理查德德森将二阶行列式定义为:,而海廷则提倡使用。两人都用归纳法定义了更高阶矩阵的行列式。1931年,奥斯丁•欧尔在一大类非交换环(后来命名为欧尔条件)上定义了行列式的概念。最著名的非交换环上的行列式的定义当属让•迪厄多内的定义。迪厄多内是布尔巴基学派的代表成员之一,他将除环中的行列式定义在商域上,而不是在中。这个定义下的行列式有接近交换环中行列式的性质。例如,迪尔多内的行列式可以保持行列式的乘法定理。而这种行列式与交换环中行列式的区别是:将矩阵的两行或两列互换后,行列式的值不变。
行列式的一些基本性质,可以由它的多线性以及交替性推出。
在行列式中,一行(列)元素全为0,则此行列式的值为0[21]。
在行列式中,某一行(列)有公因子k,则可以提出k。
在行列式中,某一行(列)的每个元素是两数之和,则此行列式可拆分为两个相加的行列式。
行列式中的两行(列)互换,改变行列式正负符号。
在行列式中,有两行(列)对应成比例或相同,则此行列式的值为0<refname="detxz"/>。
将一行(列)的k倍加进另一行(列)里,行列式的值不变。
<spanstyle="color:red;">注意:一行(列)的k倍加上另一行(列),行列式的值改变。
将行列式的行列互换,行列式的值不变,其中行列互换相当于转置[22]。这个性质可以简单地记作:
例如
行列式的乘法定理:方块矩阵的乘积的行列式等于行列式的乘积。det(AB) = det(A)det(B)。特别的,若将矩阵中的每一行每一列上的数都乘以一个常数r,那么所得到的行列式不是原来的r倍,而是rn倍。[23]。
以上的乘法公式还可以进一步推广为所谓柯西–比内公式,从而使得只要两个矩阵的乘积是方块矩阵,就有类似于以上的结果:假设A是一个矩阵,而B是一个矩阵。如果S是中具有m个元素的子集,我们记AS为A中列指标位于S中的子矩阵。类似地,记BS为B中行指标位于S中的子矩阵。那么
这里求遍中m个元素的所有可能子集S(共有二项式系数C(n,m)个)。
如果m=n,即A与B是同样大小的方块矩阵,则只有一个容许集合S,柯西–比内公式退化为通常行列式的乘法公式。如过m=1则有n容许集合S,这个公式退化为点积。如果m>n,没有容许集合S,约定行列式det(AB)是零。
若A是可逆矩阵,[24]。
由行列式的乘法定理以及可以知道,行列式定义了一个从一般线性群到上的群同态。
若将方块矩阵中的元素取共轭,得到的是矩阵的共轭矩阵。共轭矩阵的行列式值等于矩阵行列式值的共轭:这是由于行列式按照定义可以看成关于矩阵系数的多项式。另一方面,若干个复数乘积或和的共轭等于其共轭的乘积或和。从而当每个系数都取共轭后,行列式这个多项式的值也变成原来的共轭。
若两个矩阵相似矩阵,那么它们的行列式相同。这是因为两个相似的矩阵之间只相差一个基底变换,而行列式描述的是矩阵对应的线性映射对体积的影响,而不是体积,所以基底变换并不会影响行列式的值。用数学语言来说,就是:
如果两个矩阵A与B相似,那么存在可逆矩阵P使得
,所以
行列式是所有特征值(按代数重数计)的乘积。这可由矩阵必和其若尔当标准型相似推导出>。特殊地,三角矩阵的行列式等于其对角线上所有元素的乘积。
由于三角矩阵的行列式计算简便,当矩阵的系数为域时,可以通过高斯消去法将矩阵变换成三角矩阵,或者将矩阵分解成三角矩阵的乘积之后再利用行列式的乘法定理进行计算。可以证明,所有的矩阵A都可以分解成一个上三角矩阵U、一个下三角矩阵L以及一个置换矩阵P的乘积:。这时,矩阵A的行列式可以写成:
分块矩阵的行列式并不能简单地表示成每个分块的行列式的乘积组合。对于分块的三角矩阵,仍然有类似的结论:
,矩阵的行列式等于对角元素的行列式之乘积。
对于一般情况,若对角元素中有一个是可逆矩阵,比如说A可逆,那么矩阵的行列式可以写做
。
矩阵的行列式和矩阵的迹数有一定的关联,当矩阵的系数为域时,在定义了矩阵指数后,有如下的恒等式: det(exp(A)) = exp(tr(A))==行列式的展开==
对一个n阶的行列式M,去掉M的第i行第j列后形成的n-1阶的行列式叫做M关于元素mij的余因式。记作Mij[26]。
M关于元素mij的代数余子式记作Cij。。
一个n阶的行列式M可以写成一行(或一列)的元素与对应的代数余子式的乘积之和,叫作行列式按一行(或一列)的展开。
这个公式又称拉普拉斯公式,把n维矩阵的行列式计算变为了n个n-1维的行列式的计算[27]。另一方面,拉普拉斯公式可以作为行列式的一种归纳定义:在定义了二维行列式后,n维矩阵的行列式可以借助拉普拉斯公式用n-1维的行列式来定义。这样定义的行列式与前面的定义是等价的。
计算行列式的值是一个常见的问题。最简单的方法是按照定义计算或按照拉普拉斯公式进行递归运算。这样的算法需要计算n!次的加法,复杂度是指数函数。在实际的计算中只能用于计算阶数很小的行列式。注意到拉普拉斯公式的性质,如果一行或一列里面有很多个0,那么就可以把行列式按这一行或一列展开,这时数值为零的系数所对应的代数余子式就不必计算了,因为最后要乘以0,这样就可以简化计算。然而更加简便的算法是利用高斯消去法或LU分解,把矩阵通过初等变换变成三角矩阵或三角矩阵的乘积来计算行列式的值。这些算法的复杂度都是n3级别,远远小于直接计算的复杂度。
如果一个算法可以在O(ns)时间内算出矩阵乘法,那么可以构造出一种O(ns)时间内的行列式求值算法。这说明求矩阵的行列式的值和矩阵的乘法有相同的复杂度。于是,通过分治算法或者其它的方法,可以达到比O(n3)更好的结果。比如,存在复杂度O(n2.376)的行列式求值算法。
由行列式的一般表达形式中可以看出,矩阵A的行列式是关于其系数的多项式。因此行列式函数具有良好的光滑性质。
设矩阵函数为Ck(k阶连续可导)的函数,则由于行列式函数只不过是矩阵A(t)的某些系数的乘积,所以也是的。其对t的导数为 ,其中的每个Ai(t)是矩阵A(t)的第i个行向量(也可以全部是列向量)。
函数是连续的。由此,n阶一般线性群是一个开集,因为是开区间的原像,而特殊线性群则是一个闭集,因为是闭集合的原像。
函数也是可微的,甚至是光滑函数()。它在某个矩阵A处的展开为
也就是说,在装备正则范数的矩阵空间Mn()中,伴随矩阵是行列式函数的梯度
特别当A为单位矩阵时,
可逆矩阵的可微性说明一般线性群GLn()是一个李群。
行列式与外代数有密切的关系,因为外代数正是在给定的交换环上的自由-模V上最“一般性”的有交替性质的结合代数,记为。外代数是由楔积构造而成的,而楔积在V上的交替性质表现如下(定义):
:楔积是满足结合律双线性的二元运算,使得对于所有向量,
这表示
对于所有向量,,以及 当线性相关时,。
所有形同的元素称为k-向量。所有k-向量构成了的一个子空间,称为V的k-阶外幂,记为。行列式函数是n重交替线性形式,所以可以看成是将n个里面的向量映射到它们对应的n-阶外幂这样一个映射。由于的k-阶外幂的维数等于组合数,的维数是,因此实际上同构于,所以将行列式看做n个里面的向量映射到它们对应的n-阶外幂的映射与之前的行列式定义并没有冲突。外代数理论实际上涵盖了行列式理论。[28]
对三维欧几里得空间中可以建立一个线性同构如下:任取的右手的标准正交基,,,规定φ把,,分别映射为,,,则φ的定义与右手的标准正交基如何选取无关。
不难看出,对任意向量和,这个线性同构把楔积映射为叉积。这就是叉乘(向量积)的实质。叉积可以用带向量的行列式:
来表示,但要注意这个行列式形式并不代表一个“真正”的行列式,因为第一行的分量不是数,而是向量。这个计算之所以正确是得益于线性同构φ。
行列式的一个主要应用是解线性方程组。当线性方程组的方程个数与未知数个数相等时,方程组不一定总是有唯一解。对一个有n个方程和n个未知数的线性方程组,我们研究未知数系数所对应的行列式。这个线性方程组有唯一解当且仅当它对应的行列式不为零。这也是行列式概念出现的根源[29]。
当线性方程组对应的行列式不为零时,由克莱姆法则,可以直接以行列式的形式写出方程组的解。但用克莱姆法则求解计算量巨大,因此并没有实际应用价值,一般用于理论上的推导。
矩阵的概念出现得比行列式晚,直到十九世纪中期才被引入,然而两者在本质上仍然有密切关系。通过矩阵,线性方程组可以表示为
其中是由方程组中未知数的系数构成的方块矩阵,是未知数,而。
在矩阵理论中,行列式也有各种用途。多项式p(x) = det(xI − A)称为方块矩阵A的特征值多项式。这是一个由行列式定义的多项式,它的解是矩阵所有的特征值。换句话说,x是矩阵A的特征值当且仅当xI − A不是可逆矩阵。特征值多项式在矩阵理论中有重要的应用[30]。
早在高斯的时代,行列式就和多项式的研究联系在一起。行列式的一个应用是在所谓的“结式”上。结式是两个多项式p和q的西尔维斯特矩阵的行列式。两个多项式的结式等于0当且仅当它们有高于或等于一次的公因子多项式。结式还可以判断多项式是否有重根:如果多项式p和它的微分多项式p'的结式不为零,那么这个多项式没有重根,否则有重根。
行列式在多项式逼近理论中也有出现。给定一组插值点,判别插值多项式的存在性需要看所谓的范德蒙矩阵,而由于范德蒙矩阵的行列式不为零,因此根据克莱姆法则,插值多项式唯一存在(次数小于插值点个数)。
朗斯基行列式是函数矩阵的行列式,因此本身也是一个函数。给定n个n-1次连续可微函数,f1、...、fn,它们的朗斯基行列式W(f1,...,fn)为:
可以证明,如果f1、...、fn线性相关,那么它们的朗斯基行列式恒等于零。
在线性微分动力系统理论中,朗斯基行列式用来判别若干个解的线性相关性。如果n个解f1、...、fn线性无关,那么它们的朗斯基行列式将总不为零,
根据刘维尔定理,n维空间上的线性微分方程:
的基础解系所构成的朗斯基行列式W(t)满足:
,
同样地,线性微分方程:
的基础解系所构成的朗斯基行列式W(t)满足:
W'(t) = an − 1(t)W(t)
行列式体现了线性变换对于空间体积的作用,对于非线性的函数,其对体积的影响更为复杂,但对于足够“良好”的函数,在一个微小的范围内,比如说在空间中一点的附近,可以将函数的效果近似地用线性的变换来代替。由此,对于某些函数,也可以将它在某一点附近的作用效果用它在这一点上的偏导数构成的矩阵(称为雅可比矩阵)来表示。这类行列式被称为“雅可比行列式”,即是雅可比矩阵的行列式,只对连续可微的函数有定义。
在计算“体积”的多重积分中,雅可比行列式应用于换元积分法的时候。积分的思想是将空间割成许多个微小的体积元,称为积分元素,再将每个体积元上的函数值乘以体积元的体积后相加。将一个积分元素换为另一个积分元素时,实际上作了一次对空间中体积的度量方式的改变:分划体积元的方式不同了。譬如在二维空间中,将直角坐标系换为极坐标积分时,面积元素由方块区域变成扇形区域。因此,要测量这种体积度量方式的改变,可以将这种变换看成一个非线性的变换函数(实际上是一个微分同胚):。而它在每一点的影响可以通过雅可比行列式来体现。
运用雅可比行列式的还有非线性方程组的数值求解。对于一般的非线性方程组,不存在求解公式,只能够用数值分析的方法求近似解。求近似解的基本思想也是将非线性问题在局部的地方逐步线性化,化归为线性方程组来求解。设有方程组: 其中是连续可微函数,并在解的附近雅可比行列式不为零,那么可以用牛顿法迭代求得近似解。迭代程序为:
其中的是第k次迭代时的解的近似数值。每次迭代时先求解关于线性方程组
然后计算新的近似值
x(k + 1) = x(k) − Δx(k)
在实际应用中,还需要考虑带有参数的非线性方程组:
其中的λ可以代表温度、外力等环境因素。当环境改变时,方程解上的雅可比行列式可能从非零变为零。雅可比行列式为零的点称为临界点或分支点,是方程的解改变性质的地方。和线性方程组类似,当雅可比行列式的值为零时,方程组会出现局部多值的情况。寻找分支点和分支方向的研究是非线性方程求解的一大问题。