通向实在之路:宇宙法则的完全指南
上QQ阅读APP看书,第一时间看更新

13.3 线性变换和矩阵

我们在群的一般性研究里总会遇到一类特殊的对称群。这就是矢量空间里的对称群。矢量空间的各种对称性可通过保持矢量空间结构不变的线性变换来表现。

图13.4 线性变换保它所作用空间的矢量空间结构不变。这个结构由加和运算(按平行四边形法则)和数乘一个标量λ(它可以是实数,在复空间情形下可以是复数)运算确定。只要原点O固定,这种变换保直线的“平直性”和“平行性”不变。

在§11.1节和§12.3节里,我们已分别定义了矢量空间V里的矢量加法和矢量的数乘,并说明了矢量加法的几何图像可用平行四边形法则来确定,而数乘则表现为矢量在尺度上放大(或缩小)若干倍(图13.4)。这些运算我们通常指的都是实数域下情形,但实际上,在复矢量空间上这些关系也依然成立(由于复数的奇妙性,在许多场合下甚至更重要),尽管我们很难用图来描述。V的线性变换是一种V到自身的变换,它保持V的结构不变。更一般地,我们也可将线性变换视为一个矢量空间到另一个矢量空间的变换。

线性变换可清楚地表示为数的阵列,我们称之为矩阵。矩阵概念在许多数学分支里都很重要,这一节(以及§§13.4,5)里我们将利用精致的代数规则来考察一些极为有用的矩阵。实际上,§§13.3-7节都可看作是一种学习矩阵理论及其在连续群里应用的快速教程。这里描述的概念对于正确理解量子理论极为重要,那些已熟悉这些内容的读者,或对即将展开的量子理论的细节无甚兴趣的读者,可以跳过这几节。

要弄明白什么是线性变换,我们不妨先来考虑三维矢量空间的情形,观察它与§13.1节里讨论过的关于球面对称的转动群O(3)(或SO(3))之间的关系。我们可将球面视为是嵌入在三维欧几里得空间E3里(此空间可看作矢量空间,其原点O即球面的球心[8]),它在普通笛卡儿坐标系(xyz)下的轨迹为*〔13.11〕

x2+y2+z2=1

球面的转动现在表为关于E3的线性变换,但这是一种称为正交变换的特殊变换,对此我们还将在13.8里再作讨论。

一般的线性变换通常会将球面压成或拉成椭球面,如图13.5所示。几何上看,线性变换是一种保持直线和“平行”线的“平直性”不变,当然还要保证原点不动的变换,但它并不保证直角或其他角不变,因此,在均匀但各向异性的变换中,几何形状会受到挤压或拉抻。

图13.5 作用在E3上的线性变换(笛卡儿坐标系xyz下的表达式)通常会将单位球面x2+y2+z2=1压成或拉成椭球面。正交群O(3)由保单位球面不变的E 3的线性变换构成。

我们如何用坐标xyz来表示线性变换呢?答案是每个新坐标都可表为老坐标的(均匀的)线性组合,即分别表为αxyz形式,这里α,β,γ是常数。**〔13.12〕我们有3个这样的表达式,每个表达式代表一个新坐标。为了以集约形式写下所有这3个式子,我们不妨再启用第12章里的指标记法。为此将坐标改写成(x1x2x3),这里

x1=xx2=yx3=z

(再次提醒:这里上指标不表示幂指数,见§12.2)。三维欧氏空间里的某一点的坐标写为xa,其中a=1,2,3。指标记法的好处是这种讨论可应用到多维情形。我们来考虑a(和我们使用的所有其他指标字母)从1取到n的情形,这里n是一固定的正整数。对于前述情形,n=3。

利用爱因斯坦求和约定(§12.7),指标记法下一般线性变换形式为:[9]*〔13.13〕

我们称这种线性变换为T。显然T取决于一组分量Tab。这样一组分量指的是一个m×n的矩阵,通常是数的方阵(但在另一些情形下,可能是m×n长方形阵)。在三维情形下,上述方程写成

它代表3种独立的关系,开始的那个为x1T1 1x1+T1 2x2+T1 3x3*〔13.14〕

我们也可以不用指标或显式坐标,而将上述方程直接写成xTx。如果我们愿意,还可以采用抽象指标记法(§12.8),但这时“xaTabxb”不是分量表达式,而是代表这种抽象变换xTx。(对于指标代表的是抽象表达式还是分量表达式这二者区别变得十分重要的场合,应当有文字提示。)还有一种图示记法也可用于表述上述方程,如图13.6a所示。在以后叙述中,我会交替使用数字矩阵(Tab)和抽象线性变换T这两种表达式,如果二者在技术上的区别不甚重要的话(前者有赖于具体矢量空间V的具体坐标系,后者则否)。

图13.6 (a)线性变换xaTabxb,或写成无指标的xTx(或像§12.8里那样把指标看作是抽象的)的图示形式。(b)线性变换STU和它们的积STSTU的图示记法。我们把连续积用符号的垂直连接来表示。(c)克罗内克,或单位线性变换I,用一段“无主体”线段表示,这样,关系在这种记法下自动满足(也可参见图12.17)。

现在我们考虑第二种线性变换S,它往往跟在T后面使用,二者的积RR=ST)有分量(或抽象指标)表达式

(分量的加和约定)。*〔13.15〕ST的图示记法见图13.6(b)。注意,在图示记法下,线性变换的连续积用符号的垂直连接来表示。从记法上看,这恰好提供了一种使用上的方便,但如果我们还能够采用水平连线来连接符号那就十分完善了。(那样的话,代数和图示记法之间的联系就更紧密了。)

单位线性变换I的分量通常写成(克罗内克δ,一种标准约定,其指标不是像通常那样错开书写):

于是我们有*〔13.16〕

其代数关系为TI=T=IT。分量的方阵沿主对角线(从左上角到右下角)为1。对于n=3情形,I

在图示记法下,我们可简单地用一段实线来代表克罗内克δ,上述代数式的符号表示见图13.6c。

将整个矢量空间向下映射到其中某个较低维区域(子空间)的线性变换称为奇异的(或称退化的,降秩的)。[10]T为奇异的等价条件是存在非零矢量υ使得**〔13.17〕

Tυ=0。

如果变换是非奇异的,那么它有逆矩阵,**〔13.18〕T的逆写成T-1,故对于逆矩阵,有

TT-1=I=T-1T

我们可用图示记法来清晰方便地表示这个逆矩阵,如图13.7。这里我引入了一种非常有用的符号来表示反对称的列维-齐维塔量εac和εac(按εacac=n!归一化),这种反对称量最先是在§12.7节和图12.18中引入的。**〔13.19〕

矩阵代数(最先由多产的英国数学家和律师亚瑟·凯莱(Arthur Carley,1821~1895)于1858年提出)[11]可以在非常广阔的领域找到其应用,(例如统计学,工程学,晶体学,心理学,计算机等领域,更不用说量子力学了)。这种代数包括了§§11.3,5,6节里的四元代数,克利福德代数和格拉斯曼代数。我用粗黑正体大写字母(A,B,C,…)来表示组成矩阵的分量阵列(对于抽象的线性变换则用粗黑斜体字母来表示)。以后我们主要讨论的是n固定的n×n阵,我们可定义这种矩阵的加法和乘法概念,以下标准代数运算均成立:

A+B=B+A A+(B+C)=(A+B)+C A(BC)=(AB)C,

A(B+C)=AB+AC (A+B)C=AC+BC

图13.7 以图示形式给出的非奇异(n×n)矩阵T的逆T-1。这里的图示采用§12.7引入并如图12.18所示的列维-齐维塔反对称量εac和εac(按εacεac=n!归一化)的符号形式。

(A+B的每个元素即为相应的A的元素与B的元素之和)。但是通常乘法交换律不满足,即AB≠BA。而且,如上所见,不为零的n×n阵未必总有逆矩阵。

还需要指出,这种代数可扩展到m×n阵情形,这里m不必等于n。但是,m×n阵和p×q阵之间的加法运算则只有在p=mn=q条件下才成立;二者间的乘法要求n=p,其结果是m×q阵。这种扩展型代数包括了形如Tx这样的积,这里列矢量x可看作是n×1矩阵。*〔13.20〕

一般线性群GL(n)是一种n维矢量空间的对称群,它显然满足作为一种n×n非奇异矩阵的乘法群。如果矢量空间是实空间,即出现在矩阵里的相应数字均为实数,那么我们把这种完全线性群称为GL(n,R)。我们也可以考虑复数域下情形,得到完全线性群GL(n,C)。这些群都有正规子群,分别写作SL(n,R)和SL(n,C),或简写为SL(n),称为特殊线性群,当然这么做的前提是要求底场(§16.1)RC已知。这些群可通过要求矩阵的行列式等于1来获得,行列式的概念我们在下节解释。