张量积
1. 简介
令R R R 是一个交换环并且M M M 和N N N 是R R R -模。(我们总是处理具有一个乘法恒元的环,并且模被假设是单位的:对于所有m ∈ M m\in M m ∈ M ,1 ⋅ m = m 1\cdot m=m 1 ⋅ m = m )。直和M ⊕ N M\oplus N M ⊕ N 是模上的加法操作。我们在此引入一个乘积操作M ⊗ R N M\otimes_{R} N M ⊗ R N ,称为张量积。我们将首先描述模的张量积是什么样的。严格的定义将在第三节给出。
张量积最早出现在向量空间中,这也是它们出现在物理学和工程学中的唯一设定,因此我们将首先描述向量空间的张量积。令V V V 和W W W 都是域K K K 上的向量空间,并为V V V 选择基{ e i } \left\{e_{i}\right\} { e i } ,为W W W 选择基{ f j } \left\{f_{j}\right\} { f j } 。张量积V ⊗ K W V\otimes_{K} W V ⊗ K W 被定义为具有形式符号e i ⊗ f j e_{i}\otimes f_{j} e i ⊗ f j 的基的K K K 向量空间(我们根据定义声明这些新符号是线性独立的)。因此,V ⊗ K W V\otimes_{K} W V ⊗ K W 是形式和∑ i , j c i j e i ⊗ f j \sum\limits_{i,j} c_{ij} e_{i} \otimes f_{j} i , j ∑ c ij e i ⊗ f j ,其中c i j ∈ K c_{ij}\in K c ij ∈ K 。V ⊗ K W V\otimes_{K} W V ⊗ K W 的元素被称为张量。对于v ∈ V v\in V v ∈ V 和w ∈ W w\in W w ∈ W ,定义v ⊗ w v\otimes w v ⊗ w 为V ⊗ K W V\otimes_{K}W V ⊗ K W 的元素,它是通过将v v v 和w w w 写为V V V 和W W W 的原基,并且展成v ⊗ w v\otimes w v ⊗ w ,就像⊗ \otimes ⊗ 是一个非交换积(允许标量被拉出)。
例如,令V = W = R 2 = R e 1 + R e 2 V=W=\mathbb{R}^{2}=\mathbb{R}e_{1}+\mathbb{R}e_{2} V = W = R 2 = R e 1 + R e 2 ,其中{ e 1 , e 2 } \{e_{1},e_{2}\} { e 1 , e 2 } 是标准基。(我们将对R 2 \mathbb{R}^{2} R 2 的两个版本使用同一个基。)则R 2 ⊗ R R 2 \mathbb{R}^{2}\otimes_{\mathbb{R}}\mathbb{R}^{2} R 2 ⊗ R R 2 是一个四维空间,它的基为e 1 ⊗ e 1 e_1 \otimes e_1 e 1 ⊗ e 1 , e 1 ⊗ e 2 e_1 \otimes e_2 e 1 ⊗ e 2 , e 2 ⊗ e 1 e_2 \otimes e_1 e 2 ⊗ e 1 和e 2 ⊗ e 2 e_2 \otimes e_2 e 2 ⊗ e 2 。如果v = e 1 − e 2 v=e_{1}-e_{2} v = e 1 − e 2 且w = e 1 + 2 e 2 w=e_{1}+2e_{2} w = e 1 + 2 e 2 ,则
v ⊗ w = ( e 1 − e 2 ) ⊗ ( e 1 + 2 e 2 ) : = e 1 ⊗ e 1 + 2 e 1 ⊗ e 2 − e 2 ⊗ e 1 − 2 e 2 ⊗ e 2 (1.1) v \otimes w=\left(e_1-e_2\right) \otimes\left(e_1+2 e_2\right):=e_1 \otimes e_1+2 e_1 \otimes e_2-e_2 \otimes e_1-2 e_2 \otimes e_2\tag{1.1} v ⊗ w = ( e 1 − e 2 ) ⊗ ( e 1 + 2 e 2 ) := e 1 ⊗ e 1 + 2 e 1 ⊗ e 2 − e 2 ⊗ e 1 − 2 e 2 ⊗ e 2 ( 1.1 )
v ⊗ w v\otimes w v ⊗ w 是否取决于R 2 \mathbb{R}^2 R 2 基的选择?作为测试,选择另一组基,例如e 1 ′ = e 1 + e 2 e_1^{\prime}=e_1+e_2 e 1 ′ = e 1 + e 2 和e 2 ′ = 2 e 1 − e 2 e_2^{\prime}=2e_1-e_2 e 2 ′ = 2 e 1 − e 2 。那么v v v 和w w w 可以写成v = − 1 3 e 1 ′ + 2 3 e 2 ′ v=-\dfrac{1}{3}e_1^{\prime}+\dfrac{2}{3}e_2^{\prime} v = − 3 1 e 1 ′ + 3 2 e 2 ′ ,w = 5 3 e 1 ′ − 1 3 e 2 ′ w=\dfrac{5}{3}e_1^{\prime}-\dfrac{1}{3}e_2^{\prime} w = 3 5 e 1 ′ − 3 1 e 2 ′ 。通过计算
v ⊗ w = ( − 1 3 e 1 ′ + 2 3 e 2 ′ ) ⊗ ( 5 3 e 1 ′ − 1 3 e 2 ′ ) = − 5 9 e 1 ′ ⊗ e 1 ′ + 1 9 e 1 ′ ⊗ e 2 ′ + 10 9 e 2 ′ ⊗ e 1 ′ − 2 9 e 2 ′ ⊗ e 2 ′ , v \otimes w=\left(-\frac{1}{3} e_1^{\prime}+\frac{2}{3} e_2^{\prime}\right) \otimes\left(\frac{5}{3} e_1^{\prime}-\frac{1}{3} e_2^{\prime}\right)=-\frac{5}{9} e_1^{\prime} \otimes e_1^{\prime}+\frac{1}{9} e_1^{\prime} \otimes e_2^{\prime}+\frac{10}{9} e_2^{\prime} \otimes e_1^{\prime}-\frac{2}{9} e_2^{\prime} \otimes e_2^{\prime}, v ⊗ w = ( − 3 1 e 1 ′ + 3 2 e 2 ′ ) ⊗ ( 3 5 e 1 ′ − 3 1 e 2 ′ ) = − 9 5 e 1 ′ ⊗ e 1 ′ + 9 1 e 1 ′ ⊗ e 2 ′ + 9 10 e 2 ′ ⊗ e 1 ′ − 9 2 e 2 ′ ⊗ e 2 ′ ,
如果把e 1 ′ e_{1}^{\prime} e 1 ′ 和e 2 ′ e_{2}^{\prime} e 2 ′ 的定义代入最后一个线性组合中的e 1 e_{1} e 1 和e 2 e_{2} e 2 ,展开一切,并合并同类项,就会得到(1.1)右边的和。这表明v ⊗ w v\otimes w v ⊗ w 在R 2 ⊗ R R 2 \mathbb{R}^2\otimes_{\mathbb{R}}\mathbb{R}^{2} R 2 ⊗ R R 2 中是有意义的,与基础的选择无关,尽管证明这一点看起来很困难。
在模的设定中,张量积可以被描述成向量空间的情况一样,但⊗ \otimes ⊗ 应该满足的属性必须是一般的,而不只是在一组基(可能根本不存在)上:对于R R R -模M M M 和N N N ,它们的张量积M ⊗ R N M\otimes_{R}N M ⊗ R N (读作“M M M 张量N N N ”或“R R R 上M M M 张量N N N ”)是一个R R R -模生成的——而不是一组基,但只是一个生成集合(回忆一下,对于R R R -模的一个生成集合,其有限R R R -线性组合填满了模。它们总是存在,因为整个模是一个生成集合。)——通过所有符号m ⊗ n m\otimes n m ⊗ n ,其中m ∈ M m\in M m ∈ M 和n ∈ N n\in N n ∈ N ,而这些符号满足分配律
( m + m ′ ) ⊗ n = m ⊗ n + m ′ ⊗ n , m ⊗ ( n + n ′ ) = m ⊗ n + m ⊗ n ′ . (1.2) (m+m^{\prime})\otimes n=m\otimes n+m^{\prime}\otimes n,\qquad m\otimes(n+n^{\prime})=m\otimes n+m\otimes n^{\prime}.\tag{1.2} ( m + m ′ ) ⊗ n = m ⊗ n + m ′ ⊗ n , m ⊗ ( n + n ′ ) = m ⊗ n + m ⊗ n ′ . ( 1.2 )
另外,乘r ∈ R r\in R r ∈ R 可以放在⊗ \otimes ⊗ 两边:对于m ∈ M m\in M m ∈ M 和n ∈ N n\in N n ∈ N ,
r ( m ⊗ n ) = ( r m ) ⊗ n = m ⊗ ( r n ) . (1.3) r(m\otimes n)=(rm)\otimes n=m\otimes(rn).\tag{1.3} r ( m ⊗ n ) = ( r m ) ⊗ n = m ⊗ ( r n ) . ( 1.3 )
因此,写r m ⊗ n rm\otimes n r m ⊗ n 是明确的:它既是r ( m ⊗ n ) r(m\otimes n) r ( m ⊗ n ) 和( r m ) ⊗ n (rm)\otimes n ( r m ) ⊗ n 。
应将M ⊗ R N M\otimes_{R} N M ⊗ R N 中的公式(1.2)和(1.3)与M ⊕ N M\oplus N M ⊕ N 中的公式进行对比,其中
( m + m ′ , n ) = ( m , n ) + ( m ′ , 0 ) , r ( m , n ) = ( r m , r n ) . \left(m+m^{\prime}, n\right)=(m, n)+\left(m^{\prime}, 0\right), \quad r(m, n)=(r m, r n). ( m + m ′ , n ) = ( m , n ) + ( m ′ , 0 ) , r ( m , n ) = ( r m , r n ) .
在M ⊕ N M\oplus N M ⊕ N 中,元素( m , n ) (m, n) ( m , n ) 分解为( m , 0 ) + ( 0 , n ) (m, 0)+(0, n) ( m , 0 ) + ( 0 , n ) ,但在M ⊗ R N M\otimes_{R} N M ⊗ R N 中,m ⊗ n m \otimes n m ⊗ n 不会分解。虽然M ⊕ N M\oplus N M ⊕ N 中的每个元素都是一对( m , n ) (m, n) ( m , n ) ,但M ⊗ R N M\otimes_{R} N M ⊗ R N 中的元素通常比乘积m ⊗ n m\otimes n m ⊗ n 要多。M ⊗ R N M\otimes_{R} N M ⊗ R N 的一般元素称为张量,是一个R R R -线性组合(与多项式环R [ X , Y ] R[X,Y] R [ X , Y ] 相比,其元素不仅是乘积f ( X ) g ( Y ) f(X)g(Y) f ( X ) g ( Y ) ,而且是这些乘积的和∑ i , j a i j X i Y j \sum\limits_{i, j} a_{i j} X^{i} Y^{j} i , j ∑ a ij X i Y j 。结果得到R [ X , Y ] ≅ R [ X ] ⊗ R R [ Y ] R[X, Y] \cong R[X] \otimes_{R} R[Y] R [ X , Y ] ≅ R [ X ] ⊗ R R [ Y ] 是R R R -模(例 4.12)。)
r 1 ( m 1 ⊗ n 1 ) + r 2 ( m 2 ⊗ n 2 ) + ⋯ + r k ( m k ⊗ n k ) , r_1\left(m_1 \otimes n_1\right)+r_2\left(m_2 \otimes n_2\right)+\cdots+r_k\left(m_k \otimes n_k\right), r 1 ( m 1 ⊗ n 1 ) + r 2 ( m 2 ⊗ n 2 ) + ⋯ + r k ( m k ⊗ n k ) ,
其中,k ⩾ 1 k\geqslant 1 k ⩾ 1 , r i ∈ R r_{i}\in R r i ∈ R , m i ∈ M m_{i}\in M m i ∈ M 和n i ∈ N n_{i}\in N n i ∈ N 。因为r i ( m i ⊗ n i ) = ( r i m i ) ⊗ n i r_{i}(m_{i}\otimes n_{i})=(r_{i}m_{i})\otimes n_{i} r i ( m i ⊗ n i ) = ( r i m i ) ⊗ n i ,我们可以重命名r i m i r_{i}m_{i} r i m i 为m i m_{i} m i 并且记上面的线性组合为一个和
m 1 ⊗ n 1 + m 2 ⊗ n 2 + ⋯ + m k ⊗ n k . (1.4) m_{1}\otimes n_{1}+m_{2}\otimes n_{2}+\cdots+m_{k}\otimes n_{k}.\tag{1.4} m 1 ⊗ n 1 + m 2 ⊗ n 2 + ⋯ + m k ⊗ n k . ( 1.4 )
直和M ⊕ N M\oplus N M ⊕ N 中,相等很容易定义:( m , n ) = ( m ′ , n ′ ) (m,n)=(m^{\prime},n^{\prime}) ( m , n ) = ( m ′ , n ′ ) 当且仅当m = m ′ m=m^{\prime} m = m ′ 和n = n ′ n=n^{\prime} n = n ′ 。什么时候M ⊗ R N M\otimes_{R}N M ⊗ R N 中形式(1.4)的两个求和相等?用我们给出的张量积的描述,很难去说,只有一种情况例外:M M M 和N N N 是自由R R R -模,它们的基分别为{ e i } \{e_{i}\} { e i } 和{ f j } \{f_{j}\} { f j } 。在这种情况下,M ⊗ R N M\otimes_{R}N M ⊗ R N 是自由的,具有基{ e i ⊗ f j } \{e_{i}\otimes f_{j}\} { e i ⊗ f j } ,所以M ⊗ R N M\otimes_{R} N M ⊗ R N 的每个元素都是一个(有限)和∑ i , j c i j e i ⊗ f j \sum\limits_{i,j}c_{ij}e_{i}\otimes f_{j} i , j ∑ c ij e i ⊗ f j ,其中c i j ∈ R c_{ij}\in R c ij ∈ R ,并且只有当相同项系数相等时,两个这样的求和才相等。
当M M M 和N N N 没有基时,为了描述M ⊗ R N M\otimes_{R} N M ⊗ R N 中的相等,我们将使用M ⊗ R N M\otimes_{R} N M ⊗ R N 的泛映射性质。张量积是代数学中性质只有通过泛映射性质才具有一致的意义的第一个概念,即:M ⊗ R N M\otimes_{R} N M ⊗ R N 是泛对象,其将M × N M\times N M × N 上的双线性映射转化为线性映射。正如Jeremy Kun [13]所写,M ⊗ R N M\otimes_{R} N M ⊗ R N 是从M × N M\times N M × N 出来的所有双线性映射的“守门人”。
第2节讨论了双线性(和多线性)映射,第3节介绍了张量积的定义和构造。张量积的例子见第4节。在第5节中,我们将展示张量积如何与模上的其他一些构造相互作用。第6节介绍基扩张这一重要操作,即使用张量积将R R R -模转化为S S S -模,其中S S S 是另一个环。最后,我们将在第7节中介绍物理学中张量的定义。
下面简要介绍一下张量和张量积的历史。张量来自拉丁文tendere,意思是“拉伸”。1822年,Cauchy在连续介质力学中引入了Cauchy应力张量,而1861年,Riemann在几何学中创建了Riemann曲率张量,但他们并没有使用这些名称。1884年,Gibbs [7, 第三章]引入了R 3 \mathbb{R}^{3} R 3 中向量的张量积,并标注为“不定积” (Gibbs选择了这个标记,因为用他的话说,这个积是“两个向量的积的最一般形式”,因为除了双线性之外,它不受任何规律的限制,而任何值得被称为积的运算都必须满足双线性。1844 年,Grassmann创造了一种特殊的张量,称为“开积” [20, 第三章]。},并将其应用于研究物体的应变。他在1886年将不定积扩展到了n n n 维[8]。Voigt在1898年使用张量来描述晶体的应力和应变[25],张量一词在此首次具有现代物理意义(将i \mathbf{i} i , j \mathbf{j} j 和k \mathbf{k} k 写成R 3 \mathbb{R}^3 R 3 的标准基,Gibbs称之为求和a i ⊗ i + b j ⊗ j + c k ⊗ k a\mathbf{i}\otimes \mathbf{i}+b\mathbf{j}\otimes\mathbf{j}+c\mathbf{k}\otimes\mathbf{k} a i ⊗ i + b j ⊗ j + c k ⊗ k ,其中正a a a , b b b 和c c c 的右张量[7],但我不知道这是否对Voigt的术语有影响)。1900年代末,Ricci在几何学中使用了张量,他与Levi-Civita在1901年发表的论文[22](英文版见[15])对Einstein的广义相对论研究至关重要。“张量”一词在物理学和数学中的广泛使用要归功于Einstein;Ricci和Levi-Civita则用“系统”这一平淡的名称来称呼张量。Weyl在群论和量子力学一书中,把向量空间V V V 和W W W 的张量积称为“乘积空间”[27, 第二章第10节],并记为V × W V\times W V × W 。⊗ \otimes ⊗ 这个符号是Murray和von Neumann在1936年[17]为Hilbert空间的张量积(他们写成“直积”)而使用的(感谢Jim Casey让我注意到[17])。Abel群A A A 和B B B 的张量积,名称相同,但写法是A ∘ B A\circ B A ∘ B 而不是A ⊗ Z B A\otimes_{\mathbb{Z}} B A ⊗ Z B 是Whitney [28]在1938年提出的。交换环上模的张量积是Bourbaki [2]于1948年提出的。
2. 双线性映射
我们已经把M ⊗ R N M\otimes_{\mathbb{R}}N M ⊗ R N 的元素描述成符合规则(1.2)和(1.3)的求和(1.4)。我们的意图是,M ⊗ R N M\otimes_{\mathbb{R}}N M ⊗ R N 是满足(1.2)和(1.3)的“最自由”对象。(1.2)和(1.3)的本质是双线性。这意味着什么呢?
一个函数B : M × N → P B: M\times N\rightarrow P B : M × N → P ,其中M M M ,N N N 和P P P 都是R R R -模,如果当另一个参数固定时,它在每个参数中都是线性的(即R R R -线性),则称为双线性 函数:
B ( m 1 + m 2 , n ) = B ( m 1 , n ) + B ( m 2 , n ) , B ( r m , n ) = r B ( m , n ) (2.1) B\left(m_1+m_2, n\right)=B\left(m_1, n\right)+B\left(m_2, n\right),\quad B(r m, n)=r B(m, n)\tag{2.1} B ( m 1 + m 2 , n ) = B ( m 1 , n ) + B ( m 2 , n ) , B ( r m , n ) = r B ( m , n ) ( 2.1 )
B ( m , n 1 + n 2 ) = B ( m , n 1 ) + B ( m , n 2 ) , B ( m , r n ) = r B ( m , n ) (2.2) B\left(m, n_1+n_2\right)=B\left(m, n_1\right)+B\left(m, n_2\right),\quad B(m, r n)=r B(m, n)\tag{2.2} B ( m , n 1 + n 2 ) = B ( m , n 1 ) + B ( m , n 2 ) , B ( m , r n ) = r B ( m , n ) ( 2.2 )
因此,B ( − , n ) B(-, n) B ( − , n ) 对于每个n n n 都是线性映射M → P M\rightarrow P M → P ,而B ( m , − ) B(m,-) B ( m , − ) 对于每个m m m 都是线性映射N → P N \rightarrow P N → P 。特别地,B ( 0 , n ) = 0 B(0,n)=0 B ( 0 , n ) = 0 和B ( m , 0 ) = 0 B(m,0)=0 B ( m , 0 ) = 0 。下面是一些双线性映射的例子:
(1) R n \mathbb{R}^{n} R n 上的点积v ⋅ w \mathbf{v}\cdot\mathbf{w} v ⋅ w 是一个双线性方程R n × R n → R \mathbb{R}^{n}\times\mathbb{R}^{n}\to\mathbb{R} R n × R n → R 。更一般地,对于A ∈ M n ( R ) A\in\mathrm{M}_{n}(\mathbb{R}) A ∈ M n ( R ) ,函数⟨ v , w ⟩ = v ⋅ A w \langle\mathbf{v},\mathbf{w}\rangle=\mathbf{v}\cdot A\mathbf{w} ⟨ v , w ⟩ = v ⋅ A w 是一个双线性映射R n × R n → R \mathbb{R}^{n}\times\mathbb{R}^{n}\to\mathbb{R} R n × R n → R 。
(2) 矩阵乘法M m , n ( R ) × M n , p ( R ) → M m , p ( R ) \mathrm{M}_{m,n}(\mathbb{R})\times\mathrm{M}_{n,p}(\mathbb{R})\to\mathrm{M}_{m,p}(\mathbb{R}) M m , n ( R ) × M n , p ( R ) → M m , p ( R ) 是双线性的。点积是特殊情况m = p = 1 m=p=1 m = p = 1 (记v ⋅ w \mathbf{v}\cdot\mathbf{w} v ⋅ w 为v ⊤ w \mathbf{v}^{\top}\mathbf{w} v ⊤ w )。
(3) 叉积v × w \mathbf{v}\times\mathbf{w} v × w 是双线性函数R 3 × R 3 → R 3 \mathbb{R}^{3}\times\mathbb{R}^{3}\to\mathbb{R}^{3} R 3 × R 3 → R 3 。
(4) 行列式det : M 2 ( R ) → R \det:\mathrm{M}_{2}(\mathbb{R})\to\mathbb{R} det : M 2 ( R ) → R 是矩阵列的一个双线性函数。
(5) 对于一个R R R -模M M M ,标量乘法R × M → M R\times M\to M R × M → M 是双线性的。
(6) 乘法R × R → R R\times R\to R R × R → R 是双线性的。
(7) 设M M M 的对偶模为M ∨ = Hom R ( M , R ) M^{\vee}=\operatorname{Hom}_{R}(M,R) M ∨ = Hom R ( M , R ) . 对偶配对M ∨ × M → R M^{\vee}\times M\to R M ∨ × M → R 由( φ , m ) ↦ φ ( m ) (\varphi,m)\mapsto \varphi(m) ( φ , m ) ↦ φ ( m ) 给出是双线性的。
(8) 对于φ ∈ M ∨ \varphi\in M^{\vee} φ ∈ M ∨ 和ψ ∈ N ∨ \psi\in N^{\vee} ψ ∈ N ∨ ,映射M × N → R M\times N\to R M × N → R ,其中( m , n ) ↦ φ ( m ) ψ ( n ) (m,n)\mapsto \varphi(m)\psi(n) ( m , n ) ↦ φ ( m ) ψ ( n ) 是双线性的。
(9) 如果M × N → B P M\times N\xrightarrow{B} P M × N B P 是双线性的并且P → L Q P\xrightarrow{L}Q P L Q 是线性的,复合M × N → L ∘ B Q M\times N\xrightarrow{L\circ B}Q M × N L ∘ B Q 是双线性的。(这是非常重要的例子。检验它!)
(10) 从第1节,表达式m ⊗ n m\otimes n m ⊗ n 应该是m m m 和n n n 中的双线性的。即:我们想要函数M × N → M ⊗ R N M\times N\to M\otimes_{R}N M × N → M ⊗ R N 由( m , n ) ↦ m ⊗ n (m,n)\mapsto m\otimes n ( m , n ) ↦ m ⊗ n 给出是双线性的。
下面是几个两个参数的函数不 是双线性的:
(1) 对于R R R -模M M M 来说,加法M × M → M M \times M \rightarrow M M × M → M ,其中( m , m ′ ) ↦ m + m ′ \left(m, m^{\prime}\right) \mapsto m+m^{\prime} ( m , m ′ ) ↦ m + m ′ 通常不是双线性的:当m ′ m^{\prime} m ′ 固定时,它通常在m m m 中不是相加的(即:在一般情况下,( m 1 + m 2 ) + m ′ ≠ \left(m_1+m_2\right)+m^{\prime} \neq ( m 1 + m 2 ) + m ′ = ( m 1 + m ′ ) + ( m 2 + m ′ ) \left(m_1+m^{\prime}\right)+\left(m_2+m^{\prime}\right) ( m 1 + m ′ ) + ( m 2 + m ′ ) ),当m m m 固定时,它在m ′ m^{\prime} m ′ 中也不是相加的。
(2) 对于φ ∈ M ∨ \varphi\in M^{\vee} φ ∈ M ∨ 和ψ ∈ N ∨ \psi\in N^{\vee} ψ ∈ N ∨ ,求和M × N → R M\times N\to R M × N → R 由( m , n ) ↦ φ ( m ) + ψ ( n ) (m,n)\mapsto \varphi(m)+\psi(n) ( m , n ) ↦ φ ( m ) + ψ ( n ) 给出通常不是双线性的。
(3) 将M n ( C ) \mathrm{M}_{n}(\mathbb{C}) M n ( C ) 视为一个C \mathbb{C} C 向量空间。函数M n ( C ) × M n ( C ) → M n ( C ) \mathrm{M}_{n}(\mathbb{C})\times \mathrm{M}_{n}(\mathbb{C})\rightarrow \mathrm{M}_{n}(\mathbb{C}) M n ( C ) × M n ( C ) → M n ( C ) 由( A , B ) ↦ A B ‾ (A, B) \mapsto A \overline{B} ( A , B ) ↦ A B 给出不是双线性的。它是双可加的(即当另一个分量固定时,每个分量都是可加的),但是看标量乘法在第二个分量中是如何表现的:对于z ∈ C z\in\mathbb{C} z ∈ C 中,A z B ‾ A\overline{zB} A z B 是z ‾ ( A B ‾ ) \overline{z}(A\overline{B}) z ( A B ) 而不是z ( A B ‾ ) z(A\overline{B}) z ( A B ) 。
为什么要把双线性函数写成B : M × N → P B: M\times N\rightarrow P B : M × N → P ,而不是B : M ⊕ N → P B: M\oplus N\rightarrow P B : M ⊕ N → P ?因为我们没有 在域上使用模结构。这就是为什么对于加法R × R → R R\times R\rightarrow R R × R → R 和乘法R × R → R R\times R\rightarrow R R × R → R ,我们可以把加法写成R ⊕ R → R R\oplus R\rightarrow R R ⊕ R → R (它在R ⊕ R R\oplus R R ⊕ R 上是线性的),但对于乘法我们不会这么写:它是双线性的,但不是线性的,例如在一般情况下,( r + r ′ ) ( s + s ′ ) ≠ r s + r ′ s ′ \left(r+r^{\prime}\right)\left(s+s^{\prime}\right) \neq r s+r^{\prime} s^{\prime} ( r + r ′ ) ( s + s ′ ) = rs + r ′ s ′ 。线性函数是广义的加法,而双线性函数是广义的乘法。不要混淆M × N M\times N M × N 上的双线性函数和M ⊕ N M\oplus N M ⊕ N 上的线性函数。
对于R R R -模M 1 , … , M k M_1, \ldots, M_k M 1 , … , M k ,函数f : M 1 × ⋯ × M k → M f: M_1 \times \cdots \times M_k \rightarrow M f : M 1 × ⋯ × M k → M 被称为多线性 或 k k k -多线性 ,如果当其它坐标是固定的,f ( m 1 , … , m k ) f\left(m_1, \ldots, m_k\right) f ( m 1 , … , m k ) 在每个m i m_i m i 中是线性的(即:R R R -线性)。因此,2 2 2 -多线性意味着双线性。下面是一些多线性函数:
(1) 三重积u ⋅ ( v × w ) \mathbf{u}\cdot(\mathbf{v}\times\mathbf{w}) u ⋅ ( v × w ) 是三线性的R 3 × R 3 × R 3 → R \mathbb{R}^{3}\times\mathbb{R}^{3}\times\mathbb{R}^{3}\to\mathbb{R} R 3 × R 3 × R 3 → R 。
(2) 函数f ( u , v , w ) = ( u ⋅ v ) w f(\mathbf{u},\mathbf{v},\mathbf{w})=(\mathbf{u}\cdot\mathbf{v})\mathbf{w} f ( u , v , w ) = ( u ⋅ v ) w 是三线性的R n × R n × R n → R n \mathbb{R}^{n}\times\mathbb{R}^{n}\times\mathbb{R}^{n}\to\mathbb{R}^{n} R n × R n × R n → R n 。
(4) 如果B : M × N → P B: M\times N\to P B : M × N → P 和B ′ : P × Q → T B^{\prime}: P\times Q\to T B ′ : P × Q → T 是双线性的,则M × N × Q → T M\times N\times Q\to T M × N × Q → T 由( m , n , q ) ↦ B ′ ( B ( m , n ) , q ) (m,n,q)\mapsto B^{\prime}(B(m,n),q) ( m , n , q ) ↦ B ′ ( B ( m , n ) , q ) 是三线性。
(5) 有k k k 个因子的乘法R × ⋯ × R → R R\times\cdots\times R\to R R × ⋯ × R → R 是k k k -重线性的。
(6) 行列式det : M n ( R ) → R \det: \mathrm{M}_{n}(R)\to R det : M n ( R ) → R ,作为矩阵列的一个函数,是n n n -重线性的。
(7) 如果M 1 × ⋯ × M k → f M M_{1}\times\cdots\times M_{k}\xrightarrow{f} M M 1 × ⋯ × M k f M 是k k k -重线性的并且M → L N M\xrightarrow{L}N M L N 是线性的,则复合M 1 × ⋯ × M k → L ∘ f N M_{1}\times\cdots\times M_{k}\xrightarrow{L\circ f}N M 1 × ⋯ × M k L ∘ f N 是k k k -重线性的。
(8) 对于f : R m → R n f: \mathbb{R}^{m}\to\mathbb{R}^{n} f : R m → R n 和x ∈ R m \mathbf{x}\in\mathbb{R}^{m} x ∈ R m ,k k k 阶导数( D k f ) x : ( R m ) k → R k (D^{k}f)_{\mathbf{x}}: (\mathbb{R}^{m})^{k}\to\mathbb{R}^{k} ( D k f ) x : ( R m ) k → R k 是k k k -重线性的。(如果你不熟悉一阶导数作为线性映射,无视掉它)。
在函数加法和R R R -缩放条件下,R R R -线性映射M → N M\to N M → N 构成一个R R R -模Hom R ( M , N ) \operatorname{Hom}_{R}(M, N) Hom R ( M , N ) 。R R R 双线性映射M × N → P M \times N \to P M × N → P 以同样的方式构成一个R R R -模Bil R ( M , N ; P ) \operatorname{Bil}_R(M,N;P) Bil R ( M , N ; P ) 。然而,与线性映射不同,双线性映射缺少一些特征:
(1) 双线性映射M × N → P M\times N \to P M × N → P 没有“核”,因为M × N M \times N M × N 不是一个模。
(2) 双线性映射M × N → P M\times N\to P M × N → P 的像不必构成子模。
例 2.1 定义B : R n × R n → M n ( R ) B: \mathbb{R}^{n}\times\mathbb{R}^{n}\rightarrow\mathrm{M}_{n}(\mathbb{R}) B : R n × R n → M n ( R ) ,由B ( v , w ) = v w ⊤ B(\mathbf{v},\mathbf{w})=\mathbf{v}\mathbf{w}^{\top} B ( v , w ) = v w ⊤ ,其中v \mathbf{v} v 和w \mathbf{w} w 是列向量,所以v w ⊤ \mathbf{v}\mathbf{w}^{\top} v w ⊤ 是n × n n\times n n × n 。例如,当n = 2 n=2 n = 2 时,
B ( ( a 1 a 2 ) , ( b 1 b 2 ) ) = ( a 1 a 2 ) ( b 1 , b 2 ) = ( a 1 b 1 a 1 b 2 a 2 b 1 a 2 b 2 ) B\left(\binom{a_1}{a_2},\binom{b_1}{b_2}\right)=\binom{a_1}{a_2}\left(b_1, b_2\right)=\begin{pmatrix}
a_1 b_1 & a_1 b_2\\
a_2 b_1 & a_2 b_2
\end{pmatrix} B ( ( a 2 a 1 ) , ( b 2 b 1 ) ) = ( a 2 a 1 ) ( b 1 , b 2 ) = ( a 1 b 1 a 2 b 1 a 1 b 2 a 2 b 2 )
一般来说,如果v = ∑ a i e i \mathbf{v}=\sum a_{i} e_{i} v = ∑ a i e i 和w = ∑ b j e j \mathbf{w}=\sum b_{j} e_{j} w = ∑ b j e j 是用R n \mathbb{R}^{n} R n 的标准基表示的,那么v w ⊤ \mathbf{v} \mathbf{w}^{\top} v w ⊤ 就是n × n n\times n n × n 矩阵( a i b j ) \left(a_{i}b_{j}\right) ( a i b j ) 。这个矩阵在v \mathbf{v} v 和w \mathbf{w} w 中是R \mathbb{R} R -双线性的,所以B B B 是双线性的。对于n ⩾ 2 n\geqslant 2 n ⩾ 2 ,B B B 的像在加法运算下是不封闭的,所以它不是M n ( R ) \mathrm{M}_n(\mathbb{R}) M n ( R ) 的子空间。为什么呢?每个矩阵B ( v , w ) B(\mathbf{v},\mathbf{w}) B ( v , w ) 的秩都是1 1 1 (或0 0 0 ),因为它的列是v \mathbf{v} v 的标量倍数。矩阵
B ( e 1 , e 1 ) + B ( e 2 , e 2 ) = e 1 e 1 ⊤ + e 2 e 2 ⊤ = ( 1 0 ⋯ 0 0 1 ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ 0 ) B\left(e_1, e_1\right)+B\left(e_2, e_2\right)=e_1 e_1^{\top}+e_2 e_2^{\top}=\begin{pmatrix}
1 & 0 & \cdots & 0 \\
0 & 1 & \cdots & 0 \\
\vdots & \vdots & \ddots & \vdots \\
0 & 0 & \cdots & 0
\end{pmatrix} B ( e 1 , e 1 ) + B ( e 2 , e 2 ) = e 1 e 1 ⊤ + e 2 e 2 ⊤ = ⎝ ⎛ 1 0 ⋮ 0 0 1 ⋮ 0 ⋯ ⋯ ⋱ ⋯ 0 0 ⋮ 0 ⎠ ⎞
有一个二维图像,所以对于R \mathbb{R} R 中的所有v \mathbf{v} v 和w \mathbf{w} w ,B ( e 1 , e 1 ) + B ( e 2 , e 2 ) ≠ B ( v , w ) B\left(e_1, e_1\right)+B\left(e_2, e_2\right) \neq B(\mathbf{v}, \mathbf{w}) B ( e 1 , e 1 ) + B ( e 2 , e 2 ) = B ( v , w ) 。(类似地,∑ i = 1 n B ( e i , e i ) \sum\limits_{i=1}^{n} B\left(e_i, e_i\right) i = 1 ∑ n B ( e i , e i ) 是n × n n \times n n × n 的单位矩阵,其形式不是B ( v , w ) B(\mathbf{v},\mathbf{w}) B ( v , w ) )。
3. 张量积的构造
一个双线性映射M × N → P M\times N\to P M × N → P 到一个R R R -模P P P 可以与线性映射P → Q P\to Q P → Q 复合得到一个映射M × N → Q M\times N\to Q M × N → Q ,其是双线性的。
我们将构造M M M 与N N N 的张量积为泛映射问题的解:找到一个R R R -模T T T 和双线性映射b : M × N → T b: M\times N\to T b : M × N → T ,使得M × N M\times N M × N 上的每一个双线性映射是双线性映射b b b 和T T T 之外唯一的一个线性映射的复合。
它类似于群G G G 的Abel化G / [ G , G ] G/[G,G] G / [ G , G ] 的泛映射性质:具有Abel群A A A 的同态G → A G\to A G → A 与同态G / [ G , G ] → A G/[G, G]\to A G / [ G , G ] → A 是“相同的”,因为每个同态f : G → A f: G\to A f : G → A 都是正则同态π : G / [ G , G ] \pi: G/[G, G] π : G / [ G , G ] 与唯一同态f ~ : G / [ G , G ] → A \widetilde{f}: G/[G, G]\to A f : G / [ G , G ] → A 。
定义 3.1 张量积 M ⊗ R N M\otimes_{R} N M ⊗ R N 是一个配备了双线性映射M × N → ⊗ M ⊗ R N M\times N\xrightarrow{\otimes}M\otimes_{R} N M × N ⊗ M ⊗ R N 的R R R -模,使得对于每个双线性映射M × N → B P M\times N \xrightarrow{B} P M × N B P 存在一个唯一的线性映射M ⊗ R N → L P M\otimes_{R} N \xrightarrow{L} P M ⊗ R N L P 使得下图交换
虽然G / [ G , G ] G /[G,G] G / [ G , G ] 的泛映射性质中的函数都是群同态(从G G G 和G / [ G , G ] G/[G,G] G / [ G , G ] 出来),但M ⊗ R N M\otimes_{R} N M ⊗ R N 的泛映射性质中的函数并不都是同一类型的:从M × N M\times N M × N 出来的函数是双线性的,而从M ⊗ R N M\otimes_{R} N M ⊗ R N 出来的函数是线性的:从M × N M\times N M × N 出来的双线性映射变成从M ⊗ R N M\otimes_{R}N M ⊗ R N 出来的线性映射。
张量积的定义不仅涉及一个新模M ⊗ R N M \otimes_{R} N M ⊗ R N ,还涉及一个特殊的双线性映射,即⊗ : M × N → M ⊗ R N \otimes: M\times N\to M\otimes_{R} N ⊗ : M × N → M ⊗ R N 。这类似于Abel化G / [ G , G ] G/[G,G] G / [ G , G ] 的泛映射性质,它不仅需要G / [ G , G ] G/[G,G] G / [ G , G ] ,还需要同态π : G → G / [ G , G ] \pi: G\to G/[G,G] π : G → G / [ G , G ] ,所有从G G G 到Abel群系数的同态都通过它。泛映射性质要求固定这些额外信息。
在建立张量积之前,我们先来证明任意两个张量积本质上是相同的。令R R R -模T T T 和T ′ T^{\prime} T ′ ,以及双线性映射M × N → b T M\times N \xrightarrow{b} T M × N b T 和M × N → b ′ T ′ M \times N \xrightarrow{b^{\prime}} T^{\prime} M × N b ′ T ′ 满足张量积的泛映射性质。由M × N → b T M\times N\xrightarrow{b} T M × N b T 的泛性质,映射M × N → b ′ T ′ M\times N\xrightarrow{b^{\prime}} T^{\prime} M × N b ′ T ′ 可唯一地因子分解通过T T T :存在唯一的线性映射f : T → T ′ f: T\to T^{\prime} f : T → T ′ 使得
交换。由M × N → b ′ T M\times N\xrightarrow{b^{\prime}} T M × N b ′ T 的泛性质,映射M × N → b T ′ M\times N\xrightarrow{b} T^{\prime} M × N b T ′ 可唯一地因子分解通过T ′ T^{\prime} T ′ :存在唯一的线性映射f ′ : T ′ → T f^{\prime}: T^{\prime}\to T f ′ : T ′ → T 使得
交换。我们结合(3.1)和(3.2)到交换图
去除中间,我们得到交换图
从( T , b ) (T,b) ( T , b ) 的泛性质,一个唯一的线性映射T → T T\to T T → T 符合(3.3)。恒等映射起作用,所以f ′ ∘ f = i d T f^{\prime}\circ f=\mathrm{id}_{T} f ′ ∘ f = id T 。类似地,f ∘ f ′ = i d T ′ f\circ f^{\prime}=\mathrm{id}_{T^{\prime}} f ∘ f ′ = id T ′ 通过把(3.1)和(3.2)按另一种顺序叠加而成。因此,T T T 和T ′ T^{\prime} T ′ 通过f f f 和f ∘ b = b ′ f\circ b=b^{\prime} f ∘ b = b ′ 是同构R R R -模,其意味着f f f 将b b b 与b ′ b^{\prime} b ′ 等同起来。所以M M M 和N N N 的两个张量积可以通过与其相容(泛映射性质不是针对模块T T T 本身,而是针对配对( T , b ) (T,b) ( T , b ) 。)的M × N M\times N M × N 上的特定的双线性映射被唯一的等同。
定理 3.2 M M M 和N N N 的张量积存在。
证明:
4. 张量积的例子
5. 张量积的一般性质
6. 基扩张
7. 物理中的张量
参考文献
[1] D. V. Alekseevsky, A. M. Vinogradov and V. V. Lychagin, “Basic ideas and concepts of differential geometry, Geometry I”, Encycl. Math. Sci. 28, Springer-Verlag, Berlin, 1991.
[2] N. Bourbaki, “Livre II Algèbre Chapitre III (état 4) Algèbre Multilinéaire”, http://archives-bourbaki.ahp-numerique.fr/files/original/97a9fed708bdde4dc55547ab5a8ff943.pdf .
[3] S. Carroll, “Spacetime and Geometry: An Introduction to General Relativity”, Benjamin Cummings, 2003.
[4] A. Einstein, The Foundation of the General Theory of Relativity (English translation), pp. 146–199 in “The Collected Papers of Albert Einstein, Vol. 6: The Berlin Years: Writings, 1914-1917,” Princeton Univ. Press, Princeton, 1997. URL https://einsteinpapers.press.princeton.edu/vol6-trans/158 .
[5] D. Eisenbud and J. Harris, “The Geometry of Schemes”, Springer-Verlag, New York, 2000.
[6] R. P. Feynman, Chap. 31 of “The Feynman Letures on Physics, Vol. II,” Millennium edition.
[7] J. W. Gibbs, “Elements of Vector Analysis Arranged for the Use of Students in Physics,” Tuttle, More-house & Taylor, New Haven, 1884. https://archive.org/details/elementsvectora00gibb .
[8] J. W. Gibbs, “On Multiple Algebra”, Proceedings of the American Association for the Advancement of Science, 35 (1886). URL http://archive.org/details/onmultiplealgeb00gibbgoog .
[9] R. Grone, “Decomposable Tensors as a Quadratic Variety”, Proc. Amer. Math. Soc. 64 (1977), 227–230.
[10] P. Halmos, “Finite-Dimensional Vector Spaces,” Springer-Verlag, New York, 1974.
[11] J. Håstad, “Tensor rank is NP-complete”, J. Algorithms 11 (1990), 644–654.
[12] C. J. Hillar and L-K. Lim, “Most tensor problems are NP-hard”, J. ACM 60 (2013), Art. 45, 39 pp.
[13] J. Kun, “How to Conquer Tensorphobia”, https://jeremykun.com/2014/01/17/how-to-conquer-tensorphobia/ .
[14] J. M. Lee, “Manifolds and Differential Geometry,” Amer. Math. Soc., Providence, 2009.
[15] R. Hermann, “Ricci and Levi-Civita’s Tensor Analysis Paper” Math Sci Press, Brookline, 1975.
[16] C. W. Misner, K. S. Thorne, and J. A. Wheeler, “Gravitation,” W. H. Freeman and Co., San Francisco, 1973.
[17] F. J. Murray and J. von Neumann, “On Rings of Operators”, Annals Math. 37 (1936), 116–229.
[18] B. O’Neill, “Semi-Riemannian Geometry,” Academic Press, New York, 1983.
[19] B. Osgood, Chapter 8 of “The Fourier Transform and its Applications”, http://see.stanford.edu/materials/lsoftaee261/chap8.pdf .
[20] H-J Petsche, “Hermann Grassmann——Biography,” Birkhäuser, Basel, 2009.
[21] G. Y. Rainich, “Tensor analysis without coordinates”, Proc. Natl. Acad. Sci. USA 9 (1923), 179-183.
[22] G. Ricci, T. Levi-Civita, “Méthodes de Calcul Différentiel Absolu et Leurs Applications”, Math. Annalen 54 (1901), 125–201.
[23] Y. Shitov, “How hard is the tensor rank?”, https://arxiv.org/pdf/1611.01559.pdf .
[24] F. J. Temple, “Cartesian Tensors,” Wiley, New York, 1960.
[25] W. Voigt, “Die fundamentalen physikalischen Eigenschaften der Krystalle in elementarer Darstellung”, Verlag von Veit & Comp., Leipzig, 1898.
[26] R. Wald, “General Relativity,” Univ. Chicago Press, Chicago, 1984.
[27] H. Weyl, “The Theory of Groups and Quantum Mechanics,” E. P. Dutton, New York, 1932.
[28] H. Whitney, “Tensor Products of Abelian Groups”, Duke Math. Journal 4 (1938), 495–528.
[29] H. Whitney, Moscow 1935: topology moving toward America, pp. 97–117 in “A Century of Mathematics in America, Part I,” Amer. Math. Soc., Providence, 1988.