【高等代数】7. 矩阵(2)

2021/7/18 23:35:11

本文主要是介绍【高等代数】7. 矩阵(2),对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

【高等代数】7. 矩阵(2)

目录
  • 【高等代数】7. 矩阵(2)
    • 3.3 可逆矩阵
    • 3.4 矩阵的秩与相抵
    • 3.5 一些例子

3.3 可逆矩阵

前面类比了方阵和数,对方阵引入了单位元\(I\)、幂\(A^{k}\)、多项式\(f(A)\),本节考虑可类比实数中倒数的运算——矩阵求逆\(A^{-1}\)。

  • 可逆与逆矩阵:给定方阵\(A\),如果存在同型方阵\(B\),使\(AB=BA=I\),则称矩阵\(A\)是可逆的,矩阵\(B\)称为矩阵\(A\)的逆矩阵,记作\(A^{-1}\)。

需要注意的是,并不一定所有方阵都可逆,这也说明方阵不能和数域完全等同,以下定理给出了方阵可逆的充要条件:行列式不为\(0\)。

  • 定理:\(n\)阶方阵\(A\in F^{n\times n}\)可逆的充要条件是\(\det A\ne 0\),这一条件也称为\(A\)非奇异(非退化)。

    必要性:已知\(\det I=1\),若\(\det A=0\),则对任何\(B\),\(\det AB=0\ne 1\),即\(AB\ne I\)。

    充分性:设\(A=(a_{ij})\),记\(\det A\)的元素\(a_{ij}\)的代数余子式为\(A_{ij}\),取\(A^*=(A_{ij})^{\intercal}\),则因为

    \[\sum_{j=1}^{n}a_{ij}A_{kj}=\delta_{ik}\det A, \]

    我们有

    \[A\left(\frac{1}{\det A}A^* \right)=\left(\frac{1}{\det A}A^* \right)A=I_{(n)}, \]

    这就得到了\(A^{-1}=\dfrac{1}{\det A}A^*\)。

这里不仅得到了\(A\)可逆的充要条件,还在\(A\)可逆即\(\det A\ne 0\)的情况下直接构造出了一个\(A^{-1}\)。

  • 附属方阵:称各元素对应代数余子式的转置矩阵为\(A\)的附属矩阵(也称伴随矩阵),记作\(A^*\)。有

    \[AA^{*}=\det AI. \]

需要考虑,一个矩阵的可逆矩阵是唯一的,因为如果\(B,C\)都是\(A\)的逆矩阵,那么\(B=BAC=C\)。关于逆矩阵,有以下性质:

  1. 若\(A\)可逆,则\(A^{-1}\)可逆,且\((A^{-1})^{-1}=A\)。

  2. 穿脱原理:若\(A,B\)可逆,则\(AB\)可逆且\((AB)^{-1}=B^{-1}A^{-1}\)。推广至有限个可逆矩阵的乘积,有

    \[(A_1A_2\cdots A_k)^{-1}=A_k^{-1}\cdots A_2^{-1}A_1^{-1}. \]

  3. \((\lambda A)^{-1}=\lambda^{-1}A^{-1}\)。

  4. 转置可逆:\((A^{\intercal})^{-1}=(A^{-1})^{\intercal}\)。

  5. \(\det A^{-1}=(\det A)^{-1}\),即\(A^{-1}\)的行列式与\(A\)的行列式互为倒数。

  6. 若\(m\)阶方阵\(A\)与\(n\)阶方阵\(B\)可逆,则\(m+n\)阶方阵\(\mathrm{diag}(A,B)\)可逆,且\((\mathrm{diag}(A,B))^{-1}=\mathrm{diag}(A^{-1},B^{-1})\)。

下面给出一些分块矩阵与逆矩阵的结合应用,即Schur公式。设\(A\in F^{r\times r}\),\(B\in F^{r\times (n-r)}\),\(C\in F^{(n-r)\times r}\),\(D\in F^{(n-r)\times(b-r)}\),且方阵\(A\)可逆,则

  1. \[\begin{pmatrix} I_{(r)} & 0 \\ -CA^{-1} & I_{(n-r)} \end{pmatrix}\begin{pmatrix} A & B \\ C & D \end{pmatrix}=\begin{pmatrix} A & B \\ 0 & D-CA^{-1}B \end{pmatrix}. \]

  2. \[\begin{pmatrix} A & B \\ C & D \end{pmatrix}\begin{pmatrix} I_{(r)} & -A^{-1}B \\ 0 & I_{(n-r)} \end{pmatrix}=\begin{pmatrix} A & 0 \\ C & D-CA^{-1}B \end{pmatrix}. \]

  3. \[\begin{pmatrix} I_{(r)} & 0 \\ -CA^{-1} & I_{(n-r)} \end{pmatrix}\begin{pmatrix} A & B \\ C & D \end{pmatrix}\begin{pmatrix} I_{(r)} & -A^{-1}B \\ 0 & I_{(n-r)} \end{pmatrix}=\begin{pmatrix} A & 0 \\ 0 & D-CA^{-1}B. \end{pmatrix} \]

这三个公式分别对分块阵作变换,使其变为分块三角阵和分块对角阵,而我们知道,分块对角阵和分块三角阵是很容易求行列式的。

例:设\(A,B,C,D\in F^{n\times n}\)以及\(AC=CA\),求证:

\[\det \begin{pmatrix} A & B \\ C & D \end{pmatrix}=\det(AD-CB). \]

由Schur公式,

\[\det\begin{pmatrix} A & B \\ C & D \end{pmatrix}=\det\begin{pmatrix} A & B \\ 0 & D-CA^{-1}B \end{pmatrix}=\det (AD-ACA^{-1}B)=\det (AD-CB). \]


例:设\(A\in F^{m\times n}\),\(B\in F^{n\times m}\),求证:

\[\det(I_{(m)}-AB)=\det(I_{(n)}-BA). \]

构造\(m+n\)阶方阵\(\pmatrix{I_{(m)} & A \\ B & I_{(n)}}\),有

\[\begin{pmatrix} I_{(m)} & 0 \\ -B & I_{(n)} \end{pmatrix}\begin{pmatrix} I_{(m)} & A \\ B & I_{(n)} \end{pmatrix}=\begin{pmatrix} I_{(m)} & A \\ 0 & I_{(n)}-BA \end{pmatrix},\\ \begin{pmatrix} I_{(m)} & -A \\ 0 & I_{(n)} \end{pmatrix}\begin{pmatrix} I_{(m)} & A \\ B & I_{(n)} \end{pmatrix}=\begin{pmatrix} I_{(m)}-AB & 0 \\ B & I_{(n)} \end{pmatrix}. \]

两边同时取行列式,就得到所求结果。


3.4 矩阵的秩与相抵

本节从矩阵的行向量空间、列向量空间角度来呈现矩阵的另一个维度。

  • 矩阵的秩:\(m\times n\)矩阵\(A\)的所有非零子式的最高阶数称为矩阵\(A\)的秩,记作\(\mathrm{rank}(A)\)。

    \[\mathrm{rank}(A)\le \min\{m,n\}. \]

  • 满秩:对\(n\)阶方阵\(A\),如果\(\mathrm{rank}(A)=n\),则称\(A\)为满秩的,否则称之为降秩的。

    \[\mathrm{rank}(A)=n\Leftrightarrow \det(A)\ne 0. \]

  • 行满秩:对\(m\times n\)矩阵\(A\),如果\(\mathrm{rank}(A)=m\),则称\(A\)为行满秩的。

  • 列满秩:对\(m\times n\)矩阵\(A\),如果\(\mathrm{rank}(A)=n\),则称\(A\)为列满秩的。

关于矩阵乘积的秩,有以下定理:

  1. 设\(A\in F^{m\times n}\),\(B\in F^{n\times p}\),则

    \[\mathrm{rank}(AB)\le \min\{\mathrm{rank}(A),\mathrm{rank}(B)\}. \]

    设\(\mathrm{rank}(A)=r\),\(\mathrm{rank}(B)=s\),\(AB=C\)。任取\(C\)的\(r+1\)阶子式\(C\pmatrix{i_1,i_2,\cdots,i_{r+1}\\j_1,j_2,\cdots,j_{r+1}}\),由Binet-Cauchy公式,

    \[C\pmatrix{i_1,i_2,\cdots,i_{r+1}\\j_1,j_2,\cdots,j_{r+1}}=\sum_{1\le k_1<\cdots<k_{r+1}\le n}A\pmatrix{i_1,i_2,\cdots,i_{r+1}\\k_1,k_2,\cdots,k_{r+1}}\pmatrix{k_1,k_2,\cdots,k_{r+1}\\j_1,j_2,\cdots,j_{r+1}}. \]

    因为\(A\)的每个\(r+1\)阶子式都为\(0\),所以\(C\pmatrix{i_1,i_2,\cdots,i_{r+1}\\j_1,j_2,\cdots,j_{r+1}}=0\),这说明\(\mathrm{rank}(C)\le r\),同理可证\(\mathrm{rank}(C)\le s\)。

  2. 设\(A\in F^{m\times n}\),\(P\in F^{m\times m}\),\(Q\in F^{n\times n}\)且\(P,Q\)都可逆,则

    \[\mathrm{rank}(PAQ)=\mathrm{rank}(PA)=\mathrm{rank}(AQ)=\mathrm{rank}(A). \]

    即可逆矩阵不改变矩阵的秩。

    由定理\(1\),

    \[\mathrm{rank}(A)=\mathrm{rank}(P^{-1}PA)\le \mathrm{rank}(PA)\le \mathrm{rank}(A), \]

    其他可类似证明。

可逆矩阵不改变矩阵的秩,有一类特殊的可逆矩阵十分重要,它们代表一类基础的变换——初等变换。

  • 初等变换:对矩阵\(A\)试下如下的行或列变换:

    1. 对换矩阵\(A\)的某两行(或列);
    2. 矩阵\(A\)的某一行(或列)非零倍加到另一行(或列)上;
    3. 矩阵\(A\)的某一行(或列)乘以某个非零倍数。

    这些变换称为对矩阵\(A\)的初等行(或列)变换,简称初等变换。

  • 初等方阵:与初等变换相对应的方阵称为初等方阵,每一种初等变换对应一个初等方阵。

    1. \(P_{ij}\):将单位阵的第\(i\)行和第\(j\)行互换形成的方阵,称为置换方阵。
    2. \(Q_{ij}(a)\):将单位阵的第\((i,j)\)元换成\(a\)形成的方阵,代表倍加。
    3. \(P_i(b)\):将单位阵第\((i,i)\)元乘以\(b\)形成的方阵,代表倍乘。

显见初等方阵都是可逆的:\(P_{ij}^{-1}=P_{ji}\),\(Q_{ij}(a)^{-1}=Q_{ij}(-a)\),\(P_i(b)^{-1}=P_i(b^{-1})\)。事实上,用这些矩阵左乘矩阵\(A\)代表对矩阵\(A\)实行对应的行变换,右乘矩阵\(A\)代表对矩阵\(A\)实行对应的列变换。因初等方阵都是可逆的,所以初等变换不改变矩阵的秩。

  • 初等变换等秩:对矩阵的初等变换不改变矩阵的秩。

现在我们给出本节的主要结论:

  • 等秩变换:设\(m\times n\)矩阵\(A\)的秩为\(r\),则矩阵\(A\)可以经过有限次初等变换化为

    \[\begin{pmatrix} I_{(r)} & 0 \\ 0 & 0 \end{pmatrix}. \]

  • 推论:设\(A\in F^{m\times n}\)且\(\mathrm{rank}(A)=r\),则存在可逆的\(P\in F^{m\times m}\)和\(Q\in F^{n\times n}\)使得

    \[PAQ=\begin{pmatrix} I_{(r)} & 0 \\ 0 & 0 \end{pmatrix}. \]

    这里\(P\)代表对\(A\)执行的行变换总和,\(Q\)代表对\(A\)执行的列变换总和。

实际上,初等变换也完全刻画了可逆矩阵的性质,在下面的定理之后,我们将得出一个用于求矩阵的逆的方法。

  • 可逆矩阵的性质:\(n\)阶方阵\(A\)可逆,等价于\(A\)可以表现为有限个初等方阵的乘积。

    必要性:因\(A\)可逆,故\(\mathrm{rank}(A)=n\),从而存在初等矩阵\(P_i\)和\(Q_j\)使得

    \[P_1P_2\cdots P_sAQ_1Q_2\cdots Q_t=I_{(n)}, \]

    因此

    \[A=P_s^{-1}P_{s-1}^{-1}\cdots P_1^{-1}Q_t^{-1}Q_{t-1}^{-1}\cdots Q_1^{-1}. \]

    这表明\(A\)可表为有限个初等方阵的乘积。

    充分性:有限个可逆矩阵的乘积仍可逆。

  • 推论:\(n\)阶可逆方阵\(A\)可通过有限次初等行变换变为\(n\)阶单位阵。

    由可逆矩阵的性质,

    \[A=P_1P_2\cdots P_k, \]

    这里每一个\(P_i\)是可逆的,从而

    \[P_k^{-1}P_{k-1}^{-1}\cdots P_1^{-1}A=I_{(n)}, \]

    这里每一个\(P_i^{-1}\)都是一个初等矩阵。

由此,我们可以求逆矩阵的方法:初等变换法。因对任何可逆矩阵\(A\),有\(P_1P_2\cdots P_kA=I\),因此\(A\)的逆矩阵就是\(A^{-1}=P_1P_2\cdots P_k=P_1P_2\cdots P_kI\)。这告诉我们,用将\(A\)变为单位阵的初等行变换,恰好可以把\(I\)变为\(A^{-1}\),这样我们就求得了\(A^{-1}\)。

  • 相抵:设\(A,B\in F^{m\times n}\),如果\(A\)可以通过有限次初等变换变为矩阵\(B\),则矩阵\(A,B\)是相抵的。

相抵是一种等价关系,满足

  1. 自反性:\(\forall A\in F^{m\times n}\),\(A\)与自身相抵。
  2. 对称性:若\(A\)与\(B\)相抵,则\(B\)与\(A\)相抵。
  3. 传递性:若\(A\)和\(B\)相抵,\(B\)和\(C\)相抵,则\(A\)和\(C\)相抵。

在\(F^{m\times n}\)中,所有与\(A\)相抵的集合记作\(R_{A}\),称为\(A\)的相抵等价类。相抵等价类具有以下性质:

  1. 若\(B,C\in R_{A}\),则\(B\)和\(C\)相抵。
  2. 对\(A,B\),要么\(R_{A}=R_{B}\),要么\(R_{A}\cap R_{B}=\varnothing\)。

矩阵的秩是相抵等价类的全系不变量,即所有属于同一等价类的矩阵都具有相同的秩,因此判定两个矩阵是否相等,实际上只需要判定他们的秩是否相等。

  • 相抵的充要条件:设\(A\in F^{m\times n}\),\(\mathrm{rank}(A)=r\),则矩阵\(A\)相抵于

    \[\begin{pmatrix} I_{(r)} & 0 \\ 0 & 0 \end{pmatrix}, \]

    且\(A,B\)相抵的充要条件是\(\mathrm{rank}(A)=\mathrm{rank}(B)\)。

  • Hermite标准形:称矩阵\(A\),\(\mathrm{rank}(A)=r\)的Hermite标准形为

    \[\begin{pmatrix} I_{(r)} & 0 \\ 0 & 0 \end{pmatrix}. \]

Hermite标准形可以唯一刻画矩阵的秩状态,且其形状十分简单,因此应用广泛。

3.5 一些例子

本节摘录书上的例题。

例1:\(m\times n\)矩阵列满秩的充要条件是,存在\(m\)阶可逆阵\(P\)使得

\[A=P\begin{pmatrix} I_{(n)} \\0 \end{pmatrix}. \]

证明必要性。因\(A\)列满秩,故存在可逆的\(R\in F^{m\times m}\)和\(T\in F^{n\times n}\)使

\[A=R\begin{pmatrix} I_{(n)} \\ 0 \end{pmatrix}T, \]

由分块矩阵的乘法有

\[A=R\begin{pmatrix} T \\ 0 \end{pmatrix}=R\begin{pmatrix} T & 0 \\ 0 & I_{(m-n)} \end{pmatrix}\begin{pmatrix} I_{(n)} \\ 0 \end{pmatrix}\xlongequal{def}P\begin{pmatrix} I_{(n)} \\ 0 \end{pmatrix}. \]

容易证明\(P\)可逆。

例2(满秩分解定理):设\(A\in F^{m\times n}\),证明\(\mathrm{rank}(A)=r\ge 1\)的充要条件是,存在列满秩的\(m\times r\)矩阵和行满秩的\(r\times n\)矩阵\(C\),使得\(A=BC\)。

此定理表明,任何都能被分解为一个列满秩矩阵和一个行满秩矩阵的乘积。

\[A=P\begin{pmatrix} I_{(r)} & 0 \\ 0 & 0 \end{pmatrix}Q=P\begin{pmatrix} I_{(r)} \\ 0 \end{pmatrix}\begin{pmatrix} I_{(r)} & 0 \end{pmatrix} Q\xlongequal{def}BC. \]

\(B\)和\(C\)分别是列满秩和行满秩的。

例3:证明\(n\)阶幂等矩阵\(A\)(\(A^2=A\))的秩等于它的迹。

设\(\mathrm{rank}(A)=r\),则存在\(n\)阶可逆阵\(P,Q\)使得

\[A=P\begin{pmatrix} I_{(r)} & 0 \\ 0 & 0 \end{pmatrix}Q, \]

由\(A^2=A\)可得

\[\begin{pmatrix} I_{(r)} & 0 \\ 0 & 0 \end{pmatrix}QP\begin{pmatrix} I_{(r)} & 0 \\ 0 & 0 \end{pmatrix}=\begin{pmatrix} I_{(r)} & 0 \\ 0 & 0 \end{pmatrix}. \]

记\(QP=R=\pmatrix{R_{11} & R_{12} \\ R_{21} & R_{22}}\),其中\(R_{11}\)是\(r\)阶方阵,则上式化为

\[\begin{pmatrix} R_{11} & 0 \\ 0 & 0 \end{pmatrix}=\begin{pmatrix} I_{(r)} & 0 \\ 0 & 0 \end{pmatrix}\Rightarrow R_{11}=I_{(r)}. \]

于是

\[Q=\begin{pmatrix} I_{(r)} & R_{12} \\ R_{21} & R_{22} \end{pmatrix}P^{-1},\\ A=P\begin{pmatrix} I_{(r)} & 0 \\ 0 & 0 \end{pmatrix}\begin{pmatrix} I_{(r)} & R_{12} \\ R_{21} & R_{22} \end{pmatrix}P^{-1}=P\begin{pmatrix} I_{(r)} & R_{12} \\ 0 & 0 \end{pmatrix}P^{-1}, \]

由迹的可交换性,我们有

\[\mathrm{tr}(A)=\mathrm{tr}\left(PP^{-1}\begin{pmatrix} I_{(r)} & R_{12} \\ 0 & 0 \end{pmatrix}\right)=r. \]

例4(Frobenius秩不等式):设\(A\in F^{m\times n}\),\(B\in F^{n\times p}\),\(C\in F^{p\times q}\),证明:

\[\mathrm{rank}(AB)+\mathrm{rank}(BC)-\mathrm{rank}(B)\le \mathrm{rank}(ABC). \]

等号成立当且仅当以下两个矩阵相抵。

\[\begin{pmatrix} AB & 0 \\ 0 & BC \end{pmatrix},\quad \begin{pmatrix} AB & 0 \\ B & BC \end{pmatrix}. \]

原秩不等式等价于

\[\mathrm{rank}\begin{pmatrix} AB & 0 \\ 0 & BC \end{pmatrix}\le \mathrm{rank}\begin{pmatrix} ABC & 0 \\ 0 & B \end{pmatrix}. \]

由于

\[\begin{pmatrix} I_{(m)} & A \\ 0 & I_{(n)} \end{pmatrix}\begin{pmatrix} ABC & 0 \\ 0 & B \end{pmatrix}\begin{pmatrix} I_{(q)} & 0 \\ -C & I_{(p)} \end{pmatrix}\begin{pmatrix} 0 & -I_{(q)} \\ I_{(p)} & 0 \end{pmatrix}=\begin{pmatrix} AB & 0 \\ B & BC \end{pmatrix}, \]

所以

\[\mathrm{rank}\begin{pmatrix} ABC & 0 \\ 0 & B \end{pmatrix}=\mathrm{rank}\begin{pmatrix} AB & 0 \\ B & BC \end{pmatrix}, \]

也即

\[\mathrm{rank}\begin{pmatrix} AB & 0 \\ 0 & BC \end{pmatrix}\le \mathrm{rank}\begin{pmatrix} AB & 0 \\ B & BC \end{pmatrix}=\mathrm{rank}\begin{pmatrix} ABC & 0 \\ 0 & B \end{pmatrix}. \]

原式得证。

特别当\(B\)取\(n\)阶单位阵时,得到Sylvester秩不等式

\[\mathrm{rank}(A)+\mathrm{rank}(B)-n\le \mathrm{rank}(AB)\le \min\{\mathrm{rank}(A),\mathrm{rank}(B)\}. \]



这篇关于【高等代数】7. 矩阵(2)的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!


扫一扫关注最新编程教程