前言
笔者在看到分块矩阵相应内容时看到了这个公式,其在矩阵分析、系统和控制论等领域有广泛应用。事实上,它的思想和构造过程是如此的巧妙,值得我们去仔细探讨
引入
首先讨论对分块矩阵
A=\begin{bmatrix}
A_{11} & A_{12}\\
A_{21} & A_{22}
\end{bmatrix}
作Gauss消元法,仅是数变成了矩阵,我们设A_1^{-1}可逆,则A左相抵(清华书,同济书称行等价)于
::: align-center
\begin{bmatrix}
I & O \\
-A_{21}A_{11}^{-1} & I
\end{bmatrix}
\begin{bmatrix}
A_{11} & A_{12} \\
A_{21} & A_{22}
\end{bmatrix} = \begin{bmatrix}
A_{11} & A_{12} \\
O & A_{22}-A_{21}A_{11}^{-1}A_{12}
\end{bmatrix}(1)
:::
与作基于数的Gauss消元类似,惯例上我们需要将左下角的矩阵化为零矩阵,即我们需要将它减去——左上角矩阵化为恒同矩阵I后左乘它自己,这里等式的左侧第一个矩阵就是执行此操作的初等倍加矩阵,它由初等矩阵执行刚才的倍加操作得到
由上一篇文章的结论,等式左侧第一个初等矩阵¥¥一定可逆,等式右侧的矩阵可逆在假设的条件下等价于A_{22}-A_{21}A_{11}^{-1}A_{12}可逆,所以A_{22}-A_{21}A_{11}^{-1}A_{12}可逆等价于矩阵A可逆
重要命题
若矩阵A_{11}和A_{22}-A_{21}A_{11}^{-1}A_{12}可逆,则矩阵\begin{bmatrix}
A_{11} & A_{12} \\
A_{21} & A_{22}
\end{bmatrix}可逆,且
::: align-center
\begin{bmatrix}
A_{11} & A_{12} \\
A_{21} & A_{22}
\end{bmatrix} = \begin{bmatrix}
I & -A_{11}^{-1}A_{12} \\
O & I
\end{bmatrix}^{-1} \begin{bmatrix}
A_{11}^{-1} & O \\
O & (A_{22}-A_{21}A_{11}^{-1}A_{12})^{-1}
\end{bmatrix} \begin{bmatrix}
I & O \\
-A_{21}A_{11}^{-1} & I
\end{bmatrix} (2)
:::
笔者:有一丝QR分解的影子
证明命题
对(1)式右边消去右上角矩阵,即
\begin{bmatrix}
A_{11} & A_{12} \\
O & A_{22}-A_{21}A_{11}^{-1}A_{12}
\end{bmatrix} \begin{bmatrix}
I & -A_{11}^{-1}A_{12} \\
O & I
\end{bmatrix} = \begin{bmatrix}
A_{11} & O \\
O & A_{22}-A_{21}A_{11}^{-1}A_{12}
\end{bmatrix}(3)
我们在这里作了一个初等列倍加变换
之后结合(1)(3)两式,
对(3)式两边右乘\begin{bmatrix}
I & -A_{11}^{-1}A_{12} \\
O & I
\end{bmatrix}的逆,即\begin{bmatrix}
I & A_{11}^{-1}A_{12} \\
O & I
\end{bmatrix},之后代入(1)式右端
再两边左左乘\begin{bmatrix} I & -A_{11}^{-1}A_{12} \\ O & I \end{bmatrix}的逆
最后等式两边取逆即可得结论
矩阵A_{22}-A_{21}A_{11}^{-1}A_{12}称为A_{11}关于A的Schur补
推论
类似地,我们有如下推论:
若矩阵A_{22}和A_{11}-A_{12}A_{22}^{-1}A_{21}可逆,则矩阵\begin{bmatrix}
A_{11} & A_{22}\\
A_{21} & A_{22}
\end{bmatrix}可逆,且
\begin{bmatrix}
A_{11} & A_{22}\\
A_{21} & A_{22}
\end{bmatrix}^{-1} = \begin{bmatrix}
I & O\\
-A_{22}^{-1}A_{21} & A_{22}^{-1}
\end{bmatrix} \begin{bmatrix}
(A_{11}-A_{12}A_{22}^{-1}A_{21})^{-1} & O\\
O & A_{22}^{-1}
\end{bmatrix} \begin{bmatrix}
I & -A_{12}A_{22}^{-1}\\
O & I
\end{bmatrix} (4)
笔者:2x2矩阵的Schur补,最起码在取矩阵主对角线元素对于矩阵的Schur补时,都是
该元素 - 从该元素左或右侧的元素开始顺时针的元素的乘积(在遇到主对角线另一个元素时要取逆)
Sherman-Morrision-Woodbury公式
将(3)(4)右端乘开,因为二式左端相等,所以右端矩阵也必然相等,比较右端矩阵的左上角即可得到
::: align-center
(A_{11}-A_{12}A_{22}^{-1}A_{21})^{-1} = A_{11}^{-1} + A_{11}^{-1}A_{12}(A_{22}-A_{21}A_{11}^{-1}A_{12})^{-1}A_{21}A_{11}^{-1}
:::
这给出了一定条件下一个可逆矩阵加上某个矩阵乘积后的逆的公式,常称为Sherman-Morrision-Wodbury公式
简化版:Sherman-Morrison公式
对于分块矩阵\begin{bmatrix} A & u\\ -v^T & 1 \end{bmatrix},其中A是n阶方阵,u,v是n维向量
Sherman-Morrison公式: 若A可逆,则A+uv^T可逆当且仅当1+v^TA^{-1}u\ne 0(笔者:正好是俩Schur补),且可逆时
::: align-center
(A+uv^T)^{-1}=A^{-1}-\frac{A^{-1}uv^TA^{-1}}{1+v^TA^{-1}u}
:::
笔者很喜欢这个简化形式,因为A+uv^T与1+v^TA^{-1}u正好是此分块矩阵右下块和左上块关于此矩阵的Schur补,等式左侧与右侧分母也是这样,而右侧分子很有对称性
应用

为什么要这样?
我们说了那么多,但是,为什么要这样做?为什么会想到这样做?下面是笔者的一些推测
我们知道,对于任意一个2x2分块矩阵,直接判断其可逆性很非常不方便的,但是对于一个已经确定的基于数的矩阵,我们是可以通过Gauss消元法将其化为行阶梯型矩阵来判断其可逆性的,那么:
::: align-center
对于任意的一个分块矩阵,我们是否也可以通过类似的想法来方便的判断出它的可逆性呢?
:::
如果我们这样想的话,最后我们就会得到Schur补,如果我们更进一步去考虑这个矩阵的逆是什么,我们就会得到Sherman-Morrison-Woodbury公式。
所以在我们惊叹于如此巧妙的构造之时,千万不要忘记数学家们也拥有着很强的类比能力,而这对于研究才是最重要的。
全部评论 (0)
暂无评论,快来抢沙发吧~