Ax=b A x = b 有解时
当计算线性方程组 Ax=b A x = b 有解时, b b 就在
设
Ax=b A x = b 无解时
当计算线性方程组 Ax=b A x = b 时, 它可能是无解的,此时我们可以考虑求 x^∈Rn x ^ ∈ R n ,使得|| Ax^−b A x ^ − b || 最小或极小?这就意味着当 b∉C(A) b ∉ C ( A ) 时,我们需要求解 C(A) C ( A ) 上距离 b b 最近的点
以三维空间为例,目标投影空间可能是线,也可能是面。投影的实质就是找一个函数,从而使得 P(B)=b P ( B ) = b ,也就找到了 B B 在某一维度的映射。类似的,在线性代数中,我们需要找到投影矩阵
投影矩阵 P P
投影矩阵

在直线上的投影
求 b b 在直线
已知
p + e = b , e ⊥ a , p = t a ( t ∈ R ) ” role=”presentation” style=”position: relative;”>
∴e⊥a→aT(b−ta)=0→t=aTbata(a≠0) ∴ e ⊥ a → a T ( b − t a ) = 0 → t = a T b a t a ( a ≠ 0 )
即 b b 在直线a ” role=”presentation” style=”position: relative;”> 上的投影向量为 (aTbata)a=p ( a T b a t a ) a = p . (a,b表示相应列向量)投影向量 p=(aTbata)a=aTaata)b p = ( a T b a t a ) a = a T a a t a ) b
我们称 aTaata a T a a t a 为投影矩阵 P P .
在平面上的投影
给定
令
α 1 , ” role=”presentation” style=”position: relative;”> 是平面 π π 上两无关向量,即 π=C(A) π = C ( A ) 的一组基。 α 2
令 p=Ax^ p = A x ^ ,则 e=v−Ax^ e = v − A x ^ 垂直于平面 π π ,即其属于 A A 的左零空间。
∴ A T ( A X ^ − v ) = 0 ” role=”presentation” style=”position: relative;”> , 即 x^ x ^ 是 ATAx=ATv A T A x = A T v 的解。
∵A ∵ A 的列向量线性无关,即 ATA A T A 是可逆矩阵
∴x^=(ATA)−1ATv→p=A(ATA)−1ATv ∴ x ^ = ( A T A ) − 1 A T v → p = A ( A T A ) − 1 A T v .我们称 A(ATA)−1AT A ( A T A ) − 1 A T 为投影矩阵 P P .
一般情形
p ∈ C ( A ) ⟺ ∃ x ^ ∈ R n , A x ^ = p ” role=”presentation” style=”position: relative;”> 。
∵e=b−p⊥C(A)↔e∈N(AT) ∵ e = b − p ⊥ C ( A ) ↔ e ∈ N ( A T )
∴ATe=⇒AT(b−Ax^)=0.⟹p=Ax^=A(ATA)−1ATb ∴ A T e =⇒ A T ( b − A x ^ ) = 0. ⟹ p = A x ^ = A ( A T A ) − 1 A T b
这里需要注意一点: ATAx=ATb A T A x = A T b 总有解(无论 A A 是否列满秩)
这是因为C ( A T ) = C ( A T A ) , A T b ∈ C ( A T ) = C ( A T A ) ” role=”presentation” style=”position: relative;”> ,所以总能找到这样的 x^ x ^ 使得 x^=A(ATA)−1AT x ^ = A ( A T A ) − 1 A T 。投影矩阵 P P 的性质
- 若 A A 的列向量线性无关(列满秩),则矩阵
A T A ” role=”presentation” style=”position: relative;”> 可逆,投影矩阵 P=A(ATA)−1AT P = A ( A T A ) − 1 A T 满足
P2=P,PT=P P 2 = P , P T = P从直观上,向量 b b 经过一次投影到平面
A ” role=”presentation” style=”position: relative;”> 上后再经过相同的一次投影仍然在平面 A A 上,因此投影矩阵” role=”presentation” style=”position: relative;”> 和 P P 的效果是一样的,因此 P 2 P 2 = P ” role=”presentation” style=”position: relative;”> 。
数学推理:
P2=(A(ATA)−1AT)(A(ATA)−1AT))=A(ATA)−1(ATA)(ATA)−1AT=A(ATA)−1AT=P P 2 = ( A ( A T A ) − 1 A T ) ( A ( A T A ) − 1 A T ) ) = A ( A T A ) − 1 ( A T A ) ( A T A ) − 1 A T = A ( A T A ) − 1 A T = P
- C(P)=N(I−P),N(P)=C(I−P) C ( P ) = N ( I − P ) , N ( P ) = C ( I − P )
∵P2=P ∵ P 2 = P
∴P(I−P)=0⟹C(I−P)⊂N(P) ∴ P ( I − P ) = 0 ⟹ C ( I − P ) ⊂ N ( P )
设α∈N(P),则Pα=0⟹α=(I−P)α 设 α ∈ N ( P ) , 则 P α = 0 ⟹ α = ( I − P ) α
∴α∈C(I−P)⟹N(P)⊂C(I−P) ∴ α ∈ C ( I − P ) ⟹ N ( P ) ⊂ C ( I − P )
综上: N(P)=C(I−P) N ( P ) = C ( I − P )
同理 C(P)=N(I−P) C ( P ) = N ( I − P )欢迎关注我的个人博客。
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/221424.html原文链接:https://javaforall.net
