§3-3 qr 法 —— 相似变换法
Post on 11-Jan-2016
191 Views
Preview:
DESCRIPTION
TRANSCRIPT
§3-3 QR 法——相似变换法
功能:求任意矩阵 [A] 的全部特征解。
针对:标准特征问题
基本思想:
(特别适合求上 Hessenberg 阵和 对称三对角阵)
xxA
对称阵)(当对角化
为一般方阵)上三角化(变换
正交相似
A
AA
由变换矩阵求出特征向量矩阵
直接求出 n个特征值
X
第 三 章
第3
节 Q
Ri
法
一、任意矩阵的 QR 法(主要介绍思想)
设 xxA nnRA , 任意满阵。
基于在第一章讲过:矩阵的 QR 分解,
1
1111 Q
RRQAA
111112 QRQAQA T
2
222 Q
RRQ
— 上三角阵
— 正交阵 111QQT
111 AQR T
222 AQR T
第 三 章
第3
节 Q
Ri
法
则 QR 法过程如下:
222223 QRQAQA T
3
333 Q
RRQ
11111111 , k
Tkkkkkk
Tkk AQRQRQAQA
333 AQR T
可见: AAAAA kkk 111 ~~~
可以证明:当 k kA时, 的对角线以下元素
收敛于零。 成为上三角阵。kA
第 三 章
第3
节 Q
Ri
法
相似矩阵!
注意:每次相似变换前,先要对新矩阵进 行一次 QR 分解。
通过 n-1 次 H 变换实现 QR 分解。
即
1
2
1
lim
0
n
n
kk
A
即 kA 的对角
元素将收敛于
A 的特征值。
且最右下角先
收敛于最低阶
特征值。而特征向量:
kQQQQX 21
即特征向量矩阵 = 每次变换矩阵的乘积。
第 三 章
第3
节 Q
Ri
法
思考:为什么?
这里的变换矩阵可用 Householder
knkkk PPPQ 121 变换矩阵的乘积得到,即:
因为 Householder 变换可以使 上三角阵次变换1
n
HA
可见:当 nnA 一般方阵(即满阵)时, QR 方法
每步所需乘法运算量是相当大的( 3n 数量级,),这样大的计算量将使该方法对一般矩阵失去实用价值。
因此,一般不对“满阵”直接用 QR 方法,而是对一些特殊的矩阵(上 Hessenberg 阵,对称三对角
阵) QR 方法求全部特征解—可使计算量大大减少!
第 三 章
第3
节 Q
Ri
法
由第一章讲过 QR 分解知,
对称三对角矩阵
上 Hessenberg 矩阵 (也称拟上三角阵 ---- 次对角元以下元素为零。)
实际的做法:
一般方阵
对称时)对称三对角阵(矩阵上
变换
次经过
A
HessenbergA
rHouseholde
n 2
再用 QR 方法求特征解
下边分别介绍这两种特殊矩阵的 QR 法求全部特征解。
第 三 章
第3
节 Q
Ri
法
因此,用 QR 方法求全部特征解最适合用于 :
0
0
设 [A]—— 对称三对角阵 xxA
2 、基本迭代过程
1
1
111Q
RRQAA
—— 上三角阵
—— 正交矩阵
111 AQR T
111112 QRQAQA T
22 RQ
第 三 章
第3
节 Q
Ri
法
二、对称三对角阵的 QR 法求全部特征解
1 、基本思想
化为对角阵 iii xx
原问题
新问题
222 AQR T
222223 QRQAQA T
33 RQ
333 AQR T
333334 QRQAQA T
kkkkT
kk QRQAQA 1
11 kk RQ
第 三 章
第3
节 Q
Ri
法
第 k+1 次 QR 分解!
1kA可见:每次迭代后(或变换后,对新的 要进行
一次 QR 分解,目的是得到新的正交相似变换矩阵。 1kQ
对于对称三对角阵用 Givens 旋转变换矩阵实
现 QR 分解最有效。
kT
k
kTT
kT
k
kkT
kk
QAQ
QQQAQQQ
QAQA
2111
1
第 三 章
第3
节 Q
Ri
法
计算量小!
将上述迭代过程写成一个式子,即
从第一章知:
kk QQQQ 21 —— 正交矩阵
可以证明:当 k 时,
1
1
0
0
n
kA
即 AAk ~1
对角阵 对称三对角阵
0
0
0
0
法QR
k 即:
原对称三对角阵 对角阵
第 三 章
第3
节 Q
Ri
法
对角阵
k
T
kk QAQA 1即
与原问题:
kk QQA
XXA 比较
Tkkkk RAQQQQX 21
10
0
n
即:求得了原系统的全部特征解。
第 三 章
第3
节 Q
Ri
法
1 k
T
k QQ
上式两边左乘 ,得 kQ
说明:
①QR 形式上是正交相似变换,但本质上是“多个向量
的同时反迭代”,因此它是逐阶收敛的,且最低价 1 先收敛,
1kA并出现在 的右下角。
② 为了加速收敛,也可采用带移位量的 QR 方法,使最接近移位量 μ的特征值最先收敛。
下面介绍对称三对角阵带移位量的 QR 法,特别注意移位量 μ的选取方法。
第 三 章
第3
节 Q
Ri
法
(为什么?)
3 、对称三对角阵带移位量的 QR 方法
① 迭代 公式
设 k —— 移位量(每次迭代都要变化!)
kA —— 对称三对角阵
移位 kkkk RQIA —— 用 Givens 实现 QR 分解!
kT
kkkkk QAQIQRA 1
2,1k
AAk ~1 —— 对称三对角阵相似变换
第 三 章
第3
节 Q
Ri
法
可加速收敛!
思考 ?
1kAk当 时 对角阵。
则 iii xxA
2,1i
全部特征解: 1 kA
kQX
T
k
kk
RIA
IAIA1
1
11
1 ))
其中: 121 RRRRR kkk
第 三 章
第3
节 Q
Ri
法
XXA
原 特征标准问题!
另外,在相似变换中:不会改变对称三对角阵的对称特点。
0
0 kA即
2,1k
的带宽不会超过三对角,且只会减少,这是由相似变换算法本身决定的。
可见:带移位量的 QR 法与带移位量的反迭法相当,
但是移位量 k 是在变的。可以证明,它具有三
阶收敛。
② 移位量 k 的选取
第 三 章
第3
节 Q
Ri
法
∵ 当 k
1
1
0
0
n
n
kA
因此,为了使 kA 右下角元素最先成为特征值,移
位量的值用 kA 右下角 2×2 阶矩阵的两个特征值中
接近 knna 的一个,即
0
0 kA
另法:也可直接取 knnk a
第 三 章
第3
节 Q
Ri
法
knn
knn
knn
knn
aaaa
,,
,,
1
111
求出对应的 kk21 ,
然后取 kk21 , 中最
接近 knna 的 λ 值作为
移位量 k
这样取 k 后,采用移位 QR 法,结果使 kA 的右下角元素最先收敛为低价特征值 1 。
kA 仍为三对角阵!
改变 [A] 的形式,即
注:正交变换过程 中,
算法本身决定!不会
③ 在具体迭 代过程中,当右下角元素成为特征值时,
以后的迭代只要考虑
第 三 章
第3
节 Q
Ri
法
11 nnkA
收缩矩阵
2 再收缩 n
(划行划列得到)
④ 另外,如在迭代过程中,如出现某个非对角元为零时, 即
则以后的迭代中,将 分块处理: kA先考虑此矩阵的右下角子矩阵,
当右下角子矩阵对角化后,再对左上角的子矩
阵迭代,使左上角子矩阵也成为对角阵。这样处理可节省迭代时间,减少计算量。
0
0kA
第 三 章
第3
节 Q
Ri
法
4 、对于对称三对角阵,一般采用旋转变换实现(即 Givens 变换)
[A] 的 QR 分解(每一次迭代都必须做!),
而 Givens 变换矩阵的选取如下:
设
nn
nn
k
deed
deed
A
1
22
21
0
0 —— 对称的三对角阵,每次迭代不影响对称形式。
为了使所有下三角元素为零,必须用 n-1 次旋转变换!
第 三 章
第3
节 Q
Ri
法 这样计算量小!
即 kk
TkTkn
Tkn RAQQQ 21
经 n-1 次 G ivens 变换 , 使 kA
的 n-1 个上、下次对角元素均为零!
三角阵
或写成 kkT
k RAQ
knkkk QQQQ 32
kkk RQA
其中旋转变换矩阵如下:
第 三 章
第3
节 Q
Ri
法
即用 G ivens 变换实现了 的 QR 分解! kA
因为对称!
i1i
i1i
ni 32,
i 角由下式确定:
ni
de
de
iii
iii
iii
3,2cossin
21
21
2
1
第 三 章
第3
节 Q
Ri
法
1
cossin
sincos
1
ii
iikiQ
三、上 Hessenberg 矩阵的 QR 法 (多采用带移位量的双步 QR 法)
设一般矩阵 矩阵上次
变换 HessenbergAn
H
2
对于上 Hessenberg 矩阵用移位 QR 法求全部特征解与求对称三对角矩阵 QR 法有如下不同之处:
( 1 )所有相似矩阵 2,1kAk都是上 Hessenberg 阵;
第 三 章
第3
节 Q
Ri
法
注:它是非实对称矩阵!特征根可能出现复根!
( 2 )当 k 时, kA 可能趋向拟上三角阵,
即:其对角线可能出现某些二阶小方阵,每个小方阵具有一对实特征值或一对共轭复特征值。
个别对角元下方元素不为零。
若无重特征值或共轭复特征值时, kA 趋向于上三角阵。
( 3 )由于 [A] 可能具有复特征值,而且移位量也可能 是复数,因此将可能出现复数运算。
因为移位量 k是根据“小方阵”的特征根定!
第 三 章
第3
节 Q
Ri
法
00
0
0
0
为了避免复数运算和减少计算量,实用中往往采用
双步 QR 法。——把 QR 法的二步并成一步计算。
具体计算公式如下:
1 、一般带移位量的双步 QR 法过程推导实数运算)
变为
设原带移位量 QR 法的二步迭代公式为:
IQRA
RQIAIQRA
RQIA
kkkk
kkkk
kkkk
kkkk
1112
1111
1
*
第 三 章
第3
节 Q
Ri
法
(即把复数运算
第一步迭代公式
第二步迭代公式
其中移位量 kAk 1k和 是 的右下角 2×2 阶矩阵的特征值,即
1,1
,11122 ,
,
k
k
nnnn
nnnn
aaa
aaaA
可能为实数,也可能为一对共轭复数。
由数学上拉梅定理(矩阵相似变换不变量的特性)得:
22221
111
det AA
aa
kk
nnnnkk ,
第 三 章
第3
节 Q
Ri
法
显然,当 kA 为实矩阵时,
其元素为实数,则 α 与 β 也为实数。
22A 也为实矩阵,
另外,由*式可得
11
111
12
1
kkkT
kT
k
kkT
k
kkkkk
T
kk
kkT
kk
QQAQQ
QAQ
QQQQAQA
QAQA
而
第 三 章
第3
节 Q
Ri
法
设 kk
T
k RRR 1
kk RQB 令
经过上述两步法公式及拉梅定理,可推出
IAAB kk 2
kA由于 是实矩阵, α , β 为实数,
并可由 kA , α , β 直接求出。
这就避免了复数运算(避免了移位量 k 为复数时
复数运算!)
第 三 章
第3
节 Q
Ri
法
所以 [B] 是实矩阵,
即求 [B] 成为实数运算!
当 [B] 求出后,再对 [B] 进行 QR 分解即可。
2 、一般双步带移位量的 QR 法的基本步骤是:
( 1 )计算
( 2 )对 [B] 进行 QR 分解,从而求出
IAAB kk 2 —— 计算量为实数运算
kQ即 kkk QRQB 求出
( 3 )计算矩阵 kk
T
kk QAQA 2
双步迭代并为一步!
这就完成了一次双步 QR 法计算,(相当于两步迭代计算)
次次
1kk
第 三 章
第3
节 Q
Ri
法
第 三 章
第3
节 Q
Ri
法
当完成一次双步 QR 法后,求得 2kA
再对 进行新的下一次双步 QR 法: 2kA
22
T
24 kkkk QAQA
如此进行下去。
当 时,使 成为上三角阵,k 2kA
即可求得全部特征解。
且完全避免了复数运算,但计算 [B]工作量大。
因此,在实际运算时,采用改进双步 QR 法。
即: FrancisQR 法。
3 、改进的双步 QR 法(即: FrancisQR 法)
这种方法的基本思想是:
不直接计算 IAAB kk 2
而是直接对 kA 用 Householder 矩阵进行相似变换
第 三 章
第3
节 Q
Ri
法
得到一个新的上 Hessenberg 矩阵 [H]
即 221132
nnn
kT
HHHAHHH
PAPH
即: [P] 是 n-2 个 Householder 矩阵的乘积。这里: [P]—— 变换矩阵!
在原双步 QR 法: kk
T
kk QAQA 2
其中 kQ —— 变换矩阵
第 三 章
第3
节 Q
Ri
法
根据有关定理,只要 [P] 和 kQ 的第一列相同,
即 11 eQeP k
1e ——单位向量。同时 [H] 的下次对角中无
零元时,存在 2 kAH 即完成两步迭代过程!
FrancisQR 法具体做法:见教材 :p64 。
第 三 章
第3
节 Q
Ri
法
不详细讲了。
小 结第 三 章
第3
节 Q
Ri
法
1 、 QR 法表面是一种相似变换法,实质是多个向量的同时反迭代!请思考!
2 、 QR 法适合求“对称三对角阵”和“上 Hess
enberg 矩阵”的标准特征问题,计算量小。
第 三 章
第3
节 Q
Ri
法
思考
1 、 QR 法的基本思想;功能?
2 、 QR 法是怎样避免复数运算?
3 、什么情况下会出现复数运算?
4 、为什么最低阶 收敛在 右下角。1 kA
5 、在移位 QR 方法中如何选择移位量?
6 、双步 QR 法主要解决什么问题?
top related