IAD metody v poˇcıt´anı Markovov´ych retˇezc˚u
Transkript
IAD metody v poˇcıt´anı Markovov´ych retˇezc˚u
.
IAD metody v počı́tánı́ Markovových řetězců
Ivana Pultarová
Katedra matematiky, Fakulta stavebnı́, ČVUT
Ústav informatiky, AV ČR
SNA 2006
.
Přehled
• Markovovy řetězce, stochastické matice, 2.
• Iteračnı́ agregačnı́ - deagregačnı́ (IAD) metody, 3-5.
• Lokálnı́ konvergence pro polynomickou základnı́ iteraci, 6-15.
• Diskuse, otázky, 16.
• Literatura, 17.
1
.
Stochastická matice B typu N
× N:
B ≥ 0,
eT B = eT .
Hledáme vektor stacionárnı́ho rozdělenı́ pravděpodobnosti x̂ matice B (Perronův - Frobeniův
vektor),
B x̂ = x̂.
Perronova - Frobeniova věta. Existence a jednoznačnost x̂ pro B ireducibilnı́.
Např. mocninná metoda pro ireducibilnı́ a necyklickou matici B ,
x̂ = lim B k y.
k→∞
2
.
Základnı́ označenı́
n je počet agregačnı́ch skupin (Gi ),
G1 , . . . , Gn jsou disjunktnı́ množiny indexů, ∪ni=1 Gi = {1, . . . , N },
I je jednotková matice a e je vektor jedniček,
R je matice redukce typu n × N , Rij = 1 pro j ∈ Gi a 0 jinak,
S(x) je matice prolongace typu N × n, Sji (x) = xj /
P (x) je projekce P (x) = S(x)R
3
P
k∈Gi
xk pro j ∈ Gi a 0 jinak,
Obecná iteračnı́ agregačnı́ - deagregačnı́ (IAD) metoda. Opakujı́ se kroky 2 - 5:
x0 > 0, ||x0 ||1 = 1, a matice základnı́ iterace T ;
1 Zvolı́ se počátečnı́ aproximace
k := 0.
2 Vyřešı́ se RBS(xk )z
3 Prodlouženı́ z na y k
= z.
= S(xk )z .
4 Korekce základnı́ iteracı́ xk+1
5 Test konvergence, k
= T yk .
:= k + 1.
Základnı́ iterace v kroku 4 může odpovı́dat např. mocninné metodě, blokové Jacobiově nebo
Gaussově-Seidelově metodě, atd.
Jako základnı́ iterace použı́váme násobenı́ maticı́
Takovou IAD metodu nazveme Algoritmus 1.
4
p(B), kde p je polynom, p(1) = 1.
Známé výsledky
Stewart (94) - odhad faktoru konvergence pro téměř úplně rozložitelné matice, kvantitativnı́
odhady při splněnı́ 4 podmı́nek (matice i řešenı́) a ǫ → 0.
Mandel, Sekerka (83) - Odhad asymptotického faktoru konvergence pro matici B s pozitivnı́m
řádkem.
Courtois, Semal (86) - Konvergence pro cyklickou iteračnı́ matici blokové Jacobiovy metody
M −1 W , I − B = M − W , je-li prováděna agregace. Otázka četnosti agregačnı́ho kroku.
Marek, Mayer (98 a 03) - Odvozenı́ tvaru chybové matice. Poprvé uvedena tzv. rychlá konvergence.
Ipsen, Kirkland (04) - Speciálnı́ volba agregačnı́ch skupin. Studium konvergence na základě
jiné formulace algoritmu a použitı́ stochastického doplňku.
5
Lokálnı́ konvergence
Chyba se řı́dı́ vztahem
xk+1 − x̂ = J(xk )(xk − x̂),
kde
J(x) = T (I − P (x)Z)−1 (I − P (x)),
kde Z je dáno spektrálnı́m rozkladem matice B ,
B = P + Z, P 2 = P, P Z = ZP = 0,
P je Perronova-Frobeniova projekce přı́slušná B .
Studiem J(x̂) lze najı́t některé postačujı́cı́ podmı́nky pro lokálnı́ konvergenci.
Rekurentnı́ formule pro J(x), je-li T
= B,
J(x) = B(I − P (x)) + BP (x)J(x).
6
Věta 1. Je-li p(t)
přesné řešenı́ x̂.
= αt + (1 − α) a α ∈ (0, 1i, pak jediným pevným bodem Algoritmu 1 je
Věta 2. Je-li p(t) = αt + (1 − α) a α ∈ (0, 1), pak Algoritmus 1 konverguje lokálně pro
každou ireducibilnı́ stochastickou matici B k přesnému řešenı́.
Věta 3. Je-li p(t)
= t a základnı́ iterace je doplněna krokem
xk+1 := αxk+1 + (1 − α)xk ,
α ∈ (0, 1), pak Algoritmus 1 konverguje lokálně pro každou ireduciblinı́ stochastickou
matici B k přesnému řešenı́ x̂.
Věta 4. Je-li p(t) = t a diagonála matice
k přesnému řešenı́ x̂.
B je kladná, pak Algoritmus 1 konverguje lokálně
7
Věta 5.
Je-li p(t) = t a matice B obsahuje alespoň jeden kladný řádek, pak Algoritmus 1 konverguje
lokálně k přesnému řešenı́ x̂ a asymptotický faktor konvergence je
kde β je minimálnı́ prvek tohoto řádku.
p
1 − β,
Je-li matice B kladná, pak asymptotický faktor konvergence je
1 − β,
kde
β = max{||v||1 ; B ≥ veT , v ≥ 0}.
8
Divergence.
Obecně lze tedy ukázat, že
ρ(J(p, x̂)) < 1
pro p(t)
= αt + (1 − α) a α ∈ (0, 1), ale
ρ(J(p, x̂)) ≤ 1
pro α = 0 nebo 1. Právě pro
k řešenı́ ani v lokálnı́m smyslu.
α = 1 lze najı́t matici takovou, že Algoritmus 1 nekonverguje
Přı́klad 1.
1/2
0 1/2
B = 1/2
0
0 1/2 ,
1 0
agregačnı́ skupiny G1 = {1} a G2 = {2, 3}. Polynom
pouze pro množinu počátečnı́ch přiblı́ženı́ mı́ry nula.
9
p(t) = t. Oscilace. Konvergence
Zobecněnı́ takové situace.
Přı́klad 2.
B=
× ... ×
×
0
..
.
..
.
× ... ×
×
0
...
0 ... 0
× ... ×
0
×
0
0
... ×
... 0
..
.
..
.
..
.
0
0
...
..
.
..
.
..
.
0
...
...
0
..
.
0
..
.
×
0
.
Vysvětlenı́ na základě formulace algoritmu pomocı́ stochastického doplňku.
Lemma 1. Pro aproximace xk , k
= 1, 2, . . ., zı́skané Algoritmem 1 pro p(t) = t platı́
BP (xk )xk+1 = xk+1 .
10
Vyberme některou aggregačnı́ skupinu Gi . Potom (po vhodné permutaci) máme B ve tvaru
B=
C
BG
i
B11
R
BG
i
BGi
.
Stejně rozdělı́me P (xk ) na blokově diagonálnı́ matici
P (xk ) =
k
P (x )1
0
0
P (xk )Gi
Potom rovnice BP (xk )xk+1 = xk+1 lze vyjádřit ve tvaru
ρk+1 je faktor zaručujı́cı́ ||xk ||1 = 1 a
B̃Gi (xk ) =
k
0 (I − B11 P (x )1 )
0
SGi (xk )
−1
C
BG
i
.
xk+1 = ρk+1 B̃Gi (xk )e, kde
0
P (xk )Gi
kde SGi je stochastická matice,
R
k
k
−1 C
SGi (xk ) = BGi + BG
P
(x
)
(I
−
B
P
(x
)
)
BGi .
1
11
1
i
11
,
Věta 6. Je-li matice SGi (x) cyklická indexu m pro některý vektor x potom posloupnost
{xk }∞
k=0 zı́skaná Algoritmem 1 konverguje k přesnému řešenı́ x̂ pouze v přı́padě, že částečné
součty části x0Gi počátečnı́h vektoru x0 odpovı́dajı́cı́ blokům cykličnosti matice SGi (x) jsou
stejné.
Z toho ihned dostaneme
Věta 7. Je-li matice SGi (x) cyklická pro některý vektor x, pak možina počátečnı́ch přiblı́ženı́,
pto která Algoritmus 1 konverguje k přesnému řešenı́, má mı́ru nula v množině všech přı́pustných
počátečnı́ch přiblı́ženı́.
12
Vyššı́ stupeň polynomu p
Přı́klad 3. Uvažujme primitivnı́ stochastickou matici B1
0 1/2 0
0 1/2 0
0 0 1
.
1 0 0
0 0
1 1/2
B1 =
0 0
0 0
0 1/2
Agregačnı́ skupiny jsou G1
0
0
0
= {1, 2} a G2 = {3, 4, 5}. Potom máme
x̂1 = (1, 4, 2, 2, 2)T /11.
Nechť p1 (t)
= t a p2 (t) = t2 . Spektrálnı́ poloměry matic J(., x̂1 ) jsou
ρ(J(p1 , x̂1 )) = 1
a
ρ(J(p2 , x̂1 )) = 1.1570 > 1.
13
Přı́klad 4.
0
1
B2 =
0
0
0
Agregačnı́ skupiny jsou G1
pravděpodobnisti x̂2 máme
0
1/2
0
1/100
1/2
1/2
0
0
1/2
0
99/100
0
0
0
0
0
1/100
99/100
.
0
0
= {1, 2} a G2 = {3, 4, 5}. Potom pro stacionálnı́ rozdělenı́
ρ(J(p1 , x̂2 )) = 0.9855 < 1
a
ρ(J(p2 , x̂2 )) = 1.1271 > 1
kde opět p1 (t)
= t a p2 (t) = t2 .
Všimňeme si, že Algoritmus 1 s p(t) = tk konverguje loálně pro k = 1 ale
diverguje (i v lokálnı́m smyslu) pro k = 2. Tedy vı́ce kroků v základnı́ iteraci porušı́ konvergenci.
14
Spectral radii of J
1,2
1
0,8
0,6
0,4
0,2
0
0
2
4
6
8
Exponent k
10
12
Figure 1: Spektrálnı́ poloměr matic J(pk , x̂) pro B2 a pk (t)
15
14
= tk .
Závěr a dalšı́ otázky
• Lokálnı́ konvergence IAD metody nenı́ zaručena pro B ireducibilnı́ a necyklickou. Tyto
výsledky zatı́m platı́ pro T = B k .
• Otázky.
Jaká mocnina je dostatečná pro lokálnı́ konvergenci - na základě struktury nenulových
prvků matice B ?
Oscilace v přı́padě divergence?
Je bloková Jacobiova metoda postačujı́cı́ pro lokálnı́ konvergenci?
Je konvergence v lokálnı́m smyslu vždy postačujı́cı́ pro konvergenci?
Poděkovánı́.
Tato práce byla podpořena projektem Informačnı́ společnost č. 1ET400300415.
16
Literatura
• P. J. Courtois, P. Semal, Block iterative algorithms for stochastic matrices, 1986
• I. C. F. Ipsen, S. Kirkland, Convergence analysis of an improved PageRank algorithm,
2004
• I. Marek, P. Mayer, Convergence theory of some classes of iterative aggregation disaggregation methods for computing stationary probability vectors of stochastic matrices, 2003
• I. Marek, I. Pultarová, A note on local and global convergence analysis of iterative
aggregation-disaggregation methods, 2004
• I. Pultarová, Local convergence analysis of IAD methods with polynomial correction
based on sparsity of stochastic matrices, 2005
• W. J. Stewart, Introduction to the numerical solutions of Markov chains, 1994
17
Podobné dokumenty
tisku - FSE UJEP
Obecně, tento popis vzájemného vztahu probı́há tak, že hodnotám jedné veličiny (tzv.
nezávisle proměnné) přiřazujeme hodnoty druhé veličiny (tzv. závisle proměnné).
Definice 0.1.1...
Základy obecné algebry
4) T 7→ M \ T =: T ′ je unárnı́ operace na množině všech podmnožin P(M ) množiny M .
Definice 1.4. Bud’ A množina, n ∈ N0 , D ⊆ An . Potom zobrazenı́ ω : D → A se nazývá
n-árnı́ parciáln...
nosnostní tabulka - odporově svařované rošty sp
Fv = hodnoty zatížení u rovnoměrně rozložené zátěže v kN/m²
f = průhyb při zatížení v mm při zatížení Fv
Fp = hodnoty zatížení u středově působící jednotlivé zátěže v kN na ploše 200 x 200 mm
f1 = ...
%5#5,&
$ I
042- 3 2Z2
04L.