IAD metody v poˇcıt´anı Markovov´ych retˇezc˚u
Transkript
IAD metody v poˇcıt´anı Markovov´ych retˇezc˚u
. IAD metody v počı́tánı́ Markovových řetězců Ivana Pultarová Katedra matematiky, Fakulta stavebnı́, ČVUT Ústav informatiky, AV ČR SNA 2006 . Přehled • Markovovy řetězce, stochastické matice, 2. • Iteračnı́ agregačnı́ - deagregačnı́ (IAD) metody, 3-5. • Lokálnı́ konvergence pro polynomickou základnı́ iteraci, 6-15. • Diskuse, otázky, 16. • Literatura, 17. 1 . Stochastická matice B typu N × N: B ≥ 0, eT B = eT . Hledáme vektor stacionárnı́ho rozdělenı́ pravděpodobnosti x̂ matice B (Perronův - Frobeniův vektor), B x̂ = x̂. Perronova - Frobeniova věta. Existence a jednoznačnost x̂ pro B ireducibilnı́. Např. mocninná metoda pro ireducibilnı́ a necyklickou matici B , x̂ = lim B k y. k→∞ 2 . Základnı́ označenı́ n je počet agregačnı́ch skupin (Gi ), G1 , . . . , Gn jsou disjunktnı́ množiny indexů, ∪ni=1 Gi = {1, . . . , N }, I je jednotková matice a e je vektor jedniček, R je matice redukce typu n × N , Rij = 1 pro j ∈ Gi a 0 jinak, S(x) je matice prolongace typu N × n, Sji (x) = xj / P (x) je projekce P (x) = S(x)R 3 P k∈Gi xk pro j ∈ Gi a 0 jinak, Obecná iteračnı́ agregačnı́ - deagregačnı́ (IAD) metoda. Opakujı́ se kroky 2 - 5: x0 > 0, ||x0 ||1 = 1, a matice základnı́ iterace T ; 1 Zvolı́ se počátečnı́ aproximace k := 0. 2 Vyřešı́ se RBS(xk )z 3 Prodlouženı́ z na y k = z. = S(xk )z . 4 Korekce základnı́ iteracı́ xk+1 5 Test konvergence, k = T yk . := k + 1. Základnı́ iterace v kroku 4 může odpovı́dat např. mocninné metodě, blokové Jacobiově nebo Gaussově-Seidelově metodě, atd. Jako základnı́ iterace použı́váme násobenı́ maticı́ Takovou IAD metodu nazveme Algoritmus 1. 4 p(B), kde p je polynom, p(1) = 1. Známé výsledky Stewart (94) - odhad faktoru konvergence pro téměř úplně rozložitelné matice, kvantitativnı́ odhady při splněnı́ 4 podmı́nek (matice i řešenı́) a ǫ → 0. Mandel, Sekerka (83) - Odhad asymptotického faktoru konvergence pro matici B s pozitivnı́m řádkem. Courtois, Semal (86) - Konvergence pro cyklickou iteračnı́ matici blokové Jacobiovy metody M −1 W , I − B = M − W , je-li prováděna agregace. Otázka četnosti agregačnı́ho kroku. Marek, Mayer (98 a 03) - Odvozenı́ tvaru chybové matice. Poprvé uvedena tzv. rychlá konvergence. Ipsen, Kirkland (04) - Speciálnı́ volba agregačnı́ch skupin. Studium konvergence na základě jiné formulace algoritmu a použitı́ stochastického doplňku. 5 Lokálnı́ konvergence Chyba se řı́dı́ vztahem xk+1 − x̂ = J(xk )(xk − x̂), kde J(x) = T (I − P (x)Z)−1 (I − P (x)), kde Z je dáno spektrálnı́m rozkladem matice B , B = P + Z, P 2 = P, P Z = ZP = 0, P je Perronova-Frobeniova projekce přı́slušná B . Studiem J(x̂) lze najı́t některé postačujı́cı́ podmı́nky pro lokálnı́ konvergenci. Rekurentnı́ formule pro J(x), je-li T = B, J(x) = B(I − P (x)) + BP (x)J(x). 6 Věta 1. Je-li p(t) přesné řešenı́ x̂. = αt + (1 − α) a α ∈ (0, 1i, pak jediným pevným bodem Algoritmu 1 je Věta 2. Je-li p(t) = αt + (1 − α) a α ∈ (0, 1), pak Algoritmus 1 konverguje lokálně pro každou ireducibilnı́ stochastickou matici B k přesnému řešenı́. Věta 3. Je-li p(t) = t a základnı́ iterace je doplněna krokem xk+1 := αxk+1 + (1 − α)xk , α ∈ (0, 1), pak Algoritmus 1 konverguje lokálně pro každou ireduciblinı́ stochastickou matici B k přesnému řešenı́ x̂. Věta 4. Je-li p(t) = t a diagonála matice k přesnému řešenı́ x̂. B je kladná, pak Algoritmus 1 konverguje lokálně 7 Věta 5. Je-li p(t) = t a matice B obsahuje alespoň jeden kladný řádek, pak Algoritmus 1 konverguje lokálně k přesnému řešenı́ x̂ a asymptotický faktor konvergence je kde β je minimálnı́ prvek tohoto řádku. p 1 − β, Je-li matice B kladná, pak asymptotický faktor konvergence je 1 − β, kde β = max{||v||1 ; B ≥ veT , v ≥ 0}. 8 Divergence. Obecně lze tedy ukázat, že ρ(J(p, x̂)) < 1 pro p(t) = αt + (1 − α) a α ∈ (0, 1), ale ρ(J(p, x̂)) ≤ 1 pro α = 0 nebo 1. Právě pro k řešenı́ ani v lokálnı́m smyslu. α = 1 lze najı́t matici takovou, že Algoritmus 1 nekonverguje Přı́klad 1. 1/2 0 1/2 B = 1/2 0 0 1/2 , 1 0 agregačnı́ skupiny G1 = {1} a G2 = {2, 3}. Polynom pouze pro množinu počátečnı́ch přiblı́ženı́ mı́ry nula. 9 p(t) = t. Oscilace. Konvergence Zobecněnı́ takové situace. Přı́klad 2. B= × ... × × 0 .. . .. . × ... × × 0 ... 0 ... 0 × ... × 0 × 0 0 ... × ... 0 .. . .. . .. . 0 0 ... .. . .. . .. . 0 ... ... 0 .. . 0 .. . × 0 . Vysvětlenı́ na základě formulace algoritmu pomocı́ stochastického doplňku. Lemma 1. Pro aproximace xk , k = 1, 2, . . ., zı́skané Algoritmem 1 pro p(t) = t platı́ BP (xk )xk+1 = xk+1 . 10 Vyberme některou aggregačnı́ skupinu Gi . Potom (po vhodné permutaci) máme B ve tvaru B= C BG i B11 R BG i BGi . Stejně rozdělı́me P (xk ) na blokově diagonálnı́ matici P (xk ) = k P (x )1 0 0 P (xk )Gi Potom rovnice BP (xk )xk+1 = xk+1 lze vyjádřit ve tvaru ρk+1 je faktor zaručujı́cı́ ||xk ||1 = 1 a B̃Gi (xk ) = k 0 (I − B11 P (x )1 ) 0 SGi (xk ) −1 C BG i . xk+1 = ρk+1 B̃Gi (xk )e, kde 0 P (xk )Gi kde SGi je stochastická matice, R k k −1 C SGi (xk ) = BGi + BG P (x ) (I − B P (x ) ) BGi . 1 11 1 i 11 , Věta 6. Je-li matice SGi (x) cyklická indexu m pro některý vektor x potom posloupnost {xk }∞ k=0 zı́skaná Algoritmem 1 konverguje k přesnému řešenı́ x̂ pouze v přı́padě, že částečné součty části x0Gi počátečnı́h vektoru x0 odpovı́dajı́cı́ blokům cykličnosti matice SGi (x) jsou stejné. Z toho ihned dostaneme Věta 7. Je-li matice SGi (x) cyklická pro některý vektor x, pak možina počátečnı́ch přiblı́ženı́, pto která Algoritmus 1 konverguje k přesnému řešenı́, má mı́ru nula v množině všech přı́pustných počátečnı́ch přiblı́ženı́. 12 Vyššı́ stupeň polynomu p Přı́klad 3. Uvažujme primitivnı́ stochastickou matici B1 0 1/2 0 0 1/2 0 0 0 1 . 1 0 0 0 0 1 1/2 B1 = 0 0 0 0 0 1/2 Agregačnı́ skupiny jsou G1 0 0 0 = {1, 2} a G2 = {3, 4, 5}. Potom máme x̂1 = (1, 4, 2, 2, 2)T /11. Nechť p1 (t) = t a p2 (t) = t2 . Spektrálnı́ poloměry matic J(., x̂1 ) jsou ρ(J(p1 , x̂1 )) = 1 a ρ(J(p2 , x̂1 )) = 1.1570 > 1. 13 Přı́klad 4. 0 1 B2 = 0 0 0 Agregačnı́ skupiny jsou G1 pravděpodobnisti x̂2 máme 0 1/2 0 1/100 1/2 1/2 0 0 1/2 0 99/100 0 0 0 0 0 1/100 99/100 . 0 0 = {1, 2} a G2 = {3, 4, 5}. Potom pro stacionálnı́ rozdělenı́ ρ(J(p1 , x̂2 )) = 0.9855 < 1 a ρ(J(p2 , x̂2 )) = 1.1271 > 1 kde opět p1 (t) = t a p2 (t) = t2 . Všimňeme si, že Algoritmus 1 s p(t) = tk konverguje loálně pro k = 1 ale diverguje (i v lokálnı́m smyslu) pro k = 2. Tedy vı́ce kroků v základnı́ iteraci porušı́ konvergenci. 14 Spectral radii of J 1,2 1 0,8 0,6 0,4 0,2 0 0 2 4 6 8 Exponent k 10 12 Figure 1: Spektrálnı́ poloměr matic J(pk , x̂) pro B2 a pk (t) 15 14 = tk . Závěr a dalšı́ otázky • Lokálnı́ konvergence IAD metody nenı́ zaručena pro B ireducibilnı́ a necyklickou. Tyto výsledky zatı́m platı́ pro T = B k . • Otázky. Jaká mocnina je dostatečná pro lokálnı́ konvergenci - na základě struktury nenulových prvků matice B ? Oscilace v přı́padě divergence? Je bloková Jacobiova metoda postačujı́cı́ pro lokálnı́ konvergenci? Je konvergence v lokálnı́m smyslu vždy postačujı́cı́ pro konvergenci? Poděkovánı́. Tato práce byla podpořena projektem Informačnı́ společnost č. 1ET400300415. 16 Literatura • P. J. Courtois, P. Semal, Block iterative algorithms for stochastic matrices, 1986 • I. C. F. Ipsen, S. Kirkland, Convergence analysis of an improved PageRank algorithm, 2004 • I. Marek, P. Mayer, Convergence theory of some classes of iterative aggregation disaggregation methods for computing stationary probability vectors of stochastic matrices, 2003 • I. Marek, I. Pultarová, A note on local and global convergence analysis of iterative aggregation-disaggregation methods, 2004 • I. Pultarová, Local convergence analysis of IAD methods with polynomial correction based on sparsity of stochastic matrices, 2005 • W. J. Stewart, Introduction to the numerical solutions of Markov chains, 1994 17
Podobné dokumenty
tisku - FSE UJEP
Obecně, tento popis vzájemného vztahu probı́há tak, že hodnotám jedné veličiny (tzv.
nezávisle proměnné) přiřazujeme hodnoty druhé veličiny (tzv. závisle proměnné).
Definice 0.1.1...
Základy obecné algebry
4) T 7→ M \ T =: T ′ je unárnı́ operace na množině všech podmnožin P(M ) množiny M .
Definice 1.4. Bud’ A množina, n ∈ N0 , D ⊆ An . Potom zobrazenı́ ω : D → A se nazývá
n-árnı́ parciáln...
nosnostní tabulka - odporově svařované rošty sp
Fv = hodnoty zatížení u rovnoměrně rozložené zátěže v kN/m²
f = průhyb při zatížení v mm při zatížení Fv
Fp = hodnoty zatížení u středově působící jednotlivé zátěže v kN na ploše 200 x 200 mm
f1 = ...