Stochastické diferenciální rovnice
Transkript
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA STROJNÍHO INŽENÝRSTVÍ DISERTAČNÍ PRÁCE k získání akademického titulu Doktor (Ph. D.) ve studijním oboru MATEMATICKÉ INŽENÝRSTVÍ RNDr. Edita Kolářová Stochastické diferenciální rovnice v elektrotechnice Školitel: prof. RNDr. Jan Franců, CSc. Oponenti: Datum státní doktorské zkoušky: 10.2.2005 Datum odevzdání práce: Obsah 1 Úvod 1.1 Cíle, přínos a popis práce . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Základní symboly a značení . . . . . . . . . . . . . . . . . . . . . . . 2 Teorie stochastických diferenciálních rovnic 2.1 Úvod do teorie pravděpodobnosti . . . . . . . . . . . . . . 2.1.1 Pravděpodobnostní prostor . . . . . . . . . . . . . 2.1.2 Náhodná veličina, střední hodnota a nezávislost . . 2.1.3 Charakteristická funkce . . . . . . . . . . . . . . . 2.1.4 Stochastické procesy a podmíněná střední hodnota 2.2 Brownův pohyb a jeho vlastnosti . . . . . . . . . . . . . . 2.2.1 Konstrukce Brownova pohybu . . . . . . . . . . . . 2.2.2 Vlastnosti Brownova pohybu . . . . . . . . . . . . . 2.2.3 Martingaly a Markovovy procesy . . . . . . . . . . 2.3 Stochastický integrál . . . . . . . . . . . . . . . . . . . . . 2.3.1 Itôův integrál . . . . . . . . . . . . . . . . . . . . . 2.3.2 Itôova formule . . . . . . . . . . . . . . . . . . . . 2.4 Stochastické diferenciální rovnice . . . . . . . . . . . . . . 2.4.1 Existence a jednoznačnost řešení . . . . . . . . . . 2.4.2 Některé typy rovnic a jejich metody řešení . . . . . 2.5 Numerické řešení stochastických diferenciálních rovnic . . 2.5.1 Stochastická Eulerova metoda . . . . . . . . . . . . 2.5.2 Stochastická Milsteinova metoda . . . . . . . . . . 2.5.3 Aproximace střední hodnoty stochastického řešení . . . . . . . . . . . . . . . . . . . 3 Stochastické diferenciální rovnice v elektrotechnice 3.1 Deterministický model RL obvodu . . . . . . . . . . . . . . . 3.2 Stochastický model RL obvodu . . . . . . . . . . . . . . . . 3.2.1 RL obvod se stochastickým zdrojem . . . . . . . . . 3.2.2 RL obvod se stochastickým odporem . . . . . . . . . 3.2.3 RL obvod se stochastickým zdrojem i odporem . . . 3.3 Dodatek – Porovnání teoretických výsledků s experimentem 4 Závěr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 4 6 . . . . . . . . . . . . . . . . . . . 7 7 7 9 11 12 13 14 20 23 24 26 28 31 32 36 38 39 40 42 . . . . . . 43 43 44 44 46 48 53 55 2 Kapitola 1 Úvod Fyzikální jevy se obvykle modelují deterministicky, pomocí diferenciálních rovnic, které popisují průměrné chování systému. Pro úplnější informace o systému můžeme do modelu zahrnout náhodné vlivy. Tím vznikne nový matematický model, takzvaný stochastický. Takový model můžeme vytvořit buď přímo pro daný problém, nebo ho získat vhodnou úpravou klasického deterministického modelu. Během posledních 50 let se studium stochastických modelů vyvíjelo velmi intenzívně v řadě oborů. Vznikla potřeba uvažovat o náhodných vlivech také v inženýrských oborech. Jedna z technik „stochastizaceÿ spočívá v tom, že v deterministickém matematickém modelu systému se jeden nebo více vstupních parametrů nahradí náhodnými procesy. Řešením výsledného modelu je opět náhodný proces. Uvažujme například obyčejnou diferenciální rovnici dx = a(t, x). dt Stochastickou verzi této rovnice můžeme získat přidáním dalšího členu b(t, X(t))ξ(t) do pravé strany rovnice d X(t) = a(t, X(t)) + b(t, X(t))ξ(t) dt kde symbol ξ(t) označuje stochastický proces nazývaný obvykle „bílý šumÿ. Řešením této rovnice bude náhodný proces X(t). Z matematického hlediska je tato rovnice problematická zejména proto, že bílý šum ξ(t) nemá spojité trajektorie. Je tedy potřeba tento model dále modifikovat. Vynásobme rovnici dt, dX(t) = a(t, X(t)) dt + b(t, X(t))ξ(t) dt a označme ξ(t) dt = dW (t). Tento člen budeme interpretovat jako přírůstek Wienerova procesu W (t). Tento proces, nazývaný také Brownův pohyb, hraje klíčovou roli ve stochastickém modelování. Dostali jsme se tak ke stochastické diferenciální rovnici dX(t) = a(t, X(t)) dt + b(t, X(t)) dW (t), 3 kterou ve skutečnosti chápeme jako integrální rovnici Z t Z t X(t) = X(t0 ) + a(s, X(s)) ds + b(s, X(s)) dW (s). t0 t0 V tomto tvaru stochastické diferenciální rovnice jsou na pravé straně dva různé druhy integrálů. Prvním je klasický Riemannův integrál, druhým je stochastický integrál podle dW (t). Wienerův proces je sice spojitý ale má nekonečnou variaci, proto v tomto případě nemůže jít o Riemann-Stieltjesův integrál. Stochastický integrál poprvé definoval Japonský matematik Itô ve 40-tých letech minulého století. Od něj pochází výše uvedený integrální tvar stochastické diferenciální rovnice, která se do té doby zkoumala jen heuristicky. Itô zavedl nový typ integrálu, Itôův stochastický integrál, a tím vybudoval matematický aparát pro studium stochastických diferenciálních rovnic. 1.1 Cíle, přínos a popis práce Tato práce má dva hlavní cíle. Prvním cílem je vytvořit ucelený přehled Itôova stochastického kalkulu. Druhým cílem je využít tuto teorii na řešení problémů z inženýrské praxe, na stochastické modely elektrických RL obvodů. Teorie stochastických diferenciálních rovnic je velice zajímavý, rychle se rozvíjející obor matematiky, který má širokou škálu aplikací také v inženýrské praxi. Studium matematické teorie stochastických diferenciálních rovnic předpokládá znalost mnoha oblastí matematiky, jako jsou pravděpodobnost, teorie míry, obyčejné diferenciální rovnice a funkcionální analýza. Jedním z našich cílů bylo shrnout teorii tak, aby byla čitelná a srozumitelná i pro studenty inženýrského studia. Základní studijní literaturou byla monografie Øksendal [10]. Tato monografie je sice úvodem do oboru, je ale hodně teoreticky orientována. Řada pojmů je přístupnější v učebním textu Evans [4]. Konkrétní metody pro řešení stochastických diferenciálních rovnic jsou rozpracovány v monografii Arnold [1]. Tato kniha je nejvhodnější pro inženýrskou praxi, ale neobsahuje teoretické základy. Numerické metody jsme čerpali z knih Kloeden [7] a Cyganowski [3]. V těžkých chvílích bylo osvěžením otevřít knihu Steele [9], která je zaměřená na aplikace ve finanční matematice a náročnou teorii vysvětluje přístupnou formou. Druhá kapitola poskytuje úvod do teorie stochastických diferenciálních rovnic. Začíná stručným shrnutím nezbytných znalostí z pravděpodobnosti. V této části důkazy tvrzení neuvádíme. Počínaje paragrafem 2.2 se už věnujeme nové teorii. Zde uvádíme většinu tvrzení i s důkazy, pouze velmi složité případně technicky náročné důkazy vynecháváme nebo uvádíme pouze myšlenku důkazu. Nejdříve zavedeme Brownův pohyb a ukážeme jeho konstrukci podle Ciesielskiho. Dále odvodíme jeho druhou variaci a další vlastnosti Brownova pohybu. Dalším krokem je zavedení stochastického integrálu. 4 Naši pozornost soustředíme na Itôův kalkulus, ale ukážeme i rozdíl mezi Itôovým a Stratonovičovým přístupem. Dokážeme také pravidlo pro derivování složené funkce, Itôovu formuli. Od paragrafu 2.4 se věnujeme stochastickým diferenciálním rovnicím. Uvedeme podmínky pro existenci a jednoznačnost řešení. Ukážeme některé typy rovnic a metody řešení, které později využijeme v aplikacích. Na konci této kapitoly se zabýváme numerickými metodami pro stochastické diferenciální rovnice, které jsou pro aplikace v inženýrské praxi nezbytné. Pomocí těchto metod můžeme simulovat analytické řešení anebo získat řešení stochastické diferenciální rovnice, kde analytické řešení neumíme najít. Uvádíme dvě konkrétní metody, Eulerovu a Milsteinovu. Eulerova metoda pro stochastické diferenciální rovnice je odvozená ze stejnojmenné metody pro obyčejné diferenciální rovnice. Milsteinova metoda byla vytvořená přímo pro stochastické diferenciální rovnice. Třetí kapitola se zabývá aplikacemi teorie na elektrické obvody. Matematickým modelem jednoduchého elektrického RL obvodu je obyčejná lineární diferenciální rovnice prvního řádu. V této části práce ukážeme „stochastizaciÿ rovnice sériového elektrického RL obvodu, kde se náhodný člen objeví buď na pravé straně rovnice nebo u některého z koeficientů. Uvažujeme také rovnici se dvěma náhodnými koeficienty. Ve všech případech odvodíme analytické řešení pomocí Itôovy formule a pomocí numerické simulace vygenerujeme několik trajektorií řešení. Najdeme intervaly, kde se s velkou pravděpodobnosti nacházejí trajektorie stochastického řešení. Numerické simulace jsou naprogramovány v jazyce C#. Jde o nový, objektově orientovaný jazyk systému MS .Network. Využíváme knihovnu LinAlg, která umožňuje vektorové programování a má širokou škálu možnosti pro práci s maticemi. Na konci kapitoly uvádíme popis pokusu ve kterém jsme na konkrétním RL obvodu se zašuměným zdrojem změřili hodnoty proudu. Potvrdilo se, že naměřené hodnoty se nachází v intervalu získaném na základě teoretických výsledků. Jedním z přínosů této práce je vytvoření co nejvíce vyváženého textu, který zpřístupňuje hlubokou matematickou teorii zájemcům o její aplikace, především inženýrům. Dalším přínosem je implementace numerických schémat pro řešení stochastických rovnic do jazyku C#. Hlavním přínosem práce je z matematického hlediska kompletní řešení RL obvodu pomocí stochastického kalkulu. Našli jsme jak analytické, tak i numerické řešeni stochastického modelu obvodu se dvěma náhodnými parametry. Vyšetřili jsme statistické vlastnosti řešení a našli oblasti, kde se řešení nachází se zadanou pravděpodobností. 5 1.2 Základní symboly a značení R – množina reálných čísel B – Borelovská σ-algebra na množině R (Ω, A, P ) – pravděpodobnostní prostor E[X] – střední hodnota náhodné veličiny X V [X] – rozptyl náhodné veličiny X E[X|H] – podmíněná střední hodnota náhodné veličiny X vzhledem k σ-algebře H N (m, σ 2 ) – normální rozdělení se střední hodnotou m a s rozptylem σ 2 W (t), W (t, ω) – Wienerův proces na pravděpodobnostním prostoru (Ω, A, P ) Ft – σ-algebra generovaná W (s), s ≤ t na (Ω, A, P ) FtM RT A dW (t) 0 RT B ◦ dW (t) 0 – σ-algebra generovaná procesem (W1 (s), . . . , WM (s)), s ≤ t – Itôův integrál z A(t, ω) na intervalu (0, T ) – Stratonovičův integrál z B(t, ω) na intervalu (0, T ) Lp (0, T ), 1 ≤ p – prostor reálných procesů G(t, ω) na prostoru (Ω, A, P ) dle definice 2.3.3 6 Kapitola 2 Teorie stochastických diferenciálních rovnic 2.1 2.1.1 Úvod do teorie pravděpodobnosti Pravděpodobnostní prostor Definice 2.1.1. Systém podmnožin A dané množiny Ω se nazývá σ-algebra, jestliže platí: (i) ∅ ∈ A, (ii) A ∈ A ⇒ AC ∈ A, kde AC = Ω\A, ∞ [ (iii) A1 , A2 , . . . ∈ A ⇒ Ai ∈ A. i=1 Definice 2.1.2. Je-li A σ-algebra na Ω, potom dvojice (Ω, A) se nazývá měřitelný prostor. Množinová funkce P definovaná na σ-algebře A se nazývá pravděpodobnostní míra , jestliže 1. P (∅) = 0, P (Ω) = 1 2. P (A) ≥ 0 pro každé A ∈ A T 3. Pro Ai ∈ A, kde Ai Aj = ∅ je - li i 6= j, platí P( ∞ [ Ai ) = i=1 ∞ X P (Ai ). i=1 Trojice (Ω, A, P ) se nazývá pravděpodobnostní prostor. Definice 2.1.3. Nechť U je systém podmnožin množiny Ω. Potom nejmenší σalgebru, která obsahuje U, nazýváme σ-algebrou generovanou U a značíme GU . \ GU = { G; G je σ−algebra na Ω, U ⊂ G}. 7 Je-li Ω = Rn a U je systém všech otevřených podmnožin Rn , potom σ-algebru generovanou U nazýváme Borelovskou σ-algebrou na Ω, a označujeme B. Množiny B ∈ B nazýváme borelovské množiny. Poznámka. Nechť je f nezáporná integrovatelná funkce na Rn pro kterou je R f dx = 1. Pro každou borelovskou množinu B ∈ B definujeme Rn Z P (B) = f dx. B Potom (Rn , B, P ) je pravděpodobnostní prostor. Funkce f se nazývá hustota pravděpodobnostní míry P. Příklad 2.1.4. Nechť z ∈ Rn je pevně daný bod. Definujeme pro každou borelovskou množinu B ∈ B 1 pokud z ∈ B, P (B) := 0 pokud z ∈ / B. Potom (Rn , B, P ) je pravděpodobnostní prostor. Míra P se nazývá Diracova míra soustředěná do bodu z. Píšeme P = δz . Příklad 2.1.5. Wienerova míra. Uvažujme množinu Ω := {ω : h0, ∞) → R, ω(0) = 0, ω spojitá funkce. } Nechť jsou dané hodnoty 0 = t0 < t1 < . . . < tk a intervaly (ai , bi ) pro i = 1, . . . , k. Potom pro množinu A := {ω ∈ Ω | ai < ω(ti ) < bi , i = 1, . . . , k} (2.1) definujeme pravděpodobnost Z b1 Z bk P (A) := ... p(t1 , 0, x1 ) p(t2 − t1 , x1 , x2 ) . . . p(tk − tk−1 , xk−1 , xk ) dx1 . . . dxk a1 ak kde |x−y|2 1 e− 2t , x, y ∈ R, t > 0. 2πt Wiener dokázal, že zobrazení P lze rozšířit na pravděpodobnostní míru na σ-algebře generované všemi množinami typu (2.1). p(t, x, y) = √ Poznámka. Obvykle se pokládá p(0, x, y) = δx (y). Poznámka. Wienerovu míru můžeme definovat i ve vícerozměrném prostoru na množině Ω := {ω : h0, ∞) → Rn , ω(0) = 0, ω spojitá funkce }. 8 V tomto případě je n p(t, x, y) = (2πt)− 2 e− |x−y|2 2t , x, y ∈ Rn , t > 0. Příslušnou σ-algebru generují množiny typu A := {ω ∈ Ω | ω(t1 ) ∈ F1 , ω(t2 ) ∈ F2 , . . . , ω(tk ) ∈ Fk , i = 1, . . . , k} kde 0 = t0 < t1 < . . . < tk jsou reálná čísla a F1 , . . . , Fk ⊂ Rn , otevřené množiny. Z P (A) = p(t1 , 0, x1 ) p(t2 − t1 , x1 , x2 ) . . . p(tk − tk−1 , xk−1 , xk ) dx1 . . . dxk . F1 ×...×Fk 2.1.2 Náhodná veličina, střední hodnota a nezávislost Definice 2.1.6. Nechť (Ω, A, P ) je pravděpodobnostní prostor. Zobrazení X : Ω → Rn , n ≥ 1 se nazývá náhodná veličina, jestliže pro každé B ∈ B je X −1 (B) ∈ A. Poznámka. Náhodná veličina X je P -měřitelná funkce z (Ω, A, P ) do (Rn , B). Definice 2.1.7. Nechť X : Ω → Rn , n ≥ 1 je náhodná veličina. Potom systém množin G(X) := {X −1 (B) | B ∈ B } tvoří σ-algebru na Ω, které říkáme σ-algebra generovaná X. Věta 2.1.8. Nechť X, Y : Ω → Rn jsou dvě funkce, potom Y je G(X)- měřitelná právě když existuje borelovsky měřitelná funkce g : Rn → Rn taková, že Y = g(X). Definice 2.1.9. Každá náhodná veličina na X : Ω → Rn na pravděpodobnostním prostoru (Ω, A, P ) indukuje pravděpodobnostní míru µX na Rn definovanou předpisem µX (B) = P (X −1 (B)). Míra µX se nazývá rozdělení náhodné veličiny X. R |X(ω)| dP (ω) < ∞, potom číslo Z Z E[X] := X(ω) dP (ω) = x dµX (x) Definice 2.1.10. Jestliže Ω Rn Ω se nazývá střední hodnota X (vzhledem k P ). 9 n Z Poznámka. Obecněji, je-li funkce f : R → R a |f (X(ω))| dP (ω) < ∞, potom Ω Z E[f (X)] := Z f (X(ω)) dP (ω) = f (x) dµX (x). Rn Ω Definice 2.1.11. Z V [X] := |X − E[X]|2 dP = E[|X|2 ] − |E[X]|2 Ω se nazývá rozptyl náhodné veličiny X (vzhledem k P ). Věta 2.1.12. (Čebyševova nerovnost.) Nechť X : Ω → R je náhodná veličina s konečnou střední hodnotou m a konečným rozptylem σ 2 . Pak pro libovolné c > 0 platí nerovnost 1 P (|X − m| ≥ c σ) ≤ 2 . c Příklad 2.1.13. Náhodná veličina X : Ω → R má normální rozdělení N (m, σ 2 ), jestliže Z (x−m)2 1 P [X ∈ B] = √ e− 2σ2 dx, σ 2π B kde m a σ jsou konstanty, σ > 0, a B ∈ R je Borelovská množina. V tomto případě platí E[X] = m a V [X] = σ 2 . Definice 2.1.14. Dvě množiny A, B ∈ A se nazývají nezávislé jestliže platí P (A ∩ B) = P (A) · P (B). Soubor H = {Hi ; i ∈ I} systémů měřitelných množin je nezávislý jestliže platí P (Hi1 ∩ . . . ∩ Hik ) = P (Hi1 ) . . . P (Hik ) pro libovolnou volbu Hi1 ∈ Hi1 , . . . , Hik ∈ Hik s navzájem různými indexy i1 , . . . , ik . Systém náhodných veličin Xi , i ∈ I je nezávislý, jestliže soubor σ-algeber GXi generovaných Xi tvoří nezávislý systém. Věta 2.1.15. Nechť X, Y : Ω → R jsou dvě nezávislé náhodné veličiny, pro které E[|X|] < ∞ a E[|Y |] < ∞. Potom E[XY ] = E[X]E[Y ] a V [X + Y ] = V [X] + V [Y ]. Věta 2.1.16. Nechť X, Y : Ω → R jsou dvě náhodné veličiny s normálním rozdělením. Potom platí, že X, Y jsou nezávislé ⇔ E[(X − E[X])(Y − E[Y ])] = 0. 10 Věta 2.1.17. ( Borel-Cantelliho lemma.) Nechť (Ω, A, P ) je pravděpodobnostní prostor a nechť A1 , . . . , An , . . . ∈ A. Potom (i) P ( ∞ [ ∞ \ Am ) = 0 jestliže n=1 m=n (ii) P ( ∞ [ ∞ \ ∞ X P (An ) < ∞ n=1 Am ) = 1 jestliže n=1 m=n ∞ X P (An ) = ∞ a An jsou nezávislé. n=1 Definice 2.1.18. Nechť (Ω, A, P ) je pravděpodobnostní prostor. Říkáme, že pop sloupnost náhodných veličin {Xk }∞ k=1 konverguje v L k náhodné veličině X : Ω → R, jestliže h i p lim E |Xk − X| = 0. k→∞ Pro p = 1 mluvíme o konvergeci ve smyslu středů a v případě p = 2 o konvergeci ve smyslu kvadratických středů. 2.1.3 Charakteristická funkce Definice 2.1.19. Nechť X je n-rozměrná náhodná veličina. Potom funkce φX (λ) := E[eiλ·X ] λ ∈ Rn se nazývá charakteristická funkce X. Příklad 2.1.20. Nechť je X náhodná veličina s rozdělením N (0, 1). Potom φX (λ) := e− λ2 2 Je-li X náhodná veličina s rozdělením N (m, σ 2 ), potom φX (λ) := eimλ− λ2 σ 2 2 . Věta 2.1.21. Jestliže X1 , . . . , Xn jsou nezávislé náhodné veličiny, potom φX1 +...+Xn (λ) := Πnj=1 φjX (λ) λ ∈ Rn . Věta 2.1.22. Nechť X je jednorozměrná náhodná veličina. Potom E[X k ] = 1 (k) φ (0). ik Věta 2.1.23. Charakteristická funkce jednoznačně určuje rozložení náhodné veličiny. 11 2.1.4 Stochastické procesy a podmíněná střední hodnota Definice 2.1.24. Nechť (Ω, A, P ) je pravděpodobnostní prostor a T ⊂ R je interval. Systém náhodných veličin {X(t)| t ∈ T } se nazývá stochastický proces. Poznámka. Nejčastěji máme T =< 0, ∞) a díváme se na parametr t jako na čas. Pro pevné ω ∈ Ω dostaneme funkci t → X(t, ω); t∈T kterou nazveme trajektorií X(t). Je možné ztotožnit ω s trajektorií t → X(t, ω), tzn. s funkcí T → Rn . V tomto případě považujeme Ω za podmnožinu prostoru Ω = (Rn )T - prostoru všech funkcí z T do Rn . Potom σ-algebra A bude obsahovat σ-algebru B generovanou množinami typu {ω | ω(t1 ) ∈ F1 , . . . , ω(tk ) ∈ Fk }, Fi ⊂ Rn borelovská. Můžeme se tedy dívat na stochastický proces jako na pravděpodobnostní míru P definovanou na prostoru ((Rn )T , B). Definice 2.1.25. Řikáme, že stochastický proces {Y (t)| 0 ≤ t < ∞} na pravděpodobnostním prostoru (Ω, A, P ) je Gaussův proces, jestliže pro libovolnou posloupnost 0 ≤ t1 < t2 < . . . < tk má vektor (Y (t1 ), . . . Y (tk )) multidimenzionální normální rozdělení. Definice 2.1.26. Nechť (Ω, A, P ) je pravděpodobnostní prostor a A, B ∈ A a P (B) > 0. Potom vzorec P (A ∩ B) P (A|B) := P (B) definuje podmíněnou pravděpodobnost jevu A za předpokladu B. Poznámka. Podmíněná pravděpodobnost jevu A za předpokladu B je vlastně pravděpodobnost jevu A ∩ B v novém prostoru, kdy se díváme na množinu B jako P e Pe), . Označme tento prostor (B, A, na pravděpodobnostní prostor s mírou Pe = P (B) kde Ae je σ-algebra A zúžená na množinu B. Je-li X : Ω → Rn náhodná veličina na (Ω, A, P ) potom bude X|B náhodná veličina e Pe) a můžeme mluvit o tzv. podmíněné střední hodnotě na (B, A, Z Z 1 E[X|B] = X dPe = X dP. P (B) B B 12 Mějme teď náhodné veličiny X(ω), Y (ω), E[X] < ∞. Chtěli bychom znát podmíněnou střední hodnotu veličiny X za předpokladu Y. E[X|Y ] už nemůže být číslo, ale náhodná veličina a její hodnoty závisí na G(Y ) – σ-algebře generované Y, nezávisí přímo na funkčních hodnotách funkce Y. Tyto úvahy jsou východiskem k obecné definici podmíněné střední hodnoty. Definice 2.1.27. Nechť je X náhodná veličina na (Ω, A, P ), E[X] < ∞, a nechť H je σ-algebra H ⊂ A. Podmíněnou střední hodnotu veličiny X vzhledem k H rozumíme náhodnou veličinu E[X|H] která je 1. měřitelná vzhledem k H R R 2. H X dP = H E[X|H] dP pro H ∈ H. Věta 2.1.28. Nechť je (Ω, A, P ) pravděpodobnostní prostor, H ⊂ A je σ-algebra na tomto prostoru a X, Y : Ω → Rn , E[X] < ∞, E[Y ] < ∞ jsou dvě náhodné veličiny. Potom (i) E[aX + bY |H] = aE[X|H] + bE[Y |H] pro a, b ∈ R (ii) E[E[X|H]] = E[X] (iii) E[X|H] = X je-li X H- měřitelná (iv) E[X|H] = E[X] je-li X nezávislá na H. (v) Je-li H = A potom E[X|H] = X (vi)Je-li X ≤ Y potom E[X|H] ≤ E[Y |H] (vii) E[XY |H] = X E[Y |H] je-li X H- měřitelná. Věta 2.1.29. Nechť F a H jsou σ-algebry, takové že F ⊂ H. Potom E[X|F] = E[E[X|H]|F]. Věta 2.1.30. (Jensenova nerovnost.) Nechť φ : R → R je konvexní funkce a E[|φ(X)|] < ∞, potom φ(E[X|H]) 5 E[φ(X)|H]. Poznámka. (Důsledky Jensenovy nerovnosti) (i) |E[X|H]| 5 E[|X||H] (ii) |E[X|H]|2 5 E[|X|2 |H]. 2.2 Brownův pohyb a jeho vlastnosti Brownův pohyb - matematický model pohybu částice v tekutině - je důležitým příkladem náhodného procesu, který hraje klíčovou roli v teorii stochastických diferenciálních rovnic. Matematická teorie Brownova pohybu byla započata Wienerem (r. 1923), který rozložení pravděpodobnosti procesu Brownova pohybu chápal jako míru v prostoru spojitých funkcí. Proto se tento proces nazývá také Wienerův proces. 13 Definice 2.2.1. Reálný stochastický proces W (t) na pravděpodobnostním prostoru (Ω, A, P ) se nazývá Brownův pohyb nebo Wienerův proces, jestliže platí 1. W (0) = 0 skoro všude 2. W (t) − W (s) má N (0, t − s) rozdělení pro t ≥ s ≥ 0 3. pro libovolná 0 < t1 < t2 . . . < tn jsou přírůstky W (t1 ), W (t2 ) − W (t1 ), W (t3 ) − W (t2 ), . . . , W (tn ) − W (tn−1 ) vzájemně nezávislé náhodné veličiny. Poznámka. Platí, že (i) E[W (t)] = 0 pro t > 0. (ii) E[W 2 (t)] = t. Poznámka. Wienerův proces představuje integrál toho, co se v praktických aplikacích nazývá bílým šumem. Věta 2.2.2. Nechť W (t) je Wienerův proces. Potom E[W (t)W (s)] = min{t, s} pro t ≥ 0, s ≥ 0. Důkaz: Nechť t ≥ s ≥ 0. Potom E[W (t)W (s)] = E[(W (s) + W (t) − W (s))W (s)] = = E[W (s)2 ] + E[(W (t) − W (s))W (s)] = = s + E[W (t) − W (s)] E[W (s)] = s = min{t, s}. | {z } | {z } =0 2.2.1 =0 Konstrukce Brownova pohybu Konstrukci Brownova pohybu provedeme podle Z. Ciesielskiho. Nejprve se omezíme na t ∈ h0, 1i. Definice 2.2.3. Pro t ∈ h0, 1i definujeme Haarovy funkce {hk (·)}∞ k=0 takto: h0 (t) := 1 pro t ∈ h0, 1i. ( 1 pro t ∈ h0, 21 i h1 (t) := −1 pro t ∈ ( 12 , 1i 14 Pro 2n ≤ k < 2n+1 , n = 1, 2, . . . , definujeme n n 2n/2 pro k−2 ≤ t ≤ k−22n+1/2 2n n n hk (t) := −2n/2 pro k−22n+1/2 < t ≤ k−22n +1 0 jinde. Věta 2.2.4. Haarovy funkce tvoří úplný ortonormální systém v prostoru L2 (h0, 1i) - funkcí integrovatelných s kvadrátem na intervalu h0, 1i. Důkaz: Platí 1 Z h20 (s) ds = 1 ds = 1 0 0 1 Z h21 (s) 1 Z Z 1 2 ds = 0 1 Z (−1)2 ds = 1 1 ds + 1 2 0 Obecně Z 1 h2k (s) k−2n +1/2 2n Z ds = 2 ds + k−2n 2n 0 k−2n +1 2n Z n n k−2n +1/2 2n 2 ds = 2 Dále pro l > k máme buď hk hl = 0 nebo Z 1 Z n/2 hk (s)hl (s) ds = ±2 0 n 1 2n+1 + 1 2n+1 = 1. 1 hl (s) ds = 0. 0 R1 Nechť pro f ∈ L2 (h0, 1i) je 0 f (s)hk (s) ds = 0 pro každé k = 0, 1, . . . . Abychom dokázali úplnost, ukážeme, že potom f = 0 s.v. Máme Z 1 Z 1 f (s)h0 (s) ds = f (s) ds = 0. 0 0 a také Z 1 f (s)h1 (s) ds = 0. 0 Z těchto dvou vztahů dostaneme Z 1 Z 2 f (s) ds = Z R1 0 f (s)h2 (s) ds = 0 a 1 4 R1 0 1 2 Z f (s) ds = 0 f (s) ds = 0. 1 2 0 Přidáme-li vztahy 1 f (s)h3 (s) ds = 0 dostaneme 3 4 Z f (s) ds = f (s) ds = 0 a 1 2 1 4 15 1 Z f (s) ds = 0. 3 4 Budeme-li v tomto postupu pokračovat, dostaneme pro každé 0 ≤ k < 2n+1 , že Z k+1 2n+1 f (s) ds = 0. k 2n+1 DiadickáR racionální čísla tvoří hustou podmnožinu intervalu h0, 1i a tak můžeme p psát, že r f (s) ds = 0 pro libovolné 0 ≤ r ≤ p ≤ 1. Ale Z d t f (t) = f (s) ds = 0 pro s. v. t. dt 0 Dokázali jsme tedy, že Haarovy funkce tvoří úplný ortonormální systém. Definice 2.2.5. Pro k = 1, 2, . . . definujeme k-tou Schauderovu funkci vztahem Z t sk (t) := hk (s) ds pro t ∈ h0, 1i. 0 Poznámka. Grafy Schauderovy funkce mají tvar rovnoramenného trojúhelníku o n n k−2n +1 výšce 2− 2 −1 , ležícího nad intervalem h k−2 , 2n i. 2n 6 n 2− 2 −1 - - - - - - - - - - - - - - - - - - - - - - -L L L L L L L L L L L k−2n 2n k−2n +1 2n - Věta 2.2.6. Nechť {ak }∞ k=1 je posloupnost reálných čísel, 0 ≤ δ < 1/2 a nechť platí |ak | = O(k δ ) pro k → ∞. Potom řada ∞ X ak sk (t) k=1 konverguje stejnoměrně pro 0 ≤ t ≤ 1. Důkaz: Zvolme si ε > 0. Pro 2n ≤ k < 2n+1 mají funkce sk (·) disjunktní nosiče. Položme bn := max |ak | ≤ C(2n+1 )δ . 2n ≤ k < 2n+1 16 Potom pro 0 ≤ t ≤ 1 a pro m dostatečně velké platí ∞ X |ak ||sk (t)| ≤ k=2m ≤C ∞ X ∞ X bn n=m n+1 δ (2 −n/2−1 max |sk (t)| n+1 2 ≤k<2 0≤t≤1 n (δ−1) ) ·2 =C2 n=m ∞ X 2n(δ−1/2) < ε. n=m {Ak }∞ k=1 Věta 2.2.7. Nechť jsou nezávislé náhodné veličiny s rozdělením N (0, 1). Potom pro skoro všechna ω platí, že p pro k → ∞. |Ak | = O( log k) Důkaz: Pro x > 0, k = 2, . . . , máme Z −x Z ∞ Z ∞ 2 2 s2 1 1 2 − s2 − s2 P (|Ak | > x) = √ e e ds + √ ds = √ e− 2 ds 2π −∞ 2π x 2π x Z ∞ x2 s2 x2 2 e− 4 ds ≤ C · e− 4 ≤ √ e− 4 2π x √ pro nějakou konstantu C. Položme x = 4 log k. Potom p 1 P (|Ak | > 4 log k) ≤ C · e−4 log k = C 4 k . P∞ 1 Protože řada k=1 k4 konverguje, z Borel-Cantelliho lemmatu dostaneme, že p P (|Ak | > 4 log k pro nekonečně mnoho k) = 0. Poznámka. Z této věty speciálně vyplývá, že posloupnost {Ak }∞ k=1 nezávislých N (0, 1) náhodných veličin splňuje předpoklady věty 2.2.6. Věta 2.2.8. Pro 0 ≤ s, t ≤ 1 je součet P∞ k=1 sk (s)sk (t) = min(s, t). Důkaz: Definujme pro 0 ≤ s ≤ 1 funkci ( 1 pro 0 ≤ τ ≤ s ϕs (τ ) := 0 pro s < τ ≤ 1. Protože Haarovy funkce tvoří úplný ortonormální systém, můžeme psát pro s ≤ t Z 1 ∞ X s= ϕt ϕs dτ = ak b k , 0 k=1 kde Z ak = 1 Z ϕt hk dτ = 0 t Z hk dτ = sk (t), bk = 0 Z ϕs hk dτ = 0 17 1 s hk dτ = sk (s). 0 Věta 2.2.9. Nechť {Ak }∞ k=1 je posloupnost nezávislých náhodných veličin s rozdělením N (0, 1), definovaných na daném pravděpodobnostním prostoru. Potom součet W (t, ω) := ∞ X 0≤t≤1 Ak (ω)sk (t), k=1 konverguje stejnoměrně v t pro s.v. ω. Navíc (i) W (·) je Brownův pohyb a (ii) trajektorie procesu t → W (t, ω) jsou spojité pro s. v. ω. Důkaz: Stejnoměrná konvergence řady vyplývá z vět 2.2.6 a 2.2.7 a ze stejnoměrné konvergence spojitých funkcí vyplývá, že trajektorie procesu t → W (t, ω) jsou spojité pro s. v. ω. Musíme dokázat, že W (·) je Brownův pohyb. Je zřejmé, že W (0) = 0 s.v. Teď dokážeme, že pro 0 ≤ s ≤ t ≤ 1 mají přírůstky W (t) − W (s) rozdělení N (0, t − s). Platí P∞ E[eiλ(W (t)−W (s)) ] = E[eiλ k=1 Ak (ω)(sk (t)−sk (s)) ] iλAk (sk (t)−sk (s)) = Π∞ ] k=1 E[e − = Π∞ k=1 e = e− λ2 2 λ2 (sk (t)−sk (s))2 2 P∞ k=1 (sk (t)−sk (s)) = e− 2 (z nezávislosti) (z N (0, 1) rozdělení Ak ) = e− λ2 (t−2s+s) 2 λ2 2 P∞ 2 2 k=1 sk (t)−2sk (t)sk (s)+sk (s) (z věty 2.2.8) = e− λ2 (t−s) 2 . Z jednoznačnosti charakteristické funkce vyplývá, že proces W (t) − W (s) má rozdělení N (0, t − s). Zbývá ještě dokázat, že pro libovolná 0 < t1 < t2 < . . . < tn jsou přírůstky W (t1 ), W (t2 ) − W (t1 ), . . . , W (tn ) − W (tn−1 ) vzájemně nezávislé náhodné veličiny. Protože mají normální rozložení, stačí dokázat, že E[ (W (ti+1 ) − W (ti )) (W (tj+1 ) − W (tj )) ] = 0. Nejdříve spočítáme E[W (t)W (s)]. " E[W (t)W (s)] = E ∞ X Ak (ω)sk (t) · k=1 ∞ X l=1 18 # Al (ω)sl (s) " =E ∞ X # Ak (ω)Al (ω)sk (t)sl (s) = k,l=1 = ∞ X E[ A2k (ω) ]sk (t)sk (s) + k=1 ∞ X E[Ak (ω)Al (ω)]sk (t)sl (s) = k,l=1,k6=l = ∞ X sk (t)sk (s) = min(s, t), k=1 protože Ak jsou navzájem nezávislé N (0, 1) náhodné veličiny. Bez újmy na obecnosti můžeme předpokládat, že ti < tj a máme E[ (W (ti+1 ) − W (ti )) (W (tj+1 ) − W (tj )) ] = E[ W (ti+1 )W (tj+1 ) − W (ti )W (tj+1 ) − W (ti+1 )W (tj ) + W (tj )W (ti ) ] = ti+1 − ti − ti+1 + ti = 0. Věta 2.2.10. Existence Brownova pohybu. Nechť (Ω, U, P) je pravděpodobnostní prostor na kterém je definováno spočetně mnoho nezávislých N (0, 1) náhodných veličin {An }∞ n=1 . Potom existuje jednorozměrný Brownův pohyb W (·) definovaný pro ω ∈ Ω, t ≥ 0. Trajektorie Brownova pohybu 19 Důkaz: Dle předcházející věty zkonstruujeme Brownův pohyb pro 0 ≤ t ≤ 1. Přeznačováním indexů N (0, 1) náhodných veličin dostaneme spočetně mnoho tříd spočetně mnoha náhodných veličin a tak můžeme sestrojit spočetně mnoho nezávislých Brownových pohybů W n (t) pro 0 ≤ t ≤ 1. Pak definujeme Brownův pohyb pro t ≥ 0 vztahem W (t) := W (n − 1) + W n (t − (n − 1)) pro n − 1 ≤ t ≤ n. Poznámka. Uvedeme příklad pravděpodobnostního prostoru na kterém je definováno spočetně mnoho nezávislých N (0, 1) náhodných veličin. Nechť Ω = prostor posloupnosti reálných čísel (x1 , x2 . . .) | {z } ω Nechť U je σ-algebra generovaná množinami typu A := {ω ∈ Ω | ak < xk < bk , k = 1, . . . , m; −∞ ≤ ak ≤ bk ≤ ∞}. Pro takové množiny A definujeme pravděpodobnost předpisem Z bk m Y x2 1 √ P (A) := e− 2 dx. 2π ak k=1 Tuto pravděpodobnost rozšíříme na všechny množiny z U a definujeme An (ω) = xn pro ω = (x1 , x2 , . . .). Potom {An }∞ n=1 jsou nezávislé N (0, 1) náhodné veličiny. 2.2.2 Vlastnosti Brownova pohybu Věta 2.2.11. Nechť je W (t) Brownův pohyb na prostoru (Ω, A, P ). Potom proces (i) W (t0 + t) − W (t0 ) je Brownův pohyb pro t0 > 0. (ii) c W (t/c2 ) je Brownův pohyb pro c > 0. f (t) := W (t0 + t) − W (t0 ). Potom W f (0) = 0 a nezávislost Důkaz: (i) Definujme W přírůstků plyne z nezávislosti přírůstků Brownova pohybu. Pomocí charakteristické f (t) − W f (s) je N (0, t − s). funkce dokážeme, že W E[eiλ(W (t)−W (s)) ] = E[eiλ(W (t0 +t)−W (t0 )−W (t0 +s)+W (t0 )) ] = f f = E[eiλ(W (t0 +t)−W (t0 +s)) ] = e− λ2 (t0 +t−(t0 +s)) 2 = e− λ2 (t−s) 2 . c (t) := c W (t/c2 ). Potom W c (0) = 0 a podobně jako v (i) máme (ii) Definujme W c (t) − W c (s) je N (0, t − s) : nezávislost přírůstků a z charakteristické funkce, že W E[eiλ(W (t)−W (s)) ] = E[ei λ c(W (t/c c c 2 )−W (s/c2 )) 20 ] = e− λ2 c2 t−s ( 2 ) 2 c = e− λ2 (t−s) 2 . Poznámka. Pomocí této věty se dají dokázat některé další důležité vlastnosti Brownova pohybu. Věta 2.2.12. Pro každé t ≥ 0 platí, že trajektorie Brownova pohybu nemá skoro jistě derivaci v bodě t. Důkaz: Dokážeme, že skoro jistě nemá trajektorie Brownova pohybu derivaci v bodě 0. Obecné tvrzení pro t0 6= 0 plyne z toho, že proces W̃ (t) := W (t0 +t)−W (t0 ) je také Brownův pohyb. Důkaz provedeme sporem. Předpokládejme, že existuje derivace v bodě 0. Potom existuje číslo A < ∞ a ε > 0, že |W (t)| < At pro každé 0 < t < ε. Vezmeme si takové číslo A pevné. Potom 1 P (−At < W (t) < At) = √ 2πt Z At x2 e− 2t dx. −At Po substituci x = ty dostaneme, že dx = t dy a Z A y 2 t2 t P (−At < W (t) < At) = √ e− 2t dy = 2πt −A Z A y2 1 =p e− 2·1/t dy → 0 pro t → 0. 2π · 1/t −A Právě jsme dokázali, že pro A pevné je |W (t)| < At pro každé 0 < t ≤ ε s pravděpodobnosti 0. Tímto způsobem můžeme odvodit pro každé A = n, že |W (t)| < nt pro každé 0 < t ≤ ε s pravděpodobnosti 0. Ale sjednocení spočetně mnoho množin míry 0 je množina míry 0. Tak W (t) nemá derivaci v bodě t = 0 s pravděpodobnosti 1. Poznámka. Dá se dokázat i silnější tvrzení, že s pravděpodobností 1 nejsou trajektorie Brownova pohybu diferencovatelné v žádném bodě. Důkaz tohoto tvrzení pochází od Dvoretzky, Erdős a Kakutani, a je možné ho najít v [8]. Poznámka. Velice jednoduché je dokázat, že W (t) nemá derivaci v bodě t > 0 ve smyslu kvadratických středů: " 2 # E (W (t + h) − W (t))2 W (t + h) − W (t) 1 E = = . 2 h h h 21 Věta 2.2.13. Nechť je W (t) Brownův pohyb. Potom (i) E[W 2 (t)] = t. (ii) E[W 4 (t)] = 3t2 . Důkaz: (i) W (t) je N (0, t) a proto E[W 2 (t)] = t. (ii) E[W 4 (t)] vypočítáme přímo z definice. Při výpočtu použijeme dvakrát per partes a dostaneme Z x2 1 4 E[W (t)] = √ x4 e− 2t dx = 3t2 . 2πt R Věta 2.2.14. (i) Nechť W (t) je Brownův pohyb na intervalu h0, ti a nechť symbol δ n := {0 = t0 < t1 . . . < tn = t} značí dělení tohoto intervalu. Potom pro |δ n | := max0≤k≤n−1 |tk+1 − tk | → 0 platí n−1 X (W (tk+1 ) − W (tk ))2 → t k=0 ve smyslu kvadratických středů. Jinými slovy Brownův pohyb W (t) má kvadratickou variaci rovnu t. (ii) Trajektorie Brownova pohybu mají na každém intervalu nekonečnou variaci. Důkaz: (i) Chceme dokázat, že !2 X E (∆Wk )2 − t → 0 pro ∆tk → 0. tk <t Definujeme dělení intervalu 0 = t0 < t1 = nt < t2 = 2 nt < . . . < tn = t a ∆Wk = Wk+1 − Wk . Potom ∆tk = nt . !2 !2 n−1 n−1 X X t = E (∆Wk )2 − t = E (∆Wk )2 − n k=0 k=0 " E n−1 X k,j=0 t (∆Wk )2 − n !# X n−1 t t t2 2 4 2 (∆Wj ) − = E (∆Wk ) − 2 (∆Wk ) + 2 + n n n k=0 n−1 X t t 2 2 + E (∆Wk ) − E (∆Wj ) − n n {z } k, j = 0 | = 0 k 6= j = n−1 X k=0 (z nezávislosti ) = n−1 n−1 X X 2t t2 4 2 E (∆Wk ) − E (∆Wk ) + = 2 n n k=0 k=0 22 = n−1 X k=0 3 n−1 2t X t t2 t2 t2 t2 t2 t2 − + n = 3 − 2 + = 2 → 0 pro n → ∞. n2 n k=0 n n2 n n n n (ii) Funkce s konečnou variací mají kvadratickou variaci rovnou nule. Toto tvrzení je tedy přímým důsledkem (i). Definice 2.2.15. n- rozměrným Brownovým pohybem se rozumí vektorový proces W(t) := (W1 (t), . . . , Wn (t)) t ≥ 0 jehož složky tvoří n vzájemně nezávislých Brownových pohybů. 2.2.3 Martingaly a Markovovy procesy Definice 2.2.16. Systém σ-algeber M = {Mt , t ∈ T } na pravděpodobnostním prostoru (Ω, A, P ) se nazývá filtrace, pokud pro každé t ∈ T je Mt ⊂ A a Ms ⊂ Mt pro s < t, s, t ∈ T . Definice 2.2.17. Náhodný proces M = {M (t), t ∈ T } se nazývá martingalem vzhledem k filtraci M = {Mt , t ∈ T }, když E[M (t)] < ∞, E[M (t)|Ms ] = M (s), t∈T a t ≥ s, t, s ∈ T . Poznámka. Pojem martingalu pochází z teorie hazardních her. Popisuje spravedlivou hru, při níž očekávaná hodnota výhry je rovná částce, kterou hráč musí za účast ve hře zaplatit. Důležitost martingalu v matematické teorii stochastických procesů vyplývá z následující věty: Věta 2.2.18. Nechť proces M = {M (t), t ≥ 0} je spojitým martingalem na (Ω, A, P ). Potom pro každé p ≥ 1, T ≥ 0 a λ > 0 platí tzv. Doobova martingalová nerovnost: 1 P sup |M (t)| ≥ λ ≤ p E [|M (T )|p ] . λ 0≤t≤T Definice 2.2.19. Nechť W (t) je Brownův pohyb na prostoru (Ω, A, P ). Filtrace F = {Ft , t ≥ 0} se nazývá historie Brownova pohybu, jestliže pro t > 0 je Ft σ-algebra generovaná náhodnými veličinami W (s, ω), s ≤ t. Poznámka. Filtrace F = {Ft , t ≥ 0} popisuje růst informace pozorovatele o trajektorii Brownova pohybu v závislosti na čase. Věta 2.2.20. Brownův pohyb W (t) je martingalem vzhledem k své filtraci F = {Ft , t ≥ 0} 23 Důkaz: E[W (t)|Fs ] = E[W (t) − W (s) + W (s)|Fs ] = = E[W (t) − W (s)|Fs ] + E[W (s)|Fs ] = 0 + W (s) = W (s), t ≥ s, t, s ∈ T . Využili jsme toho, že náhodná veličina W (t) − W (s) je nezávislá na σ-algebře Fs a proto E[W (t) − W (s)|Fs ] = E[W (t) − W (s)] = 0, a náhodná veličina W (s) je Fs - měřitelná a proto E[W (s)|Fs ] = W (s) (viz větu 1.4.28). Věta 2.2.21. (Markovova vlastnost) Nechť je W (t) Brownův pohyb, a nechť F = {Ft , t ≥ 0} je historie Brownova pohybu. Pro s > 0 definujme proces f (t) := W (t + s) − W (s) a nechť Fe označuje historii W f (t). Potom pro každé W t > 0 jsou σ-algebry Fs a Fet nezávislé. f (t) je Brownův pohyb a má nezávislé přírůstky stejně jako proces Důkaz: Proces W W (t). Definujme množiny A := n \ {W (sj ) − W (sj−1 ) ≤ xj } ∈ Fs j=1 a B := m \ {W (tj + s) − W (tj−1 + s) ≤ yj } ∈ Fet . j=1 Množiny A a B jsou nezávislé a množiny typu A generují F a množiny typu B e generují F. Poznámka. Procesy mající Markovovu vlastnost se nazývají Markovovy procesy. Věta tedy říká, že Brownův pohyb je Markovovův proces. 2.3 Stochastický integrál Nechť je W (t) Brownův pohyb na prostoru (Ω, A, P ). Chceme definovat stochastický integrál Z T f (s, ω) dW (s, ω) 0 pro vhodnou náhodnou funkci f (s, ω). Předpokládejme zatím, že f je spojitá v s pro každé ω ∈ Ω. Riemann-Stieltjesův integrál použít nemůžeme, protože proces W (t) nemá konečnou variaci. 24 Příklad 2.3.1. Mějme interval h0, T i, a mějme dělení tohoto intervalu δ n := {0 = t0 < t1 . . . < tn = T }, |δ n | := max0≤k≤n−1 |tk+1 − tk |. Pro pevné 0 ≤ λ ≤ 1 a dělení δ n intervalu h0, T i položme τk := (1 − λ)tk + λtk+1 (k = 0, . . . , n − 1) a definujme n Rn = Rn (δ , λ, ω) := n−1 X W (τk , ω)(W (tk+1 , ω) − W (tk , ω)). k=0 RT To jsou odpovídající Riemannovy součty pro 0 W (s, ω) dW (s, ω). Pro jednoduchost zápisu vynecháme ω a spočítáme R = lim Rn pro pevné λ a pro lim |δ n | = 0. n→∞ n→∞ Nejdřív upravíme součin (zkráceně budeme psát ±A namísto +A − A ) W (τk )(W (tk+1 ) − W (tk )) = W (τk )W (tk+1 ) − W (τk )W (tk ) = 1 1 1 = W (τk )W (tk+1 ) ± W 2 (τk ) ± W 2 (tk ) ± W 2 (tk+1 ) + W (τk )W (tk ) = 2 2 2 1 1 1 = − [W (tk+1 ) − W (τk )]2 + [W (τk ) − W (tk )]2 + [W 2 (tk+1 ) − W 2 (tk )] 2 2 2 Dále Rn = n−1 X W (τk )(W (tk+1 ) − W (tk )) = k=0 1 =− 2 n−1 X n−1 n−1 1X 1X 2 [W (tk+1 ) − W (τk )] + [W (τk )−W (tk )]2 + [W (tk+1 )−W 2 (tk )] = 2 2 k=0 k=0 k=0 2 1 1 W 2 (T ) 1 1 2 2 = − (1 − λ)T + λT + (W (T ) − W (0)) = + (λ − )T. 2 2 2 2 2 Poznámka. Vidíme, že tento součet závisí na volbě λ. Zvolíme-li za λ = 0, dostaneme tzv. Itôův integrál Z T W 2 (T ) T W dW = − , 2 2 0 pro λ = 1/2 dostaneme tzv. Stratonovičův integrál Z T W 2 (T ) W ◦ dW = . 2 0 25 2.3.1 Itôův integrál Definice 2.3.2. Nechť je W (t, ω) Brownův pohyb na prostoru (Ω, A, P ) a nechť filtrace F značí historii Brownova pohybu. Říkáme, že proces {G(t, ω), t ∈ h0, ∞)} je souhlasný s F, jestliže pro každé t ≥ 0 je funkce ω → G(t, ω) Ft - měřitelná. Definice 2.3.3. Označme Lp (0, T ), T > 0, 1 ≤ p < ∞ prostor reálných procesů G(t, ω) na prostoru (Ω, A, P ) takových, že (i) {G(t, ω), t ∈ h0, T )} je souhlasný s F, (ii) (t, ω) → G(t, ω) je B × F- měřitelná, kde B je Borelovská σ-algebra na h0, T ), hR i T p (iii) E 0 G (t, ω) dt < ∞. Definice 2.3.4. Proces S ∈ L2 (0, T ) se nazývá jednoduchá funkce, jestliže existuje dělení δ := {0 = t0 < t1 . . . < tm = T }, že pro tk ≤ t < tk+1 (k = 0, . . . , m − 1). S(t, ω) = Sk (ω) Poznámka. Každá funkce Sk je Ftk - měřitelná. Definice 2.3.5. Nechť S ∈ L2 (0, T ) je jednoduchá funkce. Pak Z T S dW = 0 m−1 X Sk (ω)(W (tk+1 , ω) − W (tk , ω)) k=0 se nazývá Itôův integrál funkce S na (0, T ). Věta 2.3.6. (Itôova izometrie) Nechť S ∈ L2 (0, T ) je jednoduchá, omezená funkce. Potom " Z Z T 2 # T 2 S (t, ω) dt . =E E S(t, ω) dW (t, ω) 0 0 Důkaz: Označme ∆Wj = W (tj+1 , ω) − W (tj , ω). !2 " Z 2 # m−1 T X = S dW =E Sj ∆Wj E 0 =E " m−1 X j=0 j=0 Sj2 m−1 X 2 (∆Wj ) + 2 i,j=0,i<j 26 # Si Sj ∆Wi ∆Wj = = m−1 X m−1 X E Sj2 ∆Wj2 + 2 E[Si Sj ∆Wi ]E[∆Wj ] = j=0 = m−1 X i,j=0,i<j E[Sj2 ] E[∆Wj2 ]= X j=0 E[Sj2 ] Z (tj+1 − tj ) = E T 2 S dt . 0 j Věta 2.3.7. Nechť je G ∈ L2 (0, T ). Potom existuje posloupnost jednoduchých funkcí Sn ∈ L2 (0, T ), taková, že Z T 2 E (G(t, ω) − Sn (t, ω)) dt → 0 pro n → ∞. 0 Definujeme Itôův integrál funkce G na (0, T ) předpisem Z T Z T G(t, ω) dW (t, ω) = lim Sn (t, ω) dW (t, ω). n→∞ 0 0 Tato limita existuje a nezávisí na volbě posloupnosti Sn . Navíc platí Itôova izometrie " Z 2 # Z T T 2 E G(t, ω) dW (t, ω) =E G (t, ω) dt . 0 0 Důkaz: Prostor jednoduchých funkci tvoří hustou podmnožinu prostoru L2 (0, T ) a proto můžeme pomocí Itôovy izometrie rozšířit definici Itôova integrálu na všechny funkce G ∈ L2 (0, T ). Přesný důkaz neuvádíme, pouze popíšeme myšlenku důkazu. Nejdříve uvažujme případ, kdy funkce G(t) ∈ L2 (0, T ) je spojitá funkce pro skoro všechna ω. Definujeme posloupnost jednoduchých funkci n n n+1 pro ≤t< , n = 0, . . . , celá část (kT ). Sk (t) := G k k k Obecně, pro G(t) ∈ L2 (0, T ) definujeme Z t Gm (t) := mem(s−t) G(s) ds pro s.v. ω. 0 RT Funkce Gm (t) ∈ L2 (0, T ) a jsou spojitá pro s. v. ω a 0 |Gm (t) − G(t)|2 dt → 0 s.v. Teď můžeme aproximovat funkce Gm (t) jednoduchými funkcemi dle popsaného návodu. Věta 2.3.8. Nechť F, G ∈ L2 (0, T ). Potom RT RT RT 1. 0 (a G + b F ) dW = a 0 G dW + b 0 F dW pro a, b ∈ R hR i T 2. E 0 G dW = 0 3. RT 0 G dW je FT − měřitelná. 27 Důkaz: Je zřejmé, že věta platí pro jednoduché funkce z L2 (0, T ) a limitním přechodem dostaneme tvrzení. Věta 2.3.9. Pro G ∈ L2 (0, T ) označme I(t) := Potom Rt 0 G(s, ω) dW (s, ω), 0 ≤ t ≤ T. (i.) I(t) je martingalem vzhledem k Ft . (ii.) Existuje t-spojitá verze I(t). Důkaz tohoto tvrzení neuvádíme. Je možné ho najít v [10] na stranách 31-33. 2.3.2 Itôova formule Definice 2.3.10. Nechť je W (t) Brownův pohyb na prostoru (Ω, A, P ) a nechť X(t, ω) je stochastický proces na prostoru (Ω, A, P ), t > 0. Říkáme, že X(t, ω) je Itôův proces, jestliže Z t Z t X(t, ω) = X(0, ω) + U (s, ω) ds + V (s, ω) dW (s, ω), 0 0 kde U ∈ L1 (0, t), V ∈ L2 (0, t) a X(0, ω) je F0 −měřitelná. Poznámka. Stručně říkáme, že X má stochastický diferenciál dX(t) = U dt + V dW (t). Věta 2.3.11. (Itôova formule) Nechť X(t) má stochastický diferenciál na intervalu h0, ti dX(t) = U dt + V dW (t). Nechť g(t, x) : (0, ∞) × R → R je dvakrát spojitě diferencovatelná funkce. Potom Y (t) = g(t, X(t)) je také Itôův proces, a dY (t) = ∂g ∂g 1 ∂2g (t, X(t)) dt + (t, X(t)) dX(t) + (t, X(t))( dX(t))2 , ∂t ∂x 2 ∂x2 kde ( dX(t))2 = ( dX(t)) · ( dX(t)) se počítá podle pravidel dt · dt = dt · dW (t) = dW (t) · dt = 0, dW (t) · dW (t) = dt. Důkaz: Nejdříve ukážeme, že Y (t) je Itôův proces. U každé funkce počítáme hodnotu v bodě (t, X(t)). Předpokládejme, že platí vzorec dY (t) = ∂g ∂g 1 ∂2g dt + dX(t) + ( dX(t))2 , ∂t ∂x 2 ∂x2 a dosaďme do tohoto vzorce dX(t) = U dt + V dW (t). 28 ∂g ∂g 1 ∂2g dY (t) = dt+ (U dt+V dW (t))+ (U dt+V dW (t))2 = ∂t ∂x 2 ∂x2 + ∂g ∂g + U ∂t ∂x dt 1 ∂2g ∂g 2 2 2 2 = V dW (t) + U ( dt) + 2U V dt dW (t) + V ( dW (t)) ∂x 2 ∂x2 1 ∂2g 2 ∂g ∂g ∂g dt + V dW (t). = + U+ V 2 ∂x ∂t ∂x 2 ∂x | {z } {z } | ∗ V U∗ Ukázali jsme, že Y má stochastický diferenciál dY (t) = U ∗ dt + V ∗ dW (t). 2 ∂g ∂ g 2 Pro důkaz tvrzení, že dY (t) = ∂g dt + ∂x dX(t) + 12 ∂x 2 ( dX(t)) , použijeme Taylo∂t rův rozvoj funkce Y (t) = g(t, X(t)). Bez újmy na obecnosti můžeme předpokládat, ∂g ∂2g že funkce ∂g , ∂x a ∂x jsou omezené. Obecnou, dvakrát spojitě diferencovatelnou 2 ∂t funkci g můžeme aproximovat posloupností funkcí gn , které jsou omezené a mají omezené i příslušné derivace. Budeme také předpokládat, že funkce U a V jsou jednoduché funkce. Mějme {0 = t0 < t1 . . . < tn = t} dělení intervalu h0, ti. Tam, kde argument neuvádíme, počítáme hodnotu dané funkce v bodě (tj , X(tj )). Dle Taylorova vzorce X X ∂g X ∂g g(t, X(t)) = g(0, X(0)) + ∆g = g(0, X(0)) + ∆tj + ∆Xj + ∂t ∂x j j j + X ∂2g X 1 X ∂2g 1 X ∂2g 2 2 2 2 (∆t ) + ∆t ∆X + (∆X ) + o ( dt) + (∆X ) , j j j j j 2 2 j ∂t2 ∂x∂t 2 ∂x j j j kde ∆tj = tj+1 − tj , ∆Xj = X(tj+1 ) − X(tj ), ∆g = g(tj+1 , X(tj+1 )) − g(tj , X(tj )). Jestliže ∆tj → 0, potom máme X ∂g j ∂t ∆tj = X ∂g j ∂t Z (tj , X(tj ))∆tj → 0 t ∂g (s, X(s)) ds ∂t podobně X ∂g j ∂x Z ∆Xj → 0 t ∂g (s, X(s)) dX(s). ∂x Předpokládáme, že funkce U a V jsou jednoduché funkce, tedy X ∂2g X ∂2g X ∂2g X ∂2g 2 2 2 (∆X ) = U (∆t ) +2 U V (∆t )(∆W )+ V 2 (∆Wj )2 , j j j j j j 2 2 j 2 2 j ∂x ∂x ∂x ∂x j j j j kde Uj = U (tj ), Vj = V (tj ) a ∆Wj = W (tj+1 ) − W (tj ). 29 První dva členy konverguji k nule při ∆tj → 0 ve smyslu kvadratických středů: !2 " 2 # 2 X ∂2g X ∂ g (∆tj )4 → 0 pro ∆tj → 0. U 2 (∆tj )2 = E U2 E 2 j 2 j ∂x ∂x j j !2 2 X∂ g E Uj Vj (∆tj )(∆Wj ) ∂x2 j = X " E j ∂2g Uj Vj ∂x2 2 # (∆tj )3 → 0 pro ∆tj → 0. Zbývá dokázat, že X ∂2g ∂x j V 2 (∆Wj )2 2 j t Z → 0 ∂2g 2 V ds pro ∆tj → 0. ∂x2 Pro zjednodušení zápisu zavedeme nové označení ∂2g A(t) = t, X(t) V 2 (t), 2 ∂x Aj = A(tj ), a uvažujme !2 X X X E Aj (∆Wj )2 − Aj ∆tj = E Ai Aj ((∆Wi )2 − ∆ti )((∆Wj )2 − ∆tj ) . j j i,j Pro i < j jsou Ai Aj ((∆Wi )2 − ∆ti ) a (∆Wj )2 − ∆tj nezávislé a proto v tomto případě střední hodnota tohoto součinu se rovná součinu středních hodnot a to se rovná nule. Podobně můžeme uvažovat i v případě kdy i > j. Tak nám zůstává X X 2 E A2j ((∆Wj )2 − ∆tj )2 = E Aj E ((∆Wj )4 − 2(∆Wj )2 ∆tj + (∆tj )2 ) j = X j X E A2j (3(∆tj )2 −2(∆tj )2 +(∆tj )2 ) = 2 E A2j ((∆tj )2 ) → 0 pro ∆tj → 0. j j Jinými slovy jsme právě dokázali, že Z t X 2 Aj (∆Wj ) → A(s) ds pro j ∆tj → 0, 0 což je vlastně vztah, který zkráceně píšeme ( dW (t))2 = dt. P Z toho vztahu také vyplývá, že j o ((∆tj )2 + (∆Xj )2 ) → 0 pro ∆tj → 0. Tím je dokázaná Itôova formule. 30 Věta 2.3.12. (Multidimensionální Itôova formule) Nechť W(t, ω) = (W1 (t, ω), . . . , WM (t, ω)) označuje M-dimensionální Wienerův proces a nechť stochastický proces X(t, ω) = (X1 (t, ω), . . . , XN (t, ω)) je N-dimenzionální Itôův proces Z dX(t, ω) = X(0, ω) + t U(s, ω) ds + 0 M Z X j=1 t Vj (s, ω) dWj (s, ω) 0 kde U, V jsou vektorové funkce, jejichž složky splňují podmínky z definice 2.3.10. Nechť g(t, x) : (0, ∞)×RN → RP je dvakrát spojitě differencovatelná funkce. Potom Y(t) = g(t, X(t)) = (g1 (t, X(t)), . . . , gP (t, X(t))) je stochastický proces, jehož k−tá složka je dána rovnicí dYk = X ∂gk ∂gk 1 X ∂ 2 gk (t, X) dt + (t, X) dXi + (t, X)( dXi )( dXj ), ∂t ∂xi 2 i,j ∂xi ∂xj i kde dXi · dXj se počítá podle pravidel dt · dt = dt · dWi = dWi · dt = 0, 2.4 dWi · dWj = δi,j dt. Stochastické diferenciální rovnice Uvažujme prostor (Ω, A, P ) s neklesající soustavou σ-algeber F = {Ft , t ≥ 0}, na kterém je definován Wienerův proces W (t) vzhledem k F. Předpokládejme, že každé Ft obsahuje všechny P −nulové množiny z A. Budeme se zabývat stochastickými diferenciálními rovnicemi na intervalu h0, T i, 0 < T < ∞. Itôovou stochastickou diferenciální rovnici (Itô SDR) rozumíme rovnici dX(t) = A(t, X(t)) dt + B(t, X(t)) dW (t), X(t0 ) = X0 kde funkce A : h0, T i×R → R se nazývá koeficient driftu a funkce B : h0, T i×R → R se nazývá difuzní koeficient. Itô SDR je ve skutečnosti integrální rovnice Z t Z t B(s, X(s)) dW (s), A(s, X(s)) ds + X(t) = X0 + t0 t0 kde první integrál je Lebesgueův a druhý integrál je Itôův. 31 Když v stochastické diferenciální rovnici uvažujeme na místo Itôova integrálu Stratonovičův, dostaneme Stratonovičovu stochastickou diferenciální rovnici (Stratonovič SDR), kterou můžeme symbolicky zapsat takto: dX(t) = A(t, X(t)) dt + B(t, X(t)) ◦ dW (t), X(t0 ) = X0 . Integrální interpretace této rovnice je Z t Z t X(t) = X0 + A(s, X(s)) ds + B(s, X(s)) ◦ dW (s), t0 t0 kde první integrál je Lebesgueův a druhý integrál je Stratonovičův. Itô SDR a Stratonovič SDR se stejnými koeficienty nedají obecně stejná řešení. Platí však, že řešení X(t) Itô SDR Z t Z t X(t) = X0 + A(s, X(s)) ds + B(s, X(s)) dW (s), t0 t0 splňuje modifikovanou Stratonovič SDR Z t Z t B(s, X(s)) ◦ dW (s), X(t) = X0 + A(s, X(s)) ds + t0 t0 1 ∂B (t, x). kde koeficient A(t, X(t)) = A(t, X(t)) − B(t, X(t)) 2 ∂x 2.4.1 Existence a jednoznačnost řešení Definice 2.4.1. Nechť W(t) = (W1 (t), . . . , WM (t)) značí M-dimensionalní Wienerův proces a funkce A : h0, T i×RN → RN , B : h0, T i×RN → RN ×M jsou měřitelné. Říkáme, že na intervalu h0, T i je proces X(t) = (X1 (t), . . . , XN (t)) silným řešením stochastické diferenciální rovnice dX(t) = A(t, X(t)) dt + B(t, X(t)) dW(t), X(0) = X0 jestliže proces X(t) je souhlasný s F M a pro všechna t ∈ h0, T i Z t Z t X(t) = X0 + A(s, X(s)) ds + B(s, X(s)) dW(s) s.v. 0 0 Poznámka. Symbolem F M jsme označujeme σ-algebru generovanou procesem W(t) = (W1 (t), . . . , WM (t)). Věta 2.4.2. Nechť je T > 0, proces W(t) je M-dimensionální Wienerův proces a funkce A : h0, T i × RN → RN , B : h0, T i × RN → RN ×M jsou měřitelné, pro které platí: 32 (i) Existuje konstanta K > 0 taková, že |A(t, x) − A(t, y)| + |B(t, x) − B(t, y)| ≤ K|x − y| pro každé t ∈ h0, T i a x,y ∈ RN . (ii) Existuje konstanta L > 0 taková, že |A(t, x)| + |B(t, x)| ≤ L(1 + |x|) pro každé t ∈ h0, T i a x ∈ R. (iii) X0 je F0M -měřitelná náhodná veličina a E [ |X0 |2 ] < ∞. Potom stochastická diferenciální rovnice dX(t) = A(t, X(t)) dt + B(t, X(t)) dW(t), X(0) = X0 má jednoznačné t-spojité silné řešení X(t), pro které Z T 2 E |X(t)| dt < ∞. 0 Poznámka. Ve (iii) můžeme nahradit podmínku F0M -měřitelnosti X0 podmínkou, že X0 je nezávislá na F M . Důkaz: Nejdříve dokážeme jednoznačnost. Nechť procesy X(t) a X̃(t) jsou dvě silná řešení. Z t Z t B(s, X(s)) − B(s, X̃(s)) dW(s) A(s, X(s)) − A(s, X̃(s)) ds + X(t) − X̃(t) = 0 0 Z nerovnosti (a + b)2 ≤ 2a2 + 2b2 dostaneme "Z 2 # t E[|X(t) − X̃(t)|2 ] ≤ 2E A(s, X(s)) − A(s, X̃(s)) ds + 0 "Z 2 # t +2E B(s, X(s)) − B(s, X̃(s)) dW(s) . 0 Dle Cauchy-Schwartzovy nerovnosti platí, že Z t 2 Z t Z t 2 A(s, X(s)) − A(s, X̃(s)) ds ≤ ds |A(s, X(s)) − A(s, X̃(s))| ds , 0 0 0 "Z 2 # Z t t 2 E A(s, X(s)) − A(s, X̃(s)) ds ≤ t · E |A(s, X(s)) − A(s, X̃(s))| ds . 0 0 33 Na druhý sčítanec použijeme Itôovou izometrii. Přidáme-li podmínku (i.) dostaneme Z t 2 2 E[|X(t) − X̃(t)| ] ≤ 2t · E |A(s, X(s)) − A(s, X̃(s))| ds + 0 Z t Z t 2 +2E E[|X(s) − X̃(s)|2 ] ds. B(s, X(s)) − B(s, X̃(s)) d(s) ≤ C 0 0 2 Existuje tedy kladná konstanta R t C > 0 taková, že funkce v(t) = E[|X(t) − X̃(t)| ] splňuje nerovnost v(t) ≤ C 0 v(s) ds < ∞. Z Gronwallova lematu dostaneme, že v(t) = E[|X(t) − X̃(t)|2 ] = 0. Uvážíme-li navíc, že řešení jsou spojitá, dostaneme X(t) = X̃(t) s.v. pro každé t ∈ h0, T i. Ukázali jsme, že P |X(t) − X̃(t)| = 0 pro všechna t ∈ h0, T i = 1. Teď dokážeme existenci řešení metodou Picardových aproximací podobně jako se dokazuje existence řešení obyčejných diferenciálních rovnic. Definujme pro n = 0, 1, . . . X0 (t) := X0 n+1 X Z (t) := X0 + t Z n t B(s, Xn (s)) dW(s), A(s, X (s)) ds + 0 0 pro t ∈ h0, T i. Definujme také h 2 i n+1 n d (t) = E X (t) − X (t) . n Tvrdíme, že pro každé n = 0, 1, . . . a t ∈ h0, T i platí dn (t) ≤ (M t)n+1 , (n + 1)! kde konstanta M závisí na X0 a na konstantách z podmínek věty. Toto tvrzení dokážeme indukcí: Pro n = 0 zřejmě platí h 2 i d0 (t) = E X1 (t) − X0 (t) = "Z 2 # Z t t = E A(s, X0 (s)) ds + B(s, X0 (s)) dW(s) 0 0 "Z # Z t t 2 0 0 2 ≤ 2E L(1 + |X (s)|) ds + 2E |B(s, X (s))| ds 0 0 Z t Z t 2 2 2 ≤ 2E L (1 + |X0 |) ds ≤ M t, L(1 + |X0 |) ds + 2E 0 0 2 pro M > 4L2 (1 + |X0 |) . 34 Teď předpokládejme, že tvrzení platí pro n − 1 a odhadneme dn (t), podobně jako v důkazu jednoznačnosti. h 2 i dn (t) = E Xn+1 (t) − Xn (t) = "Z 2 # Z t t B(s, Xn (s)) − B(s, Xn−1 (s)) dW(s) E A(s, Xn (s)) − A(s, Xn−1 (s)) ds + 0 0 "Z 2 # Z t n 2 t n−1 n n−1 2 X (s) − X (s) ds ≤ 2E K(X (s) − X (s)) ds + 2K E 0 0 ≤ 2T K 2 t Z h 2 i E Xn (s) − Xn−1 (s) ds + 2K 2 0 Z t h 2 i E Xn (s) − Xn−1 (s) ds 0 ≤ 2K 2 (1 + T ) t Z (M t)n+1 (M s) ds ≤ , n! (n + 1)! n 0 2 za předpokladu, že M ≥ 2K (1 + T ). Dále odhadneme sup Xn+1 (t) − Xn (t) ≤ 0≤t≤T Z T A(s, Xn (s)) − A(s, Xn−1 (s)) ds 0 Z t n n−1 + sup B(s, X (s)) − B(s, X (s)) dW(s) . 0≤t≤T 0 Použijeme již dokázanou nerovnost, Doobovu martingalovu nerovnost, Itôovou izometrii a podmínky věty P Xn+1 (t) − Xn (t) > 2−n ≤ P Z T A(s, Xn (s)) − A(s, Xn−1 (s)) ds 2 ! > 2−2n−2 0 Z t n n−1 −n−1 +P sup B(s, X (s)) − B(s, X (s)) dW(s) > 2 0≤t≤T 0 Z T h 2 i 2n+2 ≤2 T E A(s, Xn (s)) − A(s, Xn−1 (s)) ds 0 +22n+2 Z T h 2 E B(s, Xn (s)) − B(s, Xn−1 (s)) ds] 0 ≤ 22n+2 K 2 T Z T Z h 2 i n n−1 2n+2 2 E X (s) − X (s) ds+2 K 0 ≤ 22n+2 K 2 (T + 1) T h 2 E Xn (s)) − Xn−1 (s) ds] 0 Z 0 T (4DT )n+1 (M s)n ds ≤ (n)! (n + 1)! 35 pro D ≥ K 2 (T + 1). Dále z Borel-Cantelliho lematu plyne, že P Xn+1 (t) − Xn (t) > 2−n pro nekonečně mnoho n = 0, a tak pro s.v. ω existuje n0 = n0 (ω) takové, že sup Xn+1 (t) − Xn (t) ≤ 2−n pro n ≥ n0 . 0≤t≤T Proto posloupnost Xn (t) = X0 (t) + n−1 X Xk+1 (t) − Xk (t) k=0 konverguje stejnoměrně na h0, T i, pro s.v. ω. Označme limitu této posloupnosti X(t). Tato funkce je spojitá v t pro s.v. ω a je také FtM −měřitelná, protože Xn (t) jsou spojitá a FtM −měřitelné pro každé n. Pro m > n ≥ 0 máme !2 m−1 X E |Xm (t) − Xn (t)|2 = E Xk+1 (t) − Xk (t) k=n h X (M t)k+1 2 i m−1 k+1 k ≤ E X (t) − X (t) ≤ → 0 pro n → ∞. (k + 1)! k=n k=n m−1 X Můžeme tedy vybrat podposloupnost z posloupnosti Xn (t), která bude konvergovat bodově k X(t). Proces X(t) je souhlasný s F M a platí, že Z T 2 E |X(t)| dt < ∞. 0 Díky stejnoměrné konvergenci můžeme přejít k limitě pro n → ∞ v definici Xn (t) a tím dokážeme, že X(t) splňuje rovnici Z t Z t X(t) = X0 + A(s, X(s)) ds + B(s, X(s)) dW(s) s.v. 0 2.4.2 0 Některé typy rovnic a jejich metody řešení Definice 2.4.3. Stochastická diferenciální rovnice dX(t) = A(t, X(t)) dt + B(t, X(t)) dW(t) se nazývá lineární, jestliže pro koeficienty rovnice platí A(t, x) := C(t) + D(t) x, 36 B(t, x) := E(t) + F(t) x kde funkce C : h0, T i × RN → RN , D : h0, T i → RN ×N , E : h0, T i → RN ×M a F : h0, T i × RN → RN ×M . Poznámka. Předpoklady na koeficienty rovnice ve větě o existenci a jednoznačnosti jsou splněny, pokud platí sup |C(t)| + |D(t)| + |E(t)| + |F(t)| < ∞, 0≤t≤T a tak pro X0 F0M -měřitelnou náhodnu veličinu s E [ |X0 |2 ] < ∞ má lineární diferenciální rovnice dX(t) = C(t) + D(t)X(t) dt + E(t) + F(t)X(t) dW(t), X(0) = X0 jednoznačně určené silné rešení. Příklad 2.4.4. Lineární diferenciální rovnice typu dX(t) = C(t) + D(t)X(t) dt + E(t) dW(t), X(0) = X0 má řešení Z t Φ−1 (s)(C(s) ds + E(s) dW(s)) , dX(t) = Φ(t) X0 + 0 kde Φ(·) je fundamentální matice řešení systému obyčejných diferenciálních rovnic dΦ = D(t)Φ, dt Φ(0) = I. Formálně můžeme tento vzorec zdůvodnit tím, že rovnice z příkladu vznikla jako stochastizace obyčejné lineární, nehomogenní rovnice Ẋ(t) = D(t)X(t) + C(t) + E(t)ξ, X(0) = X0 kde ξ značí bílý šum. Řešením této rovnice s nehomogenním členem C(t) + E(t)ξ získáme vzorec. Poznámka. Řešení lineární rovnice s aditivním šumem, kdy F(t) ≡ 0, je Gaussův proces, pokud náhodná veličina X0 má normální rozdělení. Příklad 2.4.5. Uvažujme stochastickou diferenciální rovnici typu dX(t) = A(t, X(t)) dt + B(t)X(t) dW (t), kde A : R × R → R a B : R → R jsou spojité funkce. 37 X(0) = X0 , Při řešení této rovnice můžeme postupovat následovně: 1. krok Definujeme integrační faktor F (t) jako F (t) = e(− Rt 0 B(s) dW (s)+ 12 Rt 0 B 2 (s) ds) . 2. krok Pomocí Itôovy formule vypočítáme, že d (F (t) · X(t)) = F (t) · A(t, X(t)) dt. 3. krok Definujeme funkci Y (t) = F (t) X(t), a pak X(t) = F −1 (t) Y (t), kde funkci Y (t) získáme jako řešení obyčejné diferenciální rovnice dY (t) = F (t) · A(t, F −1 (t) Y (t)), dt 2.5 Y (0) = X0 . Numerické řešení stochastických diferenciálních rovnic Při odvozování numerických metod pro řešení stochastických diferenciálních rovnic musíme dbát nato, aby naše metoda byla v souladu s definicí stochastického integrálu. Při hledání konkrétní trajektorie řešení dané rovnice hledáme vždy řešení vzhledem k dané trajektorii Wienerova procesu, které generujeme pro každé řešení zvláště. V případě, kdy uvažujeme numerickou metodu s krokem ∆n , přírůstky Wienerova procesu ∆Wn jsou N (0, ∆n ) Gaussovské náhodné veličiny, navzájem nezávislé. Numerická metoda nám určí aproximaci řešení v diskrétních časových hodnotách. Potřebujeme-li spojitou aproximaci řešení, použijeme interpolační metody. Nejjednodušší je lineární interpolace. Abychom mohli posoudit kvalitu metody, musíme definovat příslušné kritérium, které by mělo vycházet z praktických požadavků na stochastickou numerickou metodu. V některých případech testujeme statistické vlastnosti řešení a potřebujeme co nejpřesnější aproximaci jednotlivých trajektorií. Používáme tzv. silné metody s co nejlepším silným řádem konvergence. Definice 2.5.1. Říkáme, že metoda má silný řád konvergence γ, jestliže platí: E[|X(T ) − X ∆ (NT )|] ≤ KT ∆γ , 38 kde X značí přesné řešení stochastické diferenciální rovnice, X ∆ (NT ) je příslušná aproximace v čase T, a ∆ = max ∆n . 0≤n≤NT V mnoha praktických aplikacích dostaneme přesné řešení stochastické diferenciální rovnice které nelze vyjádřit pomocí analytických funkci, někdy dokonce ani neumíme přesné řešení najít. V takových případech potřebujeme co nejlépe aproximovat střední hodnotu a další momenty řešení. K tomuto účelu definujeme slabý řád konvergence a používáme tzv. slabé metody. Definice 2.5.2. Říkáme, že metoda má slabý řád konvergence β, jestliže pro každý polynom g existuje konstanta KT taková, že platí: |E[g(X(T ))] − E[g(X ∆ (NT ))]| ≤ KT ∆β . Poznámka. Různou volbou polynomu dostaneme konvergenci různých momentů řešení. V případě g(x) = x dostaneme konvergenci středních hodnot, pro g(x) = x2 zase konvergenci rozptylů aproximací řešení. Platí, že E[X(T )] − E[X ∆ (NT )] ≤ E |X(T ) − X ∆ (NT )| , a proto ze silné konvergence plyne slabá konvergence středních hodnot. Poznámka. Některé metody pro SDR byli odvozeny ze schémat pro numerická řešení obyčejných diferenciálních rovnic. Jako příklad takové metody uvádíme Eulerovou metodu. Jiné využívají více informace o Wienerově procesu, například Milsteinova metoda. 2.5.1 Stochastická Eulerova metoda Uvažujme Itôovu N -dimenzionální stochastickou diferenciální rovnici s M - dimenzionálním Wienerovým procesem na intervalu h0, T i, T > 0 dX(t) = A(t, X(t)) dt + B(t, X(t)) dW(t), X(0) = X0 , kde A a B jsou spojité vektorové funkce. Když tuto rovnici napíšeme po složkách, pak i-tá rovnice má tvar dXi (t) = Ai (t, X(t)) dt + M X Bi,j (t, X(t)) dWj (t). j=1 Nechť 0 = t0 < t1 < . . . < tN = T , pak Eulerova metoda pro i-tou složku rovnice je definováná předpisem: Xin+1 = Xin n + Ai (tn , X )∆n + M X Bi,j (tn , Xn )∆Wjn , j=1 kde ∆n = tn+1 − tn = R tn+1 tn ds a ∆Wjn = Wj (tn+1 ) − Wj (tn ) = 39 R tn+1 tn dWj (s). Tato metoda je v souladu s definicí Itôova integrálu, při které se integrální součty počítají z funkčních hodnot integrované funkce v levém krajním bodě subintervalu. Aproximace řešení pomocí Eulerovy metody při zmenšujícím se ∆n konverguje k přesnému Itôovu řešení, tato konvergence však není příliš rychlá. Stochastická Eulerova metoda má silný řád konvergence γ = gence β = 1. 2.5.2 1 2 a slabý řád konver- Stochastická Milsteinova metoda Přírůstky ∆Wjn neposkytují dostatek informací o Wienerově procesu uvnitř intervalu (tn , tn+1 ). Když chceme vylepšit řád konvergence numerické metody musíme použit vícenásobné integrály dle Wj (t). Příkladem takové metody je Milsteinova metoda. Definujeme Milsteinovu metodu pro i-tou složku N - dimenzionální Itôové stochastické diferenciální rovnice s M - dimenzionálním Wienerovým procesem na intervalu h0, T i, T > 0 předpisem: Xin+1 = Xin + Ai (tn , Xn )∆n + M X Bi,j (tn , Xn )∆Wjn + j=1 M X + j1 n Z tn+1 Z t L Bi,j2 (tn , X ) tn j1 ,j2 =1 dWj1 (s) dWj2 (t) tn Rt kde ∆n = tn+1 − tn , ∆Wjn = Wj (tn+1 ) − Wj (tn ) = tnn+1 dWj (s), a pro j = 1, . . . , M je operator N X ∂ j . L = Bi,j ∂xi i=1 Rt Rt Dvojný integrál tnn+1 tn dWj1 (s) dWj2 (t) můžeme pro j1 = j2 vyjádřit pomocí přírůstků ∆n a ∆Wjn1 : Z tn+1 Z t Z tn+1 dWj1 (s) dWj1 (t) = (Wj1 (t) − Wj1 (tn )) dWj1 (t) = tn tn tn Z tn+1 Z tn+1 Wj1 (t) dWj1 (t) − Wj1 (tn ) = tn dWj1 (t) = tn Wj21 (tn+1 ) − Wj21 (tn ) ∆n − − Wj1 (tn ) (Wj1 (tn+1 ) − Wj1 (tn )) = 2 2 Wj21 (tn+1 ) + Wj21 (tn ) − 2Wj1 (tn )Wj1 (tn+1 ) ∆n (∆Wjn1 )2 − ∆n = − = 2 2 2 Pro j1 6= j2 to nelze a proto musíme zkoumat statistické vlastnosti dvojného integrálu a naprogramovat to jako nový stochastický proces. = 40 Stochastická Milsteinova metoda má silný řád konvergence γ = 1 a slabý řád konvergence β = 1. Poznámka. Při numerickém řešení Itô SDR s difuzním koeficientem B(t, x) = B(t) se shoduje Milsteinova metoda s Eulerovou metodou, tzn. pro rovnici s aditivním šumem má Eulerova metoda silný řád konvergence γ = 1. Příklad 2.5.3. Znázorníme Milsteinovu metodu na dvourozměrné Itôové stochastické differenciální rovnici: dX(t) = −0.5 X(t) dt + Y (t) dW (t), dY (t) = −0.5 Y (t) dt − X(t) dW (t), X(0) = 0, Y (0) = 1. Můžeme získat analytické řešení této rovnice pomocí klasického kalkulu, když rovnici převedeme na Stratonovičovu rovnici, která v tomto případě má tvar dX(t) = Y (t) ◦ dW (t), dY (t) = −X(t) ◦ dW (t), X(0) = 0, Y (0) = 1. Vidíme, že X(t) = sin W (t) and Y (t) = cos W (t) bude řešením Stratonovičovy rovnice a potom i příslušné Itôovy rovnice. Aproximace X a Y na h0, 1i Eulerovou metodou: X n+1 = X n − 0.5 X n ∆n + Y n ∆W n , X 0 = 0, Y n+1 = Y n − 0.5 Y n ∆n − X n ∆W n , Y 0 = 1. Obr.1 Eulerovy aproximace analytického řešení X(t) = sin(W (t)) a Y (t) = cos(W (t)) Aproximace X a Y na h0, 1i Milsteinovou metodou: X n+1 = X n − 0.5 X n ∆n + Y n ∆W n − 0.5 X n ((∆W n )2 − ∆n ), X 0 = 0, Y n+1 = Y n − 0.5 Y n ∆n − X n ∆W n − 0.5 Y n ((∆W n )2 − ∆n ), Y 0 = 1. Fig.2 Milsteinovy aproximace analytického řešení sin(W (t)) a cos(W (t)) 41 2.5.3 Aproximace střední hodnoty stochastického řešení V některých případech nevyžadujeme od numerické metody co nejpřesnější aproximaci jednotlivých trajektorii, ale potřebujeme odhadnout pouze střední hodnotu µ = E[XT ] řešení stochastické diferenciální rovnice v bodě T > 0. V takových případech postupujeme tak, že pomocí některé numerické metody spočítáme několik trajektorii řešení a µ = E[XT ] vyjádříme například jako aritmetický průměr získaných trajektorii. Pro lepší aproximaci střední hodnoty řešení, včetně výpočtu intervalu spolehlivosti můžeme použit následující metodu. Naše trajektorie uspořádáme do L skupin po K trajektoriich. Střední hodnotu chyby v l-té skupině spočítáme ze vzorce K 1 X µl = YT,k,l − E[XT ] K k=1 pro l = 1 . . . L, a jejích průměr L L K 1X 1 XX µl = YT,k,l − E[XT ]. µ= L l=1 LK l=1 k=1 Podobně, variaci skupinových průměru µl dostaneme ze vztahu L σµ2 = 1 X (µl − µ)2 L − 1 l=1 a potom můžeme určit 100(1 − α) interval spolehlivosti střední hodnoty chyby µ ze Studentova t-rozdělení o L − 1 stupních volnosti r r ! σµ2 σµ2 µ − t1−α,L−1 , µ + t1−α,L−1 . L L Odhadnuta střední hodnota je ve skutečnosti jenom aproximaci E[XT ]. Přesnost této aproximace závisí také na numerické metodě, pomocí které jsme simulovali jednotlivé trajektorie řešení. 42 Literatura [1] L. Arnold: Stochastic Differential Equations: Theory and Applications, John Wiley & Sons, 1974. [2] J. Anděl: Matematická statistika, SNTL, Praha, 1985 [3] S. Cyganowski, P. Kloeden, J. Ombach: From Elementary Probability to Stochastic Differential Equations with Maple, Springer-Verlag, 2002 [4] L. Evans: An introduction to stochastic differential equations, notes for Mathematics 195 at UC Berkley, 2001 [5] D. Halliday, R. Resnick, J. Walker: Fyzika, Část 3.- Elektřina a magnetizmus, VUT Brno, VUTIUM, 2000 [6] Y. Kamarianakis, N. Frangos: Deterministic and stochastic differential equation modelling for electrical networks, HERCMA (Hellenic and European Research in Computational Mathematics) Conference, Athens University of Economics & Business, 2001 [7] P. Kloeden, E. Platen, H. Schurz: Numerical Solution Of SDE Through Computer Experiments, Springer-Verlag, 1997 [8] P. Mandl: Stochastické integrály a jejich aplikace, Praha, 1976 [9] S. M. Steele: Stochastic Calculus and Financial Applications, Springer-Verlag New York Inc., 2001 [10] B. Øksendal: Stochastic Differential Equations, An Introduction with Applications, Springer-Verlag, 1995 [11] Cs. Török: Visualization and Data Analysis in the MS .NET Framework, Communication of JINR, Dubna, 2004, E10-2004-136 [12] Cs. Török et al.: Professional Windows GUI Programming: Using C#, Chicago: Wrox Press Inc, 2002, ISBN 1-861007-66-3 56
Podobné dokumenty
Stochastický integrál podle Wienerova procesu Jitky Kostkové
V p°edkládané bakalá°ské práci se autorka zabývá úvodními partiemi stochastické analýzy a
aplikacemi tohoto aparátu na vybrané modely z ekonomie, fyziky a biologie. Úst°edním pojmem
je zde Wiener·v...
T - MFFBorec
Tvrzení: Nechť M t je Q-martingalový proces, jehož volatilita σ t je s pravděpodobností 1
nenulová. Nechť N t je nějaký jiný Q-martingalový proces. Pak existuje neanticipativní
Bližší informace o studijním programu
Profil absolventa a cíle studia
Obor je zaměřen na studium ekonomických teorií, které spočívají v dynamickém přístupu
k ekonomickým jevům. Tato nová metodologie nezachovává striktně lineární postup...
Mechanika pro bakaláře
• antisymetrický tenzor splňuje podmínku aij = −aji , ze které plyne a11 = a22 = a33 = 0 (prvky
na diagonále jsou nulové), což omezuje počet nezávislých a nutných složek na tři.
Pravděpodobnost
Míra, pravděpodobnostní míra, pravděpodobnostní prostor
Definice (Míra a pravděpodobnostní míra)
Mějme σ-algebru F ⊆ 2Ω . Každé zobrazení m : F → R ∪ {∞} splňující
m(A) ≥ 0 pro každou A ∈ F,
m(∅) ...
Vliv rychlosti na bezpečnost silničního provozu
s fyzikálním zákonem o zachování kinetické energie, kterou je potřeba při nárazu pohltit. Tato
energie je úměrná druhé mocnině rychlosti. Většina kinetické energie je vstřebána lehčím
srážkovým „op...
1. Úvod 1.1. Prostor elementárnıch jevu, algebra
Definice 32. Bud’ X náhodná veličina. Potom definujeme FX : R 7→ R, FX (x) = P (X ≤ x) pro
každé x ∈ R.
Věta 33. Bud’ X náhodná veličina, FX distribučnı́ funkce. Pak
(1) x1 ≤ x2 =⇒ FX (x1...