Pravděpodobnost a statistika
Transkript
Pravděpodobnost a statistika Spojité náhodné veličiny Vilém Vychodil KMI/PRAS, Přednáška 7 Vytvořeno v rámci projektu 2963/2011 FRVŠ V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 1 / 60 Přednáška 7: Přehled 1 Lebesgueův integrál: indikátorová funkce, Lebesgueův integrál nezáporné Borelovské funkce, absolutní spojitost, základní věta Lebesgueova integrálního počtu, vztah Lebesgueova a Riemannova integrálu, funkce hustoty. 2 Spojité náhodné veličiny: pravděpodobnostní míra indukovaná funkcí hustoty, (absolutně) spojitá náhodná veličina, očekávané hodnoty, střední hodnota, rozptyl, směrodatná odchylka, percentily, kvartily, medián. 3 Základní rozdělení spojitých náhodných veličin: empirické rozdělení, uniformní rozdělení, exponenciální rozdělení, Erlangovo rozdělení, gama funkce, gama rozdělení. V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 2 / 60 Opakování Definice (Lebesgueova míra Borelovských množin) Zobrazení m : B → R ∪ {∞}, které zobrazuje každý interval na jeho délku, to jest m (a, b) = m [a, b) = m (a, b] = m [a, b] = b − a, a které je navíc σ-aditivní, se nazývá Lebesgueova míra. Definice (Borelovská funkce) Funkce f : R → R se nazývá Borelovská funkce, pokud pro každé a ∈ R platí, že {x ∈ R | f (x) ≤ a} je Borelovská množina. Motivace: m na B ∩ 2[0,1] je pravděpodobnostní míra; budeme se snažit využít m k definici obecnějších pravděpodobnostních měr. V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 3 / 60 Indikátorová funkce V dalším výkladu použijeme následující pomocný pojem: Definice (Indikátorová funkce / charakteristická funkce) Mějme množinu A ⊆ R. Zobrazení 1A : R → R definované 1 pokud x ∈ A, 1A (x) = 0 jinak, se nazývá indikátorová funkce množiny A, angl.: indicator function. Poznámky: platí: B je Borelovská množina právě tehdy, když 1B je Borelovská funkce; (jednoduše vidět: důsledek faktu, že {x ∈ R | 1B (x) ≤ 0.5} = R − B) například Dirichletova funkce 1Q (všude nespojitá funkce) je Borelovská; V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 4 / 60 Definice (Lebesgueův integrál nezáporných Borelovských funkcí) Nechť m je Lebesgueova míra Borelovských množin. Pak Lebesgueův integrál je zobrazení, které každé nezáporné Borelovské funkci f : R → [0, ∞) přiřazuje číslo Z f dm ∈ R ∪ {∞} tak, že pro každé c ∈ [0, ∞), každou Borelovskou množinu B ⊆ R a libovolné nezáporné Borelovské funkce f, g, fn (n = 1, 2, . . . ) platí: R 1 1B dm = m(B); R R R R R 2 (f + g) dm = f dm + g dm a cf dm = c f dm; (linearita) R R 3 pokud fn % f , pak fn dm % f dm. (monotonní konvergence) Poznámka: an % b značí, že a1 , a2 , . . . je neklesající posloupnost a limn→∞ an = b; fn % f značí, že pro každé x ∈ R platí fn (x) % f (x). V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 5 / 60 Absolutní spojitost Definice (Absolutní spojitost) Funkce f : R → R se nazývá absolutně spojité (angl.: absolutely continuous) pokud pro každé ε > 0 existuje δ > 0 tak, že pro každou konečnou posloupnost (x1 , y1 ), . . . , (xn , yn ) disjunktních intervalů (xi , yi ) ⊆ R platí, že Pn Pn pokud i=1 |yi − xi | < δ, pak i=1 |f (yi ) − f (xi )| < ε. Další typy spojitosti: spojitost (pro každé y ∈ R platí: pro každé ε > 0 existuje δ > 0 tak, že pro libovolné x ∈ R takové, že |y − x| < δ, platí |f (y) − f (x)| < ε); stejnoměrná spojitost (pro každé ε > 0 existuje δ > 0 tak, že pro libovolná x, y ∈ R platí: pokud |y − x| < δ pak |f (y) − f (x)| < ε). Vztahy pojmů spojitosti: absolutní spojitost (nejsilnější) =⇒ stejnoměrná spojitost =⇒ spojitost (nejslabší) V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 6 / 60 Příklad (Cantorova funkce není absolutně spojitá) Uvažujme posloupnost funkcí f0 , f1 , . . . , kde f0 je identita a pro libovolné n ≥ 1 je funkce fn vyjádřena pomocí fn−1 následujícím předpisem: 1 1 f (3x) pro x ∈ 0, , n−1 2 1 32 1 pro x ∈ 3 , 3 , fn (x) = 2 3 1 1 f (3x − 2) + pro x ∈ ,1 . n−1 2 2 2 Pak funkce f , pro kterou fn % f , se nazývá Cantorova funkce: 1 f je spojitá ve všech bodech z intervalu [0, 1], f má nulovou derivaci ve všech bodech z intervalu [0, 1] s výjimkou spočetně mnoha bodů, f je spojitá (stejnoměrně) na intervalu [0, 1], f není absolutně spojitá. 3 4 1 2 1 4 1 9 2 9 1 3 4 9 5 9 2 3 7 9 8 9 1 V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 7 / 60 Vlastnosti Lebesgueova integrálu Věta (Základní věta Lebesgueova integrálního počtu) Nechť f : R → R je reálná funkce. Pak jsou následující tvrzení ekvivalentní: 1 f je absolutně spojitá na intervalu [a, b], 2 f má na [a, b] derivaci skoro všude, f 0 je Lebesgueovsky integrovatelná a platí Z Z 0 f (x) − f (a) = f dm = f 0 · 1[a,x] dm [a,x] 3 pro každé x ∈ [a, b]. existuje Lebesgueovsky integrovatelná funkce g na intervalu [a, b] taková, že Z Z f (x) − f (a) = g dm = g · 1[a,x] dm [a,x] pro každé x ∈ [a, b]. Skoro všude = s možnými výjimkami prvků množin A ⊆ R, pro které m(A) = 0. V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 8 / 60 Lebesgueův vs. Riemannův integrál Při výpočtech budeme používat následující vztah Lebesgueova a Riemannova integrálu: pokud je reálná funkce f Riemannovsky integrovatelná na intervalu [a, b], pak je i Lebesgueovsky integrovatelná a platí: Z Z b f dm = f (x) dx . [a,b] a Obrácené tvrzení neplatí (Lebesgueův integrál je obecnější). Příklad (Funkce, která není Riemannovsky integrovatelná) Indikátorová funkce 1Q není Riemannovsky integrovatelná, ale máme: Z 1Q dm = m(Q) = 0, protože množina racionálních čísel Q je spočetná, tedy m(Q) = 0. V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 9 / 60 Funkce hustoty Definice (Funkce hustoty, angl.: density function) Nezáporná Borelovská funkce f : R → [0, ∞) se nazývá funkce hustoty pokud Z f dm = 1. Funkce hustoty indukují důležité pravděpodobnostní míry: Věta (O pravděpodobnostní míře indukované funkcí hustoty) Pokud je f funkce hustoty, pak je zobrazení P : B → R definované Z f dm, pro každou A ∈ B, P (A) = A pravděpodobnostní míra na B. V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 10 / 60 Důkaz. Zřejmě platí, že P (A) ≥ 0. Jelikož je f : R → [0, ∞) funkce hustoty, platí: Z Z Z P (R) = f dm = f 1R dm = f dm = 1. R Uvažujme spočetně Snmnoho vzájemně S∞ disjunktních Borelovských množin A1 , A2 , . . . a položme Bn = i=1 Ai a B = i=1 Ai (B i Bn jsou Borelovské). Jelikož f 1Bn % f 1B , z monotonní konvergence máme: Z Z Z Z P (Bn ) = f dm = f 1Bn dm % f 1B dm = f dm = P (B). Bn B S využitím předchozího faktu dostáváme: [ ∞ Xn X∞ P Ai = P (B) = lim P (Bn ) = lim P (Ai ) = P (Ai ). i=1 n→∞ n→∞ i=1 i=1 To znamená, že P je σ-aditivní na B. V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 11 / 60 Příklad (Funkce hustoty) Mějme funkci f : R → R definovanou 1 · e −x 40 f (x) = 40 0 pokud x ≥ 0, pokud x < 0. Funkce f je zřejmě Borelovská. Dále platí: Z Z ∞ Z ∞ 1 −x f dm = f (x) dx = · e 40 dx 0 0 40 −b h −x ib −b = lim −e 40 = lim −e 40 − (−e0 ) = 1 − lim e 40 = 1 − 0 = 1. b→∞ 0 b→∞ b→∞ To znamená, že f je funkce hustoty. V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 12 / 60 Spojité pravděpodobnostní míry a veličiny Definice (Spojitá pravděpodobnostní míra, spojitá náhodná veličina) Mějme pravděpodobnostní míru P : B → R. Pokud existuje funkce hustoty f tak, že Z P (−∞, x] = f dm, pro každé x ∈ R, (−∞,x] pak se P nazývá (absolutně) spojitá pravděpodobnostní míra (s hustotou f ). Náhodná veličina X s rozdělením pravděpodobnosti PX : B → R se nazývá (absolutně) spojitá, pokud je PX absolutně spojitá pravděpodobnstní míra. Poznámka: Pokud je fX funkce hustoty spojité náhodné veličiny X, pak: Z FX (b) = PX (−∞, b] = fX dm, (−∞,b] Z P {a < X ≤ b} = PX (a, b] = fX dm. [a,b] V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 13 / 60 Věta (Chrakterizace spojitosti náhodné veličiny) Náhodná veličina X je absolutně spojitá právě tehdy, když je FX absolutně spojitá. Důkaz. Nechť X je spojitá náhodná veličina. To jest, existuje funkce hustoty fX tak, že Z Z FX (x) − FX (a) = PX (a, x] = fX dm = 0 + fX dm (a,x] (a,x] Z Z Z = fX dm + fX dm = fX dm. {a} (a,x] [a,x] Aplikací základní věty ihned dostáváme, že FX je absolutně spojitá. Opačná strana: pokud je FX absolutně spojitá reálná funkce, pak podle základní věty platí, že FX má derivaci skoro všude, FX0 je Lebesgueovsky integrovatelná a platí Z FX0 dm = FX (x) − lim FX (a) = FX (x) − 0 = FX (x) = PX (−∞, x] (−∞,x] a→−∞ pro každé x ∈ R, což dokazuje, že FX0 je hledaná funkce hustoty. V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 14 / 60 Důsledky vlastností spojitých náhodných veličin Důsledky absolutní spojitosti FX (Přednáška 5): Z PX (a, b] = PX (a, b) = PX [a, b] = PX [a, b) = FX (b) − FX (a) = FX0 dm. [a,b] Příklad (Prokázání slabší vlastnosti bez použití základní věty) Označme fX funkci hustoty X. Pro libovolné x ∈ R platí: Z Z Z Z PX ({x}) = fX dm = fX 1{x} dm = fX (x) · 1{x} dm = fX (x) · 1{x} dm {x} Z = fX (x) · 1{x} dm = fX (x) · m({x}) = fX (x) · 0 = 0. Z kritéria o spojitosti FX zleva (Přednáška 5) tedy máme, že FX je spojitá. V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 15 / 60 Příklad (Počítání pravděpodobnostní pro spojité veličiny) Mějme spojitou náhodnou veličinu X s hustotou fX z předchozího příkladu: Z 1 · e −x 40 pokud x ≥ 0, fX (x) = 40 PX (A) = fX dm. A 0 pokud x < 0, 0.025 P ({X > 40}) = PX [40, ∞) Z ∞ 1 −x = · e 40 dx 40 40 = e−1 ≈ 0.368. 0.020 0.015 0.010 0.005 20 V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny 40 60 80 100 120 Pravděpodobnost a statistika 16 / 60 Příklad (Vyjádření distribuční funkce z funkce hustoty a obráceně) Mějme spojitou náhodnou veličinu X s hustotou fX z předchozího příkladu: 1 · e −x 40 pokud x ≥ 0, fX (x) = 40 0 pokud x < 0. Pak pro distribuční funkci FX veličiny X platí FX (x) = 0 pro každé x < 0 a Z x Z x h −t ix 1 −t −x 40 · e dt = −e 40 = 1 − e 40 . FX (x) = fX (t) dt = 0 −∞ 0 40 Vyjádření (nové) funkce hustoty gX derivací distribuční funkce FX : −x 1 · e 40 pokud x > 0, 0 gX (x) = FX (x) = 40 0 pokud x < 0. Všimněte si: FX0 (0) není definovaná; aby byla gX funkce tvaru gX : R → R, stačí nadefinovat gX (0) (lze zvolit libovolně). Obě fX a gX jsou funkce hustoty pro X. V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 17 / 60 Příklad (Funkce hustoty s funkčními hodnotami ostře většími než 1) Mějme spojitou náhodnou veličinu X s hustotou fX , pro kterou platí: 2x pokud 0 < x < 1, fX (x) = 0 jinak. Pro náhodnou veličinu X a její distribuční funkci FX platí: 2.0 FX (x) = 0 Z pokud x < 0, 1.5 pokud 0 ≤ x < 1, 1.0 pokud x ≥ 1. 0.5 fX x 2t dt = x2 0 1 FX 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 18 / 60 Věta (O rozdělení složené náhodné veličiny g(X)) Pro náhodnou veličinu X a Borelovskou funkci g platí Pg(X) (A) = PX ({g ∈ A}). Důkaz. Z toho, že složené zobrazení g(X) je náhodná veličina (Přednáška 5) a z vlastností inverzních obrazů dostáváme: Pg(X) (A) = P ({g(X) ∈ A}) = P ({ω ∈ Ω | g(X(ω)) ∈ A}) = P ({ω ∈ Ω | X(ω) ∈ {g ∈ A}}) = P ({X ∈ {g ∈ A}}) = PX ({g ∈ A}), což je požadované tvrzení. Speciálně pro absolutně spojitou náhodnou veličinu X: Z Z Pg(X) (A) = fX dm , Fg(X) (x) = {g∈A} fX dm . {g≤x} Pozor: Výsledná g(X) nemusí být absolutně spojitá. (!!) V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 19 / 60 Věta (O funkci hustoty složené veličiny g(X)) Pokud je X absolutně spojitá náhodná veličina s hustotu fX a g je monotonní funkce, která má spojitou derivaci, pak g(X) je absolutně spojitá veličina a její funkce hustoty fg(X) je ve tvaru 1 −1 0 −1 · fX (g −1 (x)). fg(X) (x) = |(g ) (x)| · fX (g (x)) = 0 −1 g (g (x)) Důkaz. Použitím předchozího tvrzení, inverzní funkce g −1 a vlastnosti FX můžeme psát Z g−1 (a) Fg(X) (a) = fX (x) dx = FX (g −1 (a)) − lim FX (y) = FX (g −1 (a)), y→−∞ −∞ a to za předpokladu, že g je rostoucí. V tom případě derivací získáme 0 fg(X) (x) = Fg(X) (x) = FX0 (g −1 (x)) = fX (g −1 (x)) · (g −1 )0 (x). Pokud je g klesající, důkaz je analogický. Ostatní plyne z věty o inverzní funkci. V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 20 / 60 Příklad (Složené absolutně spojité veličiny) Mějme absolutně spojitou náhodnou veličinu X s hustotou fX , pro kterou platí: 2x pokud 0 < x < 1, fX (x) = 0 jinak. Úkol: Stanovte funkce hustoty veličin eX a −2X + 3. Řešení: 1 Pro eX a x ∈ (1, e) máme (v ostatních případech je hustota nulová): fX (ln(x)) 2 ln(x) 1 feX (x) = (ln(x))0 · fX (ln(x)) = · fX (ln(x)) = = . x x x 2 Pro −2X + 3 a x ∈ (1, 3) máme (v ostatních případech je hustota nulová): 3 − x 0 3 − x 3 − x 3 − x f−2X+3 (x) = = 0.5 · 2 = . · fX 2 2 2 2 Poznámka: Předchozí tvrzení lze zobecnit i pro funkci g, která má spojitou první derivaci, není obecně monotonní, ale je po částech monotonní. V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 21 / 60 Očekávané hodnoty Význam: střední hodnota náhodné veličiny v pravděpodobnostním prostoru; další charakteristiky (rozptyl . . . ) jsou střední hodnoty odvozených veličin; pro diskrétní veličiny jsme zavedli E(X). Dva základní přístupy zavedení: inženýrský (netechnický) × matematický (teoretický); inženýrský přístup: pro diskrétní a absolutně spojité veličiny dvě definice; matematický přístup: zavedení pomocí obecného pojmu integrál. Nevýhody inženýrského přístupu: do definice „není dostatečně vidětÿ (zejména v případě spojitých veličin); E(X) je definovaná pomocí hustoty (nebo pravděpodobnostní funkce); neřeší případy, pokud X není ani diskrétní, ani absolutně spojitá. V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 22 / 60 Definice (Integrál X vzhledem k pravděpodobnostní míře P ) Mějme pravděpodobnostní prostor hΩ, F, P i Pak integrál je zobrazení, které každé nezáporné náhodné veličině X : Ω → [0, ∞) v tomto prostoru přiřazuje číslo R X dP ∈ R ∪ {∞} tak, že pro každé číslo c ∈ [0, ∞), každý jev A ∈ F a libovolné nezáporné náhodné veličiny X, Y, Xn (n = 1, 2, . . . ) v hΩ, F, P i platí: R 1 1A dP = P (A); R R R R R 2 (X + Y ) dP = X dP + Y dP a cX dP = c X dP ; (linearita) R R 3 pokud Xn % X, pak Xn dP % X dP . (monotonní konvergence) Zobecnění (pro všechny X, nejen nezáporné): Pro X definujeme X(ω) pokud X(ω) ≥ 0, −X(ω) pokud X(ω) < 0, + − X (ω) = X (ω) = 0 jinak, 0 jinak. R R + R − Pak zavádíme X dP = X dP − X dP (rozdíl pozitivní a negativní části). V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 23 / 60 Očekávané hodnoty náhodných veličin Definice (Očekávaná hodnota, angl.: expected value) Mějme náhodnou veličinu X : Ω → R v pravděpodobnostním prostoru hΩ, F, P i. Pak očekávaná hodnota X vzhledem k hΩ, F, P i je Z E(X) = X dP. Odvozené charakteristiky: střední hodnota (angl.: mean): µX = E(X); 2 rozptyl (angl.: variance): σX = E (X − µX )2 ; směrodatná odchylka (angl.: standard deviation): σX = p 2 σX . Pozorování: Obecně zavedené E(· · ·) je opět lineární operátor. V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 24 / 60 Věta („Zákon nevědomého statistikaÿ) Mějme náhodnou veličinu X : Ω → R v pravděpodobnostním prostoru hΩ, F, P i a Borelovskou funkci g : R → R. Pak platí: R R 1 g(X) dP = g dPX ; R P 2 g(X) dP = x∈R g(x) · P ({X = x}) pokud je X diskrétní; R R 3 g(X) dP = g · fX dm pokud je X absolutně spojitá s hustotu fX . Důkaz (náznak). První tvrzení plyne užitím faktu, že g je náhodná veličina v hR, B, PX i a užitím faktu, že PX ({g ∈ A}) = P ({g(X) ∈ A}), viz Billingsley (Věta 16.13). Pokud je X diskrétní, existuje R P spočetná C ⊆ R tak, že PX (C) = 1. Tvrzení se prokáže užitím 1A dP = x∈C (1A (x) · PX ({x})), viz Billingsley (Věta 16.9). R R Poslední část tvrzení plyne užitím faktu, že 1A dP = P (A) = A fX dm, viz Billingsley (Věta 16.11). V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 25 / 60 Důsledky pro očekávané hodnoty spojitých veličin Mějme absolutně spojitou náhodnou veličinu X s funkcí hustoty fX . Užitím předchozí věty dostáváme: Z E g(X) = ∞ g(x) · fX (x) dx −∞ Speciálně dostáváme: střední hodnota: ∞ Z x · fX (x) dx µ = E(X) = −∞ rozptyl: 2 2 σ = E (X − µ) Z = ∞ (x − µ)2 · fX (x) dx −∞ V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 26 / 60 Příklad (Střední hodnota a rozptyl spojité náhodné veličiny) Mějme spojitou náhodnou veličinu X s hustotou fX , pro kterou platí: 2x pokud 0 < x < 1, fX (x) = 0 jinak. Střední hodnotu X vyjádříme následovně: " #1 Z ∞ Z 1 Z 1 2 x3 = . µX = E(X) = x · fX (x) dx = x · 2 · x dx = 2 · x2 dx = 2 · 3 3 −∞ 0 0 0 Z linearity operátoru E dostáváme: 2 σX 2 2 = x · fX (x) dx − = E (X − µX ) = E(X ) − 3 −∞ " #1 2 Z 1 2 x4 4 1 =2· = x2 · 2 · x dx − − = . 3 4 9 18 0 2 2 µ2X Z ∞ 2 0 V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 27 / 60 Kvantilová funkce Definice (Kvantilová funkce) Mějme náhodnou veličinu X s distribuční funkcí FX , pak se FX− : (0, 1) → R, kde FX− (p) = inf{x ∈ R | p ≤ FX (x)}. nazývá kvantilová funkce (angl.: quantile function) Věta (Základní vlastnosti kvantilové funkce) Pro kvantilovou funkci FX− náhodné veličiny X s distribuční funkcí FX platí: 1 FX− (p) je nejmenší prvek množiny {x ∈ R | p ≤ FX (x)}; 2 FX− (FX (a)) ≤ a pro každé a ∈ R; 3 p ≤ FX (FX− (p)) pro každé p ∈ (0, 1); 4 FX− (p) ≤ a právě tehdy, když p ≤ FX (a); 5 pokud je FX spojitá a rostoucí, pak FX− = FX−1 . V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 28 / 60 Důkaz. Sporem, kdyby A = {x ∈ R | p ≤ FX (x)} neměla nejmenší prvek, pak by existovala klesající posloupnost x1 , x2 , . . . taková, že p ≤ FX (xi ) pro každé i = 1, 2, . . . a limi→∞ xi 6∈ A. Potom ale p ≤ limi→∞ FX (xi ). Jelikož je FX spojitá zprava, p ≤ limi→∞ FX (xi ) = FX (limi→∞ xi ), tedy limi→∞ xi ∈ A, což je spor. Druhé tvrzení plyne z toho, že triviálně a ∈ {x ∈ R | FX (a) ≤ FX (x)}. Třetí tvrzení plyne z prvního, protože FX− (p) ∈ {x ∈ R | p ≤ FX (x)}. Čtvrté tvrzení prokážeme pomocí předchozích dvou: pokud FX− (p) ≤ a, pak FX (FX− (p)) ≤ FX (a), protože FX je neklesající; užitím předchozího tedy p ≤ FX (FX− (p)) ≤ FX (a). Obráceně, pokud p ≤ FX (a), pak FX− (p) ≤ FX− (FX (a)), protože F − je rovněž neklesající; užitím předchozího dostáváme FX− (p) ≤ FX− (FX (a)) ≤ a. Poslední tvrzení je důsledkem toho, že pokud je FX spojitá a rostoucí, pak je invertovatelná a tím pádem nejmenší prvek {x ∈ R | p ≤ FX (x)} je roven FX−1 (p). Odtud dostáváme, že FX− (p) = FX−1 (p). V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 29 / 60 Percentily, kvartily, medián Definice (Percentil, kvantil, angl.: percentile, quantile) Mějme náhodnou veličinu X s kvantilovou funkcí FX− a p ∈ (0, 1). Hodnotu FX− (p) nazýváme (100p)% percentil nebo kvantil s hladinou p veličiny X. Vlastnosti: P ({X ≤ FX− (p)}) = FX (FX− (p)) ≥ p pro libovolnou X; P ({X ≤ FX− (p)}) = FX (FX− (p)) = p pokud je FX spojitá; v důsledku: Z FX− (p) fX (x) dx = p . −∞ pokud je X absolutně spojitá náhodná veličina s hustotou fX . Terminologie a značení: Pokud je X zřejmá z kontextu, píšeme πp místo FX− (p); kvartily (angl.: quartile): π0.25 , π0.5 , π0.75 ; medián (angl.: median): π0.5 . V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 30 / 60 Příklady (Hodnoty kvantilových funkcí) FX 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 1 2 3 4 5 − FX 6 = 1 6 −1 FX 6 5 5 4 4 3 3 2 2 1 1 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 V. Vychodil (KMI/PRAS, Přednáška 7) FY 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 1 Spojité náhodné veličiny 2 3 4 5 6 − FX 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 Pravděpodobnost a statistika 1 31 / 60 Příklad (Hledání percentilů spojité náhodné veličiny, začátek) Mějme spojitou náhodnou veličinu X s hustotou fX , pro kterou platí: 1 − |x − 1| pokud 0 ≤ x ≤ 2, fX (x) = 0 jinak. Pak distribuční funkce FX je ve tvaru: 0 2 x 2 FX (x) = (2 − x)2 1 − 2 1 pokud x < 0, pokud 0 ≤ x < 1, pokud 1 ≤ x < 2, pokud 2 ≤ x. Abychom našli například hodnoty FX− (0.32) a FX− (0.92), musíme vyřešit: 2 2 FX− (0.32) 2 − FX− (0.92) FX (π0.32 ) = = 0.32, FX (π0.92 ) = 1 − = 0.92. 2 2 V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 32 / 60 Příklad (Hledání percentilů spojité náhodné veličiny, dokončení ) Vyjádřením FX− (0.32) a FX− (0.92) ze vztahů 2 2 FX− (0.32) 2 − FX− (0.92) FX (π0.32 ) = = 0.32, FX (π0.92 ) = 1 − = 0.92. 2 2 √ dostáváme: FX− (0.32) = 2 · 0.32 a FX− (0.92) = 1.6. Grafický význam: 1.0 fX FX 0.92 0.8 0.6 0.4 0.32 0.2 FX− (0.32) V. Vychodil (KMI/PRAS, Přednáška 7) FX− (0.92) 2.0 Spojité náhodné veličiny FX− (0.32) FX− (0.92) 2.0 Pravděpodobnost a statistika 33 / 60 Příklad (Motivace pro empirické rozdělení) Uvažujme výběrový soubor obsahující hmotnosti 40 produktů stejného typu: 22.38 19.39 25.92 19.84 21.55 23.86 24.00 21.97 22.20 23.28 22.97 20.11 22.55 24.63 23.43 21.06 22.87 22.35 22.72 20.57 24.40 24.23 22.90 22.48 interval meze (19.1, 20.3) (20.3, 21.5) (21.5, 22.7) (22.7, 23.9) (23.9, 25.1) (25.1, 26.3) (19.39, 20.11) (20.57, 21.42) (21.55, 22.67) (22.72, 23.86) (23.95, 24.63) (25.92, 25.92) V. Vychodil (KMI/PRAS, Přednáška 7) 21.65 23.95 23.32 23.60 fi 23.30 23.21 23.58 22.45 hi 3 0.063 5 0.104 12 0.250 14 0.292 5 0.104 1 0.021 Spojité náhodné veličiny 23.58 22.11 21.37 21.00 22.37 21.42 22.67 23.82 střed 19.7 20.9 22.1 23.3 24.5 25.7 Pravděpodobnost a statistika 34 / 60 Příklad (Dva způsoby zavedení funkce hustoty z empirických dat) FX fX 18.5 19.7 20.9 22.1 23.3 24.5 25.7 26.9 19.7 20.9 22.1 23.3 24.5 25.7 26.9 19.7 20.9 22.1 23.3 24.5 25.7 26.9 FY fY 18.5 18.5 19.7 20.9 22.1 23.3 V. Vychodil (KMI/PRAS, Přednáška 7) 24.5 25.7 26.9 18.5 Spojité náhodné veličiny Pravděpodobnost a statistika 35 / 60 Příklad (Motivace pro uniformní rozdělení) Uvažujme náhodnou veličinu X, která označuje výsledek náhodného výběru jednoho bodu z reálného intervalu (a, b], přitom všechny body mají stejnou šanci být zvoleny. Otázka: Jak vypadá distribuční funkce X? Analýza: Pravděpodobnost, že bod je zvolen z podintervalu (a, x] je x−a P {X ∈ (a, x]} = = P {a < X ≤ x} = FX (x), b−a kde FX je hledaná distribuční funkce ve tvaru 0 pokud x ≤ a, x−a pokud a < x ≤ b, FX (x) = b−a 1 pokud x > b. Důsledek: X je spojitá veličina, funkci hustoty stanovíme jako FX0 . V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 36 / 60 Uniformní rozdělení Definice (Náhodná veličina s uniformním rozdělením) Spojitá náhodná veličina X s hustotou fX má uniformní rozdělení (angl.: uniform distribution) pokud existují a, b ∈ R tak, že a < b a fX je ve tvaru fX (x) = 1 , b−a pokud a < x ≤ b, a fX (x) = 0 jinak; zkráceně značíme, že X má rozdělení U (a, b). Poznámky: rozdělení má dva parametry: meze intervalu (a, b]; důsledek spojitosti FX : interval lze chápat také jako [a, b], (a, b), . . . obecně lze z [a, b] „vyjmout spočetně mnoho bodůÿ, x−a distribuční funkce FX bude na intervalu [a, b] stále ve tvaru FX (x) = , b−a neplést s diskrétním uniformním rozdělením (Přednáška 6). V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 37 / 60 Příklad (Distribuční funkce a funkce hustoty pro U (a, b)) Mějme náhodnou veličinu X s rozdělením U (1.2, 2.45). Potom je fX ve tvaru: 1 1 fX (x) = = = 0.8, pokud 1.2 < x ≤ 2.45 b − a 1.25 a fX (x) = 0 pro x ≤ 1.2 nebo x > 2.45. 1.0 FX 1.0 fX 0.8 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0.5 1.0 1.5 2.0 0.5 2.5 1.0 1.5 2.0 2.5 Poznámka: Pokud položíme například fX (1.2) = 10, nezměníme tím FX ani PX . V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 38 / 60 Věta (Střední hodnota uniformní veličiny) Pokud má X rozdělení U (a, b), pak µX = b+a . 2 Důkaz. Integrací x · fX (x) dostáváme: Z ∞ Z µ = E(X) = x · fX (x) dx = ∞ x dx = −∞ b − a −∞ Z b a 1 x dx = · b−a b−a Z b x dx a " #b 2 1 x2 1 b a2 1 b 2 − a2 = · = · − = · b−a 2 b−a 2 2 b−a 2 a = b 2 − a2 (b + a) · (b − a) b + a = = . 2 · (b − a) 2 · (b − a) 2 V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 39 / 60 Věta (Rozptyl uniformní veličiny) 2 Pokud má X rozdělení U (a, b), pak σX = (b − a)2 . 12 Důkaz. Nejprve vyjádříme druhý moment: Z ∞ Z 2 2 E(X ) = x · fX (x) dx = −∞ a " 1 x3 · = b−a 3 #b a b 1 x2 dx = · b−a b−a Z b x2 dx a 1 b 3 − a3 b 3 − a3 · = . = b−a 3 3 · (b − a) S využitím předchozího pozorování a linearity operátoru E dostáváme: b 3 − a3 b + a 2 b2 − 2ab + a2 (b − a)2 2 2 2 σ = E(X ) − µ = − = = . 3 · (b − a) 2 12 12 V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 40 / 60 Opakování: Počet změn ve spojitém jednotkovém prostoru Definice (Náhodná veličina s Poissonovým rozdělením) Náhodná veličina X má Poissonovo rozdělení pokud existuje λ > 0 tak, že její pravděpodobnostní funkce fX je ve tvaru fX (x) = λx · e−λ x! pro x = 0, 1, . . . a fX (x) = 0 jinak. Interpretace: parametr λ: průměrný počet změn v jednotce uvažovaného prostoru, nutné předpoklady (přibližný Poissonův proces, Přednáška 6): počty změn v disjunktních podintervalech jsou nezávislé; λh ≈ pravděpodobnost právě jedné změna v (dost malém) podintervalu délky h; pravděpodobnost dvou a více změn v (dost malém) podintervalu je ≈ 0. V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 41 / 60 Příklad (Modifikace problému: čekání na první změnu, začátek) Problém: Uvažujeme přibližný Poissonův proces s parametrem λ, ale: místo pozorování počtu změn v intervalu (diskrétní náhodná veličina) budeme pozorovat dobu uplynulou mezi změnami (spojitá náhodná veličina W ). Otázka: Jaké má náhodná veličina W rozdělení? Analýza: W je zřejmě spojitá a nabývá hodnot z intervalu [0, ∞), zjednodušení úlohy: místo pozorování „doby mezi změnamiÿ budeme pozorovat dobu od začátku procesu do výskytu první změny za předpokladu, že se jedná o přibližný Poissonův proces s parametrem λ, vyjádříme distribuční funkci FW náhodné veličiny W . Jelikož doba čekání je nezáporná, zřejmě FW (w) = 0 pro každé w < 0. V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 42 / 60 Příklad (Modifikace problému: čekání na první změnu, dokončení ) Úvaha: Pravděpodobnost, že doba čekání na první změnu bude delší než w ≥ 0 je rovna pravděpodobnosti, že v intervalu [0, w] nedojde k žádné změně. To znamená, že pro každé w ≥ 0 můžeme psát: FW (w) = P ({W ≤ w}) = 1 − P ({W > w}) = 1 − P („žádná změna v intervalu [0, w]ÿ) = 1 − P ({X = 0}) = 1 − fX (0), kde X je diskrétní náhodná veličina s Poissonovým rozdělením s parametrem λ · w (průměrný počet změn v intervalu délky w) a fX je její pravděpodobnostní funkce: fX (x) = (λ · w)x · e−λ·w , x! odtud fX (0) = Důsledky: distribuční funkce: FW (w) = 1 − e−λ·w ; 0 funkce hustoty: fW (w) = FW (w) = λ · e−λ·w . V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny 1 · e−λ·w = e−λ·w . 1 Pravděpodobnost a statistika 43 / 60 Exponenciální rozdělení Definice (Náhodná veličina s exponenciálním rozdělením) Spojitá náhodná veličina X s hustotou fX má exponenciální rozdělení (angl.: exponential distribution) pokud existuje θ > 0 tak, že fX je ve tvaru fX (x) = 1 −x ·e θ , θ pokud x ≥ 0, a fX (x) = 0 jinak. Poznámky: parametr θ je převrácená hodnota (výchozího) parametru λ, intuice: θ je „průměrná doba čekání na změnuÿ (později dokážeme), interpretace: P ({a ≤ X ≤ b}) pravděpodobnost, že první změna (od počátku pozorování) nastane v časovém rozmezí [a, b]. V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 44 / 60 Věta (Střední hodnota veličiny s exponenciálním rozdělením) Pokud má X exponenciální rozdělení s parametrem θ, pak µX = θ. Důkaz. x x Nejprve si všimněme, že −e− θ · (x + θ) je primitivní funkcí k xθ · e− θ jelikož 0 x x 1 −x − xθ − xθ −e · (x + θ) = −e + · e θ (x + θ) = · e− θ . θ θ Odtud využitím základní věty integrálního počty a L’Hôpitalova pravidla dostáváme Z ∞ ∞ x −x x x µX = E(X) = · e θ dx = −e− θ · (x + θ) 0 = θ + lim −e− θ · (x + θ) x→∞ 0 θ x+θ 1 x = θ + lim x = θ + 0 = θ. 1 x→∞ −e θ x→∞ − · e θ θ = θ + lim Poznámka: θ je vskutku střední doba čekání na první změnu. V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 45 / 60 Věta (Rozptyl veličiny s exponenciálním rozdělením) 2 Pokud má X exponenciální rozdělení s parametrem θ, pak σX = θ2 . Důkaz. 0 x Použitím pravidla o derivaci součinu na −e− θ · (x2 + 2θx + 2θ2 ) dostáváme x2 − x 1 −x − xθ θ (x2 + 2θx + 2θ2 ) = −e · 2(x + θ) + ·e ·e θ. θ θ Analogicky jako v předchozím důkazu proto máme: Z ∞ 2 ∞ x x x 2 E(X ) = · e− θ dx = −e− θ · (x2 + 2θx + 2θ2 ) 0 = 2θ2 . θ 0 Z linearity operátoru E a předchozích pozorování dostáváme: 2 σX = E(X 2 ) − µ2X = 2θ2 − θ2 = θ2 . Důsledek: Směrodatná odchylka exponenciální veličiny s parametrem θ je σX = θ. V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 46 / 60 Příklad (Distribuční funkce exponenciální veličiny) Mějme náhodnou veličinu X, která má exponenciální rozdělení s parametrem µ = θ. Pak distribuční funkce FX náhodné veličiny X je ve tvaru: ( −x 1 − e θ pokud x ≥ 0, FX (x) = 0 pokud x < 0. Příklad: Pro X s parametrem θ = 5 máme: 1.0 FX FX 0.20 0.8 0.15 0.6 0.10 0.4 0.05 0.2 fX 2 4 θ 6 V. Vychodil (KMI/PRAS, Přednáška 7) 8 10 12 14 Spojité náhodné veličiny 2 4 θ 6 8 10 12 14 fX Pravděpodobnost a statistika 47 / 60 Příklad (Střední hodnota 6= medián) Mějme exponenciální náhodnou veličinu X danou parametrem µ = θ = 5. Medián mX = FX− (0.5) náhodné veličiny X stanovíme vyřešením FX (mX ) = 1 − e −mX θ = 0.5. Zlogaritmováním obou stran dostáváme mX = −θ · ln(0.5) ≈ 3.466. Grafický význam: 1.0 FX 0.20 0.8 0.15 0.6 0.5 0.4 0.10 0.05 0.2 2 mX fX θ 6 V. Vychodil (KMI/PRAS, Přednáška 7) 8 10 12 14 Spojité náhodné veličiny 2 mX θ 6 8 10 12 14 Pravděpodobnost a statistika 48 / 60 Příklad (Délka čekání na zákazníka) Problém: Na pobočku dochází v průměru dvacet záklazníků za hodinu. Zajímáme se o dobu čekání na zákazníka. Otázka: Jaká je pravděpodobnost, že na prvního budeme čekat víc jak 5 minut? Analýza: Pro zjednodušení předpokládáme, že záklazníci na pobočku docházejí v souladu s přibližným Poissonovým procesem s parametrem λ = 13 (zvolená jednotka jsou minuty). Do jaké míry je zjednodušující ponecháme stranou (nemáme další informace, ale lze předpokládat, že průměrný počet změn se mění v čase). Řešení: Nechť X označuje dobu čekání na prvího zákazníka. Náhodná veličina X má 1 1 −x geometrické rozdělení s parametrem θ = = 3. Potom tedy fX (x) = · e 3 a platí λ 3 Z ∞ 1 −x −5 · e 3 dx = e 3 ≈ 0.1889. P ({X > 5}) = 5 3 V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 49 / 60 Příklad (Zobecněný problém čekání na několik změn, začátek) Problém: Předpokládejme, že uvažujeme přibližný Poissonův proces s průměrným počtem změn za jednotku času rovným λ. Zajímáme se o čekání na několik změn. Otázka: Nechť W označuje dobu čekání na prvních α změn. Jak vypadá distribuční funkce a funkce hustoty spojité náhodné veličiny W ? Analýza: Analogicky jako v případě čekání na jednu změnu můžeme psát FW (w) = P ({W ≤ w}) = 1 − P ({W > w}) = 1 − P („méně jak α změn v intervalu [0, w]ÿ) = 1 − P ({X < α}) = 1 − FX (α − 1), kde X je diskrétní náhodná veličina s Poissonovým rozdělením s parametrem λ · w (průměrný počet změn v intervalu délky w) a FX je její distribuční funkce: FX (n) = n X x=0 V. Vychodil (KMI/PRAS, Přednáška 7) fX (n) = n X (λ · w)x · e−λ·w x=0 Spojité náhodné veličiny x! . Pravděpodobnost a statistika 50 / 60 Příklad (Zobecněný problém čekání na několik změn, dokončení ) Z předchozího tedy dostáváme vyjádření pro distribuční funkci FW veličiny W : FW (w) = 1 − α−1 X (λ · w)k · e−λ·w k=0 k! . Funkci hustoty fW vyjádříme jako derivaci FW . Pro w > 0 máme: α−1 X k · (λ · w)k−1 · λ (λ · w)k · λ 0 −λ·w −λ·w − fW (w) = FW (w) = λ · e −e · k! k! k=1 −λ·w =λ·e −e −λ·w λ · (λ · w)α−1 · λ− (α − 1)! λ · (λ · w)α−1 −λ·w = ·e . (α − 1)! Terminologie: W s fW v předchozím tvaru má tzv. Erlangovo rozdělení. Omezení: α > 0 je celé číslo, obecně chceme α ∈ (0, ∞). V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 51 / 60 Speciální funkce Γ Pro každé t > 0 definujeme hodnotu funkce Γ (gama) v bodě t následovně: Z ∞ Γ(t) = xt−1 · e−x dx . 0 Poznámky: Γ(t) je pozitivní pro každé t > 0 protože xt−1 · e−x je pozitivní; primitivní funkce k funkci f (x) = xt−1 · e−x není elementární funkce; při výpočtech hodnot Γ(t) se používají numerické aproximace; Γ lze rozšířit na komplexní čísla (nebudeme potřebovat). Implementace ve standardních knihovnách C99 (ISO/IEC 9899) #include <math.h> double tgamma (double x); V gcc se překládá s parametrem -std=c99 a sestavuje s parametrem -lm. V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 52 / 60 Věta (Funkce Γ jako zobecnění faktoriálu) Pro každé přirozené číslo n platí Γ(n) = (n − 1)!. Důkaz. Pro každé přirozené číslo n > 1 můžeme integrací per partes a konečně mnoha aplikacemi L’Hôpitalova pravidla (protože n je přirozené číslo) vyjádřit Z ∞ Z ∞ n−1 n−1 −x −x ∞ Γ(n) = x · e dx = x · (−e ) 0 + (n − 1) · xn−2 · e−x dx 0 Z ∞ 0 = lim xn−1 · (−e−x ) − 0 + (n − 1) · xn−2 · e−x dx x→∞ 0 xn−1 = lim + (n − 1) · Γ(n − 1) = 0 + (n − 1) · Γ(n − 1). x→∞ −ex Nyní stačí ukázat, že Γ(1) = 1. To ale platí, protože Z ∞ Z ∞ ∞ 1−1 −x Γ(1) = x · e dx = e−x dx = −e−x 0 = 1 + lim −e−x = 1 + 0 = 1. 0 V. Vychodil (KMI/PRAS, Přednáška 7) x→∞ 0 Spojité náhodné veličiny Pravděpodobnost a statistika 53 / 60 Příklad (Graf funkce Γ na intervalu [0, 1]) Γ 6 5 4 3 2 1 1 V. Vychodil (KMI/PRAS, Přednáška 7) 2 Spojité náhodné veličiny 3 4 Pravděpodobnost a statistika 54 / 60 Příklad (Graf funkce Γ na intervalu [−4, 6]) 200 150 100 50 0 −50 −100 −150 −200 −4 −2 V. Vychodil (KMI/PRAS, Přednáška 7) 0 Spojité náhodné veličiny 2 4 Pravděpodobnost a statistika 6 55 / 60 Rozdělení Γ Definice (Náhodná veličina s rozdělením Γ, angl.: gamma distribution) Spojitá náhodná veličina X s hustotou fX má rozdělení Γ (gama) pokud existují reálná čísla θ > 0 a α > 0 tak, že fX je ve tvaru fX (x) = 1 −x α−1 θ , · x · e Γ(α) · θα pokud x ≥ 0, a fX (x) = 0 jinak. Funkce hustoty je ozvozena z funkce hustoty Erlangova rozdělení: λ · (λ · x)α−1 −λ·x xα−1 1 −x −x ·e = ·e θ = · xα−1 · e θ . α α (α − 1)! (α − 1)! · θ Γ(α) · θ Distribuční funkce je ve tvaru Z ∞ 1 FX (x) = · y x−1 · e−y dy . Γ(x) 0 fX (x) = V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 56 / 60 Příklad (Funkce hustoty rozdělení Γ je dobře definovaná) Využitím substituční metody řešení integrálu pro y = θ · x můžeme psát Z ∞ Z ∞ Z ∞ 1 (θ · x)α−1 · e−x −x α−1 θ fX (x) dx = ·x · e dx = · θ dx α Γ(α) · θα 0 0 Γ(α) · θ 0 Z ∞ Γ(α) 1 · y α−1 · e−y dy = = 1. = Γ(α) 0 Γ(α) To znamená, že fX v předchozí definice je korektně zavedená funkce hustoty. Věta (Střední hodnota a rozptyl veličiny s rozdělením Γ) 2 Pokud má X rozdělení Γ s parametry θ a α, pak µX = α · θ a σX = α · θ2 . Speciální případy rozdělení Γ: α = 1 (exponenciální rozdělení); θ = 2, α = 2r , kde r je přirozené číslo (χ2 rozdělení, Přednáška 9). V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 57 / 60 Příklad (Grafy funkcí hustoty rozdělení Γ pro různé parametry) 0.10 θ=4 α=2 0.12 θ=2 α=4 0.10 0.08 α=3 0.08 θ=3 0.06 0.06 θ=4 0.04 0.04 α=4 0.02 0.02 5 10 15 20 25 30 θ pevně zvolené 5 10 15 20 25 30 α pevná zvolená Interpretace posunu křivek pro vzrůstající θ: Pokud se zmenšuje průměrný počet změn v jednotkovém intervalu, pak lze očekávat prodloužení čekací doby na výskyt α změn. V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 58 / 60 Příklad (Délka čekání na několik zákazníků) Problém: Na pobočku dochází v průměru třicet záklazníků za hodinu. Zajímáme se o dobu čekání na několik zákazníků. Otázka: Jaká je pravděpodobnost, že na první dva budeme čekat víc jak 5 minut? Analýza: Jako v předchozí situaci, uvažujeme X rozdělením Γ daným parametry α = 2 (čekáme na dva zákazníky) a θ = 2 (průměrná čekací doba na jednoho zákazníka jsou 2 minuty). −x −x Řešení: Využitím faktu, že (−2) · e 2 · (x + 2) je primitivní funkcí k x · e 2 máme −x Z ∞ α−1 −x Z ∞ 2−1 −x Z ∞ x ·e θ x ·e 2 x·e 2 P ({X > 5}) = dx = dx = dx = Γ(α) · θα Γ(2) · 22 4 5 5 5 i∞ 7 −5 1 h −x 2 = · (−2) · e · (x + 2) = · e 2 ≈ 0.287. 4 2 5 V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 59 / 60 Přednáška 7: Závěr Pojmy: indikátorová funkce, Lebesgueův integrál, absolutní spojitost funkce hustoty, (absolutně) spojitá náhodná veličina očekávané hodnoty, střední hodnota, rozptyl, kvantilová funkce empirické, uniformní, exponentiální, gama rozdělení Použité zdroje: Billingsley, P.: Probability and Measure John Wiley & Sons; 3. vydání, ISBN 978–0–471–00710–4. Capinski M., Zastawniak T. J.: Probability Through Problems Springer 2001, ISBN 978–0–387–95063–1. Hogg R. V., Tanis E. A.: Probability and Statistical Inference Prentice Hall; 7. vydání 2005, ISBN 978–0–13–146413–1. V. Vychodil (KMI/PRAS, Přednáška 7) Spojité náhodné veličiny Pravděpodobnost a statistika 60 / 60
Podobné dokumenty
Modelování výrobní linky
Inspektor vybírá ze zásobníku inspekce bloky jeden po druhém a určuje kvalitu vrstvy. Pokud
není dostatečná, blok je umístěn do zásobníku součástí k přepracování. Stroj na povrchovou
Pravděpodobnost
První tvrzení: Pokud je F konečné pole, pak
S pro libovolné Ai ∈ F (i = 1, 2, . . . )
existuje konečná I = {i1 , . . . , ik } tak, že ∞
i=1 Ai = Ai1 ∪ · · · ∪ Aik ∈ F.
Druhé tvrzení: Důsledek De Mo...
Pravděpodobnost a statistika
Příklad (Pravděpodobnost nalezení klíčového slova)
Problém: Předpokládejme, že máme uloženo (mnoho) HTML souborů, ve kterých
se zajímáme o pravděpodobnost výskytu klíčových slov. Dlouhodobým pozor...
Pravděpodobnost a statistika - Bodové odhady a intervaly spolehlivosti
Z definice složené funkce pro statistiku ϑ máme ϑ(ω) = g(X(ω)) ∈ R;
z definice rozdělení pravděpodobnosti: Pϑ (A) = P ({g(X) ∈ A});
Pro konkrétní výběr x1 , . . . , xn je g(x1 , . . . , xn ) konkré...
1. Úvod 1.1. Prostor elementárnıch jevu, algebra
Definice 1. Označme Ω prostor elementárnı́ch jevů, ω ∈ Ω elementárnı́ jev, A ⊂ Ω jev.
Definice 2. Bud’te A, B jevy, potom
• A = Ω je jev jistý.
• AC je jev opačný k jevu A. Platı́ ω ∈ A Y ω ...
(dvojný) integrál
• jestliže K = K1 ∪ K2 , kde K1 a K2 jsou dva obdélníky s vlastností K1 ∩ K2 = ∅, pak f ∈ R(K1 ),
f ∈ R(K2 ) a platí (aditivita vzhledem k integračnímu oboru)
Analýza rizik - Centrum pro výzkum toxických látek v prostředí
problém s technicky obtížným měřením koncentrace TCDD
a příbuzných látek ve vodním sloupci.
Modelována byla zátěž pstruhů za minulých, současných a
budoucích podmínek.
Model se shodoval s koncentra...
Normální rozdělení a centrální limitní věta
ϑ = g(X) nazveme (výběrová) statistika nebo výběrová charakteristika (angl.:
sample statistics) náhodného výběru X. Rozdělení pravděpodobnosti Pϑ : B → [0, 1]
veličiny ϑ nazýváme výběrové rozdělení...
SA1 skripta - MATEMATIKA online
a) přı́mý - po konečném počtu pravdivých výroků dojdeme od výroku A k výroku B, tj
A ⇒ V1 ⇒ V2 ⇒ . . . ⇒ Vn ⇒ B
b) nepřı́mý - provedeme obrácenou implikaci, tj ¬B ⇒ ¬A a tu pak dokazuj...