základy teorie pravděpodobnoti
Transkript
Přírodovědecká fakulta ZÁKLADY TEORIE PRAVDĚPODOBNOTI Ivan Křivý OSTRAVSKÁ UNIVERZITA 2004 OSTRAVSKÁ UNIVERZITA ZÁKLADY TEORIE PRAVDĚPODOBNOSTI Ivan Křivý ÚVOD 1 1. PROSTOR ELEMENTÁRNÍCH JEVŮ 3 1.1. Náhodné pokusy a náhodné jevy..................................................................................... 3 1.2. Vztahy mezi jevy a operace s jevy .................................................................................. 4 1.3. Prostor elementárních jevů.............................................................................................. 7 2. PRAVDĚPODOBNOST 11 2.1. Úloha teorie pravděpodobnosti ..................................................................................... 11 2.2. Kolmogorovova axiomatická soustava. Pravděpodobnostní prostor ............................ 12 2.3. Klasifikace pravděpodobnostních prostorů................................................................... 16 2.4. Klasická definice pravděpodobnosti ............................................................................. 17 2.5. Kombinatorický výpočet pravděpodobností ................................................................. 19 2.6 Geometrická pravděpodobnost...................................................................................... 24 2.5. Pravděpodobnost a četnost. Statistická definice pravděpodobnosti............................. 26 3. PODMÍNĚNÁ PRAVDĚPODOBNOST 31 3.1. Podmíněná pravděpodobnost ........................................................................................ 31 3.2. Nezávislost jevů ............................................................................................................ 33 3.3. Vzorec pro úplnou pravděpodobnost ............................................................................ 36 3.4. Bayesův vzorec ............................................................................................................. 37 Korespondenční úkol 1......................................................................................................... 41 4. NÁHODNÉ VELIČINY A JEJICH ROZDĚLENÍ 43 4.1. Základní pojmy ............................................................................................................. 43 4.2. Distribuční funkce ......................................................................................................... 45 4.3. Rozdělení diskrétní náhodné veličiny ........................................................................... 48 4.4. Rozdělení absolutně spojité náhodné veličiny .............................................................. 51 4.5. Náhodné vektory a jejich distribuční funkce................................................................. 54 4.6. Rozdělení náhodných vektorů....................................................................................... 57 A. Sdružené rozdělení dvou diskrétních náhodných veličin ............................................ 57 B. Sdružené rozdělení dvou absolutně spojitých náhodných veličin ............................... 60 4.7. Nezávislost náhodných veličin...................................................................................... 62 4.8. Funkce náhodných veličin............................................................................................. 64 A. Funkce jedné absolutně spojité náhodné veličiny ....................................................... 64 B. Funkce několika absolutně spojitých náhodných veličin ............................................ 66 5. ČÍSELNÉ CHARAKTERISTIKY NÁHODNÝCH VELIČIN 69 5.1. Klasifikace charakteristik.............................................................................................. 69 5.2. Střední hodnota ............................................................................................................. 70 5.3. Rozptyl a směrodatná odchylka .................................................................................... 74 5.4. Momentové charakteristiky........................................................................................... 76 5.5. Kvantilové a jiné charakteristiky................................................................................... 79 5.6. Charakteristiky náhodných vektorů .............................................................................. 81 A. Marginální charakteristiky .......................................................................................... 81 B. Podmíněné charakteristiky .......................................................................................... 82 C. Charakteristiky vztahu mezi náhodnými veličinami ................................................... 82 6. ROZDĚLENÍ DISKRÉTNÍHO TYPU 87 6.1. Bernoulliovy pokusy ..................................................................................................... 87 6.2. Binomické rozdělení ..................................................................................................... 88 6.3. Poissonovo rozdělení..................................................................................................... 91 6.4. Jiná rozdělení................................................................................................................. 94 A. Alternativní rozdělení.................................................................................................. 94 B. Negativně binomické rozdělení ................................................................................... 94 C. Geometrické rozdělení................................................................................................. 95 D. Hypergeometrické rozdělení ....................................................................................... 95 E. Rovnoměrné diskrétní rozdělení.................................................................................. 96 7. ROZDĚLENÍ ABSOLUTNĚ SPOJITÉHO TYPU 99 7.1. Normální rozdělení........................................................................................................ 99 7.2. Exponenciální rozdělení.............................................................................................. 102 7.3. Rovnoměrné spojité rozdělení..................................................................................... 104 7.4. Speciální rozdělení ...................................................................................................... 106 A. χ 2 rozdělení.............................................................................................................. 106 B. t rozdělení .................................................................................................................. 107 C. F rozdělení................................................................................................................. 108 Korespondenční úkol 2....................................................................................................... 111 8. ZÁKON VELKÝCH ČÍSEL 113 8.1. Čebyševovy nerovnosti ............................................................................................... 113 8.2. Konvergence podle pravděpodobnosti ........................................................................ 115 8.3. Zákon velkých čísel v Čebyševově tvaru.................................................................... 116 8.4. Zákon velkých čísel v Bernoulliově tvaru................................................................... 119 9. CENTRÁLNÍ LIMITNÍ VĚTA 121 9.1. Laplaceův div .............................................................................................................. 121 9.2. Moivreova - Laplaceova formulace centrální limitní věty.......................................... 122 9.3. Ljapunovova formulace centrální limitní věty ............................................................ 125 9.4. Užití centrální limitní věty .......................................................................................... 127 A. Pravidlo 3σ ............................................................................................................... 128 B. Pravděpodobnost a relativní četnost .......................................................................... 128 C. Aplikace na aritmetický průměr ................................................................................ 129 LITERATURA 131 Příloha I. 133 ANOTACE Předkládaná distanční opora představuje úvod do moderní teorie pravděpodobnosti. Je určena posluchačům distančního studia studijního oboru Aplikovaná matematika. Zahrnuje následující témata: Prostor elementárních jevů, náhodný jev, algebra jevů. Kolmogorovova axiomatická soustava. Pravděpodobnostní prostory. Podmíněná pravděpodobnost, nezávislost jevů, věta o úplné pravděpodobnosti, Bayesova věta. Náhodné veličiny, jejich rozdělení a číselné charakteristiky. Náhodné vektory. Funkce náhodných veličin. Zákony velkých čísel. Centrální limitní věta a její aplikace. V příloze I je navíc uvedena tabulka hodnot Laplaceovy funkce, pravděpodobností pro náhodné veličiny s normálním rozdělením. určená k výpočtu ÚVOD Předkládaná distanční opora (modul), která se Vám dostává do ruky, je určena pro jednosemestrální studium základů teorie pravděpodobnosti. Plně pokrývá požadavky učebních osnov kurzu PAST1 (Pravděpodobnost a statistika 1), zařazeného do 3. semestru prezenčního studia aplikované matematiky na Přírodovědecké fakultě Ostravské univerzity. Navíc obsahuje základní informace o náhodných vektorech, jejich rozdělení a speciálních rozděleních používaných v matematické statistice. Poslání modulu Cíle modulu: Po prostudování tohoto modulu • pochopíte základní pojmy teorie pravděpodobnosti (náhodný pokus, náhodný jev, pravděpodobnost jevu, atd.), • seznámíte se s axiomatickým přístupem k teorii pravděpodobnosti (Kolmogorovova axiomatická soustava), • naučíte se počítat pravděpodobnosti náhodných jevů s využitím kombinatorických principů, vzorce pro úplnou pravděpodobnost a Bayesova vzorce, • pochopíte význam náhodných veličin a náhodných vektorů v praxi, • naučíte se počítat číselné charakteristiky náhodných veličin s rozděleními diskrétního i spojitého typu, • pochopíte význam různých formulací zákona velkých čísel i centrální limitní věty a naučíte se je aplikovat v praxi. Celý modul je rozčleněn do následujících devíti lekcí : • prostor elementárních jevů, • pravděpodobnost, • podmíněná pravděpodobnost a nezávislost jevů, • náhodné veličiny a jejich rozdělení, • číselné charakteristiky náhodných veličin, • rozdělení diskrétního typu, • rozdělení absolutně spojitého typu, • zákon velkých čísel, • centrální limitní věta. Obsah modulu Nedílnou součástí skripta jsou i tabulky hodnot Laplaceovy funkce (viz příloha I), užitečné k výpočtu pravděpodobností pro náhodné veličiny s normálním rozdělením. U jednotlivých lekcí jsou dodržena následující pravidla: • je specifikován cíl lekce (tedy to, co by měl student po jejím prostudování umět, znát, pochopit), Struktura modulu 1 • • • • vlastní výklad učiva, popř. otázky k textu, řešené příklady, kontrolní úkoly (příklady) k procvičení učiva, korespondenční úkoly. Oba zařazené korespondenční úkoly mají charakter testů, které jsou určeny k ověření Vašich znalostí po prostudování příslušných témat. Součástí Vašich studijních povinností je splnění obou korespondenčních úkolů; jejich hodnocení bude započteno do celkového hodnocení kurzu. V každé kapitole je uvedeno vše potřebné pro samostatné studium, počínaje definicemi základních pojmů a konče využitím teoretických poznatků v praxi. Všechny uvedené matematické věty s výjimkou formulací centrální limitní věty jsou podrobně dokazovány. V zájmu správného pochopení probírané látky jsou jednotlivá témata doplněna řešením typových příkladů. Doporučujeme čtenáři, aby se nad každým příkladem důkladně zamyslel. Pochopení principů řešení je totiž nezbytným předpokladem pro porozumění dalšímu výkladu. Chtěli bychom také upozornit na to, že obrázky, které užíváme k ilustraci probíraných témat, jsou schématické. Čas potřebný k prostudování jednotlivých lekcí explicitně neuvádíme, neboť z našich zkušeností vyplývá, že rychlost studia značně záleží na Vašich schopnostech a studijních návycích. Předpokládáme, že si mnozí z Vás budou chtít doplnit a rozšířit poznatky studiem dalších učebnic a skript z teorie pravděpodobnosti. Můžeme Vám proto doporučit učební texty jak v češtině [1,2,5,8,9,11,12,13,16,18,19,20], tak i ve slovenštině [17], polštině [7], angličtině [3] a ruštině [4]. K procvičení praktických dovedností při řešení příkladů Vám poslouží sbírky úloh [6,14,17]. Věříme, že Vám předkládaný studijní materiál pomůže pochopit základní principy teorie pravděpodobnosti, a přejeme Vám hodně úspěchů ve studiu. Autor Autor děkuje touto cestou oběma recenzentům (PaedDr. Hashimu Habiballovi, Ph.D., a RNDr. Anně Madryové, Ph.D.) za pečlivé pročtení rukopisu a řadu cenných připomínek směřujících ke zkvalitnění předkládaného učebního textu. 2 1. PROSTOR ELEMENTÁRNÍCH JEVŮ Tato kapitola je koncipována tak, abyste po jejím prostudování: • pochopili některé základní pojmy z teorie pravděpodobnosti (náhodný pokus, náhodný jev, prostor elementárních jevů), • poznali základní vztahy mezi jevy a operace s jevy a uvědomili si, že jde vlastně o vztahy mezi množinami a operace s množinami, • naučili se znázorňovat vztahy mezi jevy a operace s jevy pomocí Vennových diagramů, • naučili se pracovat s výrazy, které obsahují jevy. V této kapitole se seznámíte s některými základními pojmy teorie pravděpodobnosti (náhodný pokus, náhodný jev, prostor elementárních jevů), při výkladu vycházíme z učebnice Tutubalina [20]. Je důležité, abyste pochopili, že vztahy mezi jevy a operace s jevy jsou vlastně vztahy mezi množinami a operace s množinami, a proto je můžete znázorňovat pomocí Vennových diagramů. 1.1. Náhodné pokusy a náhodné jevy Teorie pravděpodobnosti studuje matematické modely náhodných pokusů, tj. takových pokusů, jejichž výsledek není zcela jednoznačně určen podmínkami pokusu. Pokusem se přitom obecně rozumí každá realizace určitého komplexu podmínek. Oblíbeným příkladem náhodného pokusu je hod mincí. Hodíme-li totiž mincí, může padnout buď líc nebo rub mince. Náhodný pokus Teorie pravděpodobnosti se nezabývá libovolnými náhodnými pokusy, ale pouze těmi, které mají vlastnosti: a) hromadnosti, b) statistické stability neboli stability četností. Určitý pokus má vlastnost hromadnosti, když se může libovolněkrát opakovat, nebo když se může realizovat na hromadně se vyskytujících rovnocenných objektech. Vlastnost statistické stability lze popsat takto: Označme písmenem A jeden z možných výsledků náhodného pokusu a opakujme tento pokus n-krát. Předpokládejme, že se v těchto n pokusech vyskytl výsledek A právě nA krát. Poměr nA/n se nazývá relativní četností výsledku A. Vlastnost statistické stability spočívá v tom, že v opakovaných sériích pokusů při dostatečně velkém, pevně zvoleném n kolísá tato relativní četnost nepatrně kolem jistého reálného čísla, které intuitivně považujeme za pravděpodobnost dosažení výsledku A v daném pokusu. Základním pojmem teorie pravděpodobnosti je náhodný jev. Náhodným jevem (stručně jevem) rozumíme jakýkoliv možný výsledek provedeného náhodného pokusu. Každému pokusu přísluší určitá množina jevů (možných výsledků) a o každém jevu z množiny, jež odpovídá tomuto pokusu, lze při každém výsledku pokusu rozhodnout, zda nastal či nenastal. Vytvoření abstraktního modelu nějakého náhodného pokusu 3 Náhodný jev předpokládá, že se nejprve vymezí množina všech možných výsledků tohoto pokusu. Při vymezení této množiny jevů spjatých s daným pokusem se vychází z představy zidealizovaného (zjednodušeného) pokusu. V případě hodu mincí se uvažují pouze dva možné jevy: padnutí líce a padnutí rubu mince, i když je možné, že se mince ztratí ze zorného pole nebo postaví na "hranu". Jev jistý Jev nemožný Jev, který zákonitě nastane při každé realizaci určitého pokusu (komplexu podmínek), se nazývá jevem jistým. Jestliže je známo, že nějaký jev nemůže principiálně v daném pokusu nastat, pak se tento jev nazývá jevem nemožným. Jev, jenž při realizaci určitého pokusu nastat může, ale nemusí, se nazývá jevem možným. Z uvedeného je zřejmé, že má smysl mluvit o nutnosti, nemožnosti nebo náhodnosti nějakého jevu jen ve vztahu k určitému pokusu. 1.2. Vztahy mezi jevy a operace s jevy Předpokládejme, že je dán určitý komplex podmínek (pokus). Uvažme množinu jevů A, B, C,..., z nichž každý může při realizaci zmíněného pokusu nastat či nenastat, a sledujme vztahy mezi nimi. K označování jevů budeme v těchto skriptech zpravidla používat velkých písmen latinské abecedy. Jev jistý budeme označovat písmenem Ω, jev nemožný písmenem «. Ekvivalence jevů Z jevu A plyne jev B 1. Dva jevy, které při každé realizaci pokusu buď oba nastanou, nebo oba nenastanou, považujeme za ekvivalentní (sobě rovny). Skutečnost, že jevy A a B jsou ekvivalentní, značíme symbolem = , tzn. píšeme A = B. 2. Jestliže výskyt (nastoupení) jevu A má vždy za následek výskyt jevu B, potom říkáme, že z jevu A plyne jev B, a tuto okolnost zapisujeme A ⊆ B. 3. Jev, který nastane právě tehdy, nastane-li současně jev A i jev B, nazýváme průnikem (součinem) jevů A a B a značíme A ∩ B (nebo AB). Tím je definována binární operace průniku (násobení) jevů. Výsledek této operace zřejmě nezávisí na pořadí jevů A a B, takže platí komutativní zákon Průnik (součin) jevů A ∩ B = B ∩ A. Dále je zřejmé, že každý jev je idempotentní vzhledem k operaci průniku, což lze zapsat ve tvaru A ∩ A = A. Definici průniku jevů je možno zobecnit na libovolný počet jevů, přičemž lze snadno ukázat, že pro operaci průniku jevů platí i asociativní zákon A ∩ ( B ∩ C ) = ( A ∩ B ) ∩ C. Sjednocení (součet) jevů 4. Jev, jenž nastane právě tehdy, nastane-li aspoň jeden z jevů A a B, (součtem) jevů A a B a značíme nazýváme sjednocením A ∪ B (nebo A + B). Je bezprostředně vidět, že pro takto definovanou operaci sjednocení platí zákon komutativní 4 A∪ B = B ∪ A a rovněž zákon asociativní A ∪ ( B ∪ C ) = ( A ∪ B ) ∪ C. Definici sjednocení jevů lze tedy zřejmým způsobem rozšířit na větší počet jevů. Každý jev je také idempotentní vzhledem k operaci sjednocení, tj, platí A ∪ A = A. 5. Okolnost, že jev A nenastal, představuje rovněž určitý jev. Značíme jej A a nazýváme jevem opačným (komplementárním) k jevu A. Jevy A a A jsou navzájem opačné, jestliže současně splňují tyto vztahy Jev opačný (komplementární) A ∪ A = Ω, A ∩ A = ∅. Přímo z definice opačného jevu plyne A = A. 6. Jev, který nastane právě tehdy, když nastane jev A a současně nenastane jev B, se nazývá rozdílem jevů A a B v tomto pořadí a označuje A − B. Binární operace odčítání se na množině všech možných jevů definuje vzorcem Rozdíl jevů A − B = A ∩ B. S pomocí operace odčítání lze zapsat opačný jev v této formě A = Ω − A. Odčítání jevů nevyhovuje všem pravidlům známým z algebry. 7. Jevy A a B se nazývají neslučitelnými, jestliže jejich současný výskyt je jevem nemožným, tj, jestliže platí A ∩ B = ∅. Neslučitelnost jevů Uvedenou definici lze zobecnit na libovolný počet jevů takto: Jevy A1 , A2 ,..., An jsou neslučitelné, jestliže jsou po dvou neslučitelné, tj. jestliže platí Ai ∩ Aj = ∅ pro každé i ≠ j; i, j = 1, 2,..., n. 8. Jestliže platí n B = ∪ Ai , i =1 Ai ∩ Aj = ∅ pro každé i ≠ j ( i, j = 1, 2,..., n), Ai ≠ ∅, (i = 1, 2,..., n), pak říkáme, že jevy A1 , A2 ,..., An tvoří rozklad jevu B nebo že se jev B skládá z dílčích jevů A1 , A2 ,..., An . 5 Rozklad jevu Úplný systém neslučitelných jevů 9. Soustava jevů A1 , A2 ,..., An neslučitelných jevů, platí-li vztahy n ∪ A = Ω, i se nazývá úplným systémem Ai ∩ Aj = ∅ pro každé i ≠ j ( i, j = 1, 2,..., n), i =1 Ai ≠ ∅, (i = 1, 2,..., n), Úplnou soustavou neslučitelných jevů je ve smyslu této definice např. soustava (A, A ), ovšem za předpokladu, že A ≠ ∅, A ≠ Ω. Příklady 1.1. Průmyslově vyráběný filtr je podroben třem různým zkouškám. Jev A spočívá v tom, že náhodně vybraný filtr obstojí při první zkoušce, jev B v tom, že obstojí ve druhé, a jev C v tom, že obstojí ve třetí zkoušce. Vyjádřete symbolicky, že filtr obstojí: a) jen v první zkoušce; b) ve všech třech zkouškách; c) alespoň v jedné zkoušce? Řešení a) Současné nastoupení jevů A, B a C se symbolicky vyjádří jako průnik A ∩ B ∩ C. b) Současné nastoupení jevů A, B a C se symbolicky vyjádří jako průnik A ∩ B ∩ C. c) Jev "obstát alespoň jednou" je opačným jevem k jevu "neobstát ani jednou", takže celou situaci lze symbolicky popsat jako Ω − A ∩ B ∩ C = A ∪ B ∪ C. 1.2. Zjednodušte následující výraz ( A ∪ B) ∩ ( A ∪ B ) Řešení. ( A ∪ B ) ∩ ( A ∪ B ) = A ∪ ( B ∩ B ) = A ∪ ∅ = A. Kontrolní úkoly 1.1. Zjednodušte následující výrazy: a) ( A ∪ B ) ∩ ( B ∪ C ) , b) A ∩ B ∪ A ∩ B ∪ A ∩ B , c) A ∪ B ∪ A ∪ B , 1.2. Dokažte: a) A ∩ B = A ∪ B, b) A ∪ B = A ∩ B, c) A ∩ B ∪ C ∩ D = ( A ∪ B ) ∩ ( C ∪ D ) . 6 1.3. Do terče se vystřelí tři rány. Nechť jev Ak označuje zásah při k- tém výstřelu ( k = 1, 2,3) . Vyjádřete pomocí operací s jevy Ak a Ak následující jevy: a) všechny tři zásahy, d) zásah pouze třetím výstřelem, b) alespoň jeden zásah, e) nejvýše jedna chybná rána, c) nejméně dva zásahy, f) všechny tři rány chybné. 1.3. Prostor elementárních jevů Jev A se nazývá složeným jevem, jestliže jej lze vyjádřit jako sjednocení (součet) dvou jevů, z nichž žádný není ekvivalentní jevu A: Složený jev A = B ∪ C , kde B ≠ A, C ≠ A. Předpoklady B ≠ A, C ≠ A jsou nutné k tomu, abychom vyloučili triviální vyjádření A = A ∪ ∅, A = A ∪ A, která jsou možná pro každý jev A. Jevy, jež nelze takto vyjádřit, se nazývají elementárními jevy. Složené jevy mohou nastat několika různými způsoby, kdežto elementární jevy pouze jedním. Nemožný jev « se nepočítá mezi elementární jevy. Elementární jev Vysvětleme si rozdíl mezi složenými a elementárními jevy na konkrétním příkladě. Uvažme náhodný pokus, který spočívá v hodu dvěma hracími kostkami. Nechť A značí jev, že padne součet 10, a B jev, že padne součet 12. Jev A je zřejmě složený jev, neboť součtu 10 může být dosaženo jednou tak, že na obou kostkách padne číslo 5, podruhé tak, že padnou čísla 4 a 6. Přitom posledně uvedený jev je zase složený, protože může padnout buď číslo 4 na první a číslo 6 na druhé kostce, nebo obráceně. Naproti tomu jev B je jevem elementárním, neboť může nastat jedině tak, že na obou kostkách padne číslo 6. V moderní teorii pravděpodobnosti se uvažují matematické modely, v nichž jsou zachyceny všechny možné elementární (dále nerozložitelné) výsledky pokusu. Každému takovému výsledku pokusu odpovídá právě jeden elementární jev. Množina všech elementárních jevů spjatých s uvažovaným pokusem se nazývá prostorem elementárních jevů a značí se zpravidla písmenem Ω. Povaha prvků prostoru elementárních jevů je nepodstatná; mohou to být body eukleidovského prostoru, funkce jedné nebo více proměnných apod. Prostor elementárních jevů, který obsahuje konečný nebo spočetný počet elementárních jevů, nazýváme diskrétním prostorem elementárních jevů. Jednoduchým příkladem diskrétního prostoru elementárních jevů jsou množiny všech možných elementárních jevů při hodu n mincemi nebo n hracími kostkami. Poněkud složitější je situace v případě pokusu, který spočívá v tom, že se hází mincí do té doby, než padne poprvé např. líc mince. Prostor elementárních jevů tvoří znakové posloupnosti E1 = L, E2 = RL, E3 = RRL, ..., v nichž symbol R označuje padnutí rubu a symbol L padnutí líce mince. Také v tomto případě jde o diskrétní prostor elementárních jevů, protože množina možných elementárních jevů je sice nekonečná, ale spočetná. Ne všechny prostory elementárních jevů jsou ovšem diskrétní. Lze dokázat, že prostor elementárních jevů sestávající ze všech kladných čísel není diskrétní. 7 Prostor elementárních jevů Náhodný jev Definice operací s jevy pomocí elementárních jevů Libovolnou podmnožinu diskrétního prostoru elementárních jevů Ω nazveme náhodným jevem nebo stručně jevem. Jev je tedy jen jiné označení pro podmnožinu prostoru Ω, proto lze očekávat, že pro jevy budou platit všechna tvrzení, která platí pro množiny. Operace s jevy se redukují na operace s množinami a řídí se týmiž pravidly. V dalším uvedeme definice základních jevových relací v nové terminologii, založené na pojmu prostoru elementárních jevů. Jde v podstatě o "překlad" definic uvedených v předcházejících odstavcích do množinového jazyka. 1. Jev jistý je ekvivalentní množině všech elementárních jevů. Jev nemožný je ekvivalentní prázdné množině. 2. Průnikem (součinem) jevů A a B nazýváme jejich množinový průnik, tj. jev, který se skládá právě z těch elementárních jevů, jež patří současně k oběma jevům A i B. 3. Sjednocením (součtem) jevů A a B nazýváme jejich množinové sjednocení, tj. jev, který se skládá právě z těch elementárních jevů, jež patří k jevu A nebo k jevu B nebo k oběma současně. 4. Rozdílem jevů A a B nazýváme jejich množinový rozdíl v uvedeném pořadí, tj. jev, který se skládá právě z těch elementárních jevů, jež patří k jevu A a nepatří k jevu B. 5. Opačným (komplementárním) jevem k jevu A nazýváme množinový doplněk množiny A vzhledem k množině Ω, tj. jev, který se skládá právě z těch elementárních jevů, jež nepatří k jevu A. Analogickým způsobem lze definovat pomocí nové terminologie i všechny další jevové relace. Ke grafickému znázornění jevových relací se běžně využívá Vennových diagramů (viz obr. 1.1). Ω Ω A∩B A A∪B B A a) průnik jevů A a B B b) sjednocení jevů A a B Ω Ω A A− B A c) rozdíl jevů A a B B A d) jev opačný k jevu A Obr. 1.1. Vennovy diagramy pro znázornění základních operací s jevy. 8 Pojmy k zapamatování: • náhodný pokus • náhodný jev • jev jistý a jev nemožný • jev opačný (komplementární) • ekvivalence jevů • průnik (součin) jevů • sjednocení (součet) jevů • rozdíl jevů • rozklad jevu • neslučitelnost jevů • úplný systém neslučitelných jevů • jev složený a jev elementární • prostor elementárních jevů Shrnutí V této úvodní kapitole jste poznali některé základní pojmy teorie pravděpodobnosti (náhodný pokus, náhodný jev, prostor elementárních jevů atd.) a naučili jste se pracovat s algebraickými výrazy, které obsahují jevy. Je velmi důležité, abyste zavedené pojmy správně pochopili. Věnujte této části mimořádnou pozornost a teprve, až se ujistíte, že jste všemu porozuměli, přistupte ke studiu dalších kapitol. 9 10 2. PRAVDĚPODOBNOST Obsah této kapitoly je koncipován tak, abyste po jejím prostudování: • poznali základy moderní teorie pravděpodobnosti založené na Kolmogorovově axiomatické soustavě, • pochopili základní pojmy této axiomatické soustavy (σ-algebra jevů, pravděpodobnostní prostor, pravděpodobnostní míra), • poznali základní vlastnosti pravděpodobnostní míry (pravděpodobnosti), • naučili se (s využitím těchto základních vlastností) počítat pravděpodobnosti „složitějších“ jevů, • zopakovali si středoškolské poznatky z teorie pravděpodobnosti (klasická pravděpodobnost, geometrická pravděpodobnost), • pochopili statistický přístup k zavedení pravděpodobnosti jevu. V této kapitole jsme zvolili netradiční přístup k výkladu základů teorie pravděpodobnosti. Nejprve se budeme zabývat Kolmogorovovou axiomatickou soustavou a provedeme klasifikaci pravděpodobnostních prostorů. Ukážeme, že definice klasické i geometrické pravděpodobnosti vycházejí ze speciálních typů pravděpodobnostního prostoru. Základní vlastnosti pravděpodobnosti budou striktně dokázány. Důkazů se obávat nemusíte. Sami poznáte, že jsou vesměs velmi jednoduché. 2.1. Úloha teorie pravděpodobnosti Věda na základě pokusů a pozorování formuluje zákony, kterými se řídí průběh sledovaných dějů. V přírodě se vyskytují zákony dvojího typu: a) deterministické, b) pravděpodobnostní neboli stochastické. Schéma deterministického zákona je jednodušší. Lze jej formulovat takto: Při každé realizaci pokusu (komplexu podmínek) K nutně nastane určitý jev A. Uveďme jednoduchý příklad. Při libovolné chemické reakci probíhající v nějakém izolovaném systému (komplex podmínek K) zůstává celkové množství látky konstantní (jev A). Uvedené tvrzení je formulací zákona o zachování hmoty. Čtenář jistě sám nalezne celou řadu příkladů podobných zákonů ve fyzice, chemii, biologii a jiných vědách. V přírodě i v běžném životě se však vyskytují četné děje, které nelze popsat deterministickým schématem a které lze charakterizovat takto: V důsledku realizace pokusu (komplexu podmínek) K může jev A nastat, ale může také nenastat. Zákony tohoto typu se nazývají pravděpodobnostními neboli stochastickými zákony. Sledujeme-li např. určitý atom radioaktivního prvku po určitou dobu, pak je možné, že se tento atom během sledování rozpadne, avšak je také možné, že se 11 Deterministický zákon Stochastický zákon nerozpadne. Okamžik, kdy k rozpadu dojde, závisí na dějích, které se odehrávají v atomovém jádru a které většinou neznáme ani nemůžeme pozorovat. O výskytu náhodných jevů, jež nastávají ve velkém počtu, lze získat určitou informaci navzdory jejich náhodné povaze. Uvažujeme-li např. radioaktivní rozpad určité látky, můžeme předpovědět, jaká část této látky se během dané doby rozpadne. Radioaktivní rozpad se řídí exponenciálním zákonem, který je charakterizován poločasem rozpadu, tj. dobou, během níž se rozpadne polovina atomů radioaktivní látky. Exponenciální zákon rozpadu je typickým pravděpodobnostním zákonem; přitom je experimentálně potvrzen s nemenší přesností než většina tzv. deterministických zákonů přírodních věd. V případě pravděpodobnostních zákonů není ovšem komplexem uvažovaných podmínek určen přesný průběh dějů. Základní úlohou teorie pravděpodobnosti je studium pravděpodobnostních zákonů a zákonitostí, jimiž se řídí hromadné jevy. Odtud také vyplývá velký praktický význam teorie pravděpodobnosti, vždyť s hromadnými náhodnými jevy se setkáváme téměř ve všech oblastech vědy, techniky i každodenního života. Skoro každé deterministické schéma přírodních věd se při podrobnějším zkoumání ukáže pravděpodobnostním. Uvažme např. chemickou reakci dvou látek X a Y ve vodném roztoku. Rychlost této reakce je v každém časovém okamžiku úměrná součinu okamžitých koncentrací látek X a Y. Tento zákon se obvykle považuje za deterministický. Přitom se ovšem atomy, resp. ionty, obou látek volně pohybují v roztoku, takže pouze průměrný počet "srážek" částic látky X s částicemi látky Y je úměrný součinu koncentrací obou látek. Jde tedy v podstatě o zákon pravděpodobnostní povahy. 2.2. Kolmogorovova axiomatická soustava. Pravděpodobnostní prostor Matematické vlastnosti pravděpodobnosti se vymezují prostřednictvím tzv. axiomatické soustavy vlastností. Tato soustava postuluje minimální možný počet vlastností pravděpodobnosti, z nichž lze všechny další vlastnosti vyvodit deduktivním postupem. Tvrzení axiomatické soustavy se považují za pravdivá a v rámci dané soustavy se nedokazují. Existuje více přístupů k axiomatické výstavbě teorie pravděpodobnosti, první z nich pochází již z roku 1917 od Bernsteina. V těchto skriptech se však omezíme pouze na vysvětlení podstaty Kolmogorovovy axiomatické výstavby teorie pravděpodobnosti. Kolmogorov vychází z pojmu prostor elementárních jevů (viz odstavec 1.3). σ-algebra Nechť je dána libovolná neprázdná množina Ω . Neprázdný systém À podmnožin množiny Ω nazýváme σ-algebrou, jestliže a) Ω ∈ À, b) A∈ À ⇒ Ω − A ∈ À, ∞ c) Ai ∈ À, i = 1, 2, ... ⇒ ∪ Ai ∈ À. i=1 12 Uvedenou definicí se na prostoru elementárních jevů Ω zavádí σ-algebra náhodných jevů. Dvojice {Ω , À}se nazývá jevové pole . σ-algebra jevů Jevové pole Nyní uvedeme bez důkazu základní vlastnosti σ-algebry náhodných jevů (σ-algebry jevů). « œ À, 1) n 2) Ai œ À, i = 1, 2, ..., n ⇒ ∪ Ai ∈ À, i =1 ∞ 3) Ai œ À , i = 1, 2, ... ⇒ ∩ Ai ∈ À, i =1 n 4) Ai œ À, i = 1, 2, ..., n ⇒ ∩ Ai ∈ À. i =1 Základní axiomy Kolmogorovovy soustavy lze formulovat takto: Axiom 1 (axiom nezápornosti). Každému jevu A∈ À lze přiřadit nezáporné číslo P(A), které se nazývá pravděpodobnost jevu A. Axiom 2 (axiom normování). jednotková, tj. P(Ω) = 1. Pravděpodobnost jevu jistého je Kolmogorovovy axiomy Axiom 3 (axiom o σ-aditivitě pravděpodobností). Pro libovolnou posloupnost neslučitelných jevů A1 , A2 , ... (Ai ∈ À, i = 1, 2, ...) platí ∞ ∞ i =1 i =1 P (∪ Ai ) = ∑ P ( Ai ). Z uvedených tří axiomů lze snadno odvodit několik dalších významných vlastností pravděpodobnosti. 1. Pravděpodobnost jevu nemožného je rovna nule, tj. P (∅) = 0. Důkaz. Položíme A1 = Ω, A2 = A3 = ... = ∅ a použijeme axiomu 3. ∞ Protože jevy A1 , A2 , ... jsou neslučitelné a platí ∪ A = Ω , dostaneme i i =1 ∞ P (Ω) = P(Ω) + ∑ P(∅), i=2 z čehož bezprostředně plyne dokazované tvrzení. Ñ 2. Jsou-li jevy A1 , A2 , ... , An ∈ À neslučitelné, pak platí n n i =1 i =1 P (∪ Ai ) = ∑ P ( Ai ). Důkaz se provádí analogicky jako u vlastnosti 1. Ñ 3. Jestliže pro jevy A, B ∈ À platí A ⊂ B , pak P ( A) ≤ P( B). Důkaz. Platí B = A ∪ ( A ∩ B), přičemž jevy A a A ∩ B jsou neslučitelné. Z vlastnosti 2 vyplývá P ( B) = P( A) + P( A ∩ B) a odtud s použitím Ñ axiomu 1 plyne uvedená nerovnost. 13 Základní vlastnosti pravděpodobnosti 4. Pro libovolný jev A∈ À platí soustava nerovností 0 ≤ P ( A) ≤ 1. Ñ Důkaz. Vlastnost plyne z axiomů 1, 2 a z vlastnosti 3. 5. Jestliže pro P ( B − A) = P( B ) − P( A). A, B ∈ À jevy A⊂ B, platí pak Důkaz vyplývá z důkazu vlastnosti 3, neboť platí B − A = B ∩ A. Ñ 6. Pro libovolný jev A∈ À platí P ( A) = 1 − P ( A). Důkaz. Platí A = Ω − A a zároveň A ⊂ Ω. Vztah pro pravděpodobnost jevu opačného pak vyplývá z axiomu 2 a vlastnosti 5. Ñ 7. Pro libovolné dva jevy A, B ∈ À platí P ( A ∪ B) = P( A) + P( B) − P( A ∩ B ). Důkaz. Vyjděme ze zřejmých vztahů: A ∪ B = A ∪ ( B − ( A ∩ B)), B=(A ∩ B) ∪ (B-(A ∩ B)). Jevy A, B − ( A ∩ B) jsou neslučitelné a totéž platí o jevech A ∩ B, B − ( A ∩ B ). Z vlastnosti 2 vyplývá P ( A ∪ B) = P( A) + P( B − ( A ∩ B )), P ( B) = P( A ∩ B) + P( B − ( A ∩ B )). Odtud ovšem přímo plyne dokazovaný vzorec pro pravděpodobnost sjednocení libovolných jevů A, B ∈ À . 8. Pro libovolné jevy A1 , A2 , ... , An ∈ À platí n −1 n n i =1 i =1 P (∪ Ai ) = ∑ P( Ai ) − ∑ n − 2 n −1 +∑ ∑ P( A ∩ A ) + i =1 j =i +1 n ∑ ∑ P( A ∩ A i i =1 j =i +1 k = j +1 n j i j ∩ Ak ) − ... + (−1) n −1 (2.1) n P(∩ Ai ). i =1 Důkaz se provede matematickou indukcí. 9. Nechť jevy An ⊂ An +1 pro A1 , A2 , ... , An , ... tvoří posloupnost takovou, že n = 1, 2, ... , ∞ a nechť A = ∪ Ai . Potom platí i =1 P ( A) = lim P ( An ). n →∞ Důkaz. Uvažujme posloupnost jevů definovaných vztahem B1 = A1 , B2 = A2 − A1 , ... , Bn = An − An −1 , ... . Zřejmě platí ∞ n i =1 i =1 A = ∪ Bi a An = ∪ Bi , přičemž jevy B1 , B2 , ... jsou neslučitelné. Podle axiomu 3 máme ∞ n P ( A) = ∑ P( Bi ) = lim ∑ P( Bi ) = lim P( An ). i =1 n →∞ i =1 n →∞ Podobně jako vlastnost 9 lze dokázat i následující dvě vlastnosti pravděpodobnosti (viz např. [9]). 14 10. Nechť jevy An ⊃ An +1 A1 , A2 , ... , An , ... tvoří posloupnost takovou, že ∞ n = 1, 2, ... , pro a nechť A = ∩ Ai . Potom platí i =1 P ( A) = lim P ( An ). n →∞ 11. Pro libovolnou posloupnost jevů A1 , A2 , ... platí ∞ ∞ i =1 i =1 P (∪ Ai ) ≤ ∑ P( Ai ). Kolmogorovova axiomatická soustava je bezrozporná, protože existují takové reálné objekty, které vyhovují všem třem axiomům. Uvažme např. libovolnou množinu W sestávající z konečného počtu n prvků, tj. Ω = {E1 , E2 , ... , En }. Nechť À je systém všech podmnožin množiny W. Položíme P ( E1 ) = p1 , P ( E2 ) = p2 , ... , P ( En ) = p n , kde p1 , p2 , ... , pn jsou libovolná nezáporná reálná čísla, pro něž platí n ∑p i =1 i = 1. Dále pro lib. neprázdnou podmnožinu {Ei1 , Ei2 , ... , Eis } množiny W (1 ≤ i1 < i2 < ... < is ≤ n; 1 ≤ s ≤ n) položíme P ({Ei1 , Ei2 , ... , Eis }) = pi1 + pi2 + ... + pis . Pak jsou zřejmě splněny všechny axiomy Kolmogorovovy soustavy. Kolmogorovova soustava axiomů je evidentně neúplná. Pro daný prostor elementárních jevů W lze pravděpodobnosti jevů ze σ-algebry À zvolit různými způsoby. Ukážeme to na jednoduchém příkladě hodu hrací kostkou, přičemž jednotlivé elementární jevy označíme symboly E1 , E2 , E3 , E4 , E5 , E6 . Pravděpodobnosti jevů v příslušném jevovém poli lze zadat buď soustavou 1 P ( E1 ) = P ( E2 ) = P ( E3 ) = P ( E4 ) = P ( E5 ) = P( E6 ) = 6 nebo soustavou 1 1 P ( E1 ) = P ( E2 ) = P ( E3 ) = , P ( E4 ) = P ( E5 ) = P( E6 ) = 4 12 6 nebo nějakou jinou soustavou, ale takovou, že platí ∑ P( E ) = 1. i =1 i Neúplnost Kolmogorovovy axiomatické soustavy nelze v žádném případě považovat za její nedostatek. V praxi je třeba často řešit takové úlohy, v nichž se uvažují identické množiny náhodných jevů, ale s různými hodnotami příslušných pravděpodobností. Axiomatická definice pravděpodobnosti představuje zavedení v prostoru elementárních jevů jisté normované (axiom 2), nezáporné (axiom 1) a σ-aditivní (axiom 3) míry P, definované pro všechny jevy 15 Pravděpodobnostní míra příslušné σ-algebry À. Míru P s uvedenými vlastnostmi nazýváme Pravděpodobnostní pravděpodobnostní mírou a trojici {Ω, À, P} pravděpodobnostním prostor prostorem. 2.3. Klasifikace pravděpodobnostních prostorů Rozlišíme tři základní typy pravděpodobnostního prostoru: 1. konečný pravděpodobnostní prostor, 2. spočetný pravděpodobnostní prostor, 3. spojitý pravděpodobnostní prostor. Konečný pravděpodobnostní prostor Jednotlivé složky konečného pravděpodobnostního prostoru jsou definovány následujícím způsobem. a) Prostor elementárních jevů Ω je neprázdná množina obsahující konečný počet prvků N. b) σ-algebra jevů À je množina všech podmnožin Ω (včetně triviálních podmnožin); obsahuje tedy právě 2 N podmnožin (náhodných jevů). c) Pro pravděpodobnosti elementárních jevů ω1 , ω2 , ...,ωN platí ∀ωi ∈ Ω : P (ωi ) ≥ 0; N ∑ P(ω ) = 1. i =1 i Odtud pro pravděpodobnost libovolného jevu A ∈ À vyplývá P ( A) = ∑ P(ωi ) . Klasický pravděpodobnostní prostor Spočetný pravděpodobnostní prostor i:ωi ∈ A Speciálním případem konečného pravděpodobnostního prostoru je klasický pravděpodobnostní prostor. Ten se odlišuje pouze tím, že pravděpodobnosti všech elementárních jevů jsou si rovny, tj. 1 ∀ωi ∈ Ω : P(ωi ) = , N takže pro pravděpodobnost libovolného jevu A ∈ À vyplývá k P ( A) = , kde k značí počet elementárních jevů obsažených v jevu A. N Složky spočetného pravděpodobnostního prostoru jsou definovány analogicky. a) Prostor elementárních jevů Ω je spočetná množina, má právě tolik prvků jako množina přirozených čísel. b) σ-algebra jevů À je množina všech podmnožin Ω. c) Pro pravděpodobnosti elementárních jevů ω1 , ω2 , ...,ωN , … platí ∀ωi ∈ Ω : P(ωi ) ≥ 0; ∞ ∑ P (ω ) = 1 i =1 i a pravděpodobnost libovolného jevu A ∈ À je dána stejným vztahem jako v případě konečného pravděpodobnostního prostoru. Spojitý pravděpodobnostní prostor Spojitý pravděpodobnostní prostor je definován odlišně. Na tomto místě uvedeme pouze jeho zjednodušenou definici. a) Prostor elementárních jevů Ω je nějaká „integrovatelná“ podmnožina nrozměrného euklidovského prostoru. b) σ-algebra jevů À je systém všech „integrovatelných“ podmnožin Ω. 16 c) Na prostoru elementárních jevů je definována nezáporná „integrovatelná“ funkce π ( x1 , x2 , ... , xn ) taková, že splňuje podmínku normování ∫ ... ∫ π ( x , x , ... , x ) dx dx ...dx 1 2 n 1 2 n = 1. Ω Pak pro pravděpodobnost libovolného jevu A ∈ À platí P ( A) = ∫ ... ∫ π ( x1 , x2 , ... , xn ) dx1dx2 ...dxn . A 2.4. Klasická definice pravděpodobnosti V předcházejícím odstavci jsme ukázali souvislost klasické pravděpodobnosti s klasickým pravděpodobnostním prostorem. Z hlediska historického však klasická definice pravděpodobnosti vychází z pojmu „stejné možnosti" nastoupení jevů. Uvedený pojem se považuje za fundamentální a nedefinuje se. V případě hodu hraní kostkou, která je zhotovena z homogenního materiálu a má přesně symetrický tvar, lze za stejně možné považovat padnutí kteréhokoli z čísel 1, 2, 3, 4, 5, 6, protože není důvodu preferovat některou ze stěn před ostatními. V obecném případě se uvažuje konečná množina stejně možných elementárních jevů ω1 , ω 2 , ..., ω n takových, že tvoří úplnou soustavu neslučitelných jevů (rozklad množiny Ω). Laplaceova definice pravděpodobnosti: Nechť určitý pokus může vykázat celkem n různých, vzájemně se vylučujících výsledků, které jsou na podkladě symetrie a homogenity stejně možné. Jestliže m z těchto výsledků má nevyhnutelně za následek realizaci určitého jevu A, kdežto zbývajících n - m výsledků ji vylučuje, pak pravděpodobnost jevu A je rovna P ( A) = m . n V aplikacích teorie pravděpodobnosti se užívá poněkud odlišné terminologie. Množina všech neslučitelných a stejně možných jevů ωi (i = 1, 2, ..., n) , které jsou spjaty s nějakým pokusem, se nazývá množinou možných výsledků tohoto pokusu. Ty z možných výsledků, jež vedou k nastoupení jevu A, tvoří množinu výsledků příznivých jevu A. S použitím právě zavedené terminologie lze klasickou definici pravděpodobnosti vyslovit takto: Pravděpodobností jevu A rozumíme poměr počtu výsledků příznivých jevu A k počtu výsledků možných. Tato definice je přirozeně jednodušší, ovšem nepřesná, protože nezahrnuje předpoklad o stejné možnosti jednotlivých výsledků pokusu. V souladu s Laplaceovou definicí je každému jevu A, tj. každé m podmnožině A ⊂ Ω , přiřazena určitá pravděpodobnost P( A) = , kde m n značí počet těch elementárních jevů ωi (i = 1, 2, ..., n) , z nichž se skládá 17 jev A. Pravděpodobnost P(A) lze tedy považovat za funkci jevu A. Tato funkce má následující vlastnosti: Uvědomte si, že klasický přístup k zavedení pravděpodobnosti nevychází z žádných axiomů, proto je nutno dokázat i ta tvrzení, která se v Kolmogorovově přístupu považují za axiomy. 1. Pro každý jev A platí P ( A) ≥ 0. Důkaz. Uvedená vlastnost je zřejmá, neboť poměr m nemůže podle n definice nabývat záporných hodnot. 2. Pravděpodobnost jistého jevu je jednotková, tj. platí P(Ω) = 1. Důkaz. Jistému jevu jsou příznivé všechny možné výsledky pokusu, n takže P(Ω) = = 1. n 3. Jestliže se jev A skládá z dílčích jevů B a C, pak P(A) = P(B ∪ C) = P(B) + P(C) . Důkaz. Nechť se jev B skládá z m1 a jev C z m2 elementárních jevů Ei , i = 1, 2, ..., n. Jevy B a C jsou podle předpokladu neslučitelné, a proto ty elementární jevy Ei , z nichž se skládá jeden z jevů, jsou vesměs různé od elementárních jevů Ei , z nichž sestává druhý. Existuje tedy celkem m1 + m2 elementárních jevů Ei , ze kterých se skládá jev B ∪ C (které jsou příznivé nastoupení jevu B ∪ C ). Zřejmě platí P ( A) = m1 + m2 m1 m2 = + = P( B) + P(C ). n n n 4. Pravděpodobnost jevu A (jevu opačného k A) je rovna P ( A) = 1 − P ( A). Důkaz. Jevy A a A jsou neslučitelné, takže v souladu s vlastností 3 platí P ( A ∪ A) = P( A) + P( A). Navíc je zřejmé, že A ∪ A = Ω, a proto vzhledem k vlastnosti 2 musí být P ( A ∪ A) = P(Ω) = 1. Dokazované tvrzení vyplývá bezprostředně ze srovnání dvou posledních rovností. 5. Pravděpodobnost jevu nemožného je rovna nule, tj. platí P (∅) = 0. 18 Jevy Ω a Důkaz. P (Ω) = P(Ω ∪ ∅) = P(Ω) + P(∅). ∅ jsou neslučitelné, proto Odtud však okamžitě plyne, že P (∅) = 0. 6. Jestliže z jevu A plyne jev B, pak platí P( A) ≤ P( B). Důkaz. Jev B může být vyjádřen jako sjednocení dvou neslučitelných jevů A a A ∩ B . S použitím vlastností 3 a 1 snadno dostaneme P ( B) = P( A ∪ ( A ∩ B)) = P( A) + P( A ∩ B) ≥ P( A). 7. Pro pravděpodobnost libovolného jevu A z příslušného jevového pole platí 0 ≤ P( A) ≤ 1. Důkaz. Libovolný jev A jevového pole splňuje zřejmě vztahy ∅ ⊂ A ∪ ∅ = A = A ∩ Ω ⊂ Ω. Odtud ovšem a použitím vlastnosti 6 odvodíme nerovnosti 0 = P(∅) ≤ P( A) ≤ P(Ω) = 1. Klasická definice pravděpodobnosti jevu zavádí pojem apriorní pravděpodobnosti. Vychází sice z objektivních vlastností jevu samého, ale je zcela nezávislá na výsledcích experimentu. K vážným nedostatkům klasické definice patří její omezenost na konečně mnoho elementárních jevů, neurčitost a dokonce i „bludný kruh“, spočívající v tom, že vychází z pojmu "stejná možnost" ve smyslu "stejné pravděpodobnosti". Přestože se moderní teorie pravděpodobnosti nemůže spokojit s klasickou definicí pravděpodobnosti, využívá se v praxi této definice k řešení celé řady problémů (viz odstavec 2.5), zejména těch, které se dají převést na tzv. urnová schémata. 2.5. Kombinatorický výpočet pravděpodobností Výpočet pravděpodobností podle klasické definice se zakládá na kombinatorických úvahách. Zopakujte si základní kombinatorické principy a vztahy pro určení počtu kombinací, variací a permutací, ať už s opakováním nebo bez opakování. Doporučujeme Vám knížku Vilenkina [21], v níž naleznete řešení celé řady zajímavých (i velmi obtížných) kombinatorických úloh. Uvedeme několik typových příkladů. Příklady 2.1. Kdosi má v kapse N klíčů a chce potmě otevřít dveře svého bytu. Vyjímá naslepo z kapsy jeden po druhém a zkouší jimi otevřít dveře. Jaká je pravděpodobnost toho, že při k-tém pokusu zvolí správný klíč? 19 Řešení. Počet všech možných pořadí, jak vyjímat klíče, je zřejmě roven počtu permutací množiny N prvků, tj. N ! . Předpokládejme, že všechny permutace jsou stejně možné. Musíme tedy určit, kolik je takových permutací, při nichž stojí daný prvek (klíč) na k-tém místě. Odpověď je jednoduchá. Existuje právě ( N − 1) ! permutací, které jsou příznivé uvažovanému jevu, takže hledaná pravděpodobnost je rovna výrazu ( N − 1)! 1 = . N! N Pravděpodobnosti toho, že správný klíč padne do ruky při prvém, při druhém,…, resp. při posledním N-tém pokusu, jsou stejné a rovnají se 1/N. 2.2. Výtah s r pasažéry zastavuje postupně v n patrech. Určete pravděpodobnost jevu A, který spočívá v tom, že žádní dva pasažéři nevystoupí v jednom a tomtéž patře. Řešení. Předpokládejme, že všechny způsoby rozmístění pasažérů do jednotlivých pater jsou stejně možné. Celkový počet způsobů rozmístění je zřejmě roven počtu variací r-té třídy z n prvků s opakováním, tj. výrazu n r . Kolik je však způsobů rozmístění příznivých jevu A? Hledaný počet je dán opět počtem variací r-té třídy z n prvků, ale tentokrát bez opakování, tj. výrazem n(n − 1)(n − 2) ... (n − r + 1). Pro pravděpodobnost jevu A tedy platí P ( A) = n(n − 1)(n − 2) ... (n − r + 1) n! = . r n (n − r )!n r 2.3. Z hromádky 32 karet (4 barvy po 8 kartách) se náhodně vybere k karet (k > 1). Určete pravděpodobnost toho, že mezi těmito kartami je a) právě jedno eso; b) alespoň jedno eso. Řešení. Označme symbolem Ai jev, který spočívá v nalezení právě i es mezi k vybranými kartami ( i ≤ min(k , 4) ) a symbolem A jev, který spočívá v tom, že mezi k kartami bude nalezeno alespoň jedno eso. a) Množina všech možných výsledků pokusu je tvořena všemi kombinacemi k-té třídy z 32 prvků; počet těchto kombinací je roven ⎛ 32 ⎞ kombinačnímu číslu ⎜ ⎟ . Počet výsledků příznivých jevu A1 určíme ⎝k⎠ ⎛ 4⎞ následujícím postupem. Jedno eso lze vybrat ⎜ ⎟ různými způsoby a ⎝1⎠ ⎛ 28 ⎞ zbývající karty v počtu k - 1 celkem ⎜ ⎟ způsoby, takže počet ⎝ k − 1⎠ příznivých případů je roven součinu obou uvedených kombinačních čísel. Pro hledanou pravděpodobnost tedy platí 20 ⎛ 4 ⎞ ⎛ 28 ⎞ ⎜ ⎟⎜ ⎟ 1 ⎠ ⎝ k − 1⎠ ⎝ P ( A1 ) = . ⎛ 32 ⎞ ⎜ ⎟ ⎝k⎠ b) Podobnou úvahou jako v předcházející úloze stanovíme pravděpodobnosti všech jevů Ai pro i = 1, 2, ..., m, kde m značí menší z čísel k a 4, tj. m = min(k,4). Zřejmě platí ⎛ 4 ⎞ ⎛ 28 ⎞ ⎛ 4 ⎞ ⎛ 28 ⎞ ⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟ 2⎠⎝ k − 2⎠ m⎠⎝ k − m⎠ ⎝ ⎝ , ..., P ( Am ) = . P ( A2 ) = ⎛ 32 ⎞ ⎛ 32 ⎞ ⎜ ⎟ ⎜ ⎟ ⎝k⎠ ⎝k⎠ Jev A lze vyjádřit jako sjednocení neslučitelných jevů A1 , A2 , ..., Am , proto P ( A) = P ( A1 ) + P( A2 ) + ... + P( Am ). 2.4. Dítě si hraje s písmeny M, M, A, A, A, T, T, E, I, K. Jaká je pravděpodobnost toho, že se mu podaří při náhodném řazení písmen za sebou vytvořit slovo MATEMATIKA? Řešení. Označme uvažovaný jev symbolem A. Kdyby byla písmena vesměs různá, byl by počet všech možných výsledků pokusu roven počtu permutací množiny těchto písmen, tj. 10!. Mezi uvažovanými deseti písmeny jsou však dvě navzájem nerozlišitelná písmena M, tři nerozlišitelná písmena A a dvě nerozlišitelná písmena T. Proto permutace, které se liší transpozicí (záměnou) písmen M (takových permutací je celkem 2!) a/nebo transpozicí písmen A (celkem 3!) a/nebo transpozicí písmen T celkem 2!) představují jeden a tentýž výsledek pokusu. Z uvedeného je zřejmé, že počet všech vzájemně různých výsledků pokusu 10! . Pouze jedna z těchto permutací je příznivá jevu A, takže pro je 2!3!2! hledanou pravděpodobnost platí P ( A) = 2!3!2! 0, 0000066. 10! 2.5. Mějme n částic, z nichž každá má stejnou možnost nacházet se v kterémkoliv z N možných stavů ( N ≥ n) . Předpokládejme, že všechna možná rozdělení částic do stavů jsou stejně pravděpodobná (MaxwellovaBoltzmannova statistika). Jaká je pravděpodobnost toho, že a) v určitých n stavech bude po jedné částici (jev A); b) v libovolných n stavech bude po jedné částici (jev B)? 21 Řešení. a) Každá částice se může objevit v libovolném z N stavů; to znamená, že existuje N možností pro jednu částici. Celkový počet možných způsobů rozmístění n částic je zřejmě roven N n . K výpočtu hledané pravděpodobnosti zbývá ještě určit, kolika způsoby mohou být částice rozmístěny po jedné do n určitých stavů. Pro prvou částici máme zřejmě n možností, pro druhou n − 1 , pro třetí n − 2 , atd., až pro poslední zbude pouze jediná možnost. Z uvedené úvahy vyplývá, že existuje celkem n( n − 1)( n − 2) ... 2.1 = n! způsobů rozmístění, které jsou příznivé jevu A. Proto lze psát P ( A) = n! . Nn b) Počet možných způsobů rozmístění n částic v N stavech je dán, stejně jako v případě předcházejícím, výrazem N n . Při určování toho, kolika způsoby lze částice rozmístit po jedné do libovolných n stavů, využijeme rovněž dílčího výsledku předchozího příkladu. Počet způsobů rozmístění příznivých jevu B je tolikrát větší než počet způsobů příznivých jevu A, kolikrát je možno vybrat n stavů z jejich ⎛N⎞ celkového počtu N. Odtud plyne, že existuje n !⎜ ⎟ způsobů ⎝n⎠ rozmístění částic po jedné do n libovolných stavů. Hledaná pravděpodobnost jevu B je tedy ⎛N⎞ n !⎜ ⎟ n N! . P( B) = ⎝ n ⎠ = ( N − n)! N n N 2.6. Řešte příklad 2.5 za předpokladu, že všechny částice jsou vzájemně nerozlišitelné a přitom v každém z N stavů se může nacházet nejvýše jediná částice (Fermiho-Diracova statistika). Řešení. V tomto případě můžeme považovat za různá jen taková rozmístění částic, která se liší kvalitou obsazených stavů. Počet všech různých rozmístění se zřejmě rovná počtu možností, jak vybrat n stavů ⎛N⎞ z jejich celkového počtu N, tedy kombinačnímu číslu ⎜ ⎟ . ⎝n⎠ a) Je evidentní, že v případě Fermiho-Diracovy statistiky lze částice rozmístit v n určitých stavech pouze jediným způsobem, a proto P ( A) = 1 ( N − n)!n ! = . N! ⎛N⎞ ⎜ ⎟ ⎝n⎠ b) Jev B, jenž spočívá v rozmístění částic do n libovolných stavů, je v případě Fermiho-Diracovy statistiky jevem jistým, takže P(B) = 1 . 22 Podobné i podstatně obtížnější úlohy na kombinatorický výpočet pravděpodobností nalezne čtenář v učebnici Fellerově [3]. Metodám řešení kombinatorických úloh jsou věnovány speciální monografie, např. [21]. 2.7 (úloha o shodách). Je dána množina N různých dopisů a množina N obálek s různými adresami. Předpokládejme, že roztržitý úředník přiřadil dopisy zcela náhodně k jednotlivým obálkám. Jaká je pravděpodobnost toho, že alespoň jeden z dopisů dojde na správnou adresu? Řešení. Obálky libovolným způsobem uspořádáme a označíme je v souladu se zvoleným uspořádáním čísly 1, 2, ... , N. Dále postupujeme tak, že libovolně uspořádáme i dopisy a dopis, který je na i-tém místě, přiřadíme obálce s označením i (i = 1, 2,..., N). Předpokládáme, že pravděpodobnost každého možného uspořádání (permutace) dopisů je stejná a rovna 1/N!. Nechť Ai značí jev, jenž spočívá v tom, že dopis odpovídající obálce s označením i bude právě na i-tém místě, tj. bude přiřazen ke správné obálce. Protože ostatní dopisy mohou být uspořádány libovolně, platí ( N − 1)! (i = 1, 2, ... , N ); N! ( N − 2)! P ( Ai ∩ Aj ) = (i ≠ j; i, j = 1, 2, ..., N ). N! P ( Ai ) = Úlohu řešíme pomocí vzorce (2.1), na jehož pravé straně bude celkem N sčítanců. Sčítanec s pořadovým číslem k, 1 ≤ k ≤ N , obsahuje ⎛N⎞ ( N − k )! N! , takže má příspěvků, z nichž každý je roven ⎜ ⎟= N! ⎝ k ⎠ ( N − k )!k ! 1 hodnotu . Pro hledanou pravděpodobnost lze psát k! N P (∪ Ai ) = 1 − i =1 1 1 1 + − ... + (−1) N −1 . N! 2! 3! V případě dostatečně velkého N tedy platí N P(∪ Ai ) ≈ 1 − e −1 0,63212, i =1 což znamená, že hledaná pravděpodobnost prakticky nezávisí na N a je blízká 2/3. Kontrolní úkoly 2.1. Z hromádky 32 karet obsahující 4 esa jsou náhodně vybrány 3 karty. Určete pravděpodobnost toho, že mezi nimi budou nejméně 2 esa. 2.2. V sérii n výrobků je právě k zmetků ( k ≤ n ). Určete pravděpodobnost toho, že mezi m náhodně vybranými výrobky bude právě r zmetků ( r ≤ k ) . 23 2.3. Ve studijní skupině je celkem 30 studentů. Jaká je pravděpodobnost toho, že žádní dva studenti neslaví narozeniny téhož dne? Předpokládejme, že rok má 365 dnů. 2.4. Mezi 25 zkušebními lístky je 5 „šťastných“ a 20 „nešťastných“. Studenti si vybírají lístky postupně jeden za druhým. U kterého je větší pravděpodobnost, že si vytáhne „šťastný“ lístek: u toho, který táhne první, nebo u toho, který táhne druhý? 2.5. Číslice 1, 2, ... , n ( n ≤ 9) jsou náhodně uspořádány do posloupnosti. Jaká je pravděpodobnost toho, že číslice 1 a 2 stojí vedle sebe právě v tomto pořadí? 2.6. Určete pravděpodobnost toho, že poslední dvě číslice třetí mocniny náhodně vybraného celého čísla jsou rovny jednotce. 2.7. Krychle, jejíž všechny stěny jsou nabarveny, se rozřeže na 1000 krychliček stejného rozměru. Jaká je pravděpodobnost toho, že náhodně vybraná krychlička bude mít dvě nabarvené stěny? 2.8. Určete pravděpodobnost výhry první, druhé, třetí a čtvrté ceny a) v Sazce, b) ve Sportce. 2.6 Geometrická pravděpodobnost Jedním z nedostatků klasické definice pravděpodobnosti je skutečnost, že tato definice uvažuje pouze konečné základní množiny elementárních (stejně možných) jevů. Pokusy o rozšíření klasické teorie pravděpodobnosti i na případ nekonečné základní množiny elementárních jevů vedly již koncem 18. století k zavedení pojmu geometrické pravděpodobnosti. V podstatě šlo jen o modifikaci klasické definice pravděpodobnosti, protože se vycházelo opět z pojmu stejné možnosti nastoupení určitých jevů. Úloha na geometrickou pravděpodobnost může být formulována takto: Nechť je v euklidovském prostoru dána nějaká oblast Ω , která má konečný objem (obsah) V( Ω ) a v ní (uvnitř) jiná oblast A s integrovatelnou hranicí. Vybíráme náhodně bod z oblasti Ω a ptáme se, s jakou pravděpodobností patří tento bod také do oblasti A. Předpokládáme, že pravděpodobnost "padnutí" náhodně vybraného bodu oblasti Ω do oblasti A je úměrná objemu (obsahu) této oblasti a nezávisí na jejím umístění ani tvaru. Hledanou pravděpodobnost klademe v geometrickém pojetí rovnu hodnotě výrazu V ( A) V (Ω) , kde V(A) je objem (obsah) oblasti A. Takto zavedená geometrická pravděpodobnost se stala vhodným nástrojem na řešení řady úloh, na něž nestačilo klasické pojetí pravděpodobnosti. Adekvátní definice geometrické pravděpodobnosti je založena na pojmu Lebesgueovy míry. Podrobné poučení o Lebesgueově míře nalezne čtenář např. v monografii [10]. Definice geometrické pravděpodobnosti. Nechť Ω je měřitelná podmnožina n-rozměrného euklidovského prostoru n , která má kladnou 24 a konečnou Lebesgueovu míru µ (Ω). Dále nechť À je systém všech měřitelných podmnožin množiny Ω a µ ( A) je n-rozměrná Lebesgueova míra měřitelné množiny A∈ À . Položme P ( A) = µ ( A) . µ (Ω ) (2.2) Takto uvedená trojice {Ω, À, P} je Kolmogorovův pravděpodobnostní prostor. Pravděpodobnostní míra definovaná vztahem (2.2) je geometrickou pravděpodobností jevu A∈ À. Poznámka. Připomínáme, že Lebesgueova míra v euklidovském prostoru n je invariantní vzhledem k transformaci kartézské soustavy souřadnic a rovněž je invariantní vzhledem ke shodným zobrazením prostoru n . Výpočet geometrické pravděpodobnosti pomocí vztahu (2.2) se v praxi převádí na výpočet délky, obsahu nebo objemu určitých geometrických útvarů. Uvedeme dva jednoduché příklady na výpočet geometrické pravděpodobnosti. Příklady 2.8. Hodiny, které nebyly včas nataženy, se po určité době zastaví. Jaká je pravděpodobnost toho, že se velká ručička zastaví mezi trojkou a šestkou? Řešení. Označme uvažovaný jev písmenem A. Pravděpodobnost, že se velká ručička zastaví uvnitř definovaného oblouku číselníku je úměrná délce tohoto oblouku. Proto je hledaná pravděpodobnost rovna poměru délky oblouku mezi číslicemi tři a šest ( π r ) a délky obvodu celého 2 číselníku ( 2π r ), tj. πr 1 P ( A) = 2 = . 2π r 4 2.9 (úloha o setkání). Dva studenti X a Y se dohodli, že se setkají na určitém místě v době od 12 do 13 hodin. Ten, kdo přijde první, počká na druhého 20 minut, a nedočká-li se, odejde. Jaká je pravděpodobnost, že se oba studenti za těchto podmínek setkají, jestliže předpokládáme stejnou možnost příchodu každého z nich v kterémkoliv okamžiku stanoveného časového intervalu a okamžiky příchodu jsou nezávislé? Řešení. Označme okamžik příchodu (v minutách po 12.00 hod.) studenta X písmenem x a okamžik příchodu studenta Y písmenem y. Nutnou a postačující podmínkou pro uskutečnění setkání obou studentů je platnost vztahu x − y ≤ 20. Veličiny x a y budeme interpretovat jako kartézské souřadnice v euklidovské rovině (viz obr. 2.1). Všechny možné výsledky pokusu lze pak znázornit body čtverce o straně dlouhé 60 jednotek. 25 Geometrická pravděpodobnost Ty možnosti, které jsou příznivé setkání obou studentů, leží zřejmě uvnitř vyšrafované oblasti. Pravděpodobnost setkání je tedy rovna podílu obsahu vyšrafované oblasti a obsahu celého čtverce, tj. P= 602 − 402 5 = . 602 9 y 60 40 20 0 0 20 40 60 Obr. 2.1. Schematické znázornění k úloze o setkání x Úlohy o setkání lze principiálně využít k řešení následujícího problému z oblasti hromadné obsluhy. Dělník obsluhuje několik strojů téhož typu, z nichž každý vyžaduje v náhodných časových okamžicích dělníkovu přítomnost (pozornost). Může se stát, že v době, kdy je dělník u jednoho stroje, vyžaduje jeho přítomnost některý jiný, resp. jiné stroje. Úkolem je stanovit pravděpodobnost takového jevu. Kontrolní úkoly 2.9. Vepišme do koule krychli. Jaká je pravděpodobnost toho, že náhodně vybraný bod koule je také bodem vepsané krychle? 2.10. Koeficienty p a q kvadratického trojčlenu x 2 + px + q jsou vybrány náhodně z intervalu −1,1 . Jaká je pravděpodobnost toho, že uvedený trojčlen má reálné nulové body? 2.11. Na rovnoběžné přímky (v rovině) ležící ve stejných vzdálenostech d od sebe házíme jehlu délky h ( h < d ) . Jaká je pravděpodobnost toho, že jehla protne jednu z rovnoběžek (Buffonova úloha)? 2.5. Pravděpodobnost a četnost. Statistická definice pravděpodobnosti Relativní četnost jevu Statistické pojetí pravděpodobnosti vychází z pojmu relativní četnosti jevu. Uvažme nějaký pokus, jehož výsledkem může být nastoupení nebo nenastoupení určitého jevu A. Označme symbolem nA počet nastoupení uvažovaného jevu v n nezávislých pokusech. Relativní četností jevu A pak rozumíme podíl počtu pokusů, které vedly k nastoupení jevu A, 26 k celkovému počtu skutečně provedených pokusů, tj. poměr nA n . Číslo nA se nazývá absolutní četností jevu A. Dlouhodobá pozorování ukazují, že relativní četnosti celé řady jevů při dostatečně velkém n zůstávají při přechodu od jedné série pokusů k druhé prakticky konstantní. Větší odchylky od této "konstanty" se přitom pozorují tím vzácněji, čím početnější jsou provedené série experimentů. Tato stabilita relativních četností byla poprvé zjištěna u jevů demografického charakteru. Už od nejstarších dob je známo, že poměr počtu narozených chlapců k celkovému počtu narozených dětí pro velká města i celé státy zůstává v průběhu let téměř konstantní a blízký hodnotě 1/2. Později, zejména během 17. a 18. století, byla pozorována stabilita i jiných charakteristik a zákonitostí demografické povahy: procenta úmrtnosti v daném věku pro dané sociální skupiny obyvatelstva, rozdělení obyvatelstva daného pohlaví podle vzrůstu, šířky hrudníku apod. Významné je zjištění, že v těch případech, kdy je použitelná klasická definice pravděpodobnosti, kolísají relativní četnosti jevů kolem hodnot jejich klasických pravděpodobností. V současné době máme k dispozici rozsáhlý experimentální materiál, který nesporně potvrzuje tuto skutečnost. V tabulce 2.1 jsou uvedeny některé výsledky experimentů s hodem mincí. Tab. 2.1.Výsledky pokusů s hodem mincí Experimentátor Buffon Pearson Pearson Počet hodů 4 040 12 000 24 000 Abs. četnost padnutí Rel. četnost padnutí rubu rubu 2 048 0,5080 6 019 0,5016 12 012 0,5005 Z údajů v tabulce je zřejmé, že relativní četnost padnutí rubu mince kolísá kolem hodnoty 1/2, tj. kolem klasické pravděpodobnosti uvažovaného jevu pro případ homogenní a přesně symetrické mince. K podobnému závěru vedly i jiné pokusy, např. hody hrací kostkou, určování relativní četnosti výskytu určité číslice v tabulce náhodných čísel apod. Uvedené skutečnosti nás přivádějí k předpokladu objektivní existence nějaké číselné charakteristiky jevu (pravděpodobnosti jevu), kolem níž kolísají experimentálně určované relativní četnosti. Statistické zavedení pravděpodobnosti. Říkáme, že určitý jev A má pravděpodobnost, jestliže tento jev splňuje následující podmínky: a) je možno (alespoň principiálně) provést neomezený počet vzájemně nezávislých a přesně stejných pokusů, z nichž každý může vést k nastoupení nebo nenastoupení jevu A; b) relativní četnost jevu A se prakticky pro každou velkou sérii pokusů liší jen nepatrně od nějaké, v obecném případě neznámé, konstanty. 27 Absolutní četnost jevu Statistická pravděpodobnost Tato číselná charakteristika náhodného jevu A se nazývá statistickou pravděpodobností. Za její přibližnou hodnotu lze při dostatečně velkém počtu pokusů vzít buď přímo relativní četnost jevu A nebo nějaké číslo blízké této četnosti. Toto statistické zavedení pravděpodobnosti má převážně popisný charakter. Nejde o formální matematickou definici pravděpodobnosti, ale pouze o vymezení podmínek nutných pro existenci pravděpodobnosti a stanovení metody pro odhad hodnoty této pravděpodobnosti. Misesova definice pravděpodobnosti. Statistickou pravděpodobností jevu A se nazývá limita relativních četností jevu A, roste-li počet pokusů, z nichž relativní četnost určujeme, nade všechny meze, tzn. nA . n →∞ n P ( A) = lim Poznámka. Uvedenou definici je možno zpřesnit takto: Pro libovolné ε > 0 platí lim P( n →∞ nA − p <ε ) = 1, p = P( A). n Misesova definice je velmi rozšířena zejména v oblasti přírodních věd. Mises odmítá klasickou definici pravděpodobnosti a nepovažuje za nutné znát vnitřní strukturu jevů. Podle něj je uvedená empirická definice schopna v plné míře zabezpečit veškeré požadavky přírodních věd i filozofie. Statistický způsob vymezení pravděpodobnosti má ovšem vážný nedostatek. Pravděpodobnosti jevů jsou v tomto případě vázány na výsledky pokusů, takže jde o tzv. aposteriorní pravděpodobnosti. Pojem statistické pravděpodobnosti vychází pouze z výsledků pokusů a nepřihlíží k vnitřním zákonitostem a vlastnostem sledovaných jevů. Bez realizace konkrétních pokusů nelze o pravděpodobnosti jevů v rámci statistické definice vůbec mluvit. Třebaže jsou proti statistickému vymezení pravděpodobnosti vážné výhrady, používá se jej dodnes tam, kde jde o sledování velkých souborů, např. v demografickém výzkumu. Přitom se předpokládá, že pravděpodobnosti studovaných jevů jsou přibližně rovny experimentálně určeným relativním četnostem. Příklad 2.9. Na základě statistických údajů uvedených v prvních třech sloupcích tabulky 2.2 odhadněte pravděpodobnost narození dvojčat mužského pohlaví. Řešení. Údaje v tabulce 2.2 doplníme o relativní četnosti. Z uvedených údajů je možno odhadnout pravděpodobnost narození dvojčat mužského pohlaví číslem 0,35. 28 Tab. 2.2. Údaje o počtu narozených dvojčat v ČSSR Rok 1963 1964 1965 1966 1967 1968 Počet narozených dvojčat 2321 2265 2330 2188 1957 1953 Z toho oba chlapci 809 792 847 772 673 696 Relativní četnost dvojčat-chlapců 0,349 0,350 0,364 0,353 0,344 0,356 Pojmy k zapamatování: • σ-algebra jevů • jevové pole • Kolmogorovovy axiomy • pravděpodobnostní prostor • pravděpodobnost (pravděpodobnostní míra) • klasická pravděpodobnost (Laplace) • geometrická pravděpodobnost • statistická pravděpodobnost • relativní četnost jevu • absolutní četnost jevu Shrnutí: V této kapitole byly vyloženy základy moderní teorie pravděpodobnosti založené na Kolmogorovově axiomatické soustavě. Zvláštní pozornost byla věnována důkazům základních vlastností pravděpodobnostní míry (pravděpodobnosti) a odvození užitečných vztahů pro výpočet pravděpodobnosti „složitějších“ jevů. Použití těchto vztahů bylo ilustrováno na řadě typových úloh. 29 30 3. PODMÍNĚNÁ PRAVDĚPODOBNOST Po prostudování této kapitoly: • pochopíte další základní pojmy teorie pravděpodobnosti (podmíněná pravděpodobnost, podvojná a sdružená nezávislost jevů), • naučíte se počítat pravděpodobnosti jevů, resp. podmíněné pravděpodobnosti jevů, s využitím věty o násobení pravděpodobností, vzorce pro úplnou pravděpodobnost a Bayesova vzorce V této kapitole se naučíte používat další užitečné vzorce pro výpočet pravděpodobnosti „složitějších“ jevů, konkrétně vzorce pro pravděpodobnost součinu (průniku) jevů, vzorec pro úplnou pravděpodobnost a Bayesův vzorec. Zvláštní pozornost věnujte pochopení pojmů podvojná a sdružená nezávislost jevů, aby nedocházelo k záměně s pojmem neslučitelnosti jevů. 3.1. Podmíněná pravděpodobnost Pojem podmíněné pravděpodobnosti je jedním ze základních pojmů teorie pravděpodobnosti. Dosud jsme se zabývali studiem jevů, které mohou nastoupit či nenastoupit v důsledku realizace určitého pokusu (komplexu podmínek). Jestliže při výpočtu pravděpodobnosti takových jevů neklademe kromě uvedeného komplexu podmínek žádné další omezení, pak se jedná o nepodmíněné pravděpodobnosti. V řadě případů je však třeba určit pravděpodobnost sledovaného jevu A za doplňujícího předpokladu, že nastal určitý jev (hypotéza) B, který má kladnou pravděpodobnost. Taková pravděpodobnost se nazývá podmíněnou pravděpodobností a označuje symbolicky P ( A | B ). Nechť B je jev s kladnou pravděpodobností a A libovolný jev. Podmíněná pravděpodobnost jevu A za předpokladu, že nastal jev B (za hypotézy, resp. podmínky B), je definována vztahem P( A | B) = P( A ∩ B) . P( B) (3.1) Uvedená definice má smysl jen pro P ( B ) > 0. Má-li jev (hypotéza) B nulovou pravděpodobnost, není podmíněná pravděpodobnost P( A | B) definována. V diskrétních prostorech elementárních jevů nemá tento případ praktického významu. Příklad 3.1 (výběr bez vracení). Ze souboru obsahujícího n různých prvků 1, 2, ... , n se postupně vybírá po jednom prvku bez vracení vybraného prvku zpět. Nechť i a j jsou dva různé prvky uvažovaného souboru. Jaká je podmíněná pravděpodobnost toho, že při druhém pokusu bude vybrán prvek j za předpokladu, že poprvé byl vybrán prvek i? 31 Podmíněná pravděpodobnost Řešení. Zavedeme toto označení jevů: A - při druhém pokusu vybrán prvek j, B - při prvém pokusu vybrán prvek i. Zřejmě platí 1 1 P( B) = , P( A ∩ B) = . Odtud plyne pro hledanou podmíněnou n n(n − 1) pravděpodobnost v souladu s definicí vzorec 1 1 n(n − 1) P( A | B) = = . 1 n −1 n Výsledný vzorec vyjadřuje skutečnost, že se druhý výběr provádí ze souboru o rozsahu n − 1 různých prvků, přičemž každý z těchto prvků 1 může být vybrán s pravděpodobností . n −1 Podmíněná pravděpodobnost má evidentně všechny vlastnosti pravděpodobnosti. Snadno lze ověřit, že vyhovuje všem třem axiomům, které formuloval Kolmogorov. Axiom 1 je zřejmě splněn, jelikož každému jevu A∈ À je podle (3.1) přiřazena nezáporná funkce P ( A | B ) . Jestliže je A = B , pak podle definice (3.1) platí P( B | B) = P( B ∩ B) = 1, P( B) čímž je ověřena platnost axiomu 2. Pro libovolnou posloupnost neslučitelných jevů A1 , A2 , ... zřejmě také platí axiom 3, neboť ∞ ∞ P((∪ Ai ) ∩ B ) i =1 P( B) P (∪ Ai | B) = i =1 ∞ = ∑ P( A ∩ B) i i =1 P( B) ∞ = ∑ P( Ai | B). i =1 Pravděpodobnostní prostor pro podmíněné pravděpodobnosti P ( A | B ) je tvořen trojicí {B, Á, P( A ∩ B) / P( B)} , kde Á značí σ-algebru jevů definovanou vztahem Á = { A ∩ B; A ∈ À}. Z uvedeného vyplývá, že všechny věty a vzorce o (nepodmíněných) pravděpodobnostech platí i pro podmíněné pravděpodobnosti, jsou-li podmíněné pravděpodobnosti uvažovány za jedné a téže hypotézy (podmínky). Věta 3.1 (věta o násobení pravděpodobností). Pravděpodobnost průniku (současného výskytu) dvou libovolných jevů A, B ( P( A) > 0, P( B) > 0) je rovna součinu pravděpodobnosti jednoho z nich a podmíněné pravděpodobnosti druhého za předpokladu, že nastal první jev, tj. platí P ( A ∩ B) = P( B) P( A | B) = P( A) P( B | A). 32 (3.2) Důkaz. Násobíme-li definiční rovnost (3.1) číslem P( B) > 0 , dostaneme okamžitě P ( A ∩ B) = P( B) P ( A | B). Vzorec P ( A ∩ B) = P( A) P( B | A) získáme analogicky z definice podmíněné P( A ∩ B) . „ pravděpodobnosti zapsané ve tvaru P ( B | A) = P( A) Uvedenou větu lze snadno zobecnit na případ více jevů. Uvažme např. tři jevy A1 , A2 , A3 a položme nejprve B = A1 ∩ A2 . Opakovaným použitím vztahu (3.2) (podruhé zvolíme B = A1 ) získáme pro P ( A1 ∩ A2 ) > 0 vztah P ( A1 ∩ A2 ∩ A3 ) = P( A1 ∩ A2 ) P( A3 | A1 ∩ A2 ) = = P( A1 ) P( A2 | A1 ) P ( A3 | A1 ∩ A2 ). Další zobecnění na případ čtyř a více jevů je evidentní. Pravděpodobnost průniku jevů A1 , A2 , ... , An je za předpokladu n −1 P (∩ Ai ) > 0 rovna i =1 n n −1 i =1 i =1 P (∩ Ai ) = P( A1 ) P( A2 | A1 ) ... P( An | ∩ Ai ). (3.3) Věta 3.1 a její zobecnění představují v podstatě pravidlo pro počítání pravděpodobnosti průniku libovolného konečného počtu jevů. Příklad 3.2. V urně se nachází 5 bílých, 4 černé a 3 modré kuličky. Každý pokus spočívá v tom, že se náhodně vytáhne jedna kulička, která se pak už nevrací zpět do urny. Jaká je pravděpodobnost toho, že se při prvním kroku vytáhne bílá kulička, při druhém černá a při třetím modrá? Řešení. Zvolme následující označení jevů: A - při prvním kroku se vytáhne bílá kulička, B - při druhém kroku černá kulička, C - při třetím kroku modrá kulička. Snadno určíme P ( A) = 5 4 3 , P( B | A) = , P(C | A ∩ B) = , 12 11 10 takže pro hledanou pravděpodobnost dostaneme 5 4 3 1 ⋅ ⋅ = . 12 11 10 22 Kontrolní úkol 3.1. Z hromádky 32 karet se postupně vytáhnou dvě karty. Určete podmíněnou pravděpodobnost toho, že druhou taženou kartou je eso, jestliže první tažená karta bylo také eso. P ( A ∩ B ∩ C ) = P ( A) P( B | A) P(C | A ∩ B) = 3.2. Nezávislost jevů Je přirozené tvrdit, že jev A nezávisí na jevu B ( P ( B ) > 0) , jestliže se podmíněná pravděpodobnost jevu A za hypotézy (podmínky) B rovná (nepodmíněné) pravděpodobnosti jevu A, tj. P ( A | B) = P( A). 33 Je-li také P ( A) > 0 , pak lze vzhledem k platnosti (3.2) psát P ( B | A) P ( A) = P ( A | B ) P ( B ) = P ( A) P ( B ). Odtud ovšem bezprostředně plyne P ( B | A) = P( B) , tj. vlastnost nezávislosti jevů je symetrická. Lze tedy vyslovit tuto definici. Jevy A, B se nazývají nezávislé, platí-li rovnost Podvojná nezávislost jevů P ( A ∩ B ) = P( A) P( B). Poznámka. V uvedené definici nezávislosti jevů A a B můžeme upustit od požadavku, aby jevy A a B měly kladné pravděpodobnosti. Jev A, pro který platí P(A) = 0 nebo P(A) = 1, je pak nezávislý na jakémkoliv jevu B. Smysl této definice spočívá v tom, že když nastal jeden z nezávislých jevů, pak to nikterak neovlivňuje pravděpodobnost druhého jevu. Věta 3.2. Jsou-li jevy A, B nezávislé, pak jsou také nezávislé jevy A , B. Důkaz. Vyjdeme ze zřejmé rovnosti P ( A | B) + P( A | B) = 1. Podle předpokladu platí P ( A | B) = P( A), takže P ( A | B) = 1 − P( A) = P( A). Podobně lze dokázat i tvrzení, že z nezávislosti jevů A, B vyplývá nezávislost jevů A, B , popř. A, B. Ujasněte si rozdíl mezi pojmem neslučitelnost jevů, který byl definován v kapitole první, a pojmem nezávislost jevů. Neslučitelnost daných jevů je zpravidla zřejmá na první pohled, kdežto jejich nezávislost nikoliv. Uvedená definice pojmu nezávislosti dvou jevů má všechny potřebné vlastnosti, jež požadujeme z intuitivního hlediska. Abychom stejně tak "rozumně" definovali nezávislost libovolného konečného počtu n jevů A1 , A2 , ... , An , je třeba postupovat takto: Sdružená nezávislost jevů Jevy A1 , A2 , ... , An se nazývají sdruženě nezávislé, jestliže pro každou podmnožinu {i1 , i2 , ... , ik } množiny indexů {1, 2, …, n} platí při všech k ≤ n rovnost P ( Ai1 ∩ Ai2 ∩ ... ∩ Aik ) = P ( Ai1 ) P ( Ai2 ) ... P ( Aik ). (3.4) Platí-li tato rovnost pouze pro k = 2, potom se jevy A1 , A2 , ... , An nazývají po dvou nezávislé (podvojně nezávislé). V odstavci 3.1 jsme dokázali, že pro pravděpodobnost průniku (současného nastoupení) jevů A1 , A2 , ... , An platí v obecném případě vzorec (3.3). Jsou-li však uvažované jevy sdruženě nezávislé, pak přímo z definice plyne pro k = n vztah n P (∩ Ai ) = P( A1 ) P( A2 ) ... P ( An ). i =1 34 (3.5) Vzorec (3.5) představuje pravidlo pro výpočet pravděpodobnosti průniku libovolného konečného počtu sdruženě nezávislých jevů. Příklady 3.3. Máme tři bedny s výrobky. V každé bedně je celkem 10 výrobků. V prvé bedně je 8, ve druhé 7 a ve třetí 9 standardních výrobků. Jaká je pravděpodobnost toho, že náhodně vybrané tři výrobky, po jednom z každé bedny, budou standardní? Řešení. Jev A - vybrán standardní výrobek z prvé, jev B - vybrán standardní výrobek z druhé, jev C - vybrán standardní výrobek ze třetí bedny. Z triviální úvahy plyne P(A) = 0,8 ; P(B) = 0,7 ; P(C) = 0,9 . Z organizace pokusu plyne, že jevy A, B, C jsou sdruženě nezávislé, a proto lze využít vzorce (3.5). P ( A ∩ B ∩ C ) = P ( A) P( B ) P(C ) = 0,8 . 0, 7 . 0,9 = 0,504. Jsou-li jevy A1 , A2 , ... , An sdruženě nezávislé, pak jsou podle definice také po dvou nezávislé. Toto tvrzení nelze ovšem obrátit. Na následujícím příkladě ukážeme, že když jsou nějaké jevy nezávislé po dvou, nemusí být ještě sdruženě nezávislé. 3.4. Je dán čtyřstěn. Jedna jeho stěna je zbarvena červeně, druhá zeleně, třetí modře a čtvrtá je rozdělena na tři trojúhelníky, z nichž jeden má červenou, druhý zelenou a třetí modrou barvu. Při hodu takovým čtyřstěnem mohou nastat tyto jevy: A1 - padne červená, A2 - padne zelená, A3 - padne modrá barva. Pod pojmem "padne" určitá barva rozumíme přitom skutečnost, že čtyřstěn po dopadu na rovinnou podložku zůstane v poloze, kdy stěna zbarvená touto barvou bude ve styku s podložkou. Rozhodněte, zda jsou jevy A1 , A2 , A3 po dvou nezávislé, popř. sdruženě nezávislé. Řešení. Zřejmě platí: 1 P ( A1 ) = P ( A2 ) = P ( A3 ) = , 2 1 P ( A1 ∩ A2 ) = P ( A1 ∩ A3 ) = P ( A2 ∩ A3 ) = , 4 1 P ( A1 ∩ A2 ∩ A3 ) = . 4 Libovolná dvojice jevů Ai , Aj (i ≠ j; i, j = 1, 2,3) tedy splňuje vztah P ( Ai ∩ Aj ) = P ( Ai ) P( Aj ) , takže jevy A1 , A2 , A3 jsou po dvou nezávislé. Neplatí však vztah P ( A1 ∩ A2 ∩ A3 ) = P( A1 ) P ( A2 ) P ( A3 ) , což značí, že uvažované jevy nejsou sdruženě nezávislé. Kontrolní úkol 3.3. Nechť jevy A a B jsou nezávislé. Dokažte, že také jevy A a B jsou nezávislé. 35 V teorii se zavádí pro libovolné možné jevy A a B korelační koeficient definovaný vztahem Korelační koeficient jevů ρ ( A, B ) = P ( A ∩ B) − P( A) P( B) + P( A) P( A) P( B) P( B ) , který nabývá hodnot z intervalu −1,1 . V případě, že jevy A a B jsou nezávislé, platí ρ(A, B) = 0. 3.3. Vzorec pro úplnou pravděpodobnost Vyjdeme z následující věty. Věta 3.3 (věta o úplné pravděpodobnosti). Nechť jevy (hypotézy) H1 , H 2 , ... , H n tvoří úplnou soustavu neslučitelných jevů ( P( H i ) ≥ 0, i = 1, 2, ... , n) a nechť A je libovolný jev. Potom platí rovnost n P ( A) = ∑ P ( H i ) P ( A | H i ). (3.6) i =1 Důkaz. Podle předpokladů věty platí n Ω = ∪ H i , H i ∩ H j = ∅ (i ≠ j , i, j = 1, 2, ... , n). i =1 Z těchto vztahů vyplývá n A = ∪ ( A ∩ H i ), přičemž ( A ∩ H i ) ∩ ( A ∩ H j ) = ∅ pro i =1 i, j = 1, 2, ... , n; i ≠ j. Odtud s použitím vlastnosti 2 pravděpodobnosti a věty 3.1 dostaneme n n i =1 i =1 P ( A) = ∑ P( A ∩ H i ) = ∑ P( H i ) P( A | H i ). Vzorec pro úplnou pravděpodobnost Vzorec (3.6) se nazývá vzorec pro úplnou pravděpodobnost. Z hlediska matematika je tento vzorec triviální, ovšem umožňuje řešit mnoho úloh, aniž je nutno konstruovat pravděpodobnostní prostor. Zvláště užitečný je v těch případech, kdy je odhad podmíněných pravděpodobností P ( A | H i ) snazší než přímý výpočet pravděpodobnosti P(A). Příklad 3.5. Chodec vyjde z místa O s cílem dojít do místa A (viz obr. 3.1). Na každé křižovatce se rozhodne zcela náhodně, kterou cestou půjde. Chybná volba cesty znamená, že chodec do místa A nedojde. Jakou má chodec pravděpodobnost, že se dostane do místa A? Řešení. Zavedeme toto označení jevů: A - chodec dojde do místa A, Bi chodec půjde přes křižovatku Bi , i = 1, 2, 3, 4, 5. Jevy B1 , B2 , B3 , B4 a B5 tvoří úplnou soustavu neslučitelných jevů, přičemž 1 P ( B1 ) = P ( B2 ) = P ( B3 ) = P( B4 ) = P( B5 ) = . 5 36 Pro podmíněné pravděpodobnosti plyne z podmínek úlohy 1 1 2 P ( A | B1 ) = 0, P( A | B2 ) = , P ( A | B3 ) = , P ( A | B4 ) = , P ( A | B5 ) = 1. 3 2 3 Hledaná pravděpodobnost je dána vzorcem (3.6), tj. 5 1 1 1 2 1 P ( A) = ∑ P( Bi ) P( A | Bi ) = (0 + + + + 1) = . 5 3 2 3 2 i =1 B1 B2 O A B3 B4 B5 Obr. 3.1. Schéma k příkladu 3.5. Kontrolní úkoly 3.4. Je známo, že 5 % studentů dovede správně zodpovědět všechny zkušební otázky, 30 % studentů zná správnou odpověď na 70 % otázek, 40 % studentů na 60 % otázek a 25 % studentů jen na 50 % otázek. Jaká je pravděpodobnost toho, že náhodně vybraný student odpoví správně na zadanou otázku? 3.5. Střelec má k dispozici pět pušek, přičemž pravděpodobnosti zásahu jednotlivými puškami jsou 0,5; 0,6; 0,7; 0,8, resp. 0,9. Určete pravděpodobnost zásahu jedním výstřelem za předpokladu, že si střelec vybere zbraň zcela náhodně. 3.4. Bayesův vzorec Nejprve dokážeme tuto větu: Věta 3.4 (Bayesova věta) . Nechť jevy (hypotézy) H1 , H 2 , ... , H n tvoří úplnou soustavu neslučitelných jevů ( P( H i ) ≥ 0, i = 1, 2, ... , n) a nechť A je libovolný jev, pro nějž P( A) > 0. Pak pro každé i , i = 1, 2,..., n, platí P ( H i | A) = P( H i ) P( A | H i ) n ∑ P( H j =1 j . (3.7) ) P( A | H j ) 37 Důkaz. Nechť A a H i jsou dva libovolné jevy takové, že P(A) > 0, P ( H i ) > 0. Podle věty 3.1 platí P ( A ∩ H i ) = P( A) P( H i | A) = P( H i ) P( A | H i ) P( H i ) P( A | H i ) . Odtud s použitím vzorce pro úplnou P( A) pravděpodobnost jevu A dostaneme okamžitě vzorec (3.7). Ñ neboli P ( H i | A) = Bayesův vzorec Vztah (3.7) se nazývá Bayesův vzorec. V teorii pravděpodobnosti neexistuje žádná jiná věta, o které by se tolik diskutovalo jako o Bayesově větě. Zmíněná věta je nesporně dokázána a o její správnosti pochyby nevznikají. Diskuse se týká pouze jejích aplikací. Bayesova věta se často nazývá větou o pravděpodobnostech příčin. Tento název pochází odtud, že se Bayesovy věty většinou používá tehdy, chceme-li z výskytu (nastoupení) jevu A učinit závěry o pravděpodobnostech hypotéz čili příčin H i (i = 1, 2,..., n), tj. chceme-li zkoumat, do jaké míry výskyt jevu A určité hypotézy potvrzuje nebo vyvrací. Pokud jsou známy pravděpodobnosti jednotlivých hypotéz P ( H i ) do provedení pokusu (tzv. apriorní pravděpodobnosti), můžeme po realizaci pokusu použít Bayesovy věty k určení aposteriorních pravděpodobností P ( H i | A), tj. přehodnotit naše přesvědčení o správnosti každé hypotézy tak, že zaměníme pravděpodobnosti P ( H i ) pravděpodobnostmi P( H i | A). Jestliže pravděpodobnosti P ( H i ) nejsou známy, a to se stává velmi často, musíme jim přiřadit více či méně libovolné hodnoty; tento postup je pak skutečně problematický. Existují však případy, kdy popsané schéma může být užitečné. Jde např. o lékařskou diagnostiku. Předpokládejme, že na některou kliniku přicházejí nemocní, kteří mohou mít jednu z chorob H1 , H 2 , ... , H n . Označme písmenem A soubor symptomů u daného pacienta. V tomto P ( H i ) i podmíněné případě lze apriorní pravděpodobnosti pravděpodobnosti P ( A | H i ), i = 1, 2,..., n, určit experimentálně na základě statistických záznamů z minulých let. Přitom pravděpodobnost P ( H i ) se přibližně rovná relativní četnosti choroby H i , vyskytnuvší se u pacientů dané kliniky, a podmíněná pravděpodobnost P ( A | H i ) je přibližně rovna relativní četnosti pozorování souboru symptomů A u pacientů s chorobou H i na uvažované klinice. Jelikož jde o statistiku za minulá léta, je možno tyto statistické údaje považovat za téměř věrohodné. Použití Bayesova vzorce v takovém případě nevyvolává žádných pochyb, potíže se však objevují při snaze o praktickou realizaci tohoto plánu. Musíme totiž shromáždit obrovský objem experimentálního materiálu (dat), abychom mohli získat věrohodné výsledky. Bayesova vzorce se často užívá v dělostřelecké praxi při zaměřování, tj. při upřesňování znalostí o podmínkách střelby (např. o správnosti zamíření). Dobře známa je i aplikace Bayesova vzorce v chemii. 38 Předpokládejme, že v n nádobách jsou roztoky téže soli o různých koncentracích, přičemž celkový objem roztoků je 1 litr. Označme P ( H i ) objem roztoku v i-té nádobě, i = 1, 2,..., n, a P( A | H i ) koncentraci soli v i-té nádobě. Vzorec (3.7) pak udává, jaká část z celkového množství soli se nachází v i-té nádobě. Příklad 3.6. Přístroj najde vadu v materiálu s pravděpodobností 0,995, ale současně s pravděpodobností 0,0001 chybně označí materiál bez vady jako vadný. Je známo, že vada v materiálu se vyskytuje v 0,1 % případů. Přístroj označil materiál jako vadný. Jaká je pravděpodobnost toho, že materiál má skutečně vadu? Řešení. Jev A - přístroj označil materiál jako vadný, jev H1 - materiál má skutečně vadu, jev H 2 - materiál nemá vadu. Z podmínek úlohy vyplývá P ( H1 ) = 0, 001, P( H 2 ) = 0,999, P( A | H1 ) = 0,995, P( A | H 2 ) = 0, 0001. Po dosazení do Bayesova vzorce dostaneme P ( H1 | A) = = P ( H1 ) P ( A | H1 ) = P ( H1 ) P ( A | H1 ) + P ( H 2 ) P ( A | H 2 ) 0, 001 . 0,995 = 0,909. 0,001 ⋅ 0,995 + 0,999 ⋅ 0,0001 Kontrolní úkoly 3.6. Výrobky zhotovené v daném závodě jdou na kontrolu k jednomu ze dvou kontrolorů. Pravděpodobnost, že výrobek přijde k prvnímu kontrolorovi je 0,6 a ke druhému 0,4. Pravděpodobnost toho, že výrobek bude uznán za standardní prvním kontrolorem je 0,94 a druhým 0,98. Jistý výrobek byl shledán standardním. Jaká je pravděpodobnost, že tento výrobek prověřoval první kontrolor? 3.7. Na 100 mužů připadá pět a na 1000 žen dva daltonisté. Ze skupiny osob, ve které je stejný počet mužů i žen, je náhodně vybrána osoba, jež se projevila jako daltonista. Jaká je pravděpodobnost toho, že je to muž? Pojmy k zapamatování: • podmíněná pravděpodobnost • podvojná nezávislost jevů • sdružená nezávislost jevů • vzorec pro úplnou pravděpodobnost • Bayesův vzorec Shrnutí: V této kapitole jste poznali další základní pojmy z teorie pravděpodobnosti: podmíněná pravděpodobnost, podvojná a sdružená nezávislost jevů. Dále jsou uvedeny vzorec pro pravděpodobnost průniku (součinu) jevů, vzorec pro úplnou pravděpodobnost a Bayesův vzorec, s jejichž pomocí byste měli zvládnout běžné úlohy na výpočet pravděpodobnosti, resp. podmíněné pravděpodobnosti, jevů. 39 40 Korespondenční úkol 1 1. Určete náhodný jev X z rovnosti X ∪ A ∪ X ∪ A = B. 2. Dokažte, že jevy A, A ∩ B a A ∪ B tvoří úplný systém jevů. 3. Ve skříni je celkem 10 párů přezůvek různé velikosti. Z těchto přezůvek se náhodně vyberou 4 kusy. Jaká je pravděpodobnost toho, že mezi takto vybranými 4 kusy bude alespoň jeden pár? 4. Házíme současně třemi hracími kostkami. Určete pravděpodobnost toho, že při jednom hodu bude součet bodů na všech třech kostkách a) roven 12, b) roven 13. Poznámka. Tato úloha je známa pod názvem Méreův paradox. 5. Účastníci tzv. Janovské loterie si kupují lístky, na nichž je napsáno některé z čísel 1, 2, …, 90. Mohou si koupit i takové lístky, na kterých jsou 2, 3, 4 nebo 5 různých čísel. V den tahu loterie se vyjímá z osudí, jež obsahuje žetony s čísly 1 až 90, právě pět žetonů. Vyhrávají ti, kteří mají všechna čísla na svém lístku mezi taženými. Určete pravděpodobnost výhry a) při hře na jedno číslo, b) při hře na dvě čísla (tzv. ambo), c) při hře na tři čísla (terno). 6. Série 100 výrobků bude převzata uživatelem, jestliže při kontrole 50 náhodně vybraných výrobků nebude zjištěn více než jeden zmetek. Určete pravděpodobnost toho, že se celá série převezme, když obsahuje právě pět zmetků. 7. Ze šesti vajec jsou právě dvě prasklá. Jaká je pravděpodobnost, že při náhodném odběru dvou vajec vybereme a) dvě dobrá, b) jedno prasklé, c) dvě prasklá? 8. Jev A může nastat v daném pokusu s pravděpodobností p. Pokus byl nezávisle opakován celkem n-krát. Jaká je pravděpodobnost toho, že přitom jev A nastane alespoň jednou? 9. Pravděpodobnost sestřelení letadla jedním výstřelem z karabiny je 1 250. Určete pravděpodobnost sestřelení letadla salvou z 250 karabin za předpokladu, že jednotlivé výstřely jsou nezávislé. 10. Lovec vystřelil třikrát na divočáka. Pravděpodobnost zásahu prvním výstřelem je 0,4; druhým 0,5; třetím 0,7. Jedním zásahem lze divočáka usmrtit s pravděpodobností 0,2; dvěma zásahy s pravděpodobností 0,6 a třemi zásahy s jistotou. Jaká je pravděpodobnost toho, že lovec divočáka usmrtí? 41 11. Tři střelci současně vystřelili na určitý cíl, v cíli však byly zjištěny pouze dva zásahy. Určete pravděpodobnost toho, že třetí střelec cíl zasáhl, jestliže pravděpodobnost zásahu cíle je pro prvního střelce 0,6; pro druhého 0,5 a pro třetího 0,4? 12. Na významnou sportovní soutěž se připravují 4 žáci prvního ročníku, 6 žáků druhého ročníku a 5 žáků třetího ročníku určité střední školy. Pravděpodobnost reprezentace školy v uvedené soutěži je pro žáky prvního ročníku 0,9; pro žáky druhého ročníku 0,7 a pro žáky třetího ročníku 0,8. Náhodně vybraný žák skutečně reprezentoval školu v uvedené soutěži. Ve kterém ročníku tento žák s největší pravděpodobností studuje? 42 4. NÁHODNÉ VELIČINY A JEJICH ROZDĚLENÍ • • • • • Po prostudování této kapitoly: pochopíte stěžejní pojmy teorie pravděpodobnosti, a to pojmy náhodné veličiny a jejího rozdělení, poznáte základní vlastnosti funkcí popisujících rozdělení náhodné veličiny (distribuční funkce, pravděpodobnostní funkce, hustota pravděpodobnosti) a naučíte se s nimi pracovat, seznámíte se s pojmy náhodného vektoru a jeho rozdělení, pochopíte význam nezávislosti náhodných veličin při konstrukci jejich sdruženého rozdělení, seznámíte se s postupem, jak počítat rozdělení jednoduchých funkcí náhodné veličiny. Pojmy náhodné veličiny a jejího rozdělení patří k základním pojmům teorie pravděpodobnosti. Věnujte pochopení těchto pojmů maximální pozornost, protože s nimi budeme pracovat v celé zbývající části tohoto učebního textu. 4.1. Základní pojmy Z intuitivního hlediska rozumíme náhodnou veličinou (proměnnou) takovou veličinu (proměnnou), jejíž hodnoty nejsou jednoznačně určeny výsledky náhodných pokusů. Dříve než přistoupíme k formální definici, uvedeme několik příkladů náhodných veličin. Náhodnou veličinou je např. počet kosmických částic dopadajících na danou oblast zemského povrchu během časového intervalu definované délky. Tento počet značně kolísá v závislosti na celé řadě náhodných příčin. Také počet volání, které přijdou na telefonní ústřednu v daném časovém intervalu, je náhodnou veličinou. Tato veličina může zřejmě nabývat libovolných nezáporných celočíselných hodnot; její změny jsou přitom zcela náhodné. Rychlost molekuly plynu nezůstává konstantní, ale mění se v závislosti na srážkách s ostatními molekulami. Těchto srážek bývá obrovský počet, dokonce i během velmi krátkého časového intervalu. Známe-li rychlost molekuly v daném okamžiku, nemůžeme s jistotou určit její hodnotu za 0,01 nebo 0,001 sekundy. Změny rychlosti molekuly mají evidentně náhodný charakter. Uvedené příklady přesvědčivě ukazují, že se s náhodnými veličinami setkáváme v nejrůznějších oblastech vědy a techniky. Všechny příklady, bez ohledu na různost jejich konkrétního obsahu, mají jedno společné. Jde v nich o veličinu, která může pod vlivem náhodných okolností nabývat různých hodnot. V žádném z uvedených příkladů nelze předem říci, jaké hodnoty nabude sledovaná veličina, poněvadž její změny jsou ryze náhodné povahy. 43 Náhodná veličina Formálně lze náhodnou veličinu definovat takto: Nechť je dán pravděpodobnostní prostor (Ω, À, P ) . Náhodnou veličinou nazýváme reálnou funkci X (ω ) prvků ω prostoru elementárních jevů Ω takovou, že pro každé reálné číslo x je množina {ω ∈ Ω; X (ω ) < x} náhodným jevem, tj. platí {ω ∈ Ω; X (ω ) < x} ∈ À . ( 4.1 ) V rámci těchto skript budeme náhodné veličiny označovat důsledně velkými písmeny latinské abecedy a jejich konkrétní hodnoty příslušnými malými písmeny latinské abecedy. K označení náhodného jevu {ω ∈ Ω; X (ω ) < x} budeme v dalším textu používat zjednodušeného zápisu { X < x}. Pro další výklad o náhodných veličinách a jejich charakteristikách je důležitá následující věta. Věta 4.1. Jestliže X je náhodná veličina a f(x) borelovsky měřitelná funkce reálné proměnné x, pak Y = f ( X ) je také náhodná veličina. Důkaz nalezne čtenář v učebnici [16]. Poznámka. Funkce f(x) je borelovsky měřitelná, jestliže množina reálných čísel x, definovaná pro libovolné reálné c nerovností f ( x) < c je borelovská. Spojitá funkce je borelovsky měřitelná. V aplikacích se zpravidla setkáváme s náhodnými veličinami dvojího typu: a) Náhodná veličina může nabýt jen hodnot z nějaké konečné nebo spočetné množiny { x1 , x2 , ...} . b) Náhodná veličina může nabýt všech hodnot z určitého nedegenerovaného intervalu. Diskrétní náhodná veličina Absolutně spojitá náhodná veličina V případech a) říkáme, že náhodná veličina X je diskrétní (má rozdělení diskrétního typu). V případech b) jde zpravidla o absolutně spojitou náhodnou veličinu (rozdělení absolutně spojitého typu). Existují i takové náhodné veličiny, které nelze zařadit ani mezi diskrétní, ani mezi absolutně spojité, ovšem jejich praktický význam je zanedbatelný. Příklad 4.1. Rozhodněte, které z uvedených náhodných veličin jsou diskrétní a které absolutně spojité, a stanovte obory jejich funkčních hodnot. a) počet členů domácnosti; b) počet nekvalitních výrobků z celkové denní produkce; c) podíl zmetků mezi čtyřmi výrobky vybranými ze zásilky 100 výrobků, která obsahuje dva zmetky; d) životnost televizoru; e) náhodně vybrané reálné číslo. Řešení. Náhodné veličiny a) až c) jsou diskrétní, zbývající náhodné veličiny jsou absolutně spojité. Obory funkčních hodnot: 44 a) 1, 2,...; b) 0, 1,..., velikost denní produkce; 1 1 c) 0, , (počet zmetků ve výběru může být roven 0, 1, 2); 4 2 d) (0, ∞); e) (-∞, ∞). K charakterizaci náhodné veličiny nestačí znát pouze všechny možné hodnoty, kterých tato veličina může nabýt. Jedním z úkolů teorie pravděpodobnosti je vybudovat matematický aparát, pomocí kterého by bylo možno přiřadit každé prakticky zajímavé a důležité podmnožině množiny reálných čísel pravděpodobnost toho, že náhodná veličina X nabývá hodnot z této podmnožiny. Je-li takový vztah a jejich pravděpodobnostmi dán, říkáme, mezi podmnožinami množiny že je dáno rozdělení pravděpodobností příslušné náhodné veličiny X. Rozdělení pravděpodobností 4.2. Distribuční funkce Náhodné veličiny, jejichž studiem se teorie pravděpodobnosti zabývá, jsou velmi rozmanité. Počet všech možných hodnot, kterých náhodné veličiny nabývají, může být konečný, spočetný i nespočetný. K tomu, abychom mohli popisovat rozdělení pravděpodobností náhodných veličin jednotným způsobem, zavádí se v teorii pravděpodobnosti pojem distribuční funkce náhodné veličiny. Nechť X je náhodná veličina a x libovolné reálné číslo. Distribuční funkcí F(x) náhodné veličiny X nazýváme funkci, která je definována vztahem Distribuční funkce F ( x) = P( X < x) pro − ∞ < x < ∞. (4.2) Hodnota distribuční funkce v bodě x tedy udává pravděpodobnost toho, že náhodná veličina X nabývá hodnoty menší než x. Zápis P( X < x) je zjednodušenou formou zápisu pravděpodobnosti jevu { X < x} = {ω ∈ Ω; X (ω ) < x} . Nyní přejdeme k formulaci základních vlastností distribuční funkce jednorozměrné náhodné veličiny. 1. Pro libovolné reálné číslo x platí 0 ≤ F ( x) ≤ 1. Důkaz. Soustava nerovností 0 ≤ P( A) ≤ 1 platí pro libovolný náhodný jev A∈ À, a tedy i pro jev A = { X < x}. Ñ 2. Distribuční funkce F(x) je monotónní, a to neklesající. Důkaz. Je-li x2 > x1 , pak F ( x2 ) = P( X < x2 ) = P( X < x1 ) + P( x1 ≤ X < x2 ) = = F ( x1 ) + P( x1 ≤ X < x2 ) ≥ F ( x1 ), čímž je tvrzení dokázáno. (4.3) Ñ 45 Vlastnosti distribuční funkce Důsledek 1. Pravděpodobnost toho, že náhodná veličina nabude hodnoty z intervalu < a, b) , je rovna přírůstku distribuční funkce F(x) v tomto intervalu, tj. P (a ≤ X < b) = F (b) − F (a ). Důkaz. Tento důsledek vyplývá přímo ze vztahů (4.3), jestliže položíme x1 = a, x2 = b. □ Důsledek 2. Pravděpodobnost toho, že absolutně spojitá náhodná veličina X nabude jediné určité hodnoty x0 , je rovna nule, tj. P ( X = x0 ) = 0. Důkaz. Položíme-li ve vztazích (4 .3) x1 = x0 , x2 = x0 + ∆x, dostaneme P ( x0 ≤ X < x0 + ∆x) = F ( x0 + ∆x) − F ( x0 ). Distribuční funkce absolutně spojité náhodné veličiny je spojitá pro všechna reálná x (viz odstavec 4.4). Z její spojitosti v bodě x0 plyne lim [ F ( x0 + ∆x) − F ( x0 ) ] = 0, ∆x → 0 a proto P ( X = x0 ) = 0. Ñ 3. Pro libovolnou distribuční funkci F(x) platí limitní vztahy F (−∞) = 0, F (∞) = 1. Důkaz. Dokážeme první z uvedených vztahů. ∞ F (−∞) = lim F (− x) = lim F (− n) = lim P( X < − n) = P(∩ { X < − n}) = P(∅) = 0. x →∞ n →∞ n →∞ n =1 Záměnu lim F (− n) za lim F (− x) lze provést vzhledem k monotónnosti n →∞ x →∞ funkce F(x). V další části důkazu se využívá vlastnosti 10 pravděpodobnosti (viz odstavec 2.5). Analogickým postupem lze dokázat i platnost vztahu F (∞) = lim F ( x) = 1. x →∞ Ñ 4. Distribuční funkce F(x) je spojitá zleva v libovolném bodě x0 ∈ ( −∞, ∞ ) , tj. lim F ( x) = F ( x0 ). x → x0 − Důkaz. Nechť { xn } je libovolná posloupnost reálných čísel taková, že xn x0 (konvergence zdola). Označme A0 = { X < x0 } , An = { X < xn } , n = 1, 2, ... . Pak 46 F ( xn ) = P( An ), n = 1, 2, ... , ∞ An ⊂ An +1 , n = 1, 2, ... a A0 = ∪ An . n =1 Z vlastnosti 9 pravděpodobnosti (viz odstavec 2.5) pak vyplývá lim F ( xn ) = F ( x0 ), což se mělo dokázat. Ñ n →∞ Jestliže pro x = x0 platí lim F ( x) − F ( x0 ) = C0 > 0, pak říkáme, že x → x0 + distribuční funkce F(x) má v bodě x0 skok. Takové skoky v distribuční funkci se vyskytují pouze v případě diskrétních náhodných veličin, a to v bodech, které reprezentují možné hodnoty příslušné náhodné veličiny. Lze snadno ukázat, že distribuční funkce diskrétní náhodné veličiny nemůže mít více než spočetný počet skoků. Počet skoků je totiž jednoznačně určen počtem možných hodnot diskrétní náhodné veličiny, a ten může být buď konečný nebo spočetný. Velikost skoků je přitom dána pravděpodobnostmi, s nimiž uvažovaná diskrétní náhodná veličina těchto svých hodnot nabývá. V tomto odstavci jsme dokázali, že každá distribuční funkce je neklesající, spojitá zleva a splňuje okrajové podmínky F (−∞) = 0, F (∞) = 1. Platí i obrácené tvrzení. Každá funkce, která má uvedené tři vlastnosti, může být považována za distribuční funkci nějaké náhodné veličiny. V souvislosti se zavedením distribuční funkce upozorníme na jednu významnou skutečnost. Je zřejmé, že každé náhodné veličině lze jednoznačně přiřadit distribuční funkci. Na druhé straně však existuje nekonečně mnoho různých náhodných veličin, které mají jednu a tutéž distribuční funkci. Uvažme např. náhodnou veličinu X, jež nabývá 1 s pravděpodobnostmi dvou různých hodnot − 1 a +1, a náhodnou 2 veličinu Y = − X . Náhodné veličiny X a Y nabývají vždy různých hodnot. Nicméně obě tyto veličiny mají jednu a tutéž distribuční funkci, a to ⎧ 0 pro x ≤ −1, ⎪1 ⎪ F ( x) = ⎨ pro -1 < x ≤ 1, ⎪2 ⎪⎩ 1 pro x > 1. Na závěr definujeme ještě podmíněnou distribuční funkci. Nechť B je nějaký takový jev, že P( B) > 0. Pak funkci F ( x | B) = P( X < x | B) nazýváme podmíněnou distribuční funkcí náhodné veličiny X za podmínky (hypotézy) B. Funkce F ( x | B) má evidentně všechny vlastnosti obyčejné distribuční funkce F(x). 47 Podmíněná distribuční funkce 4.3. Rozdělení diskrétní náhodné veličiny Rozdělení diskrétního typu Náhodná veličina X je diskrétní (má rozdělení diskrétního typu), jestliže existuje konečná nebo spočetná množina reálných čísel { x1 , x2 , ...} taková, že pro každé xi z této množiny je pravděpodobnost P ( X = xi ) > 0 a ∑ P( X = x ) = 1. (4.4) i i Nejjednodušším způsobem lze rozdělení diskrétní náhodné veličiny X popsat zadáním množiny { x1 , x2 , ...} možných hodnot této veličiny a odpovídajících pravděpodobností P ( X = xi ), i = 1, 2, ... . Pravděpodobnosti P( X = xi ) jsou přirozeně funkcí odpovídajících hodnot xi a tato funkce P ( x) = P( X = x) Pravděpodobnostní funkce se nazývá pravděpodobnostní funkcí náhodné veličiny X. V bodech x ≠ xi jsou hodnoty pravděpodobnostní funkce zřejmě nulové. Přímo z definice pravděpodobnostní funkce vyplývá: 1. 0 ≤ P ( x) ≤ 1, 2. ∑ P ( x ) = 1. i i Distribuční funkce diskrétní náhodné veličiny X je dána vztahem F ( x) = ∑ P ( x ), (4.5) i i: xi < x v němž se sčítá přes všechna i, pro která platí xi < x. Ze vztahu (4.5) vyplývá, že distribuční funkce libovolné diskrétní náhodné veličiny je nespojitá, vykazuje skoky při hodnotách xi , jež jsou možnými hodnotami sledované veličiny. Velikost skoku distribuční funkce F(x) v bodě xi je rovna hodnotě P ( xi ), i = 1, 2, ... . Jsou-li dvě možné hodnoty veličiny X odděleny intervalem, který už neobsahuje žádné další možné hodnoty této veličiny, pak je distribuční funkce F(x) v tomto intervalu konstantní. V případě, že veličina X může nabývat jen konečného počtu n různých hodnot, má distribuční funkce F(x) tvar stupňovité (po částech konstantní) funkce s počtem stupňů (oborů konstantnosti) rovným n + 1. Rozdělení diskrétního typu lze popsat vzorcem, tabulkou nebo graficky. V tabulce 4.1 se uvádějí všechny možné hodnoty xi náhodné veličiny X a odpovídající pravděpodobností pi = P ( xi ), i =1,2, ... , n. Tab. 4.1. Tabulka hodnot pravděpodobnostní funkce 48 xi x1 x2 xn pi = P ( xi ) p1 p2 pn Tabelární způsob popisu rozdělení diskrétní náhodné veličiny je vhodný tam, kde počet možných hodnot není příliš velký. Základními způsoby grafické reprezentace rozdělení pravděpodobností diskrétní náhodné veličiny jsou: a) úsečkový diagram, b) polygon, c) histogram. Úsečkového diagramu lze užít v případě libovolné diskrétní náhodné veličiny. Na ose x se vynášejí jednotlivé hodnoty xi náhodné veličiny a na ose y odpovídající pravděpodobnosti pi . Úsečkový diagram je tvořen Úsečkový diagram svislými úsečkami délky pi sestrojenými nad body o souřadnicích [ xi , 0]. Polygon a histogram se uplatňují v těch případech, kdy možné hodnoty xi náhodné veličiny X tvoří aritmetickou posloupnost s diferencí d = xi +1 − xi , i = 1, 2, …, n. Polygonem rozdělení pravděpodobností se zpravidla rozumí (v rozporu s obvyklým významem pojmu polygon) lomená čára spojující všechny body o souřadnicích [ xi , pi ] . Při konstrukci histogramu rozdělení pravděpodobností se postupuje následujícím způsobem. Nad každým bodem o souřadnicích [ xi , 0] se sestrojí obdélník o obsahu pi tak, aby tento bod ležel ve středu vodorovné strany obdélníka, která má délku d. Svislé strany jednotlivých obdélníků mají tedy délku pi d a celkový obsah všech obdélníků je jednotkový. Společné části svislých stran sousedních obdélníků se v histogramu nevyznačují. Jednotlivé způsoby reprezentace rozdělení diskrétního typu budou zřejmé z následujícího příkladu. Příklad 4.2. Pravděpodobnost toho, že výrobek bude vyhovovat všem technickým požadavkům je 0,9. Popište rozdělení náhodné veličiny X, která udává počet nevyhovujících výrobků mezi třemi výrobky. Řešení. Počet nevyhovujících výrobků může nabýt těchto hodnot: x1 = 0, x2 = 1, x3 = 2, x4 = 3. Z jednoduché kombinatorické úvahy plyne p1 = P ( X = 0) = 0,9 . 0,9 . 0,9 = 0,729; p2 = P ( X = 1) = 0,9 . 0,9 . 0,1 + 0,9 . 0,1 . 0,9 + 0,1 . 0,9 . 0,9 = 0,243; p3 = P ( X = 2) = 0,9 . 0,1 . 0,1 + 0,1 . 0,9 . 0,1 + 0,1 . 0,1 . 0,9 = 0,027; p4 = P ( X = 3) = 0,1 . 0,1 . 0,1 = 0,001. Pravděpodobnostní funkce P ( x) sledované náhodné veličiny má zřejmě tvar ⎧⎛ 3 ⎞ x 3− x pro x = 0,1, 2,3, ⎪⎜ ⎟ 0,1 0,9 P ( x ) = ⎨⎝ x ⎠ ⎪ 0 pro ostatní x. ⎩ 49 Polygon Histogram Jednotlivé způsoby reprezentace rozdělení pravděpodobnosti veličiny X jsou uvedeny v tabulce 4.2 a na obrázcích 4.1 - 4.3 . Tab. 4.2. Hodnoty pravděpodobnostní funkce k příkladu 4.2 xi 0 1 2 3 pi 0,729 0,243 0,027 0,001 Distribuční funkci počtu nevyhovujících výrobků mezi třemi výrobky lze vyjádřit vzorcem 0 pro x ≤ 0, ⎧ ⎪ ⎛3⎞ ⎪ F ( x) = ⎨ ∑ ⎜ ⎟ 0,1xi 0,93− xi pro 0 < x ≤ 3, ⎪ i:xi < x ⎝ xi ⎠ ⎪ 1 pro x > 3. ⎩ Hodnoty této distribuční funkce jsou uvedeny v tabulce 4.3 a její graf je na obrázku 4.4. Tab. 4.3. Hodnoty distribuční funkce k příkladu 4.2 0 1 2 3 >3 x F(x) 0,000 0,729 0,972 0,999 1,000 P (x) 1,0 P ( x) 1,0 0,5 0,5 0 50 0 1 2 3 x Obr. 4.1 Úsečkový diagram 0 0 1 2 3 x Obr. 4.2. Polygon F(x) P (x) 1,0 1,0 0,5 0,5 0 0 1 2 3 Obr. 4.3. Histogram 0 x 0 1 2 3 x Obr. 4.4. Distribuční funkce Kontrolní úkoly 4.1. Určete distribuční funkci F(x) a nakreslete histogram náhodné veličiny X, pro níž platí P( X = k ) = 1 , k = 1, 2, ... . 2k 4.2. Náhodná veličina X nabývá hodnot –1, 0, 1 s pravděpodobnostmi 1 , 1 , resp. 1 . Určete distribuční funkci veličiny X a znázorněte ji 4 2 4 graficky. 4.4. Rozdělení absolutně spojité náhodné veličiny Náhodná veličina X je absolutně spojitá (má rozdělení absolutně spojitého typu), jestliže existuje nezáporná reálná funkce f(x) taková, že pro všechna reálná čísla x platí Rozdělení absolutně spojitého typu x F ( x) = ∫ f (t )dt. (4.6) −∞ Funkce f(x) se nazývá hustota rozdělení pravděpodobností nebo stručněji hustota náhodné veličiny X. Distribuční funkce absolutně spojité náhodné veličiny je absolutně spojitá, tj. má skoro všude derivaci a je rovna neurčitému integrálu své derivace (viz např. [3]). V bodech, kde existuje derivace distribuční funkce, platí f ( x) = F ′( x). (4.7) V bodech, kde derivace F(x) neexistuje, rovnost (4.7) ztrácí smysl. Proto za definici hustoty pomocí distribuční funkce můžeme považovat rovnost (4.6), ne však rovnost (4.7). 51 Hustota Uvedeme základní vlastnosti hustoty rozdělení pravděpodobností. Vlastnosti hustoty 1. Hustota rozdělení pravděpodobnosti je nezáporná, tj. f ( x) ≥ 0. Tato vlastnost je obsažena přímo v definici distribuční funkce absolutně spojitého typu. Tuto vlastnost je možno interpretovat geometricky tak, že body grafu funkce f(x) leží buď nad osou x nebo na ní. Graf funkce f(x) se obvykle nazývá křivkou rozdělení příslušné náhodné veličiny. 2. Pravděpodobnost toho, že absolutně spojitá náhodná veličina X nabývá hodnot z intervalu 〈 a, b) kde a, b jsou libovolná reálná čísla (a < b), je dána rovností b P (a ≤ X < b) = ∫ f ( x)dx. (4.8) a Důkaz. Z vlastnosti 2 distribuční funkce plyne P (a ≤ X < b) = F (b) − F (a ). Vycházejíce z Newtonova - Leibnitzova vzorce, odvodíme pro rozdíl F(b) - F(a) vztahy b b a a F (b) − F (a) = ∫ F ′( x)dx = ∫ f ( x)dx. Vztah (4.8) vyplývá s předcházející rovností. bezprostředně ze srovnání těchto vztahů Geometrická interpretace vlastnosti 2: Pravděpodobnost toho, že absolutně spojitá náhodná veličina X nabude hodnoty z intervalu 〈 a, b) (ale také z intervalů (a, b), (a, b〉 nebo a, b ), je rovna obsahu geometrického útvaru, který je vymezen křivkou f(x), osou x a přímkami x = a, x = b (viz obr. 4.5). f (x) 0 a b x Obr. 4.5. Ilustrace k vlastnosti 2 hustoty rozdělení pravděpodobností Právě uvedenou vlastnost lze také formulovat takto: Je-li f(x) spojitá v bodě x, pak P ( x ≤ X < x + ∆x) = f ( x)∆x + o(∆x), kde o (∆x) reprezentuje nekonečně malou veličinu, pro níž platí o (∆x) lim = 0. ∆x → 0 ∆x 3. Hustota rozdělení pravděpodobností splňuje podmínku 52 ∞ ∫ f ( x)dx = 1. (4.9) −∞ Důkaz. Nevlastní integrál ve vztahu (4.9) představuje pravděpodobnost jevu spočívajícího v tom, že absolutně spojitá náhodná veličina X nabude hodnoty z intervalu ( −∞, ∞ ) . Je zřejmé, že jde o pravděpodobnost jevu jistého, a ta je jednotková. V souladu s vlastností 3 je obsah geometrického útvaru vymezeného křivkou f(x) a osou x jednotkový. Každou borelovsky měřitelnou nezápornou funkci f(x) splňující vztah (4.9) lze považovat za hustotu rozdělení pravděpodobností. Funkce x F ( x) = ∫ f (t )dt −∞ má totiž všechny vlastnosti distribuční funkce. Rozdělení pravděpodobností absolutně spojité náhodné veličiny se nejčastěji reprezentuje vzorcem pro hustotu f(x) nebo jejím grafem (křivkou rozdělení pravděpodobností). Principiálně je možno rozdělení absolutně spojité náhodné veličiny popsat i tabulkou nebo histogramem. V takovém případě se interval 〈 a, b) možných hodnot náhodné veličiny X rozdělí na n elementárních intervalů stejné délky 〈 x0 = a, x1 ), 〈 x1 , x2 ), ... , 〈 xn −1 , xn = b) a spočtou se pravděpodobnosti pi = P( xi −1 ≤ X < xi ). Tabulka pak obsahuje pro každý z elementárních intervalů < xi −1 , xi ) příslušnou pravděpodobnost pi , i =1,2, ... , n. Histogram sestává z n obdélníků, přičemž i-tý obdélník se sestrojí nad elementárním intervalem < xi −1 , xi ) a má obsah pi . Příklad 4.3. Doba života libovolného atomu radioaktivního prvku je náhodná veličina X, jejíž distribuční funkce má tvar ⎧1-e −α x pro x ≥ 0, F ( x) = ⎨ ⎩ 0 pro x < 0. kde α > 0 značí rozpadovou konstantu uvažovaného radioaktivního prvku. Určete hustotu doby života atomu tohoto prvku. Řešení. Distribuční funkce F(x) má derivaci všude kromě bodu x = 0 a platí ⎧α e −α x pro x > 0, f ( x) = F ′( x) = ⎨ pro x < 0. ⎩0 Bod x = 0 je zřejmě bodem nespojitosti hustoty doby života radioaktivního atomu. Většina autorů pokládá definitoricky f (0) = 0. Distribuční funkce a hustota doby života radioaktivního atomu jsou schematicky znázorněny na obrázcích 4.6 a 4.7. 53 F (x) 1 f ( x) α 0 0 x 0 x Obr. 4.6. Distribuční funkce k příkladu 4.3 Obr. 4.7. Hustota k příkladu 4.3 0 Kontrolní úkoly 4.3. Rozhodněte, zda funkce ⎧ e − x pro x > 0, f ( x) = ⎨ jinak. ⎩0 je hustotou náhodné veličiny X a určete a) distribuční funkci F(x), 1 b) pravděpodobnosti P ( X < ) a P(1 < X < 2). 2 4.4. Určete hodnotu konstanty c tak, aby následující funkce byly hustotami náhodné veličiny X: a) f ( x) = cxe − x pro 0<x < ∞, b) f ( x) = c sin x pro 0 < x < π. 4.5. Náhodná veličina X má hustotu A f ( x) = pro − ∞ < x < ∞. 1 + x2 Určete hodnotu konstanty A a distribuční funkci F(x). 4.5. Náhodné vektory a jejich distribuční funkce Až dosud jsme uvažovali pouze jednorozměrné náhodné veličiny, tj. takové veličiny, jejichž možnými hodnotami byla vždy reálná čísla. V tomto odstavci se budeme zabývat náhodnými vektory a jejich distribučními funkcemi. Nechť Náhodný vektor {Ω, À, P} je náhodným vektorem pravděpodobnostní prostor, pak n-rozměrným X = ( X 1 , X 2 , ... , X n ) nazýváme zobrazení X : Ω → Ñ n takové, že pro libovolná reálná čísla x1 , x2 , ... , xn platí n ∩{ X i < xi } ∈ À. (4.10) i =1 Uvedená definice je ekvivalentní následující definici: n-rozměrným nazýváme zobrazení náhodným vektorem X = ( X 1 , X 2 , ... , X n ) X : Ω → Ñ n takové, že pro libovolnou borelovskou podmnožinu B ⊂ Ñn platí 54 {ω ∈ Ω; X (ω ) ∈ B )} = X −1 ( B ) ∈ À. Borelovskými podmnožinami n-rozměrného euklidovského prostoru rozumíme prvky nejmenší σ-algebry obsahující všechny n-rozměrné otevřené intervaly {x = ( x1 , x2 , ... , xn ); a1 < x1 < b1 , ... , an < xn < bn }. Místo pojmu n-rozměrný náhodný vektor se často užívá pojmu n-rozměrná náhodná veličina. Každá složka X i , i = 1, 2, ... , n, náhodného vektoru X je náhodná veličina. O pravdivosti tohoto tvrzení se přesvědčíme, když ve vztahu (4.10) zvolíme x j → ∞, j = 1, 2, ... , n, j ≠ i. Je-li dán vztah mezi podmnožinami euklidovského prostoru Ñ n a jejich pravděpodobnostmi, říkáme, že je dáno sdružené rozdělení pravděpodobností náhodného vektoru X = ( X 1 , X 2 , ... , X n ). Distribuční funkcí náhodného vektoru X = ( X 1 , X 2 , ... , X n ) nebo také sdruženou distribuční funkcí náhodných veličin X 1 , X 2 , ... , X n nazýváme reálnou funkci n reálných proměnných x1 , x2 , ... , xn danou vztahem F ( x1 , x2 , ... , xn ) = P ( X 1 < x1 , X 2 < x2 , ... , X n < xn ), v němž pravděpodobnost na pravé straně značí pravděpodobnost průniku jevů { X i < xi } , i = 1, 2, ... , n. Veličiny X 1 , X 2 , ... , X n lze geometricky interpretovat jako souřadnice bodů v Ñ n . V této interpretaci je poloha bodu [ X 1 , X 2 ... , X n ] zřejmě náhodná a distribuční funkce F ( x1 , x2 , ... , xn ) udává pravděpodobnost toho, že bod [ X 1 , X 2 ... , X n ] padne do n-rozměrné oblasti (−∞, x1 ) × (−∞, x2 ) × ... × (−∞, xn ). Pomocí distribuční funkce náhodného vektoru X můžeme snadno spočíst pravděpodobnost, že bod [ X 1 , X 2 ... , X n ] padne dovnitř rovnoběžnostěnu 〈 a1 , b1 ) × 〈 a2 , b2 ) × ... × 〈 an , bn ), kde ai , bi jsou libovolná reálná čísla ( ai < bi ). S použitím geometrické interpretace získáme vztah n P (ai ≤ X i < bi ; i = 1, 2, ... , n) = F (b1 , b2 , ... , bn ) − ∑ pi + i =1 n −1 +∑ n ∑p i =1 j =i +1 v němž (4.11) − ... +(−1) F (a1 , a2 , ... , an ), n ij pij ...k značí hodnotu funkce F ( c1 , c2 , ..., cn ) , kde ci = ai , c j = a j , ..., ck = ak a cs = bs pro s ≠ i, s ≠ j , ... , s ≠ k . 55 Sdružené rozdělení náhodného vektoru Distribuční funkce náhodného vektoru Pro speciální případ n = 2 platí P (a1 ≤ X 1 < b1 , a2 ≤ X 2 < b2 ) = F (b1 , b2 ) − F (a1 , b2 ) − F (b1 , a2 ) + F (a1 , a2 ). Základní vlastnosti distribuční funkce náhodného vektoru X lze odvodit analogicky jako v jednorozměrném případě. 1. Distribuční funkce F ( x1 , x2 , ... , xn ) splňuje soustavu nerovností Vlastnosti distribuční funkce náh. vektoru 0 ≤ F ( x1 , x2 , ... , xn ) ≤ 1. 2. Distribuční funkce F ( x1 , x2 , ... , xn ) je neklesající funkcí každé své proměnné při pevných hodnotách ostatních proměnných, tj. platí xi 2 > xi1 ⇒ F (... , xi 2 , ...) ≥ F (... , xi1 , ...) pro i = 1, 2, ... , n. 3. Distribuční funkce F ( x1 , x2 , ... , xn ) je spojitá zleva v každé ze svých proměnných při pevných hodnotách ostatních proměnných. 4. Pro distribuční funkci F ( x1 , x2 , ... , xn ) platí následující vztahy F (+∞, +∞, ... , + ∞) = 1, lim F ( x1 , x2 , ... , xn ) = 0 pro i = 1, 2, ... , n xi →−∞ a libovolné hodnoty ostatních proměnných x j (j ≠ i ). V jednorozměrném případě jsou uvedené čtyři vlastnosti nutnou a postačující podmínkou k tomu, aby funkce F(x) byla distribuční funkcí nějaké náhodné veličiny X. Ve vícerozměrném případě musí mít sdružená distribuční funkce ještě následující vlastnost. 5. Pro libovolná ai < bi (i = 1, 2, ... , n) je hodnota výrazu na pravé straně rovnosti (4.11) nezáporná. Vlastnost 5 neplyne z vlastností 1 - 4, což ukážeme na jednoduchém příkladě. Definujme funkci vztahem ⎧1 pro x1 + x2 > 0, F ( x1 , x2 ) = ⎨ ⎩0 pro x1 + x2 ≤ 0. . Tato funkce má zřejmě vlastnosti 1 - 4, ne však vlastnost 5, protože např. platí P (−1 ≤ X 1 < 2, − 1 ≤ X 2 < 2) = F (2, 2) − F (−1, 2) − F (2, −1) + F (−1, −1) = −1. Každá sdružená distribuční funkce musí mít všech pět základních vlastností. Toto tvrzení je možno obrátit. Každou funkci n proměnných, splňující uvedených pět vlastností, lze považovat za distribuční funkci nějakého náhodného vektoru. Distribuční funkce F ( x1 , x2 , ... , xn ) má pro popis rozdělení náhodného vektoru X = ( X 1 , X 2 , ... , X n ) mnohem menší význam než distribuční funkce F(x) pro popis jednorozměrné náhodné veličiny X. Je to dáno tím, 56 že ve vícerozměrném prostoru lze zvolit celou řadu vhodných soustav souřadnic (kartézské soustavy i soustavy křivočarých souřadnic). Ve vícerozměrném případě se vedle sdružené distribuční funkce F ( x1 , x2 , ... , xn ) uvažují distribuční funkce marginální (okrajové) a podmíněné. Marginální distribuční funkce popisují rozdělení libovolné skupiny k náhodných veličin X i1 , X i2 , ... , X ik , 1 ≤ i1 < i2 < ... < ik ≤ n, a jsou definovány vztahem Marginální distribuční funkce F ( xi1 , xi2 , ... , xik ) = P( X i1 < xi1 , X i2 < xi2 , ... , X ik < xik ) = F (c1 , c2 , ... , cn ), kde cs = xs pro s = ir , 1 ≤ r ≤ k , a cs = +∞ v ostatních případech. Speciálně marginální distribuční funkce Fs ( xs ) náhodné veličiny X s má tvar Fs ( xs ) = P( X s < xs ) = F (c1 , c2 , ... , cn ), kde cs = xs a pro všechna cr , r ≠ s, platí cr = +∞. Podmíněné distribuční funkce popisují rozdělení libovolné skupiny k náhodných veličin X i1 , X i2 , ... , X ik , 1 ≤ i1 < i2 < ... < ik ≤ n, za Podmíněná distribuční funkce předpokladu, že zbývající náhodné veličiny nabývají nějakých konkrétních hodnot. 4.6. Rozdělení náhodných vektorů Nyní se ve stručnosti zmíníme o dalších způsobech popisu rozdělení náhodných vektorů. Soustředíme svou pozornost na dvourozměrné náhodné vektory, přičemž budeme rozlišovat, zda jde o vektory diskrétních nebo spojitých veličin. A. Sdružené rozdělení dvou diskrétních náhodných veličin Uvažujme dvě diskrétní náhodné veličiny X a Y, jež mohou nabývat hodnot x1 , x2 , ... , xr , resp. y1 , y2 , ... , ys . Jejich rozdělení lze přirozeně Sdružená popsat pomocí sdružené pravděpodobnostní funkce pravděpodobnostní funkce P ( x, y ) = P( X = x, Y = y ), která udává pravděpodobnost, že náhodná veličina X nabude hodnoty x a současně náhodná veličina Y nabude hodnoty y. Pro x ≠ xi , i = 1, 2,..., r, a/nebo y ≠ y j , j = 1, 2,..., s, jsou hodnoty této sdružené pravděpodobnostní funkce nulové. Sdružená pravděpodobnostní funkce náhodných veličin X, Y má tyto základní vlastnosti: 1. 0 ≤ P ( x, y ) ≤ 1, 2. r s ∑∑ P( x , y ) = 1. i =1 j =1 i j Sdružené rozdělení dvou diskrétních veličin se zpravidla popisuje tabulkou (viz tab. 4.4). 57 Tab. 4.4. Tabulka hodnot sdružené a marginálních pravděpodobnostních funkcí v případě dvou diskrétních náhodných veličin yj xi Součet y1 y2 ys x1 P ( x1 , y1 ) P ( x1 , y2 ) P ( x1 , ys ) P1 ( x1 ) x2 P ( x2 , y1 ) P ( x2 , y2 ) P ( x2 , ys ) P1 ( x2 ) xr P ( xr , y1 ) P ( xr , y2 ) P ( xr , ys ) P1 ( xr ) Součet P2 ( y1 ) P2 ( y2 ) P2 ( ys ) 1 Za předpokladu, že veličina X může nabývat právě r a veličina Y právě s různých hodnot, obsahuje tabulka rs hodnot sdružené pravděpodobnostní funkce P ( xi , y j ) odpovídajících všem možným kombinacím hodnot Marginální pravděpodobnostní funkce xi a y j . Řádkové součty v tabulce 4.4 jsou hodnotami marginální pravděpodobnostní funkce P1 ( x) , která udává pravděpodobnost, že náhodná veličina X nabude hodnoty x bez ohledu na hodnotu veličiny Y . Obdobně sloupcové součty udávají hodnoty marginální pravděpodobnostní funkce P2 ( y ). Platí tedy s P1 ( xi ) = ∑ P ( xi , y j ), i = 1, 2, ... , r , j =1 r P2 ( y j ) = ∑ P ( xi , y j ), j = 1, 2, ... , s, i =1 přičemž r s i =1 j =1 r s ∑ P1 (xi ) = ∑ P2 ( y j ) = ∑∑ P( xi , y j ) = 1. Pro popis podmíněných Podmíněná pravděpodobnostní funkce pravděpodobnostní funkce předpokladu, že je i =1 j =1 rozdělení se zavádí podmíněná P ( x | Y = y j ), resp. P ( y | X = xi ), za P(Y = y j ) > 0, j = 1, 2, ... , s, resp. P ( X = xi ) > 0, i =1,2, ... , r . Funkce P ( x | Y = y j ) udává pravděpodobnost toho, že náhodná veličina X nabude hodnoty x za podmínky Y = y j a obdobně funkce P ( y | X = xi ) pravděpodobnost toho, že veličina Y nabude hodnoty y za podmínky X = xi . Podmíněné pravděpodobnostní funkce jsou definovány jako podíl sdružené a příslušné marginální pravděpodobnostní funkce. K výpočtu hodnot zmíněných pravděpodobnostních funkcí se užívá vzorců 58 P ( xi | Y = y j ) = P ( xi , y j ) , P2 ( y j ) > 0; P2 ( y j ) P ( xi , y j ) P ( y j | X = xi ) = P1 ( xi ) , P1 (xi ) > 0. které platí pro i = 1, 2,..., r, j = 1, 2,..., s. S použitím známých hodnot pravděpodobnostních funkcí se pak stanoví hodnoty sdružené distribuční funkce ∑ ∑ F ( x, y ) = P ( X < x, Y < y ) = i: xi < x j: y j < y P ( xi , y j ), marginálních distribučních funkcí s ∑ ∑ P( x , y F1 ( x) = F ( x, +∞) = i: xi < x j =1 r F2 ( y ) = F (+∞, y ) = ∑ ∑ i =1 j: y j < y i j ), P ( xi , y j ) a podmíněných distribučních funkcí F (x | Y = y j ) = ∑ P( x , y ) P2 ( y j ) ∑ F ( y | X = xi ) = i i: xi < x j: y j < y j , P2 ( y j ) > 0, j = 1, 2, ... , s; P ( xi , y j ) P1 ( xi ) , P1 ( xi ) > 0, i = 1, 2, ... , r. Příklad 4.4. V zásilce 10 výrobků je 8 kvalitních a 2 nekvalitní. Mezi kvalitními je 5 první jakosti a 3 druhé jakosti. Ze zásilky se náhodně vyberou 2 výrobky (výběr bez vracení). Počet kvalitních kusů ve výběru je náhodná veličina X a počet výrobků první jakosti je náhodná veličina Y. Určete sdružené a marginální rozdělení veličin X a Y. ⎛10 ⎞ Řešení. Výběr 2 výrobků lze provést ⎜ ⎟ = 45 způsoby. Z toho ve ⎝2⎠ ⎛ 5 ⎞ ⎛ 3 ⎞⎛ 2 ⎞ ⎜ ⎟ ⎜ ⎟⎜ ⎟ = 3 případech jsou ve výběru 2 výrobky druhé jakosti, ⎝ 0 ⎠ ⎝ 2 ⎠⎝ 0 ⎠ ⎛ 5 ⎞ ⎛ 3 ⎞⎛ 2 ⎞ v případech 2 výrobky první jakosti, ⎜ ⎟ ⎜ ⎟⎜ ⎟ = 10 ⎝ 2 ⎠ ⎝ 0 ⎠⎝ 0 ⎠ ⎛ 5⎞ ⎛ 3⎞ ⎛ 2⎞ ⎛ 5⎞ ⎛ 3⎞ ⎛ 2 ⎞ v ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ = 1 případě 2 nekvalitní výrobky, v ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ = 15 ⎝ 0⎠ ⎝ 0⎠ ⎝ 2⎠ ⎝ 1⎠ ⎝ 1⎠ ⎝ 0⎠ případech 1 výrobek první a 1 výrobek druhé jakosti, ⎛ 5⎞ ⎛ 3⎞ ⎛ 2⎞ v ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ = 10 případech 1 výrobek první jakosti a 1 nekvalitní ⎝ 1⎠ ⎝ 0⎠ ⎝ 1⎠ 59 ⎛ 5 ⎞ ⎛ 3⎞ ⎛ 2 ⎞ výrobek a v ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ = 6 případech 1 výrobek druhé jakosti a 1 ⎝ 0 ⎠ ⎝ 1⎠ ⎝ 1 ⎠ nekvalitní. Hledané hodnoty sdružené a marginálních pravděpodobnostních funkcí jsou uspořádány do tabulky 4.5. Tab. 4.5. Tabulka k příkladu 4.4 yj xi 0 1 2 P2 ( y j ) 0 1 45 6 45 3 45 1 0 2 0 10 45 15 45 0 10 45 10 45 25 45 10 45 P1 ( xi ) 1 45 16 45 28 45 1 B. Sdružené rozdělení dvou absolutně spojitých náhodných veličin Uvažme dvojici absolutně spojitých náhodných veličin X, Y, jejichž sdružené rozdělení má tu vlastnost, že existuje nezáporná reálná funkce f(x, y) taková, že pro všechna reálná x, y platí x F ( x, y ) = y ∫∫ f (t , u )dtdu. (4.12) −∞ −∞ Hustota náh. vektoru Funkce f(x, y) se nazývá hustota rozdělení pravděpodobností (stručněji hustota) náhodného vektoru (X, Y) nebo také sdružená hustota rozdělení pravděpodobností náhodných veličin X, Y. V bodech, kde existuje derivace distribuční funkce F(x, y), je možno určit sdruženou hustotu pomocí vztahu f ( x, y ) = ∂ 2 F ( x, y ) . ∂x ∂y (4.13) Hustota náhodného vektoru má vlastnosti analogické vlastnostem hustoty jednorozměrné náhodné veličiny. 1. Hustota f(x, y) je nezáporná, tj. f ( x, y ) ≥ 0. 2. Pravděpodobnost toho, že bod [ X ,Y ] padne dovnitř obdélníku < a1 , b1 )× < a2 ,b2 ) je rovna P (a1 ≤ X < b1 , a2 ≤ Y < b2 ) = b1 b2 ∫∫ a1 a2 60 f ( x, y ) dx dy. 3. Hustota f(x, y) splňuje podmínku ∞ ∞ ∫∫ f ( x, y ) dx dy = 1. −∞ −∞ Hustota rozdělení pravděpodobností vystupuje v případě absolutně spojitých náhodných veličin ve stejné roli jako pravděpodobnostní funkce u diskrétních veličin. Marginální hustoty veličin X a Y se určují ze vztahů Marginální hustota ∞ ∫ f1 ( x) = f ( x, y ) dy, −∞ (4.14) ∞ f2 ( y) = ∫ f ( x, y ) dx. −∞ a podmíněné hustoty ze vztahů f ( x, y ) , f 2 ( y ) > 0, f ( x | Y = y) = f2 ( y) f ( x, y ) , f1 ( x) > 0. f ( y | X = x) = f1 ( x) Podmíněná hustota (4.15) f ( x | Y = y ), resp. f ( y | X = x), je pouze konvenčním Poznámka. označením pro podmíněnou hustotu veličiny X za podmínky Y = y, resp. pro podmíněnou hustotu veličiny Y za podmínky X = x. Při odvozování vztahů (4.15) není na závadu, když pravděpodobnosti jevů {Y = y} nebo { X = x} jsou nulové. Známe-li hustotu náhodného vektoru (X, Y), pak je příslušná distribuční funkce určena vztahem (4.12). Pro marginální distribuční funkce jednotlivých veličin platí x F1 ( x) = F ( x, ∞) = ∫ f1 (t ) dt , −∞ y F2 ( y ) = F (∞, y ) = ∫ f 2 (u ) du. −∞ a pro podmíněné distribuční funkce x F ( x | Y = y) = ∫ f (t | Y = y ) dt −∞ f2 ( y) , f 2 ( y ) > 0; y F ( y | X = x) = ∫ f (u | X = x) du −∞ f1 ( x) , f1 ( x) > 0. Příklad 4.5. Sdružená hustota rozdělení pravděpodobností náhodného vektoru (X, Y) je dána vztahem 61 ⎧1 x y ⎪ ( + ) pro 0 < x < 2, 0 < y < 3, f ( x, y ) = ⎨ 6 2 3 ⎪⎩ 0 pro ostatní hodnoty x, y. Určete marginální a podmíněné hustoty obou veličin. Řešení. Marginální hustoty se stanoví pomocí vztahů (4.14), takže ⎧1 3 x y 1 ⎪ ∫ ( + ) dy = ( x + 1) pro 0 < x < 2, f1 ( x) = ⎨ 6 0 2 3 4 ⎪0 pro ostatní hodnoty x; ⎩ ⎧1 2 x y 1 2y ⎪ ∫ ( + ) dx = (1 + ) pro 0 < y < 3, f2 ( y) = ⎨ 6 0 2 3 6 3 ⎪ 0 pro ostatní hodnoty y. ⎩ Pro podmíněné hustoty platí v souladu se vztahy (4.15) ⎧1 x y ⎪ 6 ( 2 + 3 ) 3x + 2 y pro 0 < x < 2, 0 < y < 3, = ⎪ 2y f ( x | Y = y) = ⎨ 1 6 + 4y (1 + ) ⎪6 3 ⎪ pro ostatní hodnoty x, y; ⎩0 ⎧1 x y ⎪ 6 ( 2 + 3 ) 3x + 2 y pro 0 < x < 2, 0 < y < 3, = ⎪ f ( y | X = x) = ⎨ 1 9( x + 1) ( x + 1) ⎪ 4 ⎪ pro ostatní hodnoty x, y. ⎩ 0 Kontrolní úkol 4.6. Dvourozměrná náhodná veličina (X, Y) má sdruženou hustotu f ( x, y ) = ( π 16 + x 2 A 2 )( 25 + y ) 2 . Určete hodnotu konstanty A a sdruženou distribuční funkci F(x, y). 4.7. Nezávislost náhodných veličin Při zavádění pojmu nezávislosti náhodných veličin se vychází z definice nezávislosti jevů. Nezávislost náhodných veličin X, Y se intuitivně pojímá tak, že ze znalosti hodnoty (výsledku pozorování) jedné náhodné veličiny nelze nic usoudit o druhé náhodné veličině. Nezávislost náhodných veličin Náhodné veličiny X, Y jsou nezávislé, jestliže pro libovolné borelovské množiny A, B jsou jevy { X ∈ A} , {Y ∈ B} nezávislé. Přitom { X ∈ A} značí jev, který spočívá v tom, že náhodná veličina X nabývá hodnot z množiny A. 62 Zvolíme-li speciálně A = ( −∞ , x), B = ( −∞ , y), dostaneme tuto definici nezávislosti: Náhodné veličiny X a Y jsou nezávislé, jestliže pro libovolná reálná x, y platí P ( X < x, Y < y ) = P( X < x) P(Y < y ) (4.16) neboli F ( x, y ) = F1 ( x) F2 ( y ), kde F1 ( x), F2 ( y ) jsou marginální distribuční funkce náhodných veličin X, Y. Lze dokázat, že obě uvedené definice jsou ekvivalentní. Nyní dokážeme několik jednoduchých vět o nezávislosti dvou náhodných veličin. Věta 4.2. Konstanta je nezávislá na každé náhodné veličině. Důkaz. Nechť Y = c (konstanta), pak ⎧ P( X < x) pro c < y, P ( X < x, Y < y ) = ⎨ 0 pro c ≥ y. ⎩ takže vztah (4.16) zřejmě platí. □ Věta 4.3. Jestliže náhodné veličiny X, Y jsou nezávislé a každá z nich má hustotu, pak platí f ( x, y ) = f1 ( x) f 2 ( y ), (4.17) kde f1 ( x), f 2 ( y ) jsou marginální hustoty veličin X, Y a f(x, y) hustota náhodného vektoru (X, Y). Naopak, platí-li vztah (4.17), jsou náhodné veličiny X, Y nezávislé. Důkaz. Vztah (4.17) plyne přímo ze vztahů (4.16) a (4.13). Obráceně dostaneme vztah (4.16) ze vztahu (4.17) integrováním. □ Poznámka. V případě dvou nezávislých diskrétních náhodných veličin platí analogický vztah pro pravděpodobnostní funkce. Definici nezávislosti lze přirozeně zobecnit na případ více než dvou náhodných veličin. Náhodné veličiny X 1 , X 2 , ... , X n jsou sdruženě nezávislé, jestliže pro A1 , A2 , ... , An jsou jevy libovolné borelovské množiny { X 1 ∈ A1} , { X 2 ∈ A2 } , ... , { X n ∈ An } sdruženě nezávislé. Pro Ai = (−∞, xi ), i = 1, 2,..., n, dostaneme ekvivalentní definici sdružené nezávislosti ve tvaru: Náhodné veličiny X 1 , X 2 , ... , X n se nazývají sdruženě nezávislé, jestliže pro každou skupinu X i1 , X i2 , ... , X ik , 1 ≤ i1 < i2 < ... < ik ≤ n, těchto veličin platí rovnost P ( X i1 < xi1 , X i2 < xi2 , ... , X ik < xik ) = P ( X i1 < xi1 ) P ( X i2 < xi2 ) ... P( X ik < xik ) při libovolných reálných xi1 , xi2 , ... , xik a libovolném k, 2 ≤ k ≤ n. Pojem nezávislosti náhodných veličin má zásadní význam v teorii pravděpodobnosti. Jsou-li náhodné veličiny sdruženě nezávislé, pak rozdělení náhodného vektoru je plně určeno rozdělením jednotlivých složek. 63 Sdružená nezávislost náhodných veličin Příklad 4.6. Určete hustotu náhodného vektoru ( X 1 , X 2 ), jehož složky jsou nezávislé a mají tzv. normální rozdělení, tj. platí f k ( xk ) = 1 σk ⎡ ( x − µ )2 ⎤ exp ⎢ − k 2 k ⎥ pro − ∞ < xk < ∞, 2σ k ⎦ 2π ⎣ kde µ k , σ k2 jsou charakteristiky veličiny X k (k = 1, 2). Řešení. Hustota náhodného vektoru X 1 , X 2 je podle vztahu (4.17) rovna ⎡ ( x − µ )2 ( x − µ )2 ⎤ 1 f ( x1 , x2 ) = exp ⎢ − 1 21 − 2 2 2 ⎥ . 2πσ 1σ 2 2σ 1 2σ 2 ⎦ ⎣ 4.8. Funkce náhodných veličin V teorii pravděpodobnosti je třeba často řešit úlohy následujícího typu. Je dána distribuční funkce F ( x1 , x2 , ... , xn ) náhodného vektoru X = ( X 1 , X 2 , ... , X n ) a požaduje se určení sdružené distribuční funkce G ( y1 , y2 , ... , yk ) veličin Y1 = ϕ1 ( X 1 , X 2 , ..., X n ), Y2 = ϕ 2 ( X 1 , X 2 , ... , X n ), … , Yk = ϕ k ( X 1 , X 2 , ... , X n ). Obecné řešení této úlohy je principiálně jednoduché, ale vyžaduje rozšíření pojmu integrálu. Proto v rámci těchto skript ukážeme jen řešení dvou prakticky významných speciálních případů. A. Funkce jedné absolutně spojité náhodné veličiny Předpokládejme, že známe rozdělení pravděpodobností náhodné veličiny X a hledáme rozdělení pravděpodobností náhodné veličiny Y = ϕ ( X ) . Omezíme se přitom jen na případy, kdy veličina X je absolutně spojitá a má distribuční funkci F(x) a hustotu f(x) = dF ( x) dx . Pokud je funkce ϕ ( x ) v oboru možných hodnot veličiny X ryze monotónní, pak existuje mezi veličinami X a Y vzájemně jednoznačný vztah (zobrazení) a není obtížné určit rozdělení veličiny Y. Věta 4.4. Je-li funkce y = ϕ ( x ) na množině možných hodnot x veličiny X ryze monotónní, tj. je-li ϕ ( x ) buď rostoucí nebo klesající funkcí x, má náhodná veličina Y = ϕ ( X ) hustotu g ( y ) = f ⎡⎣ϕ −1 ( y ) ⎤⎦ d ϕ −1 ( y ) , dy (4.18) kde x = ϕ −1 ( y ) je inverzní funkce k funkci y = ϕ ( x ) . Důkaz. Pro rostoucí funkci ϕ ( x ) je distribuční funkce náhodné veličiny Y rovna 64 G ( y ) = P(Y < y ) = P [ϕ ( X ) < y ] = P ⎡⎣ X < ϕ −1 ( y ) ⎤⎦ = F ⎡⎣ϕ −1 ( y ) ⎤⎦ . Odtud dostaneme dG ( y ) d ϕ −1 ( y ) = f ⎡⎣ϕ −1 ( y ) ⎤⎦ . dy dy g ( y) = Obdobně pro klesající funkci ϕ ( x ) platí G ( y ) = P ⎡⎣ X > ϕ −1 ( y ) ⎤⎦ = 1 − P ⎡⎣ X ≤ ϕ −1 ( y ) ⎤⎦ = 1 − P ⎡⎣ X < ϕ −1 ( y ) ⎤⎦ = = 1 − F ⎡⎣ϕ −1 ( y ) ⎤⎦ , g ( y ) = − f ⎡⎣ϕ −1 ( y ) ⎤⎦ d ϕ −1 ( y ) , dy čímž je věta dokázána. □ Jestliže funkce ϕ ( x ) není v oboru možných hodnot veličiny X ryze monotónní, neexistuje mezi veličinami X a Y vzájemně jednoznačný vztah, a tedy ani inverzní funkce ϕ −1 ( y ). V takovém případě je distribuční funkce G(y) veličiny Y dána pravděpodobností, že náhodná veličina X nabude hodnoty z kteréhokoliv intervalu ∆ i ( y ), i = 1, 2, ... , pro nějž platí Y = ϕ ( X ) < y . Protože tyto intervaly jsou disjunktní, je pro dané y0 hodnota G ( y0 ) rovna (viz obr. 4.8) G ( y0 ) = ∑ P( X ∈ ∆ i ( y0 )) = ∑ i i ∫ f ( x) dx. (4.19) ∆i ( y0 ) Hustotu g(y) pak dostaneme derivováním distribuční funkce G(y). y y 0 0 1(y0) 0 2(y0) x Obr. 4.8. Ilustrace ke vztahu (4.19) Příklad 4.7. Náhodná veličina X má normální rozdělení, tj. rozdělení s hustotou f ( x) = ⎡ ( x − µ )2 ⎤ 1 exp ⎢ − ⎥ pro − ∞ < x < ∞. 2σ 2 ⎦ σ 2π ⎣ Určete hustotu náhodné veličiny Y = ( X − µ ) σ , σ > 0. Řešení. Pro hustotu g(y) veličiny Y platí podle (4.18) g ( y ) = f (σ y + µ )σ . Dosadíme-li do tohoto vztahu za hustotu f (σ y + µ ) , dostaneme 65 g ( y) = ⎡ y2 ⎤ exp ⎢ − ⎥ pro − ∞ < y < ∞. 2π ⎣ 2⎦ 1 B. Funkce několika absolutně spojitých náhodných veličin Hledejme zákon rozdělení náhodné veličiny Y = ϕ ( X 1 , X 2 , .. , X n ) za předpokladu, že je dán náhodný vektor ( X 1 , X 2 , ... , X n ), který má sdruženou hustotu f ( x1 , x2 , ... , xn ). Distribuční funkci G(y) veličiny Y určíme z obecného vztahu G ( y ) = ∫ ∫ ...∫ f ( x1 , x2 , ..., xn ) dx1dx2 ...dxn , S v němž se integruje přes oblast S vymezenou nerovností ϕ ( x1 , x2 , ... , xn ) < y. Postup určení distribuční funkce G(y) a příslušné hustoty g(y) ukážeme na jednom prakticky významném příkladě. Příklad 4.8. Je dána sdružená hustota f ( x1 , x2 ) náhodného vektoru ( X 1 , X 2 ) pro −∞ < x1 < ∞, − ∞ < x2 < ∞. Určete hustotu rozdělení pravděpodobností náhodné veličiny Y = X 1 + X 2 . Řešení. Pro distribuční funkci veličiny Y platí G ( y ) = P(Y < y ) = P ( X 1 + X 2 < y ) = ∫∫ f ( x1 , x2 ) dx1 dx2 . S Oblast S je v tomto případě (viz obr. 4.9) pro pevně zvolená y ∈ ( −∞, ∞ ) x1 + x2 < y, což znamená, že buď vymezena nerovností −∞ < x1 < ∞, − ∞ < x2 < y − x1 nebo −∞ < x1 < y − x2 , − ∞ < x2 < ∞. x2 x1 + x2 = y s x1 Obr. 4.9. Ilustrace k příkladu 4.8 Distribuční funkce G(y) je tedy dána vztahem 66 ∞ y − x2 ⎡ y − x1 ⎤ ⎡ ⎤ G ( y ) = ∫ ⎢ ∫ f ( x1 , x2 ) dx2 ⎥ dx1 = ∫ ⎢ ∫ f ( x1 , x2 ) dx1 ⎥ dx2 . ⎢ −∞ ⎢ −∞ −∞ ⎣ −∞ ⎣ ⎦⎥ ⎦⎥ ∞ Odtud pro hledanou hustotu plyne ∞ g ( y) = ∞ dG ( y ) = ∫ f ( x1 , y − x2 ) dx1 = ∫ f ( y − x2 , x2 ) dx2 . dy −∞ −∞ Uvedený vztah platí obecně pro −∞ < y < ∞. Jsou-li veličiny X 1 , X 2 nezávislé, platí navíc f ( x1 , x2 ) = f1 ( x1 ) f 2 ( x2 ), a tedy ∞ g ( y) = ∫ −∞ ∞ f1 ( x1 ) f 2 ( y − x1 ) dx1 = ∫ f1 ( y − x2 ) f 2 ( x2 ) dx2 . −∞ Podobně lze na základě známé sdružené hustoty f ( x1 , x2 ) náhodného vektoru ( X 1 , X 2 ) stanovit i hustoty rozdělení pravděpodobností veličin X 1 − X 2 , X 1 X 2 , popř. X 1 X 2 . Pojmy k zapamatování: • náhodná veličina • diskrétní náhodná veličina • (absolutně) spojitá náhodná veličina • rozdělení diskrétního typu • rozdělení (absolutně) spojitého typu • distribuční funkce náhodné veličiny • pravděpodobnostní funkce náhodné veličiny • hustota náhodné veličiny • náhodný vektor • rozdělení náhodného vektoru (sdružené rozdělení náhodných veličin) • distribuční funkce náhodného vektoru (sdružená distribuční funkce náhodných veličin) • marginální distribuční funkce • podmíněná distribuční funkce • pravděpodobnostní funkce náhodného vektoru (sdružená pravděpodobnostní funkce náhodných veličin) • marginální pravděpodobnostní funkce • podmíněné pravděpodobnostní funkce • hustota náhodného vektoru (sdružená hustota náhodných veličin) • marginální hustota • podmíněná hustota • nezávislost dvou náhodných veličin • sdružená nezávislost náhodných veličin • úsečkový diagram • polygon • histogram 67 Shrnutí: V této kapitole se především zavádí pojem náhodné veličiny a jejího rozdělení. Zvláštní pozornost se přitom věnuje popisu rozdělení náhodné veličiny, ať už ve formě analytické (distribuční funkce, pravděpodobnostní funkce, hustota), tak i ve formách tabelární (tabulka rozdělení pravděpodobností) a grafické (úsečkový diagram, polygon, histogram, graf distribuční funkce a hustoty). Dále se definuje pojem náhodného vektoru a jeho rozdělení (sdružená, marginální a podmíněná distribuční funkce, pravděpodobnostní funkce a hustota). Závěrečné odstavce jsou věnovány mimořádně významné problematice nezávislosti náhodných veličin (podvojná a sdružená nezávislost) a konstrukci rozdělení některých jednoduchých funkcí dané náhodné veličiny. 68 5. ČÍSELNÉ CHARAKTERISTIKY NÁHODNÝCH VELIČIN Po prostudování této kapitoly: • pochopíte význam číselných charakteristik pro popis rozdělení náhodné veličiny, • poznáte systematické třídění číselných charakteristik, • naučíte se počítat hodnoty základních číselných charakteristik náhodných veličin, popř. náhodných vektorů. Číselné charakteristiky náhodných veličin jsou reálná čísla, která reprezentují jednoduchým způsobem rozdělení příslušných veličin. Existuje velký počet takových charakteristik pro popis velikosti (úrovně) náhodné veličiny, její variability i tvaru jejího rozdělení. V této kapitole poznáte pouze ty nejvýznamnější z nich, jež se v praxi nejčastěji používají. Věnujte patřičnou pozornost jejich definici a základním vlastnostem, abyste byli schopni bez problémů spočítat jejich hodnoty. 5.1. Klasifikace charakteristik Chování náhodné veličiny je jednoznačně popsáno jejím rozdělením. Tato informace o náhodné veličině je sice úplná, ale často značně nepřehledná. Pro řešení úloh z teorie pravděpodobnosti a statistiky je proto výhodné shrnout informaci o rozdělení náhodné veličiny do několika vhodných číselných údajů (tzv. charakteristik), které dostatečně výstižně popisují základní vlastnosti tohoto rozdělení. Podle vlastnosti, kterou popisují, třídíme charakteristiky náhodné veličiny do tří skupin: a) charakteristiky úrovně (např. střední hodnota, modus, medián), jež jsou měřítkem úrovně hodnoty náhodné veličiny; b) charakteristiky variability (např. rozptyl, směrodatná odchylka, kvartilová odchylka), jež jsou měřítkem proměnlivosti (rozptýlenosti) jednotlivých hodnot náhodné veličiny; c) charakteristiky šikmosti a špičatosti (např. koeficienty šikmosti a špičatosti), jež slouží ke kvantifikaci tvaru rozdělení náhodné veličiny. Podle způsobu konstrukce rozlišujeme: a) charakteristiky momentové, které jsou funkcemi všech možných hodnot uvažované náhodné veličiny; b) charakteristiky kvantilové, které jsou vždy reprezentovány nějakou konkrétní hodnotou uvažované veličiny, a to takovou, jež vyhovuje příslušné podmínce, 69 c) charakteristiky jiné, jež nejsou ani momentové ani kvantilové. V této kapitole se budeme podrobněji zabývat pouze nejčastěji používanými číselnými charakteristikami jedné náhodné veličiny a způsoby jejich výpočtu. Závěrem se pak ve stručnosti zmíníme o základních charakteristikách náhodných vektorů. 5.2. Střední hodnota Nejdůležitější charakteristikou úrovně hodnoty náhodné veličiny X je střední hodnota (očekávaná hodnota nebo matematická naděje) EX . V obecné matematické definici střední hodnoty vystupuje abstraktní Lebesgueův integrál nebo Stieltjesův integrál. Protože čtenář těchto skript není obeznámen se zmíněnými integrály, uvedeme zvláště definici střední hodnoty pro náhodné veličiny diskrétního a absolutně spojitého typu. Nechť X je diskrétní náhodná veličina, která nabývá hodnot x1 , x2 , ... s pravděpodobnostmi P ( X = xi ), i = 1, 2, ... , přičemž platí vztah (4.4). Jeli řada ∑ x P( X = x ) absolutně konvergentní, pak její součet i i i EX = ∑ xi P( X = xi ) (5.1) i Střední hodnota náhodné veličiny nazýváme střední hodnotou diskrétní náhodné veličiny X. V případě absolutně spojité náhodné veličiny se vychází z hustoty. Nechť f(x) je hustota absolutně spojité náhodné veličiny X. Jestliže ∞ absolutně konverguje integrál ∫ xf ( x) dx, pak −∞ ∞ ∫ xf ( x) dx EX = (5.2) −∞ se nazývá střední hodnotou absolutně spojité náhodné veličiny X. Pokud řada ∑ x P( X = x ) , i i ∞ resp. integrál i ∫ xf ( x) dx, nekonverguje −∞ absolutně, budeme říkat, že příslušná náhodná veličina hodnotu. nemá střední Na vztahu (5.1) jsou založeny rozmanité fyzikálně matematické interpretace pojmu střední hodnota. Představme si např. soustavu hmotných bodů rozložených na přímce v bodech o souřadnicích x1 , x2 , ... , xn a majících hmotnosti pi = P( X = xi ), i = 1, 2, ... , n, přičemž n ∑ pi = 1. Pak hodnota výrazu i =1 n ∑x p i =1 i i udává souřadnici těžiště této soustavy hmotných bodů. Vztahů (5.1) a (5.2) se využívá v praxi k výpočtu středních hodnot náhodných veličin. Nyní dokážeme základní vlastnosti střední hodnoty, 70 pro jednoduchost budeme přitom uvažovat jen případ diskrétních náhodných veličin. 1. Nechť ϕ ( x ) je libovolná funkce reálné proměnné x a nechť X je x1 , x2 , ... diskrétní náhodná veličina, která nabývá hodnot s pravděpodobnostmi P ( X = xi ), i = 1, 2, ... , přičemž platí vztah (4.4). Potom střední hodnota náhodné veličiny Y = ϕ ( X ) je EY = ∑ ϕ ( xi )P( X = xi ) (5.3) i za předpokladu, že řada vpravo absolutně konverguje. Důkaz. Náhodná veličina Y může nabývat hodnot y1 = ϕ ( x1 ), y2 = ϕ ( x2 ), ... . V uvedené posloupnosti se ovšem mohou některé hodnoty opakovat. Označme y (1) , y (2) , ... posloupnost různých čísel z výchozí posloupnosti y1 , y2 , ... . Podle definice střední hodnoty (5.1) je EY = ∑ y (i ) P(Y = y ( i ) ), ale P (Y = y ( i ) ) = i ∑ j:ϕ ( x j ) = y ( i ) P( X = x j ), a tedy platí (5.3). □ Poznámka 1. Při dokazování dalších vlastností střední hodnoty budeme vycházet ze vztahu pro výpočet střední hodnoty funkce dvou proměnných. Lze dokázat následující tvrzení: Nechť φ(x, y) je libovolná funkce reálných proměnných x a y a nechť X, Y jsou diskrétní náhodné veličiny, z nichž první nabývá hodnot xi s pravděpodobnostmi P ( X = xi ), i = 1, 2, ... , a druhá hodnot y j s pravděpodobnostmi P (Y = y j ), j = 1, 2, ... , přičemž ∑ P( X = x ) = 1, ∑ P(Y = y ) = 1. i i j j Pak střední hodnota náhodné veličiny Z = ϕ ( X , Y ) je EZ = ∑∑ ϕ ( xi , y j ) P( X = xi , Y = y j ) i j za předpokladu, že řada vpravo absolutně konverguje. Poznámka 2. Jestliže veličina X má absolutně spojité rozdělení s hustotou f(x) a funkce ϕ je taková, že k ní existuje inverzní funkce ϕ −1 , používá se k výpočtu střední hodnoty náhodné veličiny Y = ϕ ( X ) vztahu ∞ EY = ∫ ϕ ( x) f ( x) dx (5.4) −∞ za předpokladu absolutní konvergence integrálu vpravo. Při výpočtu střední hodnoty náhodné veličiny Z = ϕ ( X , Y ) se vychází ze vztahu 71 Vlastnosti střední hodnoty ∞ ∞ EZ = ∫ ∫ ϕ ( x, y) f ( x, y) dx dy. −∞ −∞ 2. Střední hodnota konstanty je rovna této konstantě, tj. Ec = c. Důkaz. Konstantu c je možno považovat za diskrétní náhodnou veličinu, která může nabývat pouze jediné hodnoty c, a to □ s pravděpodobností 1. Proto Ec = c.1 = c. 3. Jsou-li X, Y libovolné náhodné veličiny mající střední hodnoty EX , EY , pak střední hodnota součtu těchto náhodných veličin je rovna součtu jejich středních hodnot, tj. E( X + Y ) = EX + EY . Důkaz. Nechť náhodná veličina X může nabývat hodnot xi , i = 1, 2, ... , a náhodná veličina Y hodnot y j , j = 1, 2, ... . Jevy { X = x ,Y = y } i tvoří j zřejmě úplnou soustavu neslučitelných jevů a platí ∑ P( X = x , Y = y ) = P(Y = y ), ∑ P( X = x , Y = y ) = P( X = x ). i j j i i j i j Odtud plyne E( X + Y ) = ∑∑ ( xi + y j ) P( X = xi , Y = y j ) = i j = ∑ xi P( X = xi ) + ∑ y j P(Y = y j ) = EX + EY . i j Používá se toho, že součet absolutně konvergentních řad je rovněž absolutně konvergentní řada. □ Důsledek. Střední hodnota součtu konečného počtu náhodných veličin majících střední hodnoty je rovna součtu jejich středních hodnot, tj. n n i =1 i =1 E( ∑ X i ) = ∑ E X i . Uvedené zobecnění plyne z vlastnosti 3, jestliže použijeme matematické indukce. 4. Jsou-li X, Y nezávislé náhodné veličiny mající střední hodnoty EX , EY , pak střední hodnota součinu těchto náhodných veličin je rovna součinu jejich středních hodnot, tj. E( XY ) = EX EY . Důkaz. Nechť xi , i = 1, 2, ... , jsou všechny možné hodnoty náhodné veličiny X a y j , j = 1, 2, ... všechny možné hodnoty veličiny Y. Potom platí 72 E( XY ) = ∑∑ xi y j P( X = xi , Y = y j ) = ∑∑ xi y j P( X = xi ) P(Y = y j ) = i j i j ⎤ ⎡ ⎤ ⎡ = ⎢ ∑ xi P( X = xi ) ⎥ ⎢ ∑ y j P(Y = y j ) ⎥ = EX EY . ⎣ i ⎦ ⎣ j ⎦ Provedené úpravy jsou oprávněné, lze totiž dokázat, že také řada □ ∑∑ xi y j P( X = xi , Y = y j ) je absolutně konvergentní. i j Důsledek 1. Je-li X libovolná náhodná veličina mající střední hodnotu EX a c libovolné reálné číslo, pak platí E(cY ) = c EY . Toto tvrzení vyplývá bezprostředně z vlastnosti 4 a věty 4.2 . Důsledek 2. Střední hodnota součinu konečného počtu sdruženě nezávislých náhodných veličin X 1 , X 2 , ... , X n majících střední hodnoty je rovna součinu středních hodnot jednotlivých veličin, tj. n n i =1 i =1 E(∏ X i ) = ∏ EX i . Uvedené vlastnosti střední hodnoty představují pravidla pro výpočet střední hodnoty složitějších výrazů s náhodnými veličinami. Příklady 5.1. Určete střední hodnotu náhodné veličiny X, která má rozdělení P (k ) = P( X = k ) = 1 2k pro k = 1, 2, ... . Řešení. Výraz pro hledanou střední hodnotu upravíme takto: ∞ ∞ ∞ k k k m −1 = = = = 2 2 ∑ ∑ ∑ k k k +1 m k =1 2 k =0 2 k =0 2 m =1 2 ∞ EX = ∑ ⎡∞ m ∞ 1 ⎤ = 2 ⎢ ∑ m − ∑ ( ) m ⎥ = 2(EX − 1). m =1 2 ⎣ m =1 2 ⎦ Ze srovnání prvního a posledního výrazu plyne okamžitě EX = 2. 5.2. Náhodné veličiny X 1 , X 2 jsou nezávislé a mají střední hodnoty EX 1 = 0, 2; EX 2 = 1,8. Určete střední hodnoty náhodných veličin a) 2 X 1 + 3 ; b) 2 X 1 − 5 X 2 ; c) X 1 X 2 . Řešení. a) E(2 X 1 + 3) = 2EX 1 + 3 = 2 ⋅ 0, 2 + 3 = 3, 4; b) E(2 X 1 − 5 X 2 ) = 2EX 1 − 5EX 2 = 2 ⋅ 0, 2 − 5 ⋅ 1,8 = −8, 6; c) E( X 1 X 2 ) = EX 1 EX 2 = 0, 2 ⋅ 1,8 = 0,36 . 5.3. Náhodná veličina X má hustotu 73 π π ⎧ω pro − ≤ x ≤ , ⎪ f ( x) = ⎨ 2π ω ω ⎪⎩ 0 jinak. Určete střední hodnotu náhodné veličiny Y = asin(ω X ), kde a, ω jsou kladná reálná čísla. Řešení. S použitím vztahu (5.4) dostaneme EY = E [ a sin(ω X ) ] = a E [sin(ω X ) ] = aω 2π π ω ∫π sin(ω x) dx = 0. − ω Kontrolní úkoly 5.1. Náhodná veličina X má Poissonovo rozdělení s parametrem λ , tj. λ k e −λ P( X = k ) = pro k = 1, 2, ... . k! Určete její střední hodnotu. 5.2. Určete střední hodnotu a) počtu bodů dosaženého při hodu jednou hrací kostkou, b) součtu bodů dosaženého při hodu dvěma hracími kostkami. 5.3. Hustota náhodné veličiny X je dána vztahem 1 ⎧ pro x < 2 ⎪ f ( x) = ⎨ π 4 − x 2 ⎪ 0 jinak. ⎩ Určete její střední hodnotu. ( ) 5.3. Rozptyl a směrodatná odchylka Rozptyl náhodné veličiny Rozptyl je základní charakteristikou odchylek hodnot náhodné veličiny od její střední hodnoty. Rozptylem (disperzí nebo také variancí) DX náhodné veličiny X se nazývá střední hodnota náhodné veličiny ( X − EX ) 2 , a tedy DX = E ⎡⎣( X − EX ) 2 ⎤⎦ . (5.5) Přímo z definice vyplývá, že rozptyl jakékoliv náhodné veličiny je vždy nezáporný. S použitím vlastnosti 1 střední hodnoty dostaneme pro diskrétní náhodnou veličinu X toto vyjádření rozptylu DX = ∑ ( xi − EX ) 2 P( X = xi ) = ∑ ( xi − EX ) 2 P ( xi ). i (5.6) i V případě absolutně spojité náhodné veličiny X se rozptyl vyjadřuje ve tvaru ∞ DX = ∫ ( x − EX ) −∞ 74 2 f ( x) dx. (5.7) Rozptyl nějaké náhodné veličiny existuje přirozeně tehdy, jestliže řada, resp. integrál, na pravé straně vztahu (5.6), resp. (5.7), konverguje. Vzorec (5.6), podobně jako vzorec (5.1), umožňuje názornou interpretaci rozptylu v mechanice. Jsou-li xi souřadnice a pi = P( X = xi ), i = 1, 2, ..., n, hmotnosti soustavy hmotných bodů v přímce, pak DX má význam momentu setrvačnosti této soustavy vzhledem k těžišti. Pro praxi je vhodnější jiné vyjádření rozptylu než vztah (5.5). Jestliže použijeme vlastností 3 a 4 střední hodnoty, získáme po jednoduché úpravě DX = E ⎡⎣( X − EX ) 2 ⎤⎦ = E ⎡⎣ X 2 − 2 X EX + (EX ) 2 ⎤⎦ = (5.8) = E( X 2 ) − 2(EX ) 2 + (EX ) 2 = E( X 2 ) − (EX ) 2 . (Veličina EX je konstanta.) Je zřejmé, že vztah (5.8) je pro stanovení rozptylu efektivnější než vztah (5.5). Rozptyl udává variabilitu náhodné veličiny ve čtvercích jejích jednotek. Proto se vedle rozptylu používá pro kvantitativní posouzení variability Směrodatná odchylka náhodné veličiny X také směrodatná odchylka σ X , která je definována vztahem σ X = + DX . Směrodatná odchylka měří variabilitu (odchylku od střední hodnoty) v původních jednotkách uvažované náhodné veličiny. Základní vlastnosti rozptylu dokážeme pomocí již odvozených vlastností střední hodnoty. 1. Rozptyl konstanty c je roven nule, tj. Dc = 0. Vlastnosti rozptylu Důkaz. Dc = E ⎡⎣(c − Ec) 2 ⎤⎦ = E ⎡⎣(c − c) 2 ⎤⎦ = 0. □ 2. Pro libovolnou náhodnou veličinu X a libovolnou konstantu c platí D(cX ) = c 2 DX . Důkaz. { D(cX ) = E [ (cX − E(cX ) ] 2 } = E{c [( X − EX )] } = c DX . 2 2 2 □ 3. Pro libovolné náhodné veličiny X, Y platí D( X ± Y ) = DX + DY ± 2E [ ( X − EX )(Y − EY ) ] . Důkaz. { D( X ± Y ) = E [ X ± Y − E( X ± Y ) ] 2 } = E{[( X − EX ) ± (Y − EY )] } = 2 = E ⎡⎣( X − EX ) 2 ⎤⎦ + E ⎡⎣(Y − EY ) 2 ⎤⎦ ± 2E [ ( X − EX )(Y − EY ) ] = = DX + DY ± 2E [ ( X − EX )(Y − EY ) ]. Výraz E [ ( X − EX )(Y − EY ) ] se nazývá kovariance náhodných veličin X, Y. Vlastnost 3 je možno přirozeně zobecnit na libovolný konečný počet náhodných veličin. □ 75 Kovariance náhodných veličin Důsledek. Rozptyl součtu i rozdílu dvou nezávislých náhodných veličin X, Y je roven součtu jejich rozptylů, tj. D( X ± Y ) = DX + DY . Lze totiž snadno ukázat, že pro nezávislé náhodné veličiny X, Y platí E [ ( X − EX )(Y − EY ) ] = 0. Vztahy uvedené v tomto odstavci můžeme chápat jako pravidla pro výpočet rozptylu náhodných veličin. Příklad 5.4. Hustota rozdělení pravděpodobností náhodné veličiny X má tvar ⎧1 ⎪ f ( x) = ⎨ a ⎪⎩ pro 0 < x < a, 0 jinak. S použitím vlastností střední hodnoty a rozptylu určete D(2 X + 3). Řešení. Nejprve určíme číselné charakteristiky EX a E( X 2 ). a a 1 a 1 a2 EX = ∫ x dx = ; E( X 2 ) = ∫ x 2 dx = . a0 2 a0 3 Rozptyl náhodné veličiny X je dán vztahem DX = E( X ) − ( EX ) 2 2 a2 a2 a2 = − = . 3 4 12 Odtud pro hledaný rozptyl dostaneme D(2 X + 3) = 4DX = 4a 2 a 2 = . 12 3 Kontrolní úkoly 5.4. Určete rozptyl náhodné veličiny, která má Poissonovo rozdělení s parametrem λ (viz kontrolní úkol 5.1). 5.5. Určete střední hodnotu a rozptyl náhodné veličiny, jejíž hustota má tvar π ⎧2 2 ⎪ cos x pro x ≤ , f ( x) = ⎨ π 2 ⎪⎩ 0 jinak. 5.4. Momentové charakteristiky Obecné momenty Nejužívanějšími charakteristikami náhodné veličiny jsou charakteristiky založené na tzv. momentech. V zásadě rozlišujeme momenty trojího druhu: obecné, centrální a normované. Obecným momentem k-tého řádu µ k′ ( X ) náhodné veličiny X nazýváme střední hodnotu veličiny X k , tj. 76 µ k′ ( X ) = E( X k ), k = 0,1, ... . Pro výpočet obecných momentů se používá těchto vzorců ⎧ ∑ xik P ( xi ) ⎪⎪ i µ k′ ( X ) = ⎨ ∞ ⎪ ∫ x k f ( x) dx ⎪⎩ −∞ pro diskrétní veličiny, (5.9) pro abs. spojité veličiny. Z definice je zřejmé, že obecné momenty existují tehdy, jestliže výrazy na pravé straně vztahů (5.9) konvergují absolutně. Mezi obecnými momenty náhodné veličiny X zaujímá nejvýznamnější postavení moment 1. řádu µ1′( X ), který je střední hodnotou EX této veličiny. Existuje-li µ1′( X ) = EX , pak můžeme definovat centrální momenty náhodné veličiny X. Centrálním momentem k - tého řádu náhodné k veličiny X nazýváme střední hodnotu veličiny ( X − EX ) , tj. Centrální momenty k µ k ( X ) = E ⎡( X − EX ) ⎤ , k =1,2, ... , ⎣ ⎦ Centrální momenty se počítají s použitím vzorců ⎧ ∑ ( xi − EX )k P ( xi ) ⎪⎪ i µk ( X ) = ⎨ ∞ ⎪ ∫ ( x − EX )k f ( x) dx ⎪⎩ −∞ pro diskrétní veličiny, (5.10) pro abs. spojité veličiny. Nutnou podmínkou pro existenci centrálních momentů je absolutní konvergence řady, resp. integrálu, na pravé straně vzorců (5.10). Mezi centrálními a obecnými momenty existuje jednoduchý vztah. Zřejmě platí ⎛k⎞ ⎛k⎞ k k −i k −i µ k ( X ) = E ⎡( X − EX ) ⎤ = ∑ ⎜ ⎟ ( −EX ) E ( X i ) = ∑ ⎜ ⎟ ( −EX ) µi′( X ). k ⎣ ⎦ k i =0 ⎝i⎠ i =0 ⎝i⎠ Vzhledem k tomu, že µ1′( X ) = EX , můžeme souvislost mezi centrálními a obecnými momenty popsat takto k µ k ( X ) = ∑ ( −1) i=2 k −i ⎛k⎞ k −i k −1 k ⎜ ⎟ [ µ1′( X ) ] µi′( X ) + ( −1) (k − 1) [ µ1′( X ) ] . ⎝i⎠ Každý centrální moment lze tedy vyjádřit pomocí obecných momentů. Pro centrální momenty prvních čtyř řádů tedy platí: µ1 ( X ) = 0, µ 2 ( X ) = µ 2′ ( X ) − [ µ1′( X ) ] = E( X 2 ) − ( EX ) , 2 2 µ3 ( X ) = µ3′ ( X ) − 3µ 2′ ( X ) µ1′( X ) + 2 [ µ1′( X ) ] , 3 µ 4 ( X ) = µ 4′ ( X ) − 4µ3′ ( X ) µ1′( X ) + 6µ 2′ ( X ) [ µ1′( X ) ] − 3[ µ1′( X ) ] . 2 4 77 Z uvedeného vyplývá, že centrální moment 2. řádu µ 2 ( X ) náhodné veličiny X je rozptylem DX této veličiny. Při popisu tvaru rozdělení náhodné veličiny lze využít tzv. normovaných momentů. Tyto momenty jsou definovány pro normovanou náhodnou veličinu U= Normované momenty X − EX . DX Normovaným momentem k-tého řádu µ k* náhodné veličiny X k nazýváme střední hodnotu veličiny U , tj. µ k∗ ( X ) = E(U k ), k = 1, 2, ... . Normované momenty se počítají pomocí vzorců typu (5.9), místo náhodné veličiny X se uvažuje normovaná náhodná veličina U. Normované momenty, a tedy i charakteristiky na nich založené, jsou bezrozměrná čísla. Koeficient šikmosti Praktický význam mají normované momenty µ3∗ ( X ) a µ 4∗ ( X ). Normovaný moment 3. řádu nazýváme koeficientem šikmosti (asymetrie) . V praxi se určuje podle vzorce µ3∗ ( X ) = µ3 ( X ) µ3 ( X ) . = µ 2 ( X ) µ 2 ( X ) DX DX U symetrického rozdělení je koeficient šikmosti roven nule. Jeho absolutní hodnota je tím vyšší, čím má rozdělení větší asymetrii. Znaménko koeficientu šikmosti udává typ zešikmení, tj. zda jde o kladně nebo záporně zešikmené rozdělení (viz obr. 5.1). Koeficient špičatosti Normovaný moment 4. řádu nazýváme zpravidla koeficientem špičatosti. Pro výpočet tohoto koeficientu se užívá vzorce µ 4∗ ( X ) = µ4 ( X ) [ µ 2 ( X )] 2 = µ4 ( X ) (DX ) 2 . Takto definovaný koeficient špičatosti je bezrozměrné nezáporné číslo. Jeho hodnota je mírou špičatosti rozdělení. Někdy se koeficient špičatosti definuje výrazem µ 4∗ ( X ) − 3. Je tomu tak proto, že špičatost uvažovaného rozdělení porovnáváme obvykle se špičatostí normálního rozdělení a pro normální rozdělení je hodnota výrazu µ 4∗ ( X ) − 3 nulová. Příklad 5.5. Náhodná veličina X má hustotu f ( x) = 1 −| x| e 2 pro − ∞ < x < ∞. Určete momentové charakteristiky úrovně, variability, šikmosti a špičatosti této veličiny. Řešení. Nejprve určíme obecné momenty prvních čtyř řádů. 78 ∞ 1 µ1′( X ) = EX = ∫ xe−| x| dx = 0 (integrand je funkce lichá), 2 −∞ µ 2′ ( X ) = ∞ ∞ 1 x 2 e −| x| dx = ∫ x 2 e − x dx = Γ(3) = 2, ∫ 2 −∞ 0 ∞ 1 µ3′ ( X ) = ∫ x3e−| x| dx = 0, 2 −∞ µ 4′ ( X ) = ∞ ∞ 1 x 4 e −| x| dx = ∫ x 4 e − x dx = Γ(5) = 24. ∫ 2 −∞ 0 Vzhledem k tomu, že EX = 0, jsou obecné momenty zároveň momenty centrálními, a proto DX = 2, µ3∗ ( X ) = 0, µ 4∗ ( X ) − 3 = P (x) 24 − 3 = 3. 22 P (x) a) b) x x Obr. 5.1. Grafy záporně (a) a kladně (b) zešikmeného rozdělení Poznámka. Při výpočtu obecných momentů jsme použili Γ funkce, která je definována vztahem ∞ Γ(t ) = ∫ xt −1e − x dx. 0 Γ funkce má tyto základní vlastnosti: a) Γ(1) = Γ(0) = 1; b) pro t > 0 platí Γ(t + 1) = tΓ(t ); je-li speciálně t přirozené číslo, pak Γ(t + 1) = t ! ; 1 c) Γ( ) = π . 2 Kontrolní úkol 5.6. Určete hodnoty koeficientů šikmosti a špičatosti pro náhodnou veličinu mající Poissonovo rozdělení s parametrem λ. 5.5. Kvantilové a jiné charakteristiky V některých případech jsou pro popis rozdělení náhodné veličiny výhodnější charakteristiky kvantilové. Jde především o takové případy, kdy uvažovaná náhodná veličina nemá momentové charakteristiky (střední 79 hodnotu, rozptyl), tj. kdy řady, resp. integrály, ve vzorcích pro momentové charakteristiky nejsou absolutně konvergentní. Nechť F(x) je distribuční funkce náhodné veličiny X. Zavedeme funkci F předpisem −1 F −1 (α ) = inf { x; F ( x) ≥ α } , 0 < α < 1. Kvantily Funkci F −1 nazýváme kvantilovou funkcí odpovídající distribuční funkci F. Hodnoty F −1 (α ) se nazývají 100α procentní kvantily a značí se zpravidla symbolem xα . Je-li distribuční funkce F rostoucí a spojitá, pak funkce F −1 je inverzní funkcí k F a kvantily se určují ze vztahu F ( xα ) = α . Medián Nejznámější kvantilovou charakteristikou úrovně je medián. Je to 50 %-ní kvantil x0,50 , který budeme dále značit x. Medián x je taková hodnota náhodné veličiny X, pro níž platí 1 F ( x) ≤ , 2 Kvartily, decily, percentily (5.11) 1 lim F (u ) ≥ . u→ x+ 2 V obecném případě není medián těmito podmínkami jednoznačně určen. Pokud je ovšem distribuční funkce F(x) rostoucí a spojitá, platí 1 F ( x) = . U symetrického rozdělení je medián zřejmě roven střední 2 hodnotě za předpokladu, že střední hodnota existuje. Mediánu se někdy dává přednost před střední hodnotou proto, že jeho hodnota je přirozeně interpretovatelná. Hodnota mediánu nezávisí na extrémních hodnotách náhodné veličiny. K charakterizaci úrovně náhodné veličiny se v praxi dosti často používají také kvartily ( x0,25 , x0,75 ), decily xk /10 (k = 1, 2, ... , 9) a percentily xk /100 (k = 1, 2, ... , 99). Z kvantilových charakteristik variability uvedeme pouze kvartilovou Kvartilová odchylka odchylku. Kvartilová odchylka náhodné veličiny X je definována pomocí dolního kvartilu x0,25 a horního kvartilu x0,75 takto 1 ( x0,75 − x0,25 ). 2 Této charakteristiky se užívá zřídka; je užitečná jen v těch případech, kdy sledovaná náhodná veličina nemá rozptyl (má nekonečně velký rozptyl). Q( X ) = Kvantilovými charakteristikami šikmosti a špičatosti rozdělení se zabývat nebudeme, protože se jich užívá v teorii pravděpodobnosti jen ojediněle. Modus Z ostatních charakteristik úrovně náhodné veličiny X je nejdůležitější modus, který se obvykle značí symbolem xˆ. V případě diskrétní veličiny udává modus její nejpravděpodobnější hodnotu. Jestliže diskrétní veličina může nabývat hodnot x1 , x2 , ... , pak pro její modus platí P ( xˆ ) ≥ P ( xi ), i = 1, 2, ... . 80 Má-li náhodná veličina X absolutně spojité rozdělení s hustotou f(x), potom se za její modus považuje taková hodnota x̂ , pro kterou platí f ( xˆ ) ≥ f ( x), -∞ <x <∞. Je důležité si uvědomit, že ani modus nemusí být určen jednoznačně. Příklad 5.6. Určete medián a modus náhodné veličiny X, jež má hustotu f ( x) = 1 π 1 + x2 ( pro − ∞ < x < ∞. ) Řešení. Uvažovaná náhodná veličina nemá ani střední hodnotu, ani rozptyl. Distribuční funkce této veličiny má tvar x F ( x) = 1 ∫ π (1 + t 2 −∞ 1 1 dt = + arctg x . 2 π ) Medián určíme podle (5.11) z rovnice 1 1 1 + arctgx = , 2 π 2 jejímž řešením je x = 0. Modus stanovíme z podmínek pro maximum hustoty rozdělení pravděpodobností xˆ ⎛ 2⎞ f ′( xˆ ) = ⎜ − ⎟ ⎝ π ⎠ 1 + xˆ 2 ( ) 2 = 0, 2 2 2 2 ⎛ 2 ⎞ (1 + xˆ ) − 4 xˆ (1 + xˆ ) f ′′( xˆ ) = ⎜ − ⎟ < 0. 4 2 ⎝ π⎠ ˆ 1+ x ( ) Uvedené podmínky splňuje xˆ = 0. Kontrolní úkol 5.7. Určete medián náhodné veličiny X s hustotou f ( x) = 1 2 ⎛ 1 ⎞ x exp ⎜ − x 2 ⎟ pro − ∞ < x < ∞. 2π ⎝ 2 ⎠ 5.6. Charakteristiky náhodných vektorů Budeme se především zabývat číselnými charakteristikami dvourozměrného náhodného vektoru (X, Y). Tyto charakteristiky můžeme pro větší přehlednost rozdělit do tří skupin. A. Marginální charakteristiky Marginální charakteristiky podávají informaci o vlastnostech marginálního rozdělení veličiny X, resp. veličiny Y. Jsou totožné s charakteristikami jednorozměrné veličiny a platí pro ně také stejné vztahy. Střední hodnota náhodné veličiny X se tedy počítá podle vztahů 81 ⎧ ∑ xi P1 ( xi ) pro diskrétní veličinu, ⎪⎪ i EX = ⎨ ∞ ⎪ ∫ xf1 ( x) dx pro abs. spojitou veličinu. ⎪⎩ −∞ K výpočtu rozptylu náhodné veličiny X se užívá vztahů ⎧ ∑ ( xi − EX )2 P1 ( xi ) pro diskrétní veličinu, ⎪⎪ i DX = ⎨ ∞ ⎪ ∫ ( x − EX )2 f1 ( x) dx pro abs. spojitou veličinu. ⎪⎩ −∞ Obdobné vzorce platí i pro náhodnou veličinu Y. Nutnou podmínkou pro existenci marginální střední hodnoty i rozptylu je absolutní konvergence řady nebo integrálu na pravé straně odpovídajících vzorců. B. Podmíněné charakteristiky Tyto charakteristiky popisují tvar podmíněného rozdělení veličiny X, resp. veličiny Y. Uvedeme opět jen vztahy pro výpočet podmíněné střední hodnoty a podmíněného rozptylu náhodné veličiny X za podmínky, že náhodná veličina Y nabývá hodnoty y. ⎧ ∑ xi P ( xi | Y = y ) pro diskrétní veličinu, ⎪⎪ i E( X | Y = y) = ⎨ ∞ ⎪ ∫ xf ( x | Y = y ) dx pro abs. spojitou veličinu. ⎪⎩ −∞ ⎧ ⎡ x − E ( X | Y = y ) ⎤ 2 P ( x | Y = y ) pro diskrétní veličinu, i ⎣ i ⎦ ⎪∑ ⎪ i D( X | Y = y ) = ⎨ ∞ 2 ⎪ ⎡ x − E ( X | Y = y ) ⎤ f ( x | Y = y ) dx pro spojitou veličinu. ⎣ ⎦ ∫ ⎪⎩ −∞ Obdobně jsou definovány i podmíněné charakteristiky E(Y | X = x) a D(Y | X = x). O existenci podmíněných charakteristik platí totéž co v případě marginálních charakteristik. C. Charakteristiky vztahu mezi náhodnými veličinami Uvažujeme vztah mezi dvěma náhodnými veličinami X a Y. Do této skupiny charakteristik patří zejména kovariance cov ( X , Y ) a korelační koeficient ρ ( X , Y ). Kovariance náhodných veličin X, Y je definována jako střední Kovariance hodnota součinu odchylek veličin X, Y od jejich středních hodnot, tj. náhodných veličin cov( X , Y ) = E ⎡⎣( X − EX )(Y − EY ) ⎤⎦ . Pro numerický výpočet kovariance je ovšem vhodnější vzorec 82 cov( X , Y ) = E ( XY ) − EX EY , (5.12) který se odvodí podobným postupem jako vzorec (5.8) pro výpočet rozptylu. Kovariance může nabývat libovolné hodnoty z intervalu ( −∞, ∞ ) a je pouze pomocným ukazatelem pro měření intenzity vazby mezi dvěma veličinami. Mírou těsnosti lineárního vztahu mezi náhodnými veličinami X, Y je korelační koeficient, jenž je definován jako podíl kovariance a součinu směrodatných odchylek obou veličin ρ ( X ,Y ) = Korelační koeficient cov( X , Y ) . σ X σY Korelační koeficient nabývá hodnot z intervalu < −1,1 > . Je-li jeho absolutní hodnota rovna 1, jde o lineární závislost mezi oběma sledovanými náhodnými veličinami. Platí | ρ ( X , Y ) |= 1 ⇔ P(Y = a + bX ) = 1, kde a, b jsou konstanty, přitom b > 0 v případě ρ ( X , Y ) = +1 a b < 0 v případě ρ ( X , Y ) = −1. Pokud platí ρ ( X , Y ) = 0, jsou náhodné veličiny X a Y lineárně nezávislé (nekorelované). Nulová hodnota korelačního koeficientu tedy neznamená obecnou nezávislost uvažovaných náhodných veličin. Rozdělení n-rozměrného náhodného vektoru ( X 1 , X 2 , ... , X n ) se zpravidla popisuje dvěma charakteristikami: a) vektorem středních hodnot ( EX 1 , EX 2 , ... , EX n ) , ⎛ c11 c12 ⎜ c c b) kovarianční (varianční) maticí ⎜ 21 22 ⎜ ⎜⎜ ⎝ cn1 cn 2 c1n ⎞ ⎟ c2n ⎟ . ⎟ ⎟ cnn ⎟⎠ Kovarianční matice Varianční matice Kovarianční matice je symetrická. Na její hlavní diagonále jsou rozptyly jednotlivých složek cii = DX i , i = 1, 2, ... , n, a pro ostatní prvky matice platí cij = cov( X i , X j ), i ≠ j; i, j = 1, 2, …, n. Příklad 5.7. Dvourozměrný náhodný vektor ( X 1 , X 2 ) má hustotu π π ⎧ ⎪0,5 sin ( x1 + x2 ) pro 0 ≤ x1 ≤ , 0 ≤ x2 ≤ , f ( x1 , x2 ) = ⎨ 2 2 ⎪⎩ 0 pro ostatní hodnoty x1 , x2 . Určete kovarianční matici. Řešení. Pro střední hodnotu náhodné veličiny X 1 platí 83 π π ⎡ π2 ⎤ 2 ⎡ ⎤ π⎞ ⎢ ⎥ ⎛ EX 1 = 0,5 ∫ x1 ⎢ ∫ sin ( x1 + x2 ) dx2 ⎥ dx1 = 0,5∫ x1 ⎢ −cos ⎜ x1 + ⎟ + cos x1 ⎥ dx1 = 2⎠ ⎝ ⎣ ⎦ 0 0 ⎢0 ⎥ ⎣ ⎦ 2 = π 0, 785. 4 Podobně pro rozptyl náhodné veličiny X 1 dostaneme podle (5.8) π ⎡ π2 ⎤ π2 ⎥ 2 ⎢ = DX 1 = 0,5 ∫ x1 ⎢ ∫ sin ( x1 + x2 ) dx2 ⎥dx1 − 16 0 ⎢⎣ 0 ⎥⎦ 2 π ⎡ ⎤ π⎞ π2 π2 π ⎛ = 0,5∫ x ⎢ −cos ⎜ x1 + ⎟ + cos x1 ⎥ dx1 − = + −2 2⎠ 16 16 2 ⎝ ⎣ ⎦ 0 2 2 1 0,188. Ze symetrie hustoty f ( x1 , x2 ) vzhledem k proměnným x1 , x2 plyne EX 2 = EX 1 , DX 2 = DX 1. Pro kovarianci cov( X 1 , X 2 ) platí podle (5.12) π ⎡ π2 ⎤ π2 ⎢ ⎥ = cov( X 1 , X 2 ) = 0,5∫ x1 ⎢ ∫ x2sin ( x1 + x2 ) dx2 ⎥dx1 − 16 0 ⎢⎣ 0 ⎥⎦ 2 π ⎡ ⎛ π⎞ π π ⎞⎤ π2 π π2 ⎛ = 0,5 ∫ x1 ⎢sin ⎜ x1 + ⎟ − sin x1 − cos ⎜ x1 + ⎟ ⎥dx1 − = −1− 2⎠ 2 2 ⎠⎦ 16 2 16 ⎝ ⎣ ⎝ 0 2 −0, 046. ⎛ 0,188 −0, 046 ⎞ Hledaná kovarianční (varianční) matice má tedy tvar ⎜ ⎟. ⎝ −0, 046 0,188 ⎠ Pojmy k zapamatování: • momenty obecné • střední hodnota • momenty centrální • rozptyl (disperze, variance) • směrodatná odchylka • momenty normované • koeficient šikmosti • koeficient špičatosti • kvantily • medián • kvartily dolní a horní • decily 84 • • • • • • percentily kvartilová odchylka modus kovariance korelační koeficient kovarianční matice Shrnutí: V úvodním odstavci uvádíme klasifikaci číselných charakteristik náhodné veličiny ze dvou hledisek: podle vlastnosti, kterou popisují, a podle způsobu konstrukce (výpočtu). Následují definice nejužívanějších číselných charakteristik. Největší pozornost přitom věnujeme střední hodnotě, rozptylu, mediánu a modu náhodné veličiny. Dokazujeme základní vlastnosti střední hodnoty a rozptylu, abyste mohli počítat jejich hodnoty i pro jednoduché funkce náhodných veličin. Na závěr uvádíme přehled základních číselných charakteristik náhodného vektoru a charakteristiky vztahu (intenzity vztahu) mezi náhodnými veličinami (kovariance, korelační koeficient, kovarianční matice). 85 86 6. ROZDĚLENÍ DISKRÉTNÍHO TYPU Po prostudování této kapitoly: • pochopíte pojem Bernoulliovy pokusy (Bernoulliovo schéma pokusů), • seznámíte se s nejčastěji používanými rozděleními diskrétního typu a jejich vlastnostmi (zejména číselnými charakteristikami), • naučíte se řešit úlohy, v nichž vystupují diskrétní náhodné veličiny. V této kapitole se budeme zabývat pouze nejdůležitějšími typy rozdělení pravděpodobnosti jednorozměrné diskrétní náhodné veličiny, a to takovými, které se používají nejčastěji. S definicí a vlastnostmi jiných rozdělení diskrétního typu se můžete seznámit např. v monografiích [1,2]. 6.1. Bernoulliovy pokusy V teorii pravděpodobnosti má velký význam jednoduché schéma náhodných pokusů, které se nazývá Bernoulliovy pokusy. Klasicky je můžeme definovat takto: Bernoulliovy pokusy (Bernoulliovo schéma) představují takovou sérii (posloupnost) nezávislých pokusů se dvěma možnými výsledky (úspěch a neúspěch), že pravděpodobnost úspěchu se nemění při přechodu od jednoho pokusu k pokusu dalšímu. Podle uvedené definice lze rozhodnout, v jakých konkrétních situacích jde o Bernoulliovy pokusy. Bernoulliovými pokusy jsou např. házení mincí (úspěchem je např. padnutí rubu mince), náhodný výběr s vracením (úspěchem je vybrání prvku zvoleného druhu) nebo pozorování počasí každoročně v určitý den roku (úspěchem je např. počasí beze srážek). Definici Bernoulliových pokusů však nevyhovují např. tyto pokusy: házení různě deformovanými mincemi, náhodný výběr bez vracení nebo každodenní sledování počasí během určitého období. V prvních dvou případech se mění pravděpodobnost úspěchu při přechodu od jednoho pokusu k druhému a v posledním případě je narušena podmínka nezávislosti jednotlivých pokusů. Pro rozvíjení teorie pravděpodobnosti je přirozeně vhodnější definice založená na pojmu pravděpodobnostního prostoru. V případě jediného pokusu se dvěma možnými výsledky se prostor elementárních jevů skládá ze dvou prvků. Jeden z těchto prvků nazveme "úspěchem" a označíme jej jedničkou, druhý nazveme "neúspěchem" a označíme jej nulou. Je-li pravděpodobnost úspěchu p, tj. P (1) = p, pak pravděpodobnost neúspěchu je q = 1 − p , a tedy P (0) = q = 1 − p. 87 Bernoulliovy pokusy V případě n nezávislých pokusů je příslušný prostor elementárních jevů Ω součinem n prostorů {0,1} . Skládá se ze všech n-členných posloupností E = (ω1 , ω 2 , ... , ω n ) , kde ωi ∈ {0,1} , i = 1, 2, ... , n. Z uvedeného je zřejmé, že symbol ωi reprezentuje výsledek i-tého pokusu. Při určování pravděpodobností příslušejících jednotlivým posloupnostem náhodných pokusů je třeba každé jedničce v uvažované posloupnosti přiřadit pravděpodobnost p, každé nule pravděpodobnost q a tyto pravděpodobnosti spolu vynásobit. Počet jedniček (úspěchů) v posloupnosti E budeme označovat symbolem k(E). Na základě předcházejících úvah můžeme Bernoulliovy pokusy definovat takto: Bernoulliovými pokusy nazýváme pravděpodobnostní prostor ( Ω, À, P ) , kde platí Ω = {0,1} × {0,1} × ... × {0,1} n -krát a pro libovolné E P ( E ) = p k ( E ) q n − k ( E ) , 0 ≤ p ≤ 1, q = 1 − p. Definice založená na pojmu pravděpodobnostního prostoru je vhodná pro teoretické závěry, nedává však návod, jak rozpoznat v praxi Bernoulliovy pokusy. 6.2. Binomické rozdělení Předpokládejme, že se provede n nezávislých pokusů, přičemž pravděpodobnost úspěchu v každém jednotlivém pokusu je konstantní a rovna p. Hledejme rozdělení diskrétní náhodné veličiny X, která udává celkový počet úspěchů (nezávisle na pořadí) v sérii n Bernoulliových pokusů. Počet úspěchů může být zřejmě roven 0, 1,..., n. Pro odpovídající pravděpodobnosti platí následující věta. Věta 6.1. Pravděpodobnost P(X = k) toho, že série n Bernoulliových pokusů s pravděpodobností úspěchu p vede k-krát k úspěchu a (n - k)-krát k neúspěchu je dána vztahem ⎛ n⎞ ⎛ n⎞ n−k P ( X = k ) = ⎜ ⎟ p k (1 − p ) = ⎜ ⎟ p k q n − k . ⎝k⎠ ⎝k⎠ (6.1) Důkaz. Vyjdeme z definice Bernoulliových pokusů uvedené na konci předchozího odstavce. Naším úkolem je v podstatě určit, kolika způsoby je možné dosáhnout k úspěchů v n nezávislých pokusech, tj. kolik existuje takových elementárních jevů, pro něž platí X = k. Hledaný počet je zřejmě ⎛ n⎞ , roven kombinačnímu číslu ⎜ ⎟ , čímž je tvrzení dokázáno. ⎝k⎠ 88 Náhodná veličina X, jejíž rozdělení je popsáno pravděpodobnostní funkcí ⎧⎛ n ⎞ k p (1 − p ) n − k pro k = 0,1, ... , n, ⎪ P (k ) = ⎨⎜⎝ k ⎟⎠ ⎪ 0 pro ostatní k , ⎩ (6.2) má binomické rozdělení s parametry n a p, což zapisujeme symbolicky ve tvaru X ∼ Bi ( n, p ) . Funkce P (k ), definovaná vztahem (6.2), splňuje podmínky pro pravděpodobnostní funkci, protože platí a) P (k ) > 0 pro k = 0,1, ... , n; n n ⎛ n⎞ n−k = P k ( ) ∑ ⎜ ⎟ p k (1 − p ) = ⎣⎡(1 − p ) + p ⎦⎤ = 1. ∑ k =0 k =0 ⎝ k ⎠ n b) Hodnoty pravděpodobnostní funkce pro n = 5 a vybrané hodnoty p jsou znázorněny na obr. 6.1. P ( k) p = 0,1 p = 0,5 p = 0,9 0,6 0,4 0,2 0 0 1 2 3 4 k 5 Obr. 6.1. Rozdělení náhodné veličiny X ∼ Bi ( 5, p ) Odvodíme vztahy pro střední hodnotu a rozptyl náhodné veličiny X ∼ Bi ( n, p ) . Uvažme nejprve náhodné veličiny X i , i = 1, 2, … , n, definované takto: ⎧ 1, jestliže i -tý pokus skončil úspěchem, Xi = ⎨ ⎩0, jestliže i -tý pokus skončil neúspěchem. Pro tyto veličiny zřejmě platí EX 1 = EX 2 = ... =EX n = 1. p + 0. (1 − p ) = p, ( ) ( ) ( ) = E ( X ) − ( EX ) E X 12 = E X 22 = ... =E X n2 = 12. p + 02. (1 − p ) = p, DX 1 = DX 2 = ... =DX n 2 i i 2 = p (1 − p ) = pq. Sledovaná náhodná veličina X je součtem sdruženě nezávislých veličin X 1 , X 2 , ... , X n . Proto lze psát 89 Binomické rozdělení ⎛ n ⎞ n EX = E ⎜ ∑ X i ⎟ = ∑ EX i = np, ⎝ i =1 ⎠ i =1 ⎛ n ⎞ n DX = D ⎜ ∑ X i ⎟ = ∑ DX i = np (1 − p ) = npq. ⎝ i =1 ⎠ i =1 Binomické rozdělení je plně určeno dvěma parametry: počtem pokusů n a pravděpodobností úspěchu p při jednom pokusu. V aplikacích bývá obvykle n známé, za p se dosazuje relativní četnost úspěchů při dostatečně velkém počtu nezávislých pokusů. V praxi nás často zajímá, čemu je roven nejpravděpodobnější počet úspěchů k̂ v sérii n Bernoulliových pokusů. Přímo ze vztahu (6.1) plyne ( n + 1) p − k , P( X = k ) = 1+ P ( X = k − 1) kq takže P ( X = k ) > P( X = k − 1) pro k < ( n + 1) p, P ( X = k ) < P ( X = k − 1) pro k > ( n + 1) p, P ( X = k ) = P( X = k − 1) pro k = ( n + 1) p, je-li ( n + 1) p celé číslo. Nejpravděpodobnější počet úspěchů k̂ musí tedy splňovat podmínku ( n + 1) p − 1 = np − q ≤ kˆ ≤ ( n + 1) p = np + p. (6.3) Příklady 6.1. Pravděpodobnost zásahu cíle jedním výstřelem je rovna 1 . Jaká je 8 pravděpodobnost toho, že z 12 výstřelů nezasáhne ani jeden cíl? Řešení. Náhodná veličina X, která udává počet zásahů cíle, má rozdělení Bi(12, 1 ). Proto podle vzorce (6.1) platí 8 0 12 ⎛12 ⎞ ⎛ 1 ⎞ ⎛ 7 ⎞ P ( X = 0) = ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ 0, 2014. ⎝ 0 ⎠⎝ 8 ⎠ ⎝ 8 ⎠ 6.2. Provádí se 6 nezávislých pokusů. Pravděpodobnost nastoupení jevu A je pro všechny pokusy stejná a rovna 0,2. Určete nejpravděpodobnější počet nastoupení jevu A. Řešení. V tomto případě máme n = 6; p = 0,2; q = 0,8. Po dosazení do vztahu (6.3) dostaneme 6 ⋅ 0, 2 − 0,8 ≤ kˆ ≤ 6 ⋅ 0, 2 + 0, 2 neboli 0, 4 ≤ kˆ ≤ 1, 4. Odtud vyplývá, že nejpravděpodobnější počet nastoupení jevu A je 1. 90 Kontrolní úkoly 6.1. V přístroji je zamontováno 10 tranzistorů. Pravděpodobnost toho, že každý jednotlivý tranzistor bude pracovat bez poruchy v průběhu roku, je rovna p. Jaká je pravděpodobnost toho, že v průběhu roku • bude mít poruchu alespoň jeden tranzistor, • budou mít poruchu právě dva tranzistory? 6.2. Při realizaci určitého pokusu je pravděpodobnost dosažení požadovaného výsledku rovna 0,1. Kolikrát je nutno pokus opakovat, aby bylo možno s pravděpodobností 0,5 očekávat dosažení tohoto výsledku aspoň jednou? 6.3. Poissonovo rozdělení Při praktických aplikacích binomického rozdělení nás obvykle zajímají pravděpodobnosti P ( a ≤ X ≤ b) = ∑ a ≤ k ≤b P( X = k ) = ⎛ n⎞ ∑ ⎜ k ⎟p q a ≤ k ≤b ⎝ ⎠ k n−k . (6.4) Pro velká n, a, b je výpočet součtů typu (6.4) velmi složitý. Bylo by proto vhodné, kdyby byly k dispozici tabulky pro vyčíslení těchto součtů. Zřejmě platí P (a ≤ X ≤ b) = P(0 ≤ X ≤ b) − P(0 ≤ X ≤ a − 1), takže úplně postačí sestavit tabulky pro výpočet P (0 ≤ X ≤ b). Tato pravděpodobnost závisí na hodnotách n, p, b a tabulky musí mít tedy tři vstupy. Z uvedeného vyplývá, že takové tabulky jsou příliš objemné a pro praxi nepohodlné. V praxi se uplatňují některé aproximace binomického rozdělení, které se dostanou při různých předpokladech o parametrech n, p. Takové aproximace jsou dvě: Moivreova-Laplaceova a Poissonova. Nyní se budeme zabývat jednodušší, i když historicky pozdější, aproximací Poissonovou, jež se týká případu, kdy počet pokusů n je veliký a pravděpodobnost úspěchu p malá, přičemž hodnota součinu np je konstantní. Poissonovu aproximaci nelze formulovat pomocí jedné série Bernoulliových pokusů. Je třeba uvažovat posloupnost sérií Bernoulliových pokusů: v první sérii je pouze jeden pokus (n = 1) s pravděpodobností úspěchu p1 , ve druhé sérii jsou dva nezávislé pokusy (n = 2) s pravděpodobností úspěchu p2 , ... , v n-té sérii je n nezávislých pokusů s pravděpodobností úspěchu pn . Sledovanými náhodnými veličinami jsou počty úspěchů v jednotlivých sériích, označíme je postupně X 1 , X 2 , ... , X n . Věta 6.2 (Poissonova věta). Nechť pn → 0 pro n → ∞ a přitom npn → λ , kde λ je pevně zvolené nezáporné číslo. Potom pro libovolné k = 0, 1, … platí 91 P( X n = k ) → λk k! e − λ pro n → ∞. Důkaz. Vyjdeme z předpokladu pn = λ ⎛1⎞ ⎛1⎞ + o ⎜ ⎟ , kde symbolem o ⎜ ⎟ n ⎝n⎠ ⎝n⎠ vyjadřujeme, že λ⎞ ⎛1⎞ ⎛ ⎜ pn − ⎟ ⎜ ⎟ → 0 pro n → ∞. Pak můžeme psát n⎠ ⎝n⎠ ⎝ ⎛ n⎞ n−k P ( X n = k ) = ⎜ ⎟ pnk (1 − pn ) = ⎝k⎠ n ( n − 1) ... ( n − k + 1) ⎡ λ ⎛ 1 ⎞⎤ = + o ⎜ ⎟⎥ ⎢ k! ⎝ n ⎠⎦ ⎣n k ⎡ λ ⎛ 1 ⎞⎤ ⎢1 − n − o ⎜ n ⎟ ⎥ ⎝ ⎠⎦ ⎣ n−k . Pro n → ∞ máme k ⎡λ ⎛ 1 ⎞⎤ n ( n − 1) ... ( n − k + 1) ⎢ + o ⎜ ⎟ ⎥ = ⎝ n ⎠⎦ ⎣n n ( n − 1) ... ( n − k +1) k ⎡⎣1 + o (1) ⎤⎦ → λ k ; = λk k n ⎡ λ ⎛ 1 ⎞⎤ ⎢1 − n − o ⎜ n ⎟ ⎥ ⎝ ⎠⎦ ⎣ n−k → e−λ , z čehož okamžitě plyne tvrzení věty 6.2. , Aproximace binomického rozdělení, kterou dává Poissonova věta, není zvlášť dobrá. Tutubalin [20] považuje Poissonovu větu za výbornou v tom smyslu, že její tvrzení zůstává v platnosti, i když jsou porušeny její předpoklady. Formálně se vztahuje k Bernoulliovým pokusům, lze však dost silně porušit podmínky Bernoulliova schématu (připustit proměnnou pravděpodobnost úspěchu a dokonce nepříliš silnou závislost jednotlivých pokusů), aniž se poruší závěr Poissonovy věty. Náhodná veličina X, jejíž rozdělení je popsáno pravděpodobnostní funkcí ⎧ λ k −λ ⎪ e pro k =0,1, ... , λ > 0, P (k) = ⎨ k! ⎪0 pro ostatní hodnoty k . ⎩ Poissonovo rozdělení (6.5) má Poissonovo rozdělení s parametrem λ , což zapisujeme symbolicky ve tvaru X ∼ Po ( λ ) . Uvedená pravděpodobnostní funkce splňuje skutečně podmínky kladené na pravděpodobnostní funkci, neboť a) je-li λ > 0, pak P (k ) > 0 pro k = 0,1, ... ; 92 b) ∞ ∞ λk k =0 k =0 k! ∑ P (k ) = ∑ e − λ = e − λ eλ = 1. Na obr. 6.2 je pro ilustraci znázorněno polygonem rozdělení náhodné veličiny X ∼ Po ( 0,1) . P ( k) 1,0 0,8 0,6 0,4 0,2 0 0 1 2 3 4 k 5 Obr. 6.2. Rozdělení náhodné veličiny X ∼ Po ( 0,1) Pro střední hodnotu náhodné veličiny X ∼ Po ( λ ) platí ∞ λk k =0 k! EX = ∑ k = λe −λ ∞ ∞ λk k =1 k! e− λ = ∑ k λm ∞ e− λ = λ e− λ ∑ k =1 λ k −1 ( k − 1)! = ∑ m ! = λ e λ eλ = λ . − m =0 ( ) Analogicky odvodíme E X 2 = λ 2 + λ , takže pro rozptyl sledované náhodné veličiny dostaneme ( ) DX = E X 2 − ( EX ) = λ 2 + λ − λ 2 = λ. 2 Poissonova rozdělení užíváme v praxi k aproximaci binomického rozdělení v těch případech, kdy jsou splněny následující předpoklady: n > 30, p ≤ 0,1 a součin np je konstanta v rozmezí 0-10. Uvažované rozdělení má např. počet bakterií v kapce vody, počet onemocnění nějakou neinfekční chorobou v určité oblasti, atd. Poissonovým rozdělením se řídí také náhodná veličina, která má význam počtu výskytů sledovaného jevu v určitém časovém intervalu délky ∆t. Jestliže uvažovaný jev splňuje následující podmínky: a) jev může nastat v kterémkoliv časovém okamžiku, b) počet výskytů jevu během časového intervalu ∆t závisí jen na jeho délce a ne na jeho počátku, ani na tom, kolikrát jev nastoupil před jeho počátkem, c) pravděpodobnost, že jev nastoupil více než jednou v intervalu délky ∆t , konverguje k nule rychleji než ∆t , d) střední hodnota počtu výskytů jevu za časovou jednotku (intenzita výskytů jevu) je rovna právě λ , 93 pak příslušná náhodná veličina má rozdělení Po ( ∆t λ ) . Poissonovo rozdělení je tedy vhodné např. k popisu počtu dopravních nehod, počtu zákazníků v prodejně, počtu telefonních volání nebo počtu pozorovaných komet během nějakého časového intervalu. Poissonova rozdělení nelze použít tam, kde jde o silnou závislost výsledků jednotlivých pokusů. To platí např. pro počet nemocných nějakou infekční chorobou v uvažované oblasti nebo pro počet kupujících, kteří přišli do prodejny během jistého časového intervalu pro zboží, jehož je na trhu nedostatek. Příklad 6.3. Automatická telefonní ústředna spojuje za hodinu průměrně 540 hovorů. Jaká je pravděpodobnost toho, že během daného časového intervalu délky 1 minuta spojí právě 20 hovorů? Řešení. Náhodná veličina X, kterou je počet telefonních hovorů během intervalu délky 1 minuta, má zřejmě Poissonovo rozdělení s parametrem 1 .540 = 9. Hledaná pravděpodobnost je tedy 60 P ( X = 20) = 920 −9 e 20! 0, 000617. Kontrolní úkol 6.3. Přístroj sestává z 1000 elektronických prvků. Pravděpodobnost poruchy každého jednotlivého prvku v průběhu jednoho roku je rovna 0,001 a nezávisí na stavu ostatních prvků. Určete: • pravděpodobnost poruchy právě dvou prvků za rok, • pravděpodobnost poruchy alespoň dvou prvků za rok. 6.4. Jiná rozdělení A. Alternativní rozdělení Alternativní rozdělení Nejjednodušším rozdělením diskrétního typu je rozdělení alternativní. Náhodná veličina X nabývající dvou možných hodnot 1 a 0 má alternativní rozdělení, jestliže její rozdělení je popsáno vztahy P ( X = 1) = p, P ( X = 0 ) = 1 − p = q. B. Negativně binomické rozdělení Předpokládejme, že provádíme nezávislé pokusy a že pravděpodobnost úspěchu je pro všechny pokusy stejná a rovna p. Náhodnou veličinou X nechť je počet neúspěšných pokusů, které předcházejí n-tému úspěšnému pokusu. Z jednoduché kombinatorické úvahy vyplývá ⎛ k + n − 1⎞ n k P( X = k ) = ⎜ ⎟ p (1 − p ) . ⎝ k ⎠ Říkáme, že náhodná pravděpodobnostní funkcí veličina X, jejíž rozdělení ⎧⎛ k + n − 1⎞ n k p (1 − p ) pro k = 0,1, ... ; n > 0, ⎪⎜ ⎟ P ( k ) = ⎨⎝ k ⎠ ⎪ 0 pro ostatní k , ⎩ 94 je určeno (6.6) má negativně binomické rozdělení s parametry n, p. Čtenář se může snadno přesvědčit, že funkce (6.6) splňuje všechny podmínky kladené na pravděpodobnostní funkci. Negativně binomické rozdělení Pro číselné charakteristiky veličiny X s negativně binomickým rozdělením platí EX = n(1 − p) , p DX = n(1 − p) . p2 Uvedená interpretace negativně binomického rozdělení předpokládá, že parametr n je celé číslo. C. Geometrické rozdělení Toto rozdělení je speciálním případem negativně binomického rozdělení pro n =1. Říkáme tedy, že náhodná veličina X s pravděpodobnostní funkcí ⎧ p (1 − p ) k pro k = 0,1, 2, ... P (k ) = ⎨ 0 pro ostatní k ⎩ má geometrické rozdělení s parametrem p. Tuto náhodnou veličinu lze interpretovat jako počet provedených neúspěšných nezávislých pokusů do prvního úspěchu. Název geometrické vyplývá ze skutečnosti, že s rostoucím k hodnoty pravděpodobnostní funkce klesají řadou geometrickou. D. Hypergeometrické rozdělení Uvažujme náhodný výběr prvků nějakého souboru za předpokladu, že se žádný vybraný prvek nevrací zpět, tj. výběr bez vracení. Předpokládejme, že soubor o rozsahu N prvků obsahuje právě M prvků (M < N) se sledovaným znakem. Vybereme-li z tohoto souboru náhodně n ( n < N ) prvků bez vracení, pak pro náhodnou veličinu X, která udává počet vybraných prvků se sledovaným znakem, platí ⎛ M ⎞⎛ N − M ⎞ ⎜ ⎟⎜ ⎟ k ⎠⎝ n − k ⎠ ⎝ P( X = k ) = pro max(0, M − N + n) ≤ k ≤ min( M , n). ⎛N⎞ ⎜ ⎟ ⎝n⎠ Říkáme, že náhodná veličina X, jejíž rozdělení je popsáno pravděpodobnostní funkcí ⎧⎛ M ⎞ ⎛ N − M ⎞ ⎪⎜ ⎟ ⎜ ⎟ ⎪⎪ ⎝ k ⎠ ⎝ n − k ⎠ pro max(0, M − N + n) ≤ k ≤ min( M , n), (6.7) P (k ) = ⎨ ⎛N⎞ ⎜ ⎟ ⎪ ⎝n⎠ ⎪ ⎪⎩ 0 pro ostatní k , 95 Geometrické rozdělení Hypergeometrické rozdělení má hypergeometrické rozdělení. Střední hodnota a rozptyl takové veličiny X jsou M M ⎛ M ⎞ N −n , DX = n ⎜1 − ⎟ . N N⎝ N ⎠ N −1 Střední hodnota je zřejmě totožná se střední hodnotou pro rozdělení M Bi(n, p), kde p = . Rozptyl je roven součinu rozptylu pro zmíněné N binomické rozdělení a zlomku ( N − n ) ( N − 1) . Protože EX = n ( N − n ) ( N − 1) ≤ 1, je rozptyl v případě hypergeometrického rozdělení zpravidla menší než rozptyl pro odpovídající binomické rozdělení. Tato skutečnost má význam pro matematickou statistiku, neboť z ní plyne, že úsudky vytvořené na základě výběru bez vracení jsou přesnější než ty založené na výběru s vracením. Hypergeometrické rozdělení se uplatňuje především ve statistické kontrole jakosti. Když ze série N výrobků, mezi nimiž je M zmetků, vybereme náhodně n kusů, udává vztah (6.7) pravděpodobnost toho, že mezi vybranými kusy bude právě k zmetků. Dále se hypergeometrického rozdělení užívá jako pravděpodobnostního modelu některých her, např. Sportky nebo Matesa (N = počet všech čísel, M = počet vylosovaných čísel, n = počet vsazených čísel, k = počet uhodnutých čísel). E. Rovnoměrné diskrétní rozdělení Náhodná veličina X, jejíž rozdělení je dáno pravděpodobnostní funkcí ⎧1 ⎪ P (k ) = ⎨ m ⎪⎩ 0 Rovnoměrné diskrétní rozdělení pro k = 1, 2, ..., m, jinak, má rovnoměrné diskrétní rozdělení. Pro základní číselné charakteristiky takové veličiny X zřejmě platí EX = m +1 , 2 DX = m2 − 1 . 12 Příklad 6.4. Při sázení Matesa se vyznačí (vsadí) 5 z celkového počtu 35 čísel. Losování spočívá v tom, že se náhodně bez vracení vybere 5 vyhrávajících čísel. Určete pravděpodobnost výhry prvního pořadí v Matesu. Řešení. Náhodná veličina X, kterou je počet uhodnutých čísel na jedné sázence, má zřejmě hypergeometrické rozdělení. Protože N = 35, M = 5, n = 5, je pravděpodobnost výhry prvního pořadí ⎛ 5 ⎞ ⎛ 30 ⎞ ⎜ ⎟⎜ ⎟ 5 0 P ( X = 5) = ⎝ ⎠ ⎝ ⎠ ⎛ 35 ⎞ ⎜ ⎟ ⎝5⎠ 96 0, 0000031. Kontrolní úkol 6.4. Administrativní pracovnice podniku A volá ústřednu podniku B v době největšího zatížení linky, kdy je pravděpodobnost, že linka nebude obsazena, rovna 0,25. Jednotlivé pokusy o spojení opakuje po několika minutách tak dlouho, dokud nebude spojena. Určete pravděpodobnost toho, že dosáhne spojení až při pátém pokusu. Pojmy k zapamatování: • • • • • • • • Bernoulliovy pokusy (Bernoulliovo schéma) rozdělení alternativní rozdělení binomické rozdělení Poissonovo rozdělení negativně binomické rozdělení geometrické rozdělení hypergeometrické rozdělení rovnoměrné diskrétní Shrnutí: V této kapitole zavádíme pojem Bernoulliovy pokusy, a to jak intuitivně, tak striktní definicí. Následně podrobně rozebíráme dva nejvýznamnější typy rozdělení diskrétních náhodných veličin: binomické rozdělení a Poissonovo rozdělení. Závěrečný odstavec přináší stručný přehled jiných rozdělení diskrétního typu (alternativní, negativně binomické, geometrické, hypergeometrické a rovnoměrné). 97 98 7. ROZDĚLENÍ ABSOLUTNĚ SPOJITÉHO TYPU V této kapitole: • poznáte náhodné veličiny absolutně spojitého typu a jejich vlastnosti (zejména číselné charakteristiky), • seznámíte se s některými speciálními typy rozdělení spojitého typu, které hrají významnou roli ve statistice, • naučíte se řešit úlohy, v nichž vystupují absolutně spojité náhodné veličiny. V úvodním odstavci se budeme podrobně zabývat nejdůležitějším, v teorii i v praxi nejčastěji používaným, rozdělením spojitého typu – rozdělením normálním. Následující odstavce jsou věnovány exponenciálnímu rozdělení a rozdělení rovnoměrnému. S definicí a vlastnostmi jiných rozdělení absolutně spojitého typu se můžete seznámit např. v monografiích [1,2]. 7.1. Normální rozdělení Nejprve se budeme zabývat speciálním případem normálního rozdělení, tzv. normovaným normálním rozdělením. Říkáme, že náhodná veličina X má normované normální rozdělení, jestliže pro její hustotu platí f ( x) = 1 - x2 2 e 2π pro − ∞ < x < ∞. (7.1) Funkce (7.1) zřejmě splňuje základní požadavky kladené na hustotu rozdělení pravděpodobností, protože a) f ( x) > 0 pro − ∞ < x < ∞, ∞ b) ∫ f ( x) dx = −∞ 1 2π ∞ ∫e −∞ − x2 2 dx = 2 2π ∞ ∫e 0 − x2 2 dx = 1 π ∞ ∫t −1 2 − t e dt = 0 1 1 Γ( ) = 1. π 2 Při výpočtu integrálu jsme použili jednak toho, že hustota normovaného normálního rozdělení je funkce sudá, tj. f ( x) = f (− x) , jednak vlastností funkce G(viz poznámka k příkladu 5.5). Podobným postupem určíme i střední hodnotu a rozptyl veličiny s normovaným normálním rozdělením. 99 Normované normální rozdělení 1 EX = 2π DX = 1 2π ∞ ∫ xe − x2 2 dx = 0, −∞ ∞ ∫ 2 x 2 e − x 2 dx = −∞ ∞ 2 2 2 x 2 e − x 2 dx = ∫ π 2π 0 ∞ ∫t 1 2 −t e dt = 0 2 3 Γ( ) = 1. π 2 Normované normální rozdělení označujeme zpravidla symbolem N(0, 1), což značí, že jde o normální rozdělení s parametry EX = 0 a DX = 1. Gaussova křivka Hustota veličiny X ~ N(0, 1) je schematicky znázorněna na obr. 7.1. Graf této funkce se obvykle nazývá Gaussovou křivkou, popř. křivkou rozdělení chyb. Gaussova křivka je symetrická vzhledem k přímce x = 0 a nabývá maxima o velikosti 1 2π v bodě x = 0. Inflexní body Gaussovy křivky mají souřadnice x = ±1. Distribuční funkce veličiny X ~ N(0, 1) má tvar 1 F ( x) ≡ Φ( x) = 2π Laplaceova funkce x ∫e −t 2 2 dt. (7.2) −∞ Tato funkce se nazývá Laplaceova funkce a označuje se zpravidla zvláštním symbolem Φ , její graf je schematicky znázorněn na obr. 7.2. Laplaceovu funkci nelze vyjádřit pomocí elementárních funkcí, její hodnoty jsou však tabelovány (viz příloha I). Hodnota Laplaceovy funkce Φ ( x) udává podle definice pravděpodobnost, že náhodná veličina X ~ N(0, 1) nabývá hodnoty z intervalu (-¶, x). Základní vlastnosti Laplaceovy funkce lze formulovat takto: F ( x) f ( x) 1 √2π 1,0 0,5 x −1 0 1 Obr. 7.1. Hustota veličiny X ~ N(0, 1) x Obr. 7.2. Distribuční funkce veličiny X ~ N(0, 1) 1. Φ (− x) = 1 − Φ ( x), 2. P ( x1 < X < x2 ) = Φ ( x2 ) − Φ ( x1 ), a speciálně P (| X |< x) = P(− x < X < x) = Φ ( x) − Φ (− x) = 2Φ ( x) − 1. Význam Laplaceovy funkce vynikne zejména v souvislosti s použitím centrální limitní věty. Poznámka. Někteří autoři definují Laplaceovu funkci trochu odlišně, např. 100 1 Φ ( x) = * 2π x ∫e −t 2 2 dt. 0 Takto upravená funkce Φ* je pro tabelaci zřejmě výhodnější (menší rozsah tabulek). Před použitím tabulek Laplaceovy funkce je nutno vždy prohlédnout jejich záhlaví, kde musí být uvedeno, co se konkrétně chápe pod Laplaceovou funkcí. Nyní přejdeme k obecnému tvaru normálního rozdělení. Říkáme, že náhodná veličina Y = σ X + µ , kde σ > 0, m je libovolné reálné číslo a X ~ N(0, 1), má normální rozdělení s parametry µ a σ 2 , což zapisujeme symbolicky ve tvaru Y ∼ N ( µ , σ 2 ). Taková náhodná veličina Y má hustotu f ( y) = 1 σ 2π e−( y − µ ) 2 (2σ 2 ) pro − ∞ < y < ∞. Pro její střední hodnotu a rozptyl zřejmě platí EY = E(σ X + µ ) = σ EX + µ = µ , DY = D(σ X + µ ) = σ 2 DX = σ 2 . Výpočet momentových charakteristik šikmosti a špičatosti veličiny Y vede k těmto výsledkům: µ3* (Y ) = 0, µ 4* (Y ) = 3. Také v případě, kdy sledovaná náhodná veličina má obecné (ne normované) normální rozdělení, lze k výpočtům pravděpodobností využít tabulek Laplaceovy funkce. Jestliže Y = σ X + µ , X ~ N(0, 1), σ > 0, potom y − µ Y − µ y2 − µ P ( y1 < Y < y2 ) = P( 1 < < )= σ σ σ y −µ y −µ y −µ y −µ P( 1 <X< 2 ) = Φ( 2 ) − Φ( 1 ). σ σ σ σ Normálním rozdělením se řídí přesně jen málo náhodných veličin. Jsou to především náhodné chyby měření, tj. chyby způsobené velkým počtem neznámých a vzájemně nezávislých příčin, proto se normálnímu rozdělení často říká zákon chyb. Význam normálního rozdělení spočívá zejména v tom, že za jistých podmínek dobře aproximuje řadu jiných (i diskrétních) rozdělení. Tak např. normální rozdělení velmi dobře aproximuje binomické rozdělení pro velké hodnoty parametru n (Moivreova-Laplaceova věta, viz odstavec 9.2). V praxi se často předpokládá, že sledovaná náhodná veličina má normální rozdělení, ačkoliv její skutečné rozdělení má jen podobný tvar, to znamená, že je jednovrcholové a přibližně symetrické. Takový postup je výhodný, poněvadž usnadňuje teoretické řešení mnoha problémů i praktický výpočet hledaných charakteristik. 101 Obecné normální rozdělení Příklady 7.1. Náhodná veličina X má normální rozdělení s parametry µ = 20 a σ = 10, tj. X ∼ N (20,100). Určete pravděpodobnost, že její odchylka od střední hodnoty bude v absolutní hodnotě menší než 3. Řešení. X − 20 < 0,3) = Φ (0,3) − Φ (−0,3) = 10 2.0, 61791 − 1 = 0, 23582. P (| X − 20 |< 3) = P(−0,3 < = 2Φ (0,3) − 1 7.2. Pevnost jistého druhu ocelových lan je náhodná veličina s rozdělením N(1000 kg/cm2, 2500 (kg/cm2)2. Určete, kolik ocelových lan z 1000 kusů má průměrně menší pevnost než 900 kg/cm2. Řešení. Sledovanou náhodnou veličinu označíme např. symbolem X. Spočteme pravděpodobnost P ( X < 900 kg/cm 2 ). Zřejmě platí P ( X < 900) = P( X − 1000 < −2) = Φ (−2) = 1 − Φ (2) 1 − 0,97725 = 50 = 0, 02275. Mezi 1000 kusy ocelových lan je tedy v průměru 22-23 lan s pevností menší než 900 kg/cm2. Kontrolní úkoly 7.1. Určete pravděpodobnost, že náhodná veličina U s normovaným normálním rozdělením nabude hodnoty: a) menší než 1,64; b) větší než –1,64; c) v mezích od –1,96 do 1,96. 7.2. Náhodná veličina X má normální rozdělení. Určete P (1 < X < 4 ) , jestliže platí: EX = 3 a P ( 3 < X < 5 ) = 0,1915. 7.2. Exponenciální rozdělení Exponenciální rozdělení Říkáme, že náhodná veličina X má exponenciální rozdělení s parametry A, α ( α >0 ) , jestliže pro její hustotu (viz obr. 7.3) platí ⎧α e −α ( x − A) pro x > A, f ( x) = ⎨ pro x ≤ A. ⎩0 (7.3) V praxi se častěji užívá speciálního tvaru exponenciálního rozdělení pro A = 0, tj. tvaru ⎧α e −α x pro x > 0, f ( x) = ⎨ pro x ≤ 0. ⎩0 102 Čtenář se může snadno přesvědčit, že funkce definovaná vztahem (7.3) splňuje podmínky pro hustotu rozdělení pravděpodobností. Pro střední hodnotu veličiny X s exponenciálním rozdělením platí ∞ EX = α ∫ xe -α (x − A ) A ⎡ A 1 ∞ −α ( x − A) ⎤ 1 dx = α ⎢ + ∫ e dx ⎥ = A + α ⎣α α A ⎦ Analogicky lze odvodit E( X 2 ) = A2 + 2A α + 2 α2 , takže pro rozptyl sledované veličiny dostaneme DX = E( X 2 ) − (EX ) 2 = A2 + f ( x) 2A α + 2 α 2 − (A+ 1 α )2 = 1 α2 . F (x) 1 0 0 A Obr. 7.3. Hustota veličiny s exp. rozdělením x 0 0 A x Obr. 7.4. Distribuční funkce veličiny s exp. rozdělením Distribuční funkce veličiny s exponenciálním rozdělením má tvar pro x ≤ A, ⎧0 ⎪ x F ( x) = ⎨ -α (t − A ) dt = 1 − e-α (x − A) pro x > A. ⎪α ∫ e ⎩ A Průběh této distribuční funkce je zřejmý z obr. 7.4, její hodnoty se pro x → ∞ asymptoticky blíží hodnotě 1. Exponenciální rozdělení se používá v teorii obnovy a v teorii hromadné obsluhy. Popisuje se jím doba životnosti některých výrobků, doba trvání nějakých akcí (např. obsluhy zákazníka v prodejně) nebo doba čekání na nějakou událost (např. poruchu). Hypotéza exponenciálního rozdělení je velmi přitažlivá. Uvedeme pro to dva důvody. a) Předpokládejme, že se uvažovaný přístroj skládá z n součástí S1 , S 2 , ..., Sn . Porucha libovolné součásti nechť má za následek poruchu přístroje, přičemž okamžiky poruch X i součástí Si jsou sdruženě nezávislé náhodné veličiny, které mají exponenciální rozdělení s parametry Ai = 0 a α i > 0, i = 1, 2, ..., n. V tomto případě je 103 okamžik poruchy přístroje X = min( X 1 , X 2 , ..., X n ). Platí náhodnou veličinou P ( X < x) = 1 − P ( X ≥ x) = 1 − P (min( X 1 , X 2 , ..., X n ) ≥ x) = n = 1 − ∏ P( X i ≥ x) = 1 − e-(α1 +α 2 + ... +α n ) x , i =1 takže veličina X má opět exponenciální rozdělení s parametrem α = α1 + α 2 + ... + α n . b) Exponenciální rozdělení těsně souvisí s Poissonovým rozdělením. Předpokládejme, že počet poruch X, které vzniknou během časového intervalu 0,t má Poissonovo rozdělení s parametrem λ . Délka bezporuchového provozu zařízení Y má pak exponenciální rozdělení s parametry A = 0 a α >0. Pravděpodobnost P (Y ≥ t ) bezporuchového provozu v intervalu 0,t je zřejmě rovna pravděpodobnosti P(X = 0). Odtud plyne P (Y < t ) = 1 − P(Y ≥ t ) = 1 − e-α t = 1 − P( X = 0) = 1 − e- λ . Příklad 7.3. Životnost určitého výrobku se řídí exponenciálním rozdělením se střední hodnotou 3 roky. Jak dlouhou záruční dobu poskytne výrobce zákazníkům, jestliže požaduje, aby relativní četnost výrobků, které během záruční doby přestanou plnit svou funkci, byla v průměru 0,1? Řešení. Sledovanou náhodnou veličinou T je délka časového intervalu, v němž výrobek plní svou funkci. Ze zadání plyne, že T má exponenciální 1 rozdělení s parametrem α = , dále předpokládáme A = 0. Označíme-li 3 délku záruční doby jako z, pak řešíme exponenciální rovnici P (T < z ) = 1 − e − z 3 = 0,1. Z této rovnice dostaneme z 0,32 roku. Kontrolní úkol 7.4. Výrobní zařízení má poruchu v průměru jednou za 2000 hodin. Předpokládejme, že doba čekání na poruchu je náhodná veličina s exponenciálním rozdělením. Určete hodnotu t tak, aby pravděpodobnost, že zařízení bude pracovat bez poruchy dobu delší než t, byla rovna 0,99. 7.3. Rovnoměrné spojité rozdělení Rovnoměrné spojité rozdělení Říkáme, že náhodná veličina X má rovnoměrné spojité rozdělení v nedegenerovaném intervalu (a, b), jestliže pro její hustotu (viz obr. 7.5) platí ⎧ 1 pro a < x < b, ⎪ f ( x) = ⎨ b − a ⎪⎩ 0 pro ostatní x. 104 (7.4) Funkce typu (7.4) zřejmě splňuje všechny podmínky kladené na hustotu rozdělení pravděpodobností, neboť a) f ( x) ≥ 0 pro − ∞ < x < ∞, ∞ b) ∫ −∞ b 1 f ( x)dx = dx = 1. b − a ∫a f ( x) 1 b− a 0 F (x) 1 0 a b 0 x Obr. 7.5. Hustota veličiny s rovnoměrným rozdělením 0 a b x Obr. 7.6. Distribuční funkce veličiny s rovnoměrným rozdělením Pro základní číselné charakteristiky náhodné veličiny X s rovnoměrným spojitým rozdělením dostaneme b 1 a+b EX = x dx = , ∫ b−a a 2 b E( X 2 ) = 1 b3 − a 3 b 2 + ab + a 2 2 x dx , = = b − a ∫a 3(b − a) 3 DX = E( X ) − ( EX ) 2 2 b 2 + ab + a 2 (a + b) 2 (b − a) 2 . = − = 3 4 12 Distribuční funkce veličiny X s rovnoměrným spojitým rozdělením (viz obr. 7.6) má tvar ⎧ 0 ⎪ x x−a ⎪ 1 F ( x) = ⎨ dx = ∫ b−a ⎪b − a a ⎪ 1 ⎩ pro x ≤ a, pro a < x < b, pro x ≥ b. Náhodnými veličinami s rovnoměrným spojitým rozdělením jsou např. chyby při zaokrouhlování nebo doba čekání do nastoupení určitého jevu, který se opakuje v pravidelných intervalech. Příklad 7.4. Prodejna očekává dodávku nového zboží určitý den v době od 8 do 10 hodin. Podle sdělení dodavatele je uskutečnění dodávky stejně možné kdykoliv během tohoto časového intervalu. Jaká je pravděpodobnost, že zboží bude dodáno v době od půl deváté do tři čtvrtě na devět? Řešení. Sledovanou náhodnou veličinou X je doba čekání na dodávku zboží. Tato veličina má podle zadání rovnoměrné spojité rozdělení v intervalu (8, 10). Proto platí 105 8,75 1 8, 75 − 8,50 P (8,50 < X < 8, 75) = ∫ dx = = 0,125. 2 8,50 2 Kontrolní úkol 7.5. Trolejbusy městské dopravy odjíždějí z dané stanice v pětiminutových intervalech. Předpokládejme, že cestující přijde na stanici v libovolném okamžiku. Jaká jsou střední hodnota a směrodatná odchylka doby jeho čekání na odjezd ze stanice? 7.4. Speciální rozdělení V tomto odstavci se budeme stručně zabývat třemi speciálními rozděleními, která mají mimořádný význam v matematické statistice, zejména při ověřování statistických hypotéz. Jsou to rozdělení χ 2 (Pearsonovo), t (Studentovo) a F (Fisherovo - Snedecorovo). A. χ 2 rozdělení Nechť U1 ,U 2 , ..., U n jsou sdruženě nezávislé náhodné veličiny s normovaným normálním rozdělením, tj. U i ∼ N(0,1) pro i = 1, 2,..., n. Pak náhodná veličina n X = U12 + U 22 + ... +U n2 = ∑ U i2 i =1 2 χ rozdělení má χ rozdělení s n stupni volnosti, což zapisujeme ve tvaru X ∼ χ n2 . 2 Lze dokázat, že hustota rozdělení pravděpodobností veličiny X ∼ χ n2 má tvar 1 ⎧ x n 2−1e − x 2 pro x > 0, ⎪ n2 Γ n ( 2)2 f n ( x) = ⎨ ⎪0 pro x ≤ 0. ⎩ (7.5) Ze vztahu (7.5) je zřejmé, že tvar rozdělení χ 2 závisí na jediném parametru, a to počtu stupňů volnosti n, n = 1, 2,... . Graf hustoty χ 2 rozdělení je pro vybrané hodnoty parametru n uveden na obr. 7.7. Pro náhodnou veličinu X ∼ χ n2 platí EX = n, DX = 2n. S růstem n se χ n2 rozdělení blíží k normálnímu rozdělení se střední hodnotou n a rozptylem 2n. Kritická hodnota Distribuční funkci χ n2 rozdělení nelze vyjádřit pomocí elementárních funkcí. V praxi se neužívá hodnot distribuční funkce, ale tabulek kvantilů nebo tzv. kritických hodnot χ n2 (α ) definovaných vztahem P ( X ≥ χ n2 (α )) = α . 106 fn (x) 0,5 0,4 0,3 0,2 0,1 0 n=1 n=4 n = 10 0 2 4 6 8 10 12 14 x Obr. 7.7. Hustota veličiny s rozdělením χ 2 (schematicky) B. t rozdělení Nechť Y a Z jsou takové nezávislé Y ∼ N(0,1) a Z ∼ χ n2 . Pak náhodná veličina X= Y Z náhodné veličiny, že n má t rozdělení s n stupni volnosti . Toto rozdělení značíme symbolem tn , n = 1, 2,... . Hustota náhodné veličiny X ∼ tn má tvar (viz obr. 7.8) n +1 ) x2 2 f n ( x) = (1 + ) − ( n +1) / 2 pro − ∞ < x < ∞. n n Γ( ) π n 2 Γ( Z uvedeného vztahu vyplývá, že rozdělení veličiny X závisí pouze na jediném parametru, a to počtu stupňů volnosti veličiny Z. fn (x) n=1 n=3 0,4 0,2 −3 −2 −1 0 1 2 3 x Obr. 7.8. Hustota veličiny s tn rozdělením (schematicky) Analýza průběhu hustoty f n ( x) pro tn rozdělení ukazuje, že s rostoucím počtem stupňů volnosti n se graf této funkce blíží grafu hustoty pro normované normální rozdělení. Pro n > 30 se tn rozdělení velmi dobře aproximuje rozdělením N(0, 1). Základní charakteristiky náhodné veličiny X ∼ tn jsou 107 t rozdělení EX = 0 DX = pro n > 1, n n−2 pro n > 2. Také v případě tn rozdělení se namísto distribuční funkce využívá tabulek kvantilů a kritických hodnot tn (α ) , které jsou obvykle definovány takto: P (| X |≥ tn (α )) = α . C. F rozdělení Nechť Y a Z jsou takové nezávislé Y ∼ χ m2 a Z ∼ χ n2 . Pak náhodná veličina X= F rozdělení náhodné veličiny, že Y m Z n má F rozdělení o m a n stupních volnosti, m, n = 1, 2,... , což zapisujeme ve tvaru X ∼ Fm,n . Hustota tohoto rozdělení (viz obr. 7.9) je rovna ⎧ m+n ⎪ Γ( 2 ) ⎛ m ⎞ m 2 m 2−1 m (1 + x) − ( m + n ) / 2 pro x > 0, x ⎪ ⎜ ⎟ n n f m,n ( x) = ⎨ m n Γ ( )Γ ( ) ⎝ ⎠ ⎪ 2 2 ⎪ pro x ≤ 0. ⎩0 fn (x) 0,5 0,4 0,3 0,2 0,1 0 n=1 n=4 n = 10 0 2 4 6 8 10 12 14 x Obr. 7.9. Hustota veličiny s Fm ,n rozdělením (schematicky) Rozdělení náhodné veličiny X ∼ Fm,n je tedy charakterizováno dvěma parametry, a to stupni volnosti čitatele a jmenovatele v definičním vztahu. Pro střední hodnotu a rozptyl veličiny X lze odvodit n pro n > 2, n−2 2n 2 (m + n − 2) DX = pro n > 4. m(n − 2) 2 (n − 4) EX = V praxi se namísto distribuční funkce používá tabulek kvantilů a kritických hodnot Fm,n (α ), jež jsou definovány vztahem 108 P ( X ≥ Fm,n (α )) = α . • • • • • • • • • • Pojmy k zapamatování: rozdělení normované normální rozdělení normální Gaussova křivka (křivka rozdělení chyb) Laplaceova funkce rozdělení exponenciální rozdělení rovnoměrné χ2-rozdělení (rozdělení Pearsonovo) t-rozdělení (rozdělení Studentovo) F-rozdělení (rozdělení Fisherovo-Snedecorovo) kritická hodnota rozdělení Shrnutí: V této kapitole podrobně rozebíráme tři nejvýznamnější typy rozdělení absolutně spojitého typu: normální rozdělení (s důrazem na normované normální rozdělení), exponenciální rozdělení a rovnoměrné rozdělení. V posledním odstavci uvádíme přehled speciálních typů spojitého rozdělení (χ2-rozdělení, t-rozdělení a F-rozdělení), které se uplatňují především v matematické statistice (intervalové odhady, testování statistických hypotéz), a zavádíme pojem kritické hodnoty rozdělení daného typu. 109 110 Korespondenční úkol 2 1. Ze série 100 výrobků, mezi nimiž je 10 zmetků, se náhodně vybere pět výrobků ke kontrole kvality. Určete rozdělení pravděpodobností veličiny X, jež udává počet zmetků ve výběru. 2. Náhodná veličina X má hustotu −b x −c f ( x) = ae pro − ∞ < x < ∞, přičemž 0 < a < ∞, 0 < b < ∞, − ∞ < c < ∞. Určete vztah mezi konstantami a, b, jakož i příslušnou distribuční funkci F(x). 3. Distribuční funkce náhodné veličiny X má tvar 4. 5. 6. 7. 8. 9. ⎧ ⎪ 0 pro x ≤ 0, ⎪ π ⎪ F ( x) = ⎨a + b sin x pro 0 < x < , 2 ⎪ π ⎪ 1 pro x ≥ . ⎪⎩ 2 Čemu se rovnají konstanty a a b? Jaký tvar má odpovídající hustota rozdělení pravděpodobností? Určete rozptyl počtu bodů dosaženého a) při hodu jednou hrací kostkou, b) při hodu dvěma hracími kostkami. Do daného terče se střílí až do dosažení n-tého zásahu. Předpokládá se, že jednotlivé výstřely jsou navzájem nezávislé a pravděpodobnost zásahu je při každém výstřelu rovna p. Určete střední hodnotu spotřeby nábojů (náhodné veličiny X). Určete střední hodnotu a rozptyl náhodné veličiny X, jejíž hustota rozdělení pravděpodobností má tvar ⎧ 9 pro x > 1, ⎪ f ( x ) = ⎨ x10 ⎪⎩ 0 jinak. Určete střední hodnotu a rozptyl veličiny X, jejíž hustota má tvar π ⎧2 2 ⎪ cos x pro x ≤ , f ( x) = ⎨ π 2 ⎪⎩ 0 jinak. Je známo, že pravděpodobnost vypěstování zdravé rostliny ze semena je 0,4. Bylo zasazeno právě 12 semen. Za náhodnou veličinu X považujte počet zdravých rostlin vypěstovaných z těchto semen. Určete, jaký je nejpravděpodobnější počet zdravých rostlin, které lze takto vypěstovat, a jaká je pravděpodobnost dosažení tohoto počtu. Telefonní ústředna přijme během hodiny průměrně 15 hovorů. Jaká je pravděpodobnost, že během čtyř minut přijme a) právě jeden hovor, b) alespoň dva hovory, c) alespoň dva a nejvýše pět hovorů? 111 10. Při kontrole se přejímají všechny výrobky, jejichž délka přesahuje 77 cm. Bylo zjištěno, že střední hodnota délky výrobku (náhodné veličiny X) je 75 cm a směrodatná odchylka 5 cm. Za předpokladu, že sledovaná náhodná veličina má přibližně normální rozdělení, určete a) pravděpodobnost, že výrobek projde kontrolou, b) pravděpodobnost, že výrobek, který prošel kontrolou, je delší než 80 cm. 11. Náhodná veličina X má rovnoměrné spojité rozdělení v intervalu (2, 6). Vypočtěte a) E ( 2 X + 3) , ( ) b) E X 2 − 5 X + 2 , c) D ( 6 X − 7 ) , ( ) d) D X 2 . 12. Stanovte střední hodnotu doby obsluhy v prodejně, víte-li že pravděpodobnost obsloužení v době kratší než 4 minuty je 0,2592. Předpokládejte, že doba obsluhy má exponenciální rozdělení s hustotou ve tvaru −λ x −1 ⎪⎧λe ( ) pro x > 1, f ( x) = ⎨ jinak. ⎪⎩ 0 112 8. ZÁKON VELKÝCH ČÍSEL Po prostudování této kapitoly: pochopíte význam Čebyševových nerovností pro dokazování různých formulací zákona velkých čísel, • seznámíte se s konvergencí posloupnosti náhodných veličin podle pravděpodobnosti a pochopíte, v čem se tato konvergence liší od konvergence číselných posloupností, • poznáte dvě nejvýznamnější formulace zákona velkých čísel a naučíte se jich využívat v praxi. • Tato kapitola je pro samostatné studium velmi náročná. Poznáte v ní řadu nových, pro pochopení obtížnějších pojmů: Čebyševovy nerovnosti, konvergence posloupnosti náhodných veličin podle pravděpodobnosti a zákon velkých čísel. Uvědomte si, že Čebyševovy nerovnosti představují především matematický aparát pro dokazování různých formulací zákona velkých čísel. Věnujte zvláštní pozornost pochopení rozdílu mezi nově zavedenou konvergencí podle pravděpodobnosti a konvergencí číselných posloupností známou z matematické analýzy. V této kapitole poznáte pouze dvě z celé řady různých formulací zákona velkých čísel, a to ty, jež mají pro realizaci praktických měření největší význam. 8.1. Čebyševovy nerovnosti Při důkazu vět, které formulují zákon velkých čísel, se vychází z tzv. Čebyševových nerovností. Věta 8.1 (Čebyševova nerovnost I. typu). Pro libovolnou nezápornou náhodnou veličinu X, která má střední hodnotu EX , a libovolné reálné ε > 0 platí P( X ≥ ε ) ≤ EX ε . (8.1) Důkaz. Uvažujme pro jednoduchost jen diskrétní náhodné veličiny. Vyjdeme ze vztahu EX = ∑ xi P( X = xi ), i kde se sčítá přes všechny možné hodnoty náhodné veličiny X. Nahradímeli sčítání přes všechna i sčítáním přes všechna taková i, že xi ≥ ε , pak se součet nemůže zvětšit. Platí tedy EX ≥ ∑ x P( X = x ) ≥ ε ∑ε P( X = x ) = ε P( X ≥ ε ), i: xi ≥ε i i z čehož bezprostředně plyne (8.1). i: xi ≥ i Ñ 113 Čebyševova nerovnost I. typu Čebyševova nerovnost II. typu Věta 8.2 (Čebyševova nerovnost II. typu). Pro libovolnou náhodnou veličinu X, která má střední hodnotu EX a rozptyl DX , a libovolné reálné ε > 0 platí P(| X − EX |≥ ε ) ≤ DX ε2 . (8.2) Důkaz. Postupujeme analogicky jako při důkazu Čebyševovy nerovnosti I. typu. Dostaneme DX ≥ ∑ i:| xi − EX | ≥ε ( xi − EX ) 2 P( X = xi ) ≥ ε 2 ∑ i:| xi − EX |≥ε P( X = xi ) = ε 2 P(| X − EX |≥ ε ). Ñ Z uvedeného ovšem přímo vyplývá nerovnost (8.2) Poznámka. Čebyševovy nerovnosti lze také zapsat ve tvaru P( X < ε ) ≥ 1 − EX ε , P (| X − EX |< ε ) ≥ 1 − DX ε2 . V praxi je užívanější Čebyševova nerovnost II. typu, kterou lze zjednodušeně formulovat takto: Je-li rozptyl DX malý, pak jsou velké odchylky náhodné veličiny X od její střední hodnoty EX jen málo pravděpodobné. Čebyševových nerovností se užívá: a) k důkazu různých formulací zákona velkých čísel, b) pro odhad uvedených pravděpodobností bez znalosti rozdělení uvažované náhodné veličiny. Čebyševovy nerovnosti mají pro odhadování jen omezený význam, protože často poskytují velmi hrubé nebo dokonce triviální odhady. Je-li např. DX > ε 2 , a tedy DX / ε 2 > 1, pak Čebyševova nerovnost II. typu vyjadřuje pouze tu skutečnost, že pravděpodobnost jevu {| X − EX |≥ ε } je menší než 1, ale to je zřejmé i bez použití Čebyševovy nerovnosti. Příklady 8.1. Jaká je pravděpodobnost toho, že absolutní hodnota odchylky 3 náhodné veličiny Y od její střední hodnoty EY nebude menší než σ Y ? 2 Řešení. S použitím Čebyševovy nerovnosti II. typu dostaneme 3 4 DY P (| Y − EY |≥ σ Y ) ≤ = . 9 2 DY 9 4 114 8.2. Jaký je nejvyšší možný počet vkladatelů, jestliže žádný vklad neklesne pod 100 Kč, úhrn vkladů je 20 milionů Kč a pravděpodobnost toho, že náhodný vklad činí alespoň 1 100 Kč je rovna 0,7? Řešení. Za náhodnou veličinu X zvolíme částku, o kterou vklad převyšuje 100 Kč na náhodně vybrané vkladní knížce. Pro střední hodnotu této veličiny platí EX = 20 000 000 − 100n , n kde n značí počet vkladatelů. Přitom víme, že P ( X ≥ 1 000) = 0, 7. S použitím Čebyševovy nerovnosti I. typu získáme 0, 7 ≤ 20 000 000 − 100n . 1 000n Řešením uvedené nerovnice dostaneme pro maximální počet vkladatelů nmax = 25 000. Kontrolní úkoly 8.1. Pro náhodnou veličinu X platí DX = 0, 01 a nerovnost P ( X − EX < a ) > 0,96. Určete hodnotu čísla a. 8.2. Dokažte, že pro náhodnou veličinu X platí nerovnost E eX , P ( X ≥ a) ≤ ea jestliže ovšem existuje střední hodnota E e X . ( ) ( ) 8.2. Konvergence podle pravděpodobnosti Pojem konvergence podle pravděpodobnosti (pravděpodobnostní konvergence) zavedeme následujícími definicemi. Říkáme, že posloupnost náhodných veličin X 1 , X 2 , ..., X n , ... konverguje podle pravděpodobnosti k nule, jestliže pro libovolné reálné ε > 0 platí P (| X n |< ε ) → 1 Konvergence podle pravděpodobnosti k nule pro n → ∞. P →, Konvergenci podle pravděpodobnosti značíme obvykle symbolem ⎯⎯ P → 0. takže namísto P (| X n |< ε ) → 1 můžeme psát X n ⎯⎯ Uvedenou definici můžeme rozšířit takto: Říkáme, že posloupnost náhodných veličin X 1 , X 2 , ..., X n , ... konverguje podle pravděpodobnosti P ke konstantě c, resp. k náhodné veličině X (zápis X n ⎯⎯ → c , resp. P X n ⎯⎯ → X ), jestliže posloupnost rozdílů X 1 − c, X 2 − c, ..., X n − c, ... , resp. X 1 − X , X 2 − X , ..., X n − X , ..., konverguje podle pravděpodobnosti k nule, tj. jestliže platí 115 Zobecnění konvergence podle pravděpodobnosti P ( X n − c < ε ) → 1, resp. P ( X n − X < ε ) → 1 pro n → ∞. Poznámka. Skutečnost, že posloupnost náhodných veličin X 1 , X 2 , ..., X n , ... konverguje podle pravděpodobnosti k nule, resp. ke konstantě c, resp. k náhodné veličině X, lze zapsat také takto: P (| X n |≥ ε ) → 0 pro n → ∞, P (| X n − c |≥ ε ) → 0 pro n → ∞, P (| X n − X |≥ ε ) → 0 pro n → ∞. Je nutno si uvědomit, že konvergence podle pravděpodobnosti nemá charakter matematické konvergence, s níž se čtenář setkal v matematické analýze. Pravděpodobnostní konvergencí rozumíme skutečnost, že pravděpodobnost libovolné odchylky náhodných veličin X 1 , X 2 , ..., X n , ... od nuly konverguje k nule s rostoucím n. Úkol k zamyšlení Jaký je rozdíl mezi konvergencí posloupnosti náhodných veličin podle pravděpodobnosti a obyčejnou konvergencí číselné posloupnosti? Na závěr tohoto odstavce dokážeme užitečnou větu. Věta 8.3. Jestliže pro posloupnost náhodných veličin X 1 , X 2 , ..., X n , ... DX n → 0 pro n → ∞, pak posloupnost platí X 1 − EX 1 , X 2 − EX 2 , ..., X n − EX n , ... konverguje podle pravděpodobnosti k nule. Důkaz. Podle Čebyševovy nerovnosti II. typu platí pro každé reálné ε>0 1 ≥ P(| X n − EX n |< ε ) ≥ 1 − DX n ε2 . Jestliže pro n → ∞ platí DX n → 0, potom zřejmě také platí P (| X n − EX n |< ε ) → 1, čímž je tvrzení věty dokázáno. □ 8.3. Zákon velkých čísel v Čebyševově tvaru Hodnoty náhodné veličiny získáváme v aplikacích jako výsledky měření, přičemž buď samotná měření jsou zatížena náhodnými chybami nebo objekty měření se náhodně vybírají z nějakého souboru. Již dávno bylo pozorováno, že zatímco hodnoty náhodných veličin X 1 , X 2 , ..., X n , ..., které reprezentují výsledky jednotlivých měření, se mohou značně lišit, vykazují aritmetické průměry ( X1 + X 2 + ... +X n ) n mnohem větší stabilitu. Jsou-li aritmetické průměry skutečně statisticky stabilní, pak v matematickém modelu, jímž zkoumáme náhodné jevy, musí existovat věta, která by tuto skutečnost postihovala. Touto větou je právě 116 Čebyševova formulace zákona velkých čísel. V jejích předpokladech je ovšem třeba uvést některá omezení na náhodné veličiny X 1 , X 2 , ..., X n , ... . Tyto předpoklady jsou dvojího druhu: a) předpoklad o nezávislosti veličin X 1 , X 2 , ..., X n , ..., b) předpoklad o existenci (omezenosti) středních hodnot a rozptylů veličin X 1 , X 2 , ..., X n , ... . Věta 8.4 (zákon velkých čísel v Čebyševově tvaru) . Nechť náhodné veličiny X 1 , X 2 , ..., X n , ... jsou po dvou nezávislé, mají střední hodnoty EX i a rozptyly DX i ≤ c, i = 1, 2, ..., n, ..., kde c je nějaké kladné reálné číslo. Pak pro libovolné reálné ε > 0 platí P (| X 1 + X 2 + ... +X n EX 1 + EX 2 + ... + EX n − |< ε ) → 1 pro n → ∞. n n Důkaz. Jelikož E( X 1 + X 2 + ... + X n EX 1 + EX 2 + ... + EX n )= , n n pak stačí podle věty 8.3 dokázat, že rozptyly aritmetických průměrů ( X 1 + X 2 + ... +X n ) n konvergují k nule. Vzhledem k uvedeným dvěma předpokladům dostaneme pro n → ∞ D( X 1 + X 2 + ... + X n 1 )= 2 n n n ∑ DX i =1 i ≤ nc c = → 0, n2 n což se mělo dokázat. (8.3) □ Důsledek. Ve speciálním případě EX 1 = EX 2 = ... = EX n = ... = µ platí pro libovolné reálné ε > 0 P (| X 1 + X 2 + ... + X n − µ |< ε ) → 1 pro n → ∞. n Tento důsledek právě vyjadřuje stabilitu aritmetických průměrů. Poznámka. Větu 8.4 lze dokázat přímo s použitím Čebyševovy nerovnosti II. typu na aritmetické průměry. Podstata dokázané věty spočívá v následujícím: Jednotlivé nezávislé náhodné veličiny X i mohou nabývat hodnot vzdálených od jejich středních hodnot EX i , ale aritmetický průměr dostatečně velkého počtu těchto náhodných veličin nabývá s velkou pravděpodobností hodnoty blízké aritmetickému průměru jejich středních hodnot. Jinými slovy, zatímco jednotlivé náhodné veličiny mohou mít rozptyly velké, jejich aritmetický průměr bude mít rozptyl malý. Aritmetický průměr dostatečně velkého počtu nezávislých náhodných veličin (s omezeným rozptylem) jakoby ztrácí charakter náhodné veličiny. Vysvětluje se to tím, že odchylky jednotlivých veličin od jejich středních hodnot mohou být jak kladné, tak i záporné, a v případě aritmetického průměru se tyto odchylky vzájemně kompenzují. 117 Čebyševův zákon velkých čísel Je třeba si uvědomit, že z Čebyševovy formulace zákona velkých čísel nevyplývá stabilita aritmetických průměrů jako experimentální skutečnost. Z žádné matematické věty logicky neplyne ten či onen výsledek experimentu, protože nikdy nelze v praxi zaručit splnění všech podmínek věty. Nyní ukážeme použití věty 8.4 (speciálně jejího důsledku) v praxi. Při měření nějaké fyzikální veličiny se obvykle postupuje tak, že se provede několik měření a pak se určí aritmetický průměr, který se považuje za hledanou hodnotu měřené veličiny. Čebyševova formulace zákona velkých čísel říká, že tento způsob měření je správný v tom případě, kdy jsou splněny následující podmínky: a) náhodné veličiny X 1 , X 2 , ..., X n , které reprezentují výsledky jednotlivých měření, jsou po dvou nezávislé; b) střední hodnoty všech uvažovaných náhodných veličin jsou stejné a jsou rovny skutečné hodnotě fyzikální veličiny; c) rozptyly všech náhodných veličin jsou omezeny jedním a týmž číslem. První požadavek bývá zpravidla splněn. Druhý požadavek bude splněn tehdy, jestliže měření nejsou zatížena systematickými chybami, tj. chybami, jež mají jednostranný charakter (totéž znaménko). Pro splnění třetího požadavku je nutno, aby měřící přístroj zajistil určitou přesnost měření, tj. omezenost rozptylů jednotlivých měření. Význam Čebyševovy formulace zákona velkých čísel spočívá nejen v tom, že ukazuje správnost popsaného způsobu měření, ale také v tom, že specifikuje podmínky, za nichž může být tento způsob použit. Příklad 8.3. Určete pravděpodobnost toho, že aritmetický průměr z 500 nezávislých měření udává skutečnou hodnotu měřené veličiny µ s přesností 0,1, jestliže rozptyl jednotlivých výsledků měření nepřevyšuje 0,3. Řešení. Nechť X 1 , X 2 , ..., X 500 jsou výsledky nezávislých měření, přičemž EX i = µ a DX i ≤ 0,3 pro i = 1, 2, ..., 500. Pak s použitím Čebyševovy nerovnosti II. typu a vztahu (8.3) dostaneme X 1 + X 2 + ... + X 500 X + X 2 + ... + X 500 1 − µ |≥ 0,1) ≤ D( 1 )≤ 2 500 500 0,1 1 0,3 ≤ = 0, 06. 0,12 500 P (| Odtud plyne pro hledanou pravděpodobnost P (| X 1 + X 2 + ... + X 500 − µ |< 0,1) ≥ 1 − 0, 06 = 0,94. 500 Kontrolní úkoly 8.3. Kolik nezávislých měření je třeba provést, aby pravděpodobnost toho, že aritmetický průměr z těchto měření udává hodnotu měřené 118 veličiny s přesností 0,3, byla rovna 0,99, jestliže rozptyl jednotlivých výsledků měření nepřevyšuje 0,2? 8.4. Pravděpodobnost, že aritmetický průměr ze 400 nezávislých měření udává hodnotu měřené veličiny s přesností ε , je rovna 0,80. Určete hodnotu ε za předpokladu, že rozptyl jednotlivých výsledků měření nepřevyšuje 0,04. 8.4. Zákon velkých čísel v Bernoulliově tvaru V tomto odstavci se budeme zabývat jinou, velmi významnou formulací zákona velkých čísel. Věta 8.5 (zákon velkých čísel v Bernoulliově tvaru). Nechť náhodná veličina X udává počet nastoupení jevu A v n nezávislých opakováních určitého pokusu a p pravděpodobnost nastoupení tohoto jevu v každém jednotlivém pokusu. Pak pro náhodnou veličinu X/n a libovolné reálné ε > 0 platí ⎛ X ⎞ P ⎜ − p < ε ⎟ → 1 pro n → ∞. ⎝ n ⎠ Důkaz. Zavedeme náhodné veličiny X i , které udávají počet nastoupení jevu A v i-tém pokusu, i = 1, 2, ... n. Zřejmě platí 1 X = X 1 + X 2 + ... + X n ; EX i = p; DX i = p(1 − p) ≤ . 4 Odtud E( X ⎛1 n ⎞ 1 n ) = E ⎜ ∑ X i ⎟ = ∑ EX i = p , n ⎝ n i =1 ⎠ n i =1 D( X ⎛1 n ⎞ 1 ) = D⎜ ∑ Xi ⎟ = 2 n ⎝ n i =1 ⎠ n n ∑ DX i =1 i = np (1 − p ) 1 ≤ → 0 pro n → ∞, 4n n2 takže Bernoulliova formulace je pouze jednoduchým speciálním případem formulace Čebyševovy. Věta 8.5 tvrdí toto: Roste-li počet nezávislých pokusů, pak relativní četnost nastoupení jevu A v sérii těchto pokusů konverguje podle pravděpodobnosti ke konstantě p, tj. X P ⎯⎯ → p pro n → ∞. n Praktický význam Bernoulliovy formulace zákona velkých čísel je v tom, že můžeme odhadnout pravděpodobnost nastoupení uvažovaného jevu v jednom pokusu relativní četností tohoto jevu při realizaci velkého počtu nezávislých pokusů. Pro ověření Bernoulliovy formulace bylo provedeno mnoho rozsáhlých sérií pokusů (házení mincí, házení hracími kostkami, rozdávání karet apod.). Výsledky těchto experimentů vykázaly vždy velmi dobrou shodu s teorií. 119 Bernoulliův zákon velkých čísel Část pro zájemce Vedle konvergence podle pravděpodobnosti se zavádí také konvergence skoro jistě (konvergence s pravděpodobností 1). Posloupnost náhodných veličin X 1 , X 2 , ..., X n , ... konverguje skoro jistě (s pravděpodobností 1) k náhodné veličině X, jestliže platí ⎛∞ ∞ ∞ ⎛ 1 ⎞⎞ ⎛ ⎞ P ⎜ lim X n = X ⎟ = P ⎜ ∩∪ ∩ ⎜ X n − X ≤ ⎟ ⎟ = 1. k ⎠⎠ n →∞ ⎝ ⎠ ⎝ k =1 N =1 n = N ⎝ s. j. X. Taková konvergence se označuje znakem X n ⎯⎯→ S použitím právě zavedené konvergence se pak formulují tzv. silné zákony velkých čísel. Např. silný zákon velkých čísel pro aritmetické průměry (obdoba speciálního případu Čebyševovy formulace zákona velkých čísel) lze formulovat takto: Nechť X 1 , X 2 , ..., X n , ... je posloupnost nezávislých náhodných veličin se stejným rozdělením. Nechť pro všechna n ( n = 1, 2, ...) existují střední hodnoty EX n = µ a rozptyly DX n = σ2 > 0. Pak pro tuto posloupnost platí 1 n ⎛ ⎞ P ⎜ lim ∑ X k = µ ⎟ = 1. ⎝ n→∞ n k =i ⎠ Další podrobnosti o konvergenci skoro jistě a silných zákonech velkých čísel naleznete např. v učebnici [17]. Pojmy k zapamatování: • Čebyševova nerovnost I. typu • Čebyševova nerovnost II. typu • konvergence podle pravděpodobnosti (slabá konvergence) • konvergence podle pravděpodobnosti k nule • konvergence podle pravděpodobnosti k dané konstantě (náhodné veličině) • Čebyševova formulace zákona velkých čísel • Bernoulliova formulace zákona velkých čísel Shrnutí: Úvodní část této kapitoly pojednává o Čebyševových nerovnostech I. a II. typu. Následuje zavedení pojmu konvergence posloupnosti náhodných veličin podle pravděpodobnosti k nule, resp. k dané konstantě či dané náhodné veličině. S využitím takto zavedené konvergence jsou formulovány dva nejvýznamnější zákony velkých čísel (Čebyševova a Bernoulliova formulace zákona velkých čísel). 120 9. CENTRÁLNÍ LIMITNÍ VĚTA Tato kapitola je koncipována tak, že po jejím prostudování: pochopíte podstatu různých formulací centrální limitní věty, seznámíte se s nejobecnější formulací centrální limitní věty (Ljapunovovou větou) a dvěma v praxi nejužívanějšími formulacemi této věty (integrální i lokální MoivreovouLaplaceovou větou), • naučíte se využívat centrální limitní věty při řešení úloh týkajících se náhodných veličin s binomickým rozdělením, • poznáte tzv. pravidlo 3 σ , jež má významné uplatnění v matematické statistice. • • Tato kapitola je pro samostatné studium zřejmě nejobtížnější. Poznáte v ní jednu ze stěžejních vět teorie pravděpodobnosti – centrální limitní větu. Věnujte maximální úsilí tomu, abyste pochopili její „filozofickou“ podstatu formulovanou na konci úvodního odstavce 9.1. Pak už byste neměli mít problémy s jejími četnými aplikacemi. 9.1. Laplaceův div Uvažme n sdruženě nezávislých náhodných veličin X 1 , X 2 , ..., X n , které mají identická rozdělení se střední hodnotou µ a rozptylem σ 2 , takže platí n E( X 1 + X 2 + ... + X n ) = ∑ EX i = nµ , i =1 n D( X 1 + X 2 + ... + X n ) = ∑ DX i = nσ 2 . i =1 Vytvoříme nyní novou náhodnou veličinu (tzv. normovaný součet) U n s použitím vztahu Un = ( X1 + X 2 + ... + X n ) − nµ σ n . Lze dokázat, že veličina U n má pro dostatečně velká n následující vlastnosti: a) U n má přibližně normované normální rozdělení, což značí, že pro její hustotu platí f (u ) ≈ 1 −u 2 2 e 2π pro − ∞ < u < ∞. 121 b) Pravděpodobnost, že náhodná veličina U n nabývá hodnoty z intervalu 〈 a, b) je dána přibližným vzorcem 1 P (a ≤ U n < b) ≈ 2π b ∫e − x2 2 dx = Φ (b) − Φ (a ), (9.1) a kde Φ značí Laplaceovu funkci (viz vztah (7.2)). Laplaceův div Vztah (9.1) platí bez omezení pro diskrétní i spojité náhodné veličiny X i , i = 1, 2,..., n, a je matematickým vyjádřením tzv. Laplaceova divu, jehož podstata spočívá v tom, že normovaný součet nezávislých náhodných veličin s libovolným, ale přitom identickým rozdělením má za uvedených podmínek přibližně normované normální rozdělení. V této kapitole se budeme podrobněji zabývat některými, z praktického hlediska nejvýznamnějšími formulacemi centrální limitní věty. Podstatu všech možných formulací centrální limitní věty lze vyjádřit takto: Jestliže náhodné veličiny X 1 , X 2 , ..., X n , jsou sdruženě nezávislé a mají střední hodnoty EX i a rozptyly DX i , i = 1, 2, ..., n, pak náhodná veličina X = X 1 + X 2 + ... + X n má za dosti obecných předpokladů pro dostatečně velká n přibližně normální rozdělení. Důkazy jednotlivých formulací jsou zdlouhavé a nepřinášejí z metodického hlediska mnoho nového, nebudeme je proto uvádět a odkážeme čtenáře na příslušnou literaturu. 9.2. Moivreova - Laplaceova formulace centrální limitní věty Nejprve uvedeme Moivreovu - Laplaceovu větu v integrálním tvaru. Věta 9.1 (integrální Moivreova - Laplaceova věta). Nechť náhodná veličina X udává počet úspěchů v sérii n nezávislých Bernoulliových pokusů s konstantní pravděpodobností p dosažení úspěchu v každém jednotlivém pokusu. Pak náhodná veličina ( X − np ) / npq, kde q = 1 − p, splňuje pro n → ∞ limitní vztah ⎛ X − np ⎞ < x ⎟ → Φ ( x), P⎜ ⎜ npq ⎟ ⎝ ⎠ a to stejnoměrně vzhledem k x. Důkaz nalezne čtenář v učebnicích [4,20]. Ñ Poznámka. Veličinu X je možno pokládat za součet sdruženě X 1 , X 2 , ..., X n , z nichž každá nabývá nezávislých veličin s pravděpodobností p hodnoty 1 a s pravděpodobností q = 1 - p hodnoty 0. Integrální Moivreova - Laplaceova věta tedy říká, že při velkém počtu n nezávislých náhodných pokusů konverguje distribuční funkce veličiny X 122 s rozdělením Bi(n, p) k distribuční funkci normálního rozdělení. Proto lze v uvažovaném případě používat následující aproximace ⎛ ⎞ X − np < b ⎟ ≈ Φ (b) − Φ (a). P⎜a ≤ ⎜ ⎟ npq ⎝ ⎠ Uvedená aproximace není vhodná tam, kde jsou pravděpodobnosti p velmi nízké ( p 0, 001) nebo naopak velmi blízké jednotce ( p 0,999 ). V takových případech může vést navrhovaná aproximace k chybám o velikosti řádově až stovky procent. Příklady 9.1. Pravděpodobnost narození chlapce je pravděpodobnost, že mezi 10 000 novorozenci bude a) více děvčat než chlapců; b) chlapců od 5 000 do 5 300 včetně? 0,515. Jaká je Řešení. Počet narozených chlapců je náhodnou veličinou X, která má zřejmě binomické rozdělení s parametry n = 10 000 a p = 0,515 (q = 0,485). Protože n je dostatečně velké a hodnoty pravděpodobností p, q zhruba stejné, jsme oprávněni použít integrální Moivreovy - Laplaceovy věty. Snadno spočteme np = 5 150, npq = 2 497,75. a) ⎛ X − 5 150 5 000 − 5 150 ⎞ < P ( X < 5 000) = P ⎜ ⎟ ⎜ 2 497,75 2 497,75 ⎟⎠ ⎝ ≈ Φ (−3) = 1 − Φ (3) 1 − 0,99865 = 0, 00135. ⎛ X − 5 150 ⎞ < −3 ⎟ P⎜ ⎜ 2 497,75 ⎟ ⎝ ⎠ b) ⎛ ⎞ X − 5 150 ≤ 3 ⎟ ≈ Φ (3) − Φ (−3) = P ⎜ −3 ≤ ⎜ ⎟ 2 497,75 ⎝ ⎠ = 2Φ (3) − 1 1,99730 − 1 = 0,99730. P (5 000 ≤ X ≤ 5 300) 9.2. Pravděpodobnost poruchy autobusu během sledovaného období je 0,2. Jak velký musí být počet autobusů, aby se během daného období alespoň 50 z nich s pravděpodobností 0,9 vyhnulo poruše? Řešení. Za náhodnou veličinu X považujeme počet autobusů, které se v daném období vyhnou poruše. Tato veličina má binomické rozdělení s parametry n (určujeme) a p = 0,8 (q = 0,2). S použitím integrální Moivreovy - Laplaceovy věty dostaneme ⎛ X − 0,8n 50 − 0,8n ⎞ ⎛ X − 0,8n 50 − 0,8n ⎞ P ( X ≥ 50) = P ⎜ ≥ < ⎟ = 1− P ⎜ ⎟≈ 0, 4 n 0, 4 n 0, 4 n 0, 4 n ⎝ ⎠ ⎝ ⎠ ⎛ 50 − 0,8n ⎞ ⎛ 50 − 0,8n ⎞ ≈ 1− Φ ⎜ ⎟ = Φ⎜− ⎟ = 0,9. ⎝ 0, 4 n ⎠ ⎝ 0, 4 n ⎠ Z tabulky hodnot Laplaceovy funkce (viz příloha I) odečteme 123 − a odtud spočteme n 50 − 0,8n 0, 4 n 1, 28 68. Kontrolní úkoly 9.1. Pravděpodobnost, že součástka nevyhoví při kontrole spolehlivosti, je 0,05. Určete pravděpodobnost toho, že při kontrole 100 součástek nevyhoví: • alespoň 5 součástek, • méně než 5 součástek, • 5-10 součástek. 9.2. Pravděpodobnost nastoupení jevu A v jednom pokusu je rovna 0,05. Kolik je nutno provést nezávislých pokusů, aby s pravděpodobností 0,8 jev A nastal nejméně pětkrát? Uvažme náhodnou veličinu X ∼ Bi( n, p). Je zřejmé, že numerický výpočet pravděpodobnosti P ( X = k ) podle vzorce (6,1) je při velkých hodnotách n, k značně obtížný. K řešení uvedeného problému se využívá následující věty. Věta 9.2 (lokální Moivreova - Laplaceova věta). Nechť náhodná veličina X značí počet úspěchů v sérii nezávislých Bernoulliových pokusů s konstantní pravděpodobností p dosažení úspěchu v každém jednotlivém pokusu. Pak pravděpodobnost P ( X = k ) splňuje pro n → ∞ limitní vztah npqP ( X = k ) ⎧ 1 ⎡ k − np ⎤ 2 ⎫ 1 ⎪ ⎪ exp ⎨− ⎢ ⎥ ⎬ → 1, 2π ⎪⎩ 2 ⎢⎣ npq ⎥⎦ ⎪⎭ a to stejnoměrně pro všechny hodnoty k, pro něž (9.2) ( k − np ) npq leží uvnitř nějakého konečného intervalu. Důkaz je uveden např. v učebnici [4]. Ñ Význam lokální Moivreovy - Laplaceovy věty spočívá tedy v tom, že umožňuje rychle a jednoduše stanovit přibližné hodnoty uvažovaných pravděpodobností pro binomické rozdělení. V praxi se užívá vztahu (9.2) ve tvaru P( X = k ) ≈ ⎛ k − np ⎞ 1 ϕ⎜ ⎟, npq ⎜⎝ npq ⎟⎠ kde ϕ značí hustotu veličiny s normovaným normálním rozdělením. Příklad 9.3. Pravděpodobnost vyrobení zmetku je rovna 0,005. Jaká je pravděpodobnost toho, že mezi 10 000 náhodně vybranými výrobky bude právě 40 zmetků? Řešení. Počet zmetků mezi 10 000 výrobky (náhodná veličina X) má binomické rozdělení s parametry n = 10 000 a p = 0,005 (q = 0,995). Spočteme np = 50, npq = 49,75, 124 k − np 10 =− −1, 42. npq 49, 75 K přibližnému určení hledané pravděpodobnosti užijeme lokální Moivreovy - Laplaceovy věty 2 1 P ( X = 40) ≈ e −1,42 / 2 0, 0206. 49, 75.2π Kontrolní úkol 9.3. Přístroj sestává z 1000 elektronických prvků. Pravděpodobnost poruchy každého jednotlivého prvku v průběhu jednoho roku je rovna 0,001 a nezávisí na stavu ostatních prvků. Určete pravděpodobnost poruchy právě dvou prvků za rok. 9.3. Ljapunovova formulace centrální limitní věty Nejobecnější formulace centrální limitní věty pochází od Ljapunova. Věta 9.3 (integrální Ljapunovova věta). Nechť je dána posloupnost sdruženě nezávislých náhodných veličin X 1 , X 2 , ..., X n ,..., které mají střední hodnoty EX i = µi , rozptyly DX i = σ i2 a absolutní centrální ( ) momenty třetího řádu E | X i − EX i |3 , i = 1, 2, ..., n, ... . Označme n n i =1 i =1 Bn2 = D( X 1 + X 2 + ... + X n ) = ∑ DX i = ∑ σ i2 . Nechť je dále splněna podmínka (tzv. Ljapunovova podmínka) 1 n ∑ E | X i − EX i |3 → 0 pro n → ∞. Bn3 i =1 ( ) (9.3) Pak normovaná náhodná veličina Un = X 1 + X 2 + ... + X n − ( µ1 + µ 2 + ... + µ n ) Bn splňuje vztah P (U n < x) → Φ ( x) pro n → ∞, a to stejnoměrně vzhledem k x. Důkaz nalezne čtenář např. v učebnicích [4,16,20]. Ñ Předpoklady Ljapunovovy věty jsou postačujícími podmínkami pro platnost této věty, jsou však neobyčejně blízké k podmínkám nutným. Z Ljapunovovy podmínky (9.3) lze odvodit, že DX i → 0 pro n → ∞, Bn2 tj., že rozptyl každé jednotlivé náhodné veličiny tvoří jen malou část celkového rozptylu součtu X 1 + X 2 + ... + X n . Kdyby tomu tak nebylo, např. kdyby se veličina X 1 měnila podstatně více než ostatní veličiny 125 X 2 , X 3 , ..., X n , pak by bylo rozdělení součtu X 1 + X 2 + ... + X n v zásadě určeno veličinou X 1 . V takovém případě by nebyl důvod očekávat, že součet X 1 + X 2 + ... + X n bude mít přibližně normální rozdělení. Ljapunovova podmínka (9.3) bývá při praktických aplikacích splněna téměř vždy. Speciálně je splněna pro nezávislé náhodné veličiny X 1 , X 2 , ..., X n s identickým zákonem rozdělení, které mají střední hodnotu, rozptyl a absolutní centrální moment 3. řádu. Pak totiž existují kladné konstanty c, d tak, že pro i = 1, 2, ..., n platí DX i = c, ( ) E | X i − EX i |3 = d . V takovém případě n n ∑ E (| X Bn2 = ∑ DX i = nc, i =1 i =1 ) − EX i |3 = nd , i a proto 1 Bn3 n ∑ E (| X i =1 i ) − EX i |3 = nd ( nc ) 32 → 0 pro n → ∞. Také v případě, kdy považujeme náhodné veličiny X 1 , X 2 , ..., X n za přibližně „rovnocenné“, lze ukázat, že je Ljapunovova podmínka splněna. Přibližnou rovnocennost náhodných veličin je možno vyjádřit matematicky takto: Existují kladné konstanty c1 , c2 , d1 , d 2 tak, že pro i = 1, 2, ..., n platí ( ) c1 ≤ DX i ≤ c2 , d1 ≤ E | X i − EX i |3 ≤ d 2 . Odtud plyne n n ∑ E (| X Bn2 = ∑ DX i ≥ nc1 , i =1 i =1 i ) − EX i |3 ≤ nd 2 , takže 1 n nd 2 E | X i − EX i |3 ≤ → 0 pro n → ∞. 3 ∑ Bn i =1 (nc1 )3 2 ( ) Centrální limitní věta je z hlediska přírodovědce velmi dobrou větou v tom smyslu, že zůstává v platnosti i při jistém porušení svých předpokladů. Dokonce i její základní předpoklad o sdružené nezávislosti veličin X 1 , X 2 , ..., X n lze dosti silně oslabit. Proto se všeobecně soudí, že celkové chyby měření, které jsou úhrnem mnohých, částečně závislých, částečně nezávislých faktorů, mají normální rozdělení. Příklad 9.4. Přístroj se skládá z 50 částí, jež nezávisle na sobě mohou mít poruchu. Bylo zjištěno, že střední hodnoty a rozptyly počtu poruch jednotlivých částí během jistého časového intervalu (tj. náhodné veličiny X 1 , X 2 , ..., X 50 ) jsou EX i = 0, 05i, DX i = 0, 02i pro i = 1, 2, ..., 50. Jaká je 126 pravděpodobnost toho, že celkový počet poruch částí přístroje během uvažovaného časového intervalu bude menší než 74? Řešení. Náhodná veličina X představující celkový počet poruch částí přístroje je dána součtem sdruženě nezávislých veličin X i pro 50 i = 1, 2, ..., 50, tj. X = ∑ X i . i =1 Předpokládejme, že každá z veličin X 1 , X 2 , ..., X 50 má absolutní centrální moment 3. řádu. Pak jsou předpoklady Ljapunovovy věty zřejmě splněny. Proto lze neznámé rozdělení veličiny X nahradit normálním rozdělením se střední hodnotou 50 EX = ∑ EX i = 0, 05. i =1 50 .(50 + 1) = 63, 75 2 a rozptylem 50 DX = ∑ DX i = 0, 02. i =1 50 .(50 + 1) = 25,5. 2 Pro hledanou pravděpodobnost dostaneme ⎛ X − 63, 75 74 − 63, 75 ⎞ < P ( X < 74) = P ⎜ ⎟ ⎜ 25,5 25,5 ⎟⎠ ⎝ ≈ Φ (2, 03) 0,97882. ⎛ X − 63, 75 ⎞ < 2, 03 ⎟ ≈ P⎜ ⎜ ⎟ 25,5 ⎝ ⎠ Kontrolní úkol 9.4. Náhodná veličina Y je aritmetickým průměrem 3200 sdruženě nezávislých náhodných veličin, které mají identická rozdělení se střední hodnotou EY = 3 a rozptylem DY = 2. Určete pravděpodobnost toho, že veličina Y nabude hodnoty v mezích od 2,95 do 3,075. 9.4. Užití centrální limitní věty Centrální limitní věta se obvykle aplikuje podle následujícího schématu (viz řešení příkladů 9.1 a 9.4). Je třeba určit pravděpodobnost toho, že součet S n = X 1 + X 2 + ... + X n nabude hodnoty ležící v některém nedegenerovaném intervalu a, b , tj. hodnotu P(a ≤ Sn ≤ b). Při řešení této úlohy postupujeme takto: 1. ověříme předpoklady centrální limitní věty; 2. určíme číselné charakteristiky náhodné veličiny Sn , tj. ES n a DSn ; 3. vytvoříme normovanou náhodnou veličinu Un = S n − ES n DSn a použijeme zřejmé identity 127 ⎛ a − ES n b − ES n ⎞ ≤ Un ≤ P (a ≤ S n ≤ b) = P ⎜ ⎟; ⎜ DS ⎟ D S n n ⎠ ⎝ 4. nahradíme pravou část této identity přibližným výrazem ⎛ b − ES n ⎞ ⎛ a − ES n ⎞ Φ⎜ ⎟−Φ⎜ ⎟, ⎜ DS ⎟ ⎜ DS ⎟ n ⎠ n ⎠ ⎝ ⎝ kde Φ značí Laplaceovu funkci. Odhad chyby, které se dopouštíme při aproximaci skutečného rozdělení náhodné veličiny Sn normálním rozdělením, se provádí jen výjimečně, v podstatě pouze v čistě teoretických pracích. Otázka k zamyšlení Centrální limitní věty se v praxi využívá pro generování pseudonáhodných čísel s normovaným normálním rozdělením N(0,1). Přitom se vychází z předpokladu, že je k dispozici generátor pseudonáhodných čísel s rovnoměrným rozdělením na intervalu 0,1 . Dokázali byste navrhnout příslušný algoritmus? A. Pravidlo 3σ Jestliže zvolíme konstanty a, b tak, aby platilo a = ESn − 3 DSn = ESn − 3σ Sn , b = ES n + 3 DS n = ES n + 3σ Sn , pak P (a ≤ Sn ≤ b) = P (| S n − ESn |≤ 3σ Sn ] ≈ Φ (3) − Φ (−3) = 2Φ (3) − 1 0,99730. Pravidlo 3σ Můžeme tedy prakticky s jistotou tvrdit, že se hodnoty náhodné veličiny Sn liší od její střední hodnoty ESn nejvýše o 3σ Sn . Uvedené tvrzení je známo pod názvem „pravidlo 3 σ ". Toto pravidlo však platí striktně jen pro náhodnou veličinu se skutečně normálním rozdělením. Je-li X ∼ N µ , σ 2 , pak lze s pravděpodobností 0,99730 očekávat, že hodnoty ( ) veličiny X padnou dovnitř intervalu µ − 3σ , µ + 3σ . Pravidlo 3σ se významně uplatňuje při statistickém vyhodnocování experimentu. B. Pravděpodobnost a relativní četnost Pokusíme se zodpovědět otázku, do jaké míry se může relativní četnost v rámci Bernoulliova schématu lišit od pravděpodobnosti p při daném počtu pokusů n. Nechť náhodná veličina X udává počet úspěchů v sérii n Bernoulliových pokusů s konstantní pravděpodobností p úspěchu v každém jednotlivém pokusu. S použitím integrální Moivreovy Laplaceovy věty dostaneme 128 ⎛ X − np ε n ⎞ ⎛ X ⎞ P ⎜ | − p |< ε ⎟ = P ⎜ | |< ⎟≈ ⎜ ⎟ npq pq ⎝ n ⎠ ⎝ ⎠ ⎛ε n ⎞ ⎛ ε n⎞ ⎛ ε n⎞ ≈ Φ⎜ ⎟ − Φ⎜− ⎟ = 1 − 2Φ ⎜ − ⎟. ⎜ pq ⎟ ⎜ ⎜ pq ⎟⎠ pq ⎟⎠ ⎝ ⎠ ⎝ ⎝ 1 Jelikož pro p + q = 1 zřejmě platí pq ≤ , můžeme psát 4 ⎛ ε n⎞ X ⎛X ⎞ P ⎜ − ε < p < + ε ⎟ ≈ 1 − 2Φ ⎜ − ⎟ ≥ 1 − 2Φ −2ε n . ⎜ ⎟ n pq ⎝n ⎠ ⎝ ⎠ ( ) Známe-li tedy počet úspěchů X v sérii n Bernoulliových pokusů, můžeme sestrojit interval X ⎛X ⎞ ⎜ − εα , + εα ⎟ , n ⎝n ⎠ který obsahuje neznámou hodnotu pravděpodobnosti p úspěchu v jednotlivém pokusu, a to s libovolně velkou zadanou pravděpodobností 1 − α . K tomu je zapotřebí pouze určit εα ze vztahu ( ) 2Φ −2εα n ≤ α . C. Aplikace na aritmetický průměr Nechť X 1 , X 2 , ..., X n jsou sdruženě nezávislé náhodné veličiny se střední hodnotou EX i = µ a rozptylem DX i = σ 2 , i = 1, 2, ..., n, a nechť ε > 0. Aplikujeme-li centrální limitní větu (v integrální formě) na aritmetický průměr veličin X 1 , X 2 , ..., X n , dostaneme ⎛ X + X 2 + ... + X n − nµ ε n ⎞ ⎛ X + X 2 + ... + X n ⎞ P ⎜| 1 − µ |< ε ⎟ = P ⎜⎜ | 1 |< ⎟≈ n σ ⎟⎠ σ n ⎝ ⎠ ⎝ ⎛ ε n⎞ ≈ 1 − 2Φ ⎜⎜ − ⎟⎟ . ⎝ σ ⎠ Např. pro ε n = 3σ je tato pravděpodobnost rovna 0,99730. Jestliže interpretujeme X 1 , X 2 , ..., X n jako výsledky jednotlivých pozorování (měření), pak limitní chyba záměny µ za ( X 1 + X 2 + ... + X n ) n je při zadané hodnotě pravděpodobnosti nepřímo úměrná odmocnině z počtu pozorování, tj. ε ∼ 1 n. Je zajímavé, že tento typ závislosti na počtu pozorování platí skoro vždy. Někdy ovšem bývá lepší použít přesnějšího měřícího přístroje, než očekávat, že se přesnost zvýší v důsledku většího počtu pozorování. Pojmy k zapamatování: • Laplaceův div • Ljapunovova věta 129 • integrální Moivreova-Laplaceova věta • lokální Moivreova-Laplaceova věta • pravidlo 3σ Shrnutí: Tato závěrečná kapitola poskytuje tři formulace centrální limitní věty: především Ljapunovovu větu, která představuje formulaci nejobecnější, dále integrální a lokální Moivreovu-Laplaceovu větu. Zvláštní pozornost je přitom věnována aplikacím centrální limitní věty. Uvádíme jednak obecný postup při použití centrální limitní věty v praxi, jednak některé speciální aplikace, z nichž je pro Vaše další samostatné studium patrně nejdůležitější pravidlo 3σ. 130 LITERATURA [1] Anděl, J. Matematická statistika. Praha: SNTL 1978. [2] Anděl, J. Základy matematické statistiky. [Preprint]. Praha: MFF UK 2002. [3] Feller, V. An Introduction to Probability Theory and Its Applications. Vol. 1. New York Wiley 1950, Vol. 2. New York Wiley 1966. [4] Gnedenko, D. V. Kurs teorii verojatnostej. 5. vydání. Moskva: Fizmatgiz 1969. [5] Hajkr, O., Mičulka, B., Tošenovský, J. Pravděpodobnost a statistika. Ostrava: vydavatelství VŠB 1986. 270 s. [6] Hebák, P, Kahounová, J. Počet pravděpodobnosti v příkladech. Praha: SNTL 1978. [7] Hellwig, Z. Elementy rachunku prawdepodobieňstva Warszawa: Paňstvove wydawnictvo naukowe 1978. [8] Jarušková, D. Pravděpodobnost a matematická statistika 1. Praha: vydavatelství ČVUT 1999. 120 s. [9] Jurečková, J. Úvod do počtu pravděpodobnosti. Skriptum MFF UK. Praha: SPN 1978. i statystyki matematycznej. [10] Kolmogorov, A. N., Fomin, S. V. Základy teorie funkcí a funkcionální analýzy. Praha: SNTL 1975. [11] Komenda, S., Klementa, J. Analýza náhodného v pedagogickém výzkumu a praxi. Praha: SPN 1981. 320 s. [12] Komenda, S. Základy pravděpodobnostních a statistických metod v psychologickém a pedagogickém výzkumu. Praha: SPN 1969. 174 s. [13] Likeš, L., Machek, J. Počet pravděpodobnosti. MVŠT X. Praha: SNTL 1981. [14] Pluciňska, A., Pluciňski, E. Zadania z rachunku prawdopodobienstwa i statyatyki. Warszava: Paňstvove vydavnictwo naukove 1978. [15] Potocký, B., Kalas, J., Komorník, J., Lamoš, F. Zbierka úloh z pravdepodobnosti a matematickej štatistiky. Bratislava: Alfa 1991. 392 s. [16] Renyi, A. Teorie pravděpodobnosti. Praha: Academia 1972. [17] Riečan, B., Lamoš, F., Lenárt, C. Pravdepodobnosť a matematická štatistika. Bratislava: Alfa 1984. 320 s. [18] Štěpán, J. Teorie pravděpodobnosti. Praha: Academia 1987. 448 s. [19] Štěpán, J., Machek, J. Pravděpodobnost a statistika pro učitelské studium. Praha: SPN 1985. 240 s. [20] Tutubalin, V. N. Teorie pravděpodobnosti. Praha: SNTL 1978. [21] Vilenkin, N. J. Kombinatorika. Praha: SNTL 1977. 131 132 132 Příloha I. Distribuční funkce normovaného normálního rozdělení (Laplaceova funkce) u 1 exp(− x 2 / 2)dx. Φ (u ) = ∫ 2π −∞ 7 8 9 0,0 u 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0 1 2 3 4 0,52790 0,53188 0,53586 0,1 0,53983 0,54380 0,54176 0,55112 0,55567 0,55961 0,56356 0,56749 0,57142 0,57535 0,2 0,57926 0,58317 0,58796 0,59095 0,59483 0,59811 0,60257 0,60642 0,61026 0,61409 0,3 0,61791 0,62112 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,61803 0,65173 0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68193 0,5 0,69146 0,69497 0,69847 0,70194 0,10540 0,70884 0,11226 0,71566 0,71904 0,71240 0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75115 0,75490 0,7 0,75804 0,76115 0,76421 0,76130 0,71035 0,71337 0,77637 0,77935 0,78230 0,78524 0,8 0,78814 0,79103 0,79389 0,19613 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327 0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891 1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214 1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298 1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147 1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91169 0,91309 0,91466. 0,91621 0,91774 1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92786 0,92922 0,93056 0,93189 1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408 1,6 0,94520 0,94630 0,94138 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449 1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96146 0,96327 1,8 0,96407 0,96485 0,96562 0,96638 0,96112 0,96784 0,96856 0,96926 0,96995 0,97062 1,9 0,97128 0,97193 0,97257 0,97320 0,91381 0,97441 0,97500 0,97558 0,97615- 0,97670 2,0 0,97725 0,97178 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98121 0,98169 2,1 0,98244 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574 2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899 2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158 2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361 2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520 2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643 2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736 2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807 2,9 0,99813 0,99819 0,99825 0,99831 0,99841 0,99846 0,99851 0,99856 0,99861 3,0 0,99865 0,99869 0,99874 0,99878 0,99882 0,99886 0,99889 0,99893 0,99896 0,99900 3,1 0,99903 0,99906 0,99910 0,99913 0,99916 0,99918 0,99921 0,99924 0,99926 0,99929 3,2 0,99931 0,99934 0,99936 0,99938 0,99940 0,99942 0,99944 0,99946 0,99948 0,99950 3,3 0,99952 0,99953 0,99955 0,99957 0,99958 0,99960 0,99961 0,99962 0,99964 0,99965 3,4 0,99966 0,99968 0,99969 0,99970 0,99971 0,99972 0,99973 0,99974 0,99975 0,99916 3,5 0,99977 0,99978 0,99978 0,99979 0,99980 0,99981 0,99981 0,99982 0,99983 0,99983 3,6 0,99984 0,99985 0,99985 0,99986 0,99986 0,99987 0,99987 0,99988 0,99988 0,99989 3,7 0,99989 0,99990 0,99990 0,99990 0,99991 0,99991 0,99992 0,99992 0,99992 0,99992 3,8 0,99993 0,99993 0,99993 0,99994 0,99994 0,99994 0,99994 0,99995 0,99995 0,99995 3,9 0,99995 0,99995 0,99996 0,99996 0,99996 0,99996 0,99996 0,99996 0,99997 0,99997 4,0 0,99997 0,99997 0,99997 0,99997 0,99997 0,99997 0,99998 0,99998 0,99998 0,99998 4,1 0,99998 0,99998 0,99998 0,99998 0,99998 0,99998 0,99998 0,99998 0,99999 0,99999 1,2 0,99999 0,99999 0,99999 0,99999 0,99999 0,99999 0,99999 0,99999 0,99999 0.99999 4,3 0,99999 0,99999 0,99999 0,99999 0,99999 0,99999 0,99999 0,99999 0,99999 0,99999 4,4 0,99999 0,99999 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 0,998 6 5 6 133
Podobné dokumenty
Zajimave ulohy z fyziky
Když už Křemílek s Vochomůrkou měli na potoce jezírko, vyrobili si jedno užitečné zařízení, jehož název je ukryt v tajence. Až ho odhalíte, napište, k čemu toto
zařízení Křemílek a Vochomůrka použí...
ponuka na predaj - jún 2013 - Štátna vedecká knižnica v Banskej
Kádár,J.
Jeníček,V.
Jeníček,V.
Šusta,A.
Chovanec,J.
Chovanec,J.
Vaněk,V.
Malpass,E.
Stingl,M.
Clarke,K.
Doolaard,A.
Doolaard,A.
Lenin,V.I.
Loukotka,J.
Potužník,V.
Pohunek,M.
Osterloff,W.K.
Pechlát,...
Neuronové sítě jako modely analogových výpočtů
článek [3] ve své úvodní části obsahuje přehled výsledků o časové
složitosti učení neuronových sítí. Navíc níže v kapitole 4 začleníme
výsledky disertace do kontextu celkového výzkumu ve výpočetní
...
Dva texty k článku P. Miškovského Úvod do studia matematiky
aktérů. Oba tyto uvedené příklady jsou ukázkou toho, že kolem nás je mnoho jevů
ovlivněných mnoha okolnostmi, které se v podstatě ani nedají matematicky vyjádřit.
Kromě popsaných situací se můžeme ...