Náhodný výběr a statistika - Math and Stats Support Centre
Transkript
Náhodný výběr a statistika I Náhodný výběr Začněme příkladem. Chceme získat informace o platech v ČR, např. průměrný plat nebo nás zajímají rozdíly mezi platy mužů a žen. Za tímto účelem je potřeba sesbírat data - ptát se jednotlivých občanů na jejich plat. Samozřejmě, že když se zeptáme všech, budeme naprosto přesní a budeme mít kompletní informace. Jenže tento postup je dost nákladný a dost obtížně proveditelný. Proto z celku všech lidí zvolíme náhodně pouze některé – čímž získáme náhodný výběr. Nový pojem: Náhodný výběr Náhodný výběr je uspořádaná n-tice náhodných veličin X1 , X2 , . . . , Xn , které jsou stochasticky nezávislé a mají stejné rozdělení. Upořádaná n-tice proto, abychom ji mohli zapsat do sloupcového vektoru (pokud se jedná o vícerozměrné rozdělení, tak do matice). Realizací náhodného výběru jsou pak konkrétní hodnoty, které značíme malými písmeny x1 , x2 , . . . , xn . Rozsah náhodného výběru je n. Interpretační poznámka. Rozdělení, které mají náhodné veličiny X1 , X2 , . . . , Xn musí být stejné, ale nepotřebujeme jej konkrétně znát. Důležitý předpoklad je dostatečná nahodilost – zkoumáme-li výšku příjmů vysokoškoláků, nestačí poptat se svých spolužáků. Je třeba zahrnout všechny vysoké školy nebo změnit studii na „Výška příjmů mých spolužáků“ . Podle toho, na jaké otázky hledáme odpověď, můžeme rozlišit dva směry statistiky: • Statistická indukce (inference) – podle informací z náhodného vyběru vyslovíme závěry o celém základním souboru, odhadneme parametry rozdělení, ze kterého data pochází apod. V našem příkladě přejdeme od průměrného platu v získaném výběru k střední hodnotě platu v celé populaci. • Testování hypotéz – hledáme odpovědi na otázky, které se váží k populaci, například „Je průměrný plat v ČR vyšší, než 25 000 Kč?“ nebo „Liší se průměrný plat mužů a žen v ČR?“ . Protože ale pracujeme s náhodnými výběry a ne celým základním souborem informací, dopouštíme se chyby. Pro statistiku je důležité umět tuto chybu kvantifikovat – takto umíme určit, která metoda je lepší. Obvykle chyba, se kterou pracujeme klesá s rostoucí velikostí náhodného výběru n. V praxi je důležitý výpočet velikosti náhodného výběru (sample size estimation) při návrhu studie. Náhodný výběr musí být dostatečně velký, aby riziko chyby bylo malé (obvykle 5%), na druhou stranu získat pozorování může být dosti nákladné. II Statistika? Slovo statistika má dva významy. První, známější, je věda, která získává informace z dat. Druhý význam, se kterým budeme často pracovat, je statistika jakožto funkce. Handout 1 Statistika 2 II. kapitola II. Základní pojmy matematické statistiky Math & Stats Support Centre Nový pojem: Statistika Statistika je libovolná funkce náhodného výběru. Interpretační poznámka. To znamená, že je to nějaká formulka, do které dosadíme hodnoty, které jsou obsaženy v náhodném výběru. Takže se tam vyskytují náhodné veličiny Xi (při samotném výpočtu dosazujeme ale realizace xi – naměřené hodnoty) a možná taky n – velikost náhodného výběru. Dále je uveden seznam některých často používaných statistik (jejich podrobnému vysvětlení jsou věnovány samostatné materiály). Rozmyslete si, že každá z níže uvedených náhodných veličin je statistika, tedy funkce náhodného výběru. V následující tabulce vždy uvažujeme náhodný výběr X1 , X2 , . . . , Xn , rozsah je tedy n. název výběrový průměr medián modus výběrový rozptyl výběrová směrodatná odchylka výběrová kovariance výběrový korelační koeficient empirická distribuční funkce v bodě x Handout značení X̂ S2 S výpočet P M = ni=1 Xni Prostřední hodnota uspořádaného náhodného výběru pro n liché, jinak aritmetický průměr dvou prostředních hodnot. Nejčetnější hodnota náhodného výběru. Pn 1 2 S 2 = n−1 i=1 (Xi − M ) √ S = S2 S12 R12 Pn 1 S12 = n−1 i=1 ((Xi − M1 )(Yi − M2 )) S12 R12 = S1 S2 F (x) F (x) = M X0,5 card{i,Xi ≤x} n 2 Statistika 2 II. kapitola
Podobné dokumenty
Zatížení letounu - Ústav letadlové techniky
Použití: náběžné hrany křídel, centroplán (např. MIG-29)
ponsse activeframe
nízko (na úrovni nápravy). Tím jsou otřesy kabiny eliminovány
tak efektivně, jak je to jen možné.
czech version 2014 / 2015
Ideální pro rodiny s dětmi
Stylově vybavená koupelna s vanou nebo sprchovým koutem
Zdobné stropní štuky
Postel velikosti „king size“ (možnost oddělených postelí)
prezentace a grafické objekty
na záložce Velikost nastavujeme velikost obrázku, tlačítkem Obnovit se – v případě, že je
obrázek větší než šířka nebo výška stránky nebo byl zmenšen – obrázek vrátí do původních
rozměrů. Měřítko (...
King Meter - Elektrokola
0-3 nebo 1-3: PAS1 také ukazuje, ECO, PAS2 také ukazuje TOUR,
PAS3 také ukazuje BOOST.
0-5 nebo 1-5: PAS1 také ukazuje, ECO, pAS2 také ukazuje CITY,
PAS3 také ukazuje TOUR, PAS4 také ukazuje POWER,...
Vyšetření slzného filmu - THE VISION CARE INSTITUTE®, LLC
lze zaznamenat rychlé odpařování slz. Situace se může zhoršit,
když pacient plně nemrká, neboť to brání tomu, aby se celá čočka
náležitě zvlhčila. Postupně vede nahromadění usazenin na povrchu
RGP ...
Základní operace s maticemi Determinant matice °ádu 2 × 2
Základní operace s maticemi
Determinant matice °ádu 2 × 2
Kaºdá £tvercová matice m·ºe být charakterizována £íselnou hodnotou, kterou nazýváme determinant. Determinanty jsou uºite£né nap°. p°i studi...
LESSON SEVENTEEN: REVISION UNIT 2 1. Hello song 2. Captain
What have you got for us, Captain Jack? Pencil cases!
Here you are!
What´s in your pencil case?
A pencil, a crayon, a rubber!
3. Can I have …?
Učitel se ptá svých žáků dle obsahu jejich pouzder:
Ca...