Náhodný výběr a statistika - Math and Stats Support Centre
Transkript
Náhodný výběr a statistika
I
Náhodný výběr
Začněme příkladem. Chceme získat informace o platech v ČR, např. průměrný plat nebo nás
zajímají rozdíly mezi platy mužů a žen. Za tímto účelem je potřeba sesbírat data - ptát se
jednotlivých občanů na jejich plat. Samozřejmě, že když se zeptáme všech, budeme naprosto
přesní a budeme mít kompletní informace. Jenže tento postup je dost nákladný a dost obtížně
proveditelný. Proto z celku všech lidí zvolíme náhodně pouze některé – čímž získáme náhodný
výběr.
Nový pojem: Náhodný výběr
Náhodný výběr je uspořádaná n-tice náhodných veličin X1 , X2 , . . . , Xn , které jsou stochasticky nezávislé a mají stejné rozdělení.
Upořádaná n-tice proto, abychom ji mohli zapsat do sloupcového vektoru (pokud se jedná
o vícerozměrné rozdělení, tak do matice). Realizací náhodného výběru jsou pak konkrétní hodnoty, které značíme malými písmeny x1 , x2 , . . . , xn . Rozsah náhodného výběru je n.
Interpretační poznámka. Rozdělení, které mají náhodné veličiny X1 , X2 , . . . , Xn musí být stejné, ale nepotřebujeme jej konkrétně znát. Důležitý předpoklad je dostatečná nahodilost –
zkoumáme-li výšku příjmů vysokoškoláků, nestačí poptat se svých spolužáků. Je třeba zahrnout
všechny vysoké školy nebo změnit studii na „Výška příjmů mých spolužáků“ .
Podle toho, na jaké otázky hledáme odpověď, můžeme rozlišit dva směry statistiky:
• Statistická indukce (inference) – podle informací z náhodného vyběru vyslovíme závěry o
celém základním souboru, odhadneme parametry rozdělení, ze kterého data pochází apod.
V našem příkladě přejdeme od průměrného platu v získaném výběru k střední hodnotě
platu v celé populaci.
• Testování hypotéz – hledáme odpovědi na otázky, které se váží k populaci, například „Je
průměrný plat v ČR vyšší, než 25 000 Kč?“ nebo „Liší se průměrný plat mužů a žen v
ČR?“ .
Protože ale pracujeme s náhodnými výběry a ne celým základním souborem informací, dopouštíme se chyby. Pro statistiku je důležité umět tuto chybu kvantifikovat – takto umíme určit,
která metoda je lepší. Obvykle chyba, se kterou pracujeme klesá s rostoucí velikostí náhodného
výběru n. V praxi je důležitý výpočet velikosti náhodného výběru (sample size estimation) při
návrhu studie. Náhodný výběr musí být dostatečně velký, aby riziko chyby bylo malé (obvykle
5%), na druhou stranu získat pozorování může být dosti nákladné.
II
Statistika?
Slovo statistika má dva významy. První, známější, je věda, která získává informace z dat. Druhý
význam, se kterým budeme často pracovat, je statistika jakožto funkce.
Handout
1
Statistika 2
II. kapitola
II. Základní pojmy matematické statistiky
Math & Stats
Support Centre
Nový pojem: Statistika
Statistika je libovolná funkce náhodného výběru.
Interpretační poznámka. To znamená, že je to nějaká formulka, do které dosadíme hodnoty,
které jsou obsaženy v náhodném výběru. Takže se tam vyskytují náhodné veličiny Xi (při
samotném výpočtu dosazujeme ale realizace xi – naměřené hodnoty) a možná taky n – velikost
náhodného výběru.
Dále je uveden seznam některých často používaných statistik (jejich podrobnému vysvětlení
jsou věnovány samostatné materiály).
Rozmyslete si, že každá z níže uvedených náhodných veličin je statistika, tedy funkce náhodného
výběru.
V následující tabulce vždy uvažujeme náhodný výběr X1 , X2 , . . . , Xn , rozsah je tedy n.
název
výběrový průměr
medián
modus
výběrový rozptyl
výběrová směrodatná
odchylka
výběrová kovariance
výběrový korelační
koeficient
empirická distribuční
funkce v bodě x
Handout
značení
X̂
S2
S
výpočet
P
M = ni=1 Xni
Prostřední hodnota uspořádaného náhodného výběru
pro n liché, jinak aritmetický průměr dvou
prostředních hodnot.
Nejčetnější hodnota náhodného výběru.
Pn
1
2
S 2 = n−1
i=1 (Xi − M )
√
S = S2
S12
R12
Pn
1
S12 = n−1
i=1 ((Xi − M1 )(Yi − M2 ))
S12
R12 = S1 S2
F (x)
F (x) =
M
X0,5
card{i,Xi ≤x}
n
2
Statistika 2
II. kapitola
Podobné dokumenty
Zatížení letounu - Ústav letadlové techniky
Použití: náběžné hrany křídel, centroplán (např. MIG-29)
ponsse activeframe
nízko (na úrovni nápravy). Tím jsou otřesy kabiny eliminovány
tak efektivně, jak je to jen možné.
czech version 2014 / 2015
Ideální pro rodiny s dětmi
Stylově vybavená koupelna s vanou nebo sprchovým koutem
Zdobné stropní štuky
Postel velikosti „king size“ (možnost oddělených postelí)
prezentace a grafické objekty
na záložce Velikost nastavujeme velikost obrázku, tlačítkem Obnovit se – v případě, že je
obrázek větší než šířka nebo výška stránky nebo byl zmenšen – obrázek vrátí do původních
rozměrů. Měřítko (...
King Meter - Elektrokola
0-3 nebo 1-3: PAS1 také ukazuje, ECO, PAS2 také ukazuje TOUR,
PAS3 také ukazuje BOOST.
0-5 nebo 1-5: PAS1 také ukazuje, ECO, pAS2 také ukazuje CITY,
PAS3 také ukazuje TOUR, PAS4 také ukazuje POWER,...
Vyšetření slzného filmu - THE VISION CARE INSTITUTE®, LLC
lze zaznamenat rychlé odpařování slz. Situace se může zhoršit,
když pacient plně nemrká, neboť to brání tomu, aby se celá čočka
náležitě zvlhčila. Postupně vede nahromadění usazenin na povrchu
RGP ...
Základní operace s maticemi Determinant matice °ádu 2 × 2
Základní operace s maticemi
Determinant matice °ádu 2 × 2
Kaºdá £tvercová matice m·ºe být charakterizována £íselnou hodnotou, kterou nazýváme determinant. Determinanty jsou uºite£né nap°. p°i studi...
LESSON SEVENTEEN: REVISION UNIT 2 1. Hello song 2. Captain
What have you got for us, Captain Jack? Pencil cases!
Here you are!
What´s in your pencil case?
A pencil, a crayon, a rubber!
3. Can I have …?
Učitel se ptá svých žáků dle obsahu jejich pouzder:
Ca...
obtížné porozumět