Přednáška 7 - Webhosting na VŠE
Transkript
5EN306 Aplikované kvantitativní metody I Přednáška 6 Zuzana Dlouhá Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam popisných charakteristik 4. Vicenásobná regrese v ekonomické analýze 5. Vicenásobná regrese: DUMMY proměnné a jejich interakce 6. Difference in differences estimator 7. First Differencing a Fixed Effects 8. Instrumentální proměnné, Panelová data 9. Testy robustnosti 10. Úvod do časových řad (zbyde-li čas) • témata se prolínají 2 Základy ekonometrie – funkční formy • • • kap. 6 k logaritmům – nepřesnost se zvyšuje s množstvím procent výpočet přesné procentuální změny (když Δx = 1): %∆𝑦 = 100(𝑒 𝛽 − 1) Kvadratická závislost • • • první rok zkušeností (exper) zvyšuje mzdu o cca 0,30 USD, druhý rok zvyšuje o 0,298 – 2*(0,0061)*1 = 0,029 USD atd. maximální mzda: znamená to, že po 24,4 roce klesají výnosy ze zkušeností? (ne, záleží kolik dat leží vpravo od 24,4, je to 28%, např. problém specifikace) 3 Základy ekonometrie – funkční formy • další př. – efekt znečištění na cenu domu • minimum funkce: můžeme ignorovat (pouze 1% z celkového počtu) • nárůst místností z 5 na 6 • nárůst místností ze 6 na 7 4 Základy ekonometrie – funkční formy Kubická závislost Interagující proměnné (interaction terms) • • efekt počtu ložnic (bdrms) závisí na její rozloze (sqrft) interakční efekt – důležité je vyhodnocení efektu jedné interagující proměnné při zajímavých hodnotách druhé interagující proměnné (např. průměr) 5 Základy ekonometrie – funkční formy + výběr regresorů Reparametrizace modelu – interagujících proměnných Výhody • • • efekt x2 za předpokladu průměrných hodnot všech ostatních proměnných jednoduchá interpretace všech parametrů k dispozici standardní chyby parciálních efektů na průměrné hodnotě v případě potřeby možný nápočet efektů na jiných hodnotách než na průměru 6 Základy ekonometrie – funkční formy + výběr regresorů Výběr regresorů • pokud přidáme do modelu libovolnou další vysvětlující proměnnou, koeficient determinace neklesne (obvykle se zvýší) • nemá smysl se bezhlavě snažit o zvyšování koeficientu determinace • nestrannost nijak nesouvisí s velikostí koeficientu determinace, záleží na splnění G-M předpokladů • nízký koeficient determinace znamená, že SSR je vysoký v porovnání s SST • pokud ale máme velký soubor, můžeme se i tak dostat k relativně přesným odhadům koeficientů • adjustovaný (korigovaný) koeficient determinace při přidání proměnné může i klesnout 7 Základy ekonometrie – výběr regresorů Výběr regresorů - zahnízděné modely (nested models) • • • modely jsou zahnízděné, pokud je můžeme dostat ze vše zahrnujícího modelu (tj. zahrnujícího všechny proměnné, které přicházejí v úvahu a jejich mocniny - tzv. obecný model) lineárními omezeními parametrů vždy se snažíme o co nejjednodušší model u obecného modelu otestujeme F-testem (nebo LM testem) příslušná lineární omezení parametrů a pokud můžeme, přejdeme k jednoduššímu modelu Výběr regresorů - nezahnízděné modely • vybírám model 2 8 Základy ekonometrie – výběr regresorů Výběr regresorů – jiná forma závislé proměnné • tady výběr modelu na základě statistické významnosti a hodnot koeficientů (vybírám druhý model) 9 Základy ekonometrie – výběr regresorů Kontrola na příliš mnoho faktorů v regresní analýze • • • • nemá cenu dávat zároveň proměnnou tax a beercons pamatujte na ceteris paribus interpretaci zvýšení daně zvýší cenu piva a tedy sníží spotřebu piva a to bude mít efekt na nehody když máme v modelu obě proměnné, koeficient u daně nám říká, jaký je efekt daně na nehodovost při nezměněné spotřebě piva, a to moc nedává smysl 10 Dummy proměnné a jejich interakce • • • • kap. 7 kvalitativní informace – pohlaví, region, rasa, rating,… jedním ze způsobů jak zahrnout kvalitativní proměnnou je její použití jako dummy proměnnou závislá i nezávislá 11 Dummy proměnné a jejich interakce Dummy proměnná – trap (past) • • perfektní kolinearita mezi male a female vynechám buď male nebo female nebo odhadnu model bez konstanty: • – složitě testovat rozdíly mezi parametry – koeficient determinace platný jenom u modelů s konstantou příklad 12 Dummy proměnné a jejich interakce • příklad - je účinný grantový program pro školení při zaměstnání? • dummy proměnná v regresi s log(y) 13 Dummy proměnné a jejich interakce Víc kategorií • důležité – která kategorie bude vynechána – základní • máme 4 • vynechán – single man, vůči němu pak interpretuji koeficienty Ordinální informace • vhodnější formulace 14 Dummy proměnné a jejich interakce Interakce • • • ?? muži a ?? ženy hypotéza – výnosy ze vzdělání stejné pro muže i ženy: hypotéza – celá rovnice stejná pro muže i ženy: 15 Dummy proměnné a jejich interakce Chowův test • testuje jestli je regresní funkce různá pro různé skupiny • neomezený model (všechny interakce) College grade point average Standardized aptitude test score High school rank percentile Total hours spent in college courses • omezený model • nulová hypotéza (všechny interakční efekty jsou nulové, tedy regresní koeficienty jsou stejné pro muže i ženy) 16 Dummy proměnné a jejich interakce Chowův test – pokračování Testujeme-li individuálně, nemůžeme odmítnout hypotézu, že jednotlivé interakční efekty jsou nulové. • testovací statistika – sdružený test – zamítám hypotézu H0 17 Dummy proměnné a jejich interakce • • Asensio, J.: The success story of Spanish suburban railways: determinants of demand and policy implications, Transport Policy, Volume 7 (4), 10/2000, pp. 295-302 k dispozici na stránkách https://webhosting.vse.cz/figlova/5en306/ 18 Dummy proměnné a jejich interakce • • Zietz et al. : Determinants of House Prices: A Quantile Regression Approach: Department of Economics and Finance Working Paper Series; Middle Tennessee State University, May 2007 k dispozici na stránkách https://webhosting.vse.cz/figlova/5en306/ 19 Binární závislá proměnná • lineární pravděpodobnostní model 20 Binární závislá proměnná • příklad – zaměstnanost ženy • graf pro nwifeinc=50, exper=5, age=30, kindslt6=1, kidsge6=0 21 Binární závislá proměnná • náhodná složka nemá normální rozdělení (má binomické rozdělení), čili důležité jsou asymptotické vlastnosti estimátorů • je zde heteroskedasticita, takže na standardní chyby odhadů se nemůžeme moc spoléhat • predikovaná pravděpodobnost může být mimo přípustný interval • efekt vysvětlující proměnné na predikovanou pravděpodobnost je lineární • většinou se chová dobře kolem průměrných hodnot vysvětlujících proměnných • pro posouzení kvality modelu se zejména používá „procento správně predikovaných hodnot“ • logit a probit modely (přesahují rámec kurzu) také pracují s binární závislou proměnnou a některé nedostatky LPM odstraňují 22 Heteroskedasticita - příčiny • • • • • • kap. 8 chybná specifikace modelu – vynechání podstatné vysvětlující proměnné – nevhodná funkční forma modelu odhad z prostorových dat se značnou variabilitou v jednom náhodném výběru – variabilita endogenní proměnné (a tedy i reziduí) může být závislá na některé exogenní proměnné chyby měření – s rostoucí hodnotou endogenní proměnné dochází ke kumulaci chyb měření – to zvyšuje rozptyl endogenní proměnné a tedy i rozptyl reziduí odhad z upravených dat – odhad nikoliv na původních pozorováních, ale např. ze skupinových průměrů získaných z tříděných dat u lineárního pravděpodobnostního modelu vždy 23 Heteroskedasticita - důsledky • • • • • • • nemá vliv na nestrannost a konzistenci MNČ estimátoru interpretace koeficientu determinace se nemění odhady směrodatných chyb bodových odhadů (sbi) a rozptylu sigma (s2) jsou vychýlené intervalové odhady nejsou směrodatné statistické testy (t-testy, F-test) ztrácejí na síle byly vyvinuty asymptoticky platné vzorečky pro OLS standardní chyby a související statistiky robustní vůči heteroskedasticitě neznámé formy White-Eickerovy standardní chyby, gretl: HC0 obvyklý t-test je asymptoticky platný (použijeme-li robustní standardní chyby) obvyklá F-statistika při heteroskedasticitě platná není, ale většina softwaru poskytuje verzi robustní vůči heteroskedasticitě 24 Heteroskedasticita – Whiteův test • nemá vliv na nestrannost a konzistenci MNČ estimátoru • parametrický test 25 Heteroskedasticita – WLS • • vážené nejmenší čtverce je známá funkční forma heteroskedasticity • příklad 26 Heteroskedasticita – WLS • transformovaný model je homoskedastický • WLS je vydatnější než OLS v původním modelu, protože pozorování s velkým rozptylem a tedy méně informativní než ta s malým rozptylem mají při odhadu menší váhu • WLS je speciálním případem Metody zobecněných nejmenších čtverců – GLS (generalized least squares) Důležitý zvláštní případ heteroskedasticity • pokud jsou pozorované údaje průměry (za město, oblast, zemi, firmu...), měly by být váženy velikostí příslušné jednotky • pokud nevíme, jestli jsou chyby na úrovni individuí homoskedastické, můžeme při OLS na transformovaném modelu aplikovat robustní chyby 27 Heteroskedasticita – FGLS • • • feasible generalized LS použije se, když neznáme funkční formu heteroskedasticity předpoklad exponenciální funkční formy (rozptyl nemůže být záporný) • • inverzní hodnoty této odhadnuté funkce použijeme jako váhy při WLS FGLS je konzistentní a asymptoticky vydatnější než OLS 28 Heteroskedasticita – FGLS – příklad • odhad MNČ • odhad FGLS 29 Heteroskedasticita – FGLS • • • • pokud použijeme chybnou funkční formu heteroskedasticity, jsou FGLS (WLS) estimátory konzistentní (za předpokladu, že jsou ostatní G-M předpoklady splněny), ale měli bychom pracovat s robustními standardními chybami pokud se OLS a FGLS (WLS) odhady velmi liší, obvykle to indikuje, že některý další G-M předpoklad není splněn, může indikovat také chybnou specifikaci LRM při silné heteroskedasticitě je často lepší použít chybnou funkční formu heteroskedasticity než žádnou – zvýšíme tím vydatnost použití exponenciální funkční formy ve FGLS je poměrně sofistikované, můžeme ale vyjít i z mnohem jednodušší funkční formy, historicky se využíval třeba Whiteův test 30 Heteroskedasticita – WLS v LPM • v LPM známe přesně funkční formu heteroskedasticity • WLS neproveditelné, pokud jsou LPM predikce menší než nula či větší než jedna pokud těchto případů není mnoho, můžeme takové predikce nahradit třeba hodnotami 0,01 či 0,99 (resp. jinými ad-hoc zvolenými hodnotami blízkými hranici intervalu 0-1) • Další možnosti řešení heteroskedasticity v LPM: • lze použít FGLS (ignorujeme známou funkční formu heteroskedasticity) • lze vynechat všechna pozorování vedoucí k predikcím mimo interval 01 (nenáhodný výběr!) • lze použít OLS s robustními standardními chybami (odhad není vydatný) 31
Podobné dokumenty
American Memory (LoC)
Kolekce lze rozdělit také podle časových úseků počínaje rokem 1400 až do dnešní doby. Dále je lze třídit podle
typu záznamu, který obsahují, můžeme tak například získat seznam všech kolekcí obsahuj...
www.ssoar.info Prostorová analýza českého stranického systému
procesů na mikroúrovni (jako například nákazové nebo sousedské efekty). Totéž
je ale často problematické na úrovni vyšších celků, jako jsou, v českém případě,
okresy či kraje. Čím vyšší je úroveň a...
Informace ke kurzu 5EN306 ZS2011
*) Jedná se o jediný termín testu. Na test se studenti nepřihlašují. První půlka abecedy píše v první
půlce přednášky (bude upřesneno na přednášce). V případě doložených zdravotních důvodů dle
prav...
Charakteristika Google Book Search
říjen 2005, Google chce rozšířit službu na další evropské jazyky (Francie, Itálie, Německo, Nizozemí,
Rakousko, Švýcarsko, Belgie a Španělsko mají mít vlastní verzi)
18. listopad 2005, přejmenování...
1. Slovenský systémový integrátor
1. Současný přístup až 20 pracovníků ke stroji (IT, údržba, výroba, engineering)
2. Sofistikovaná práce s daty:
cenovy predpis LP - podpis PM
nebo distributorem zdarma, je základ 0 Kč. K částce vypočtené procentuální sazbou se
připočte maximálně pevná část odpovídající pásmu dle výše základu (nápočet).
V případě, že distributor distribuu...