PDF článku ke stažení… - Data a výzkum
Transkript
Ekologické usuzování: explorace metody latentní struktury za využití volebních dat z ČR1 Pat Lyons2 Sociologický ústav AV ČR, v.v.i. Abstract: This article explores how aggregate level data may be used to make inferences about individual level behaviour. A common strategy in the past was to assume that the relations evident in aggregated data are also present in individual data. Analysis of datasets where there is both individual and aggregated information demonstrates that this assumption is most often incorrect. This means that the relationships observed between variables at an aggregated level are unlikely to be observed in individual level data. This is a problem because quite often social scientists only have aggregated data for exploring individual level behaviour. A key question explored in this article is how is it possible to validly and reliably use aggregated datasets to make inferences about relationships between variables at the individual level. An example analysis is given using electoral data from the Czech Republic. Data a výzkum - SDA Info 2008, Vol. 2, No. 1: 49 - 75. (c) Sociologický ústav AV ČR, v.v.i., Praha 2008. Jedna z prvních empirických analýz založených na využití regresní analýzy, které byly v historii politologie publikovány, se pokoušela odpovědět na otázku, jak hlasují ženy. V době vydání práce, tedy v roce 1919, byla otázka rozdílů mezi pohlavími ve volebním chování do značné míry neprozkoumaná, a to ze dvou důvodů. Za prvé bylo před koncem 1. světové války velmi málo zemí, v nichž měly všeobecné hlasovací právo vedle mužů i ženy. Za druhé, systematická analýza volebních dat byla v plenkách. Ve svém pokusu o odpověď na otázku, jak ženy volí, Ogburn a 1 Text vznikl jako součást řešení projektu Legitimita politického systému a nerovností, projekt GA ČR 403/06/1421, 2006–2008. Chtěl bych poděkovat oběma recenzentům a kolegovi Lukáši Linkovi za kritické připomínky a návrhy na vylepšení textu. Za veškeré faktické nebo interpretační chyby zodpovídá autor. Data z šetření CVVM, na kterých je založena tato analýza, byla poskytnuta Sociologickým datovým archivem Sociologického ústavu AV ČR. 2 Veškerou korespondenci posílejte na adresu: Pat Lyons, Sociologický ústav AV ČR, v.v.i., Jilská 1, 110 00 Praha 1, e-mail: [email protected]. - 49 - Goltra [1919: 413] konstatovali, že jde o obtížný úkol, protože hlasy žen a mužů se nesčítají odděleně. Při neexistenci tvrdých dat o hlasování žen navrhli Ogburn a Goltra použít při analýze 26 referend k široké škále politických témat ve městě Portland v Oregonu nepřímou metodu. Nepřímá metoda v podstatě spočívala ve zkoumání souvislostí mezi výsledky referend a podílem žen v jednotlivých volebních obvodech. Ogburn a Goltra předpokládali, že rozdíly v hlasování mezi jednotlivými okrsky budou odpovídat rozdílům v poměru mezi ženami a muži, čímž vznikne metoda, jak nepřímo zjistit způsob hlasování žen. Ve svých analýzách, jež používaly Pearsonovy korelační koeficienty, zjistili, že ženy jsou oproti mužům méně nakloněny návrhům jako a) osmihodinový pracovní den, b) progresivní zdanění, c) volební systém s poměrným zastoupením, d) zrušení Senátu státu Oregon, e) odebrání volebního práva přistěhovalcům bez amerického občanství nebo f) zákaz prodeje a konzumace alkoholu. Tyto výsledky naznačovaly, že voličky v Portlandu byly v roce 1919 konzervativnější než voliči-muži [Ogburn, Goltra 1919: 417]. Výzkumníci ovšem konstatovali, že taková interpretace jejich dat platí pouze za předpokladu, že veškeré rozdíly mezi ženami a muži určuje stupeň konzervativnosti k jednotlivým analyzovaným tématům, jež je způsoben právě jenom odlišností pohlaví. Při existenci jiných faktorů (například věkové složení, počet přistěhovalců, míra stranictví) ovlivňujících individuální hlasování v daném okrsku by vysvětlení rozdílů mezi ženami a muži pomocí konstantní úrovně konzervativnosti nebylo možné. Kromě toho by výsledky nebyly validní ani tehdy, pokud by individuální hlasování bylo ovlivněno poměrem mezi ženami a muži v daném okrsku [Schuessler 1999: 10579]. Ogburn a Goltra [1919: 415] si uvědomovali, že korelační koeficienty mohou být chybné, protože korelace mezi volebním chováním a poměrem mezi ženami a muži zjištěné na úrovni okrsků mohly být teoreticky způsobeny libovolnou kombinací těchto faktorů na individuální úrovni. Jeden z nejvlivnějších výroků na obecné téma vztahů mezi strukturou individuálních a agregovaných dat říká, že je sice možné, aby korelace mezi daty (tj. mezi pohlavím a konzervativností v hlasování) byla na obou úrovních analýzy stejná, ale „podmínky, za kterých k tomu může dojít, jsou dosti vzdálené podmínkám, které se obvykle v datech vyskytují.“ [Robinson 1950: 357] Stručně řečeno, je vysoce pravděpodobné, že korelace zjištěné v datových souborech pro agregovanou a individuální úroveň nebudou shodné. V tomto článku budu postupovat následujícím způsobem. V první části představím problém ekologického usuzování a v následující části podám přehled jeho nejznámějších řešení. Třetí část popíše přístup k ekologickému usuzování, který se nazývá metoda latentní struktury. Ve čtvrté části budu ilustrovat možnosti použití této metody na českých volebních datech. Předposlední část pojedná možnosti valorizace odhadů získaných ekologickým usuzováním pomocí dat z povolebních dotazníkových šetření. Poté uvedu několik závěrečných poznámek. Problém ekologického usuzování Teoretické a empirické poznatky získané z jednotek analýzy na různých úrovních jsou v sociálních vědách velmi rozšířené. Například sociologové zkoumají jednotlivce, rodiny, obce i společnosti; politologové sledují voliče, politické strany, třídy, - 50 - Obrázek 1. Vztah mezi pohlavím a zpĤsobem hlasování v referendu Registrovaní voliþi Muži Ženy Hlasování v referendu Pro návrh Proti návrhu 1-ǃim ǃim ǃiw 1-ǃiw Ti 1-Ti Xi 1-Xi tematické skupiny, celé elektoráty nebo regionální uskupení uvnitř států; a ekonomové studují individuální spotřebu, chování firem nebo mezinárodní obchodní toky. Dění na individuální úrovni zcela zřejmě ovlivňuje i vyšší úrovně agregace a naopak. Jak jsme uvedli v úvodu, explanace a deskripce na různých úrovních by byla velmi obtížná, protože vztah mezi úrovněmi analýzy je často znám jen velmi povrchně, nebo je zcela neznámý.3 Tento problém je znám pod různými názvy: problém ekologického usuzování (ecological inference problem), problém agregačního zkreslení (aggregation bias problem) nebo problém usuzování napříč úrovněmi (cross-level inference problem). V geografii se s ekologickým usuzováním často setkáváme jako s problémem změnitelnosti územní jednotky analýzy (modifiable area unit problem), ve kterém nejde jen o určení vztahů napříč jednotkami analýzy, ale i o to, že zjištěné statistické vztahy mohou být ovlivněny i samotným způsobem konstrukce či agregace (územních) jednotek. Vzhledem k šíři problému ekologického usuzování je vhodné pustit se na tomto místě do podrobnějšího vysvětlení.4 Obrázek 1 ukazuje typický příklad použití ekologického usuzování. Vrátíme-li se k příkladu z úvodu, je cílem prozkoumat rozdíly mezi pohlavími v hlasování při referendu. Za předpokladu, že za všechny volební okrsky je k dispozici pouze úřední statistika hlasování, máme pro každou jednotku k dispozici tři údaje. Za prvé, oficiální výsledky – ty uvádějí, jaký podíl registrovaných voličů v okrsku i tvoří muži [Xi]. Za druhé, analogicky máme údaj, jaký podíl voličů v každém okrsku tvoří ženy [1-Xi]. Za třetí, oficiální výsledky ukazují, jaké procento voličů vyslovilo v referendu souhlas [Ti]. Neznámý zůstává podíl mužů [βim] a žen [βiw], tedy těch, kteří souhlas. Tyto údaje musíme odhadnout z podílu mužů v elektorátu [Xi], celkového podílu lidí, kteří hlasovali pro návrh [Ti], a celkové velikosti registrovaného elektorátu Ni. Stručně řečeno, v obrázku 1 máme údaje pro krajní sloupec a řádek matice, ale nikoli pro každé z jejích čtyř polí. Celkový podíl voličů hlasujících pro návrh se z definice rovná součtu podílů mužů a žen hlasujících pro návrh na celkovém počtu účastnících se voličů. To umožňuje stanovit následující rovnici: Ti = βim Xi + βiw(1-Xi). Bohužel dva členy 3 Převod modelů z individuální úrovně na úroveň vyšší často nefunguje. Achen a Shively [1995: 23-24] ukazují, že v případě jednoduché agregace standardního modelu nepřátelství mezi jednotlivými státy, výsledek neodpovídá vlivnému modelu globálního konfliktu. Obecně lze pozorovat, že verze modelů povýšené z nižších úrovní na vyšší nebo snesené z úrovní vyšších na nižší jsou často neslučitelné s dominantními modely, které byly pro danou konkrétní úroveň analýzy vyvinuty. 4 Výklad je na tomto místě nutně stručný a neformální. Pro více podrobností odkazuji na Achena a Shivelyho [1995]. - 51 - této rovnice jsou neznámé, a proto je neřešitelná. Toto je v literatuře známo jako problém neurčitelnosti (indeterminancy). Jedním z řešení této rovnice je její převedení na regresní model [Ti = βm Xi + βw(1-Xi)] a odhadnutí podílů mužů a žen hlasujících pro (tj. βim a βiw) z dat sebraných za jednotlivé okrsky v celé zemi. Metody ekologického usuzování Uvedený regresní model předpokládá, že podíl voličů, kteří v referendu vyslovili souhlas, je ve všech okrscích stejný. To je velmi silný (a nerealistický) předpoklad. Z regresního modelu tak vyplývají parametrické odhady „průměrného“ podílu souhlasících za muže i ženy ve všech volebních okrscích dohromady. S možností, že podíl souhlasících je v některých okrscích vyšší a v jiných nižší, se nepočítá. Goodmanova ekologická regrese Tento přístup je znám jako Goodmanův model ekologické regrese [Goodman 1953]. Kvůli předpokladu, že vliv pohlaví je ve všech okrscích stejný, mohou z modelu vyplynout špatné odhady, například že souhlas vyslovilo více než sto procent mužů nebo že proti hlasovalo méně než nula procent žen. Tento předpoklad je možné uvolnit tak, aby se rozdíly v hlasování mezi pohlavími mohly lišit okrsek od okrsku a aby se odchylky od celkového průměru staly v regresním modelu součástí chyby odhadu. Toto řešení je však problematické, protože odchylky jednotlivých okrsků od průměrného podílu souhlasících často korelují s nezávislými proměnnými. V důsledku toho dochází v tomto regresním modelu ke zkreslení způsobenému špatnou specifikací modelu. Metoda hranic Alternativou ke Goodmanově ekologické regresi je metoda hranic (method of bounds) navržená Duncanem a Davisem [1953]. Metoda hranic vychází ze skutečnosti, že za určitých okolností je možné určit chování na individuální úrovni z agregovaných dat naprosto přesně. Je to možné tehdy, abychom se vrátili k našemu příkladu, když je elektorát v daném okrsku tvořen výhradně muži nebo výhradně ženami. Zde známe individuální hlasování mužů nebo žen s jistotou. Takovéto krajní situace mohou být sice považovány za triviální a nezajímavé, ale dobře ilustrují užitečnost uplatnění znalosti struktury elektorátu v daném okrsku jako základu pro odhad individuálního volebního chování. Toto chování se totiž bude s jistotou pohybovat uvnitř určitých pevně stanovených limitů či hranic. Metoda hranic zdůrazňuje skutečnost, že podíl určité skupiny – v uváděném případě žen – hlasujících v referendu pro daný návrh má určitou minimální a maximální možnou výši. Minimální limit je určen jako celkový počet voličů v okrsku (kteří k referendu skutečně přišli) snížený o celkový počet mužů v okrsku.5 Maximální limit odpovídá celkovému počtu žen žijících v okrsku nebo podmnožině žen, které se referenda zúčastnily.6 Počet údajů potřebných ke stanovení hranic 5 Teoreticky je možné, aby celkový počet mužů-voličů převyšoval celkovou volební účast. V této situaci bude minimální počet žen-voliček roven nule. 6 Například činí-li míra volební účasti 60 % a podíl žen v tomto elektorátu 80 %, pak je maximální podíl žen-voliček, které se zúčastnily voleb, roven 0,6 / 0,8 = 0,75 a minimální podíl je 0,2 / 0,8 = 0,25. Podobně lze odhadnout i hranice pro muže-voliče: minimum činí - 52 - pro ekologické usuzování o podmíněnosti volebního chování pohlavím se může lišit, protože závisí na poměru mezi ženami a muži v jednotlivých okrscích. Minimální a maximální hranice obvykle uzavírají interval menší než polovina celého rozsahu [0, 1] neboli v rozmezí 0 až 100 procent. Výsledky použití metody hranic jsou teoreticky neproblematické, nicméně často mají příliš široký rozsah, a tak při vysvětlování volebního chování nemívají skutečně podstatný význam. Kingova metoda EI Kingova [1997] novější metoda EI (zkratka pojmenovávající software pro použití jeho techniky ekologického usuzování – Ecological Inference) kombinuje Goodmanův model ekologické regrese s Duncanovou a Davisovou metodou hranic. Kingův postup se skládá ze dvou kroků. V prvním kroku je metodou hranic určen rozsah, ve kterém se pohybují pravdivé hodnoty (např. individuální hlasování mužů a žen). Ve druhém kroku se rozsah stanovený metodou hranic statisticky zužuje s použitím metody maximální pravděpodobnosti, pomocí níž je všem možným hodnotám individuálního hlasování mužů a žen připsána relativní pravděpodobnost jejich pravdivosti. Pravděpodobnostní odhady ve druhém kroku jsou stanoveny pomocí Goodmanova regresního modelu, který je omezen třemi předpoklady. První předpoklad uvolňuje východisko Goodmanova modelu, že podmíněnost volebního rozhodování pohlavím je ve všech volebních okrscích konstantní. V EI je umožněno kolísání vztahu mezi pohlavím a volebním rozhodováním, neboť vzorce volebního chování mužů a žen jsou vzájemně provázané. Vztah mezi pohlavím a volebním rozhodováním v referendu (s možností hlasovat pouze pro nebo proti) je definován jako dvourozměrné normální rozdělení, které je omezené tak, aby všechny hodnoty ležely mezi hodnotami 0 a 1 (neboli 0 až 100 procent). Jedno z možných rozdělení parametrů ilustruje obrázek 2a. Metoda EI předpokládá existenci jediného vrcholu (modu) v rozdělení, který označuje nejpravděpodobnější míru podmíněnosti volebního rozhodování pohlavím zjištěnou v celém elektorátu. Druhým předpokladem v odhadu maximální pravděpodobnosti EI je, že podmíněnost volebního rozhodování pohlavím v jednom okrsku je nezávislá na všech ostatních okrscích, neboli – techničtěji řečeno – že v datech není žádná prostorová korelace. Třetí předpoklad říká, že rozdílné hlasování mužů a žen v žádném z okrsků nekoreluje s celkovým podílem žen a mužů.7 Jedním ze způsobů, jak lze vyjádřit hranice uvedených parametrů (v našem případě volebního chování mužů a žen v referendu), je použití tomografického zobrazení parametrů volebního rozhodování βim a βiw (viz obrázek 2b). Každá z čar vyjadřuje koeficient spojený se všemi platnými možnostmi hlasování žen a mužů. Do tohoto znázornění jsou dále zaneseny hraniční linie maximální hodnoty pravděpodobnosti 50 % a 95 %, uvnitř kterých leží nejpravděpodobnější hodnoty. 0,25 (0,2 / 0,8) a maximum 0,33 (0,2 / 0,6). 7 Tento předpoklad může být uvolněn v rozšíření základního modelu EI, kde lze pro souvislost mezi podmíněností volebního rozhodování pohlavím a složením obyvatelstva okrsku předpokládat konkrétní hodnotu nebo stanovit odhad. - 53 - Obrázek 2a. DvourozmČrné normální rozdČlení pro hlavní parametry modelu Zdroj: King (1997: 105); Schuessler (1999: 10579). Poznámka: Tento obrázek je prezentován pouze pro ilustrativní úþely. Ukazuje hypotetický vztah mezi hlasováním v referendu a pohlavím (ǃim and ǃiw) s omezením normálního rozdČlení do hranic 0 až 1. Tyto dvě hraniční linie ve střední části obrázku 2b jsou vypočteny z dat použitých k sestavení obrázku 2a. Ve společném středu obou elipsoidů leží místo nejvyšší pravděpodobnosti (tj. vrchol obrázku 2a), které je určeno jako bod s nejvyšším počtem průsečíků čar „metody hranic“. Horizontální rozměr každé čáry vyjadřuje volební rozhodování žen v konkrétním okrsku a vertikála ukazuje odpovídající hodnoty pro muže. Hodnoty ležící uvnitř menšího elipsoidu (oblast 50 %) vyjadřují ty hodnoty (βim, βiw), které mají nejvyšší pravděpodobnost, tj. jsou nejblíže vrcholu obrázku 2a. Obrázky 2a a 2b často analytikové používají k vyhodnocení výše uvedených tří předpokladů metody EI. Přes intuitivnost tomografických zobrazení je jejich opodstatněnost zpochybňována [Cho 1998]. Ústřední problém EI nastává, když jsou odhadované hranice široké spíše než úzké. Při širokých hranicích může být usuzování závislé na použitém modelu. Předpoklad, že společné rozdělení βim a βiw má omezené dvourozměrné normální rozdělení, může být chybný, což může vést k nevalidnímu usuzování [King, Rosen, Tanner 2004: 8]. Vzniká tak problém zásadní neurčitelnosti, neboť jakékoliv statistické usuzování závisí na přijetí nějakých předpokladů o rozdělení, ale ke zvolení správné funkční podoby daných parametrických rozdělení přitom nemáme dostatek dat. To v praxi znamená, že ke - 54 - Obrázek 2b. Tomografické zobrazení þar maximální vČrohodnosti s odhady koeficientĤ získaných metodou hranic Zdroj: Schuessler (1999: 10580). Poznámka: Tento obrázek je prezentován pouze pro ilustrativní úþely. Ukazuje, jak by hypoteticky vypadala informace o ǃim a ǃiw v pĜípadČ rĤzných kombinací vztahĤ hlasování a pohlaví podle EI modelování. Horizontální osa ukazuje podíl žen, hlasující pro návrh v referendu v každém z volebních obvodĤ, zatímco vertikální osa prezentuje tutéž informaci pro muže. VČtší oblá þára reprezentuje 95 procentní maximální pravdČpodobnost, zatímco menší þára reprezentuje 50 procentní maximální pravdČpodobnost. Tyto oblé þáry jsou odhady vČtšiny skuteþných hodnot ǃim, ǃiw a jsou dvoudimenzionální projekcí informací obsažených v obrázku 2a. stejným odhadům mohou vést různé předpoklady o rozdělení βim a βiw a data nám neumožňují s jistotou určit, které z nich je nejsprávnější. Gary King a jeho kolegové rozšířili metodu EI tím, že se zaměřili na tuto specifickou otázku. Uvedli, že problém zásadní neurčitelnosti může být úspěšně řešen pomocí hierarchického bayesovského modelování. Tato strategie v podstatě vkládá ještě před použití EI další krok s cílem určit podobu společného rozdělení βim a βiw, místo aby předpokládala, že jde o omezené dvourozměrné normální rozdělení. Modelování je hierarchické v tom smyslu, že postupuje v řadě kroků: 1) modelování volební účasti, 2) odhad parametrů volebního rozhodování mužů a žen, 3) odhad všech neznámých parametrů s použitím techniky statistické simulace. Bayesovské hierarchické modely ekologického usuzování Předtím než uvedu příklad bayesovského hierarchického modelu ekologického usuzování, musím vysvětlit, co míním bayesovským přístupem ke statistické analýze a usuzování. Gill [2008: 5] navrhuje vymezit základy bayesovského myšlení ve třech obecných krocích: - 55 - 1) určit pravděpodobnostní model, který zahrnuje nějaké předchozí poznatky o parametrech, jejichž hodnoty neznáme, 2) rozšířit poznatky o neznámých parametrech tím, že je tato pravděpodobnost podmíněna zjištěnými daty, 3) vyhodnotit schopnost modelu vysvětlit data a citlivost závěrů vůči předpokladům. V tzv. frekvenčním pojetí statistiky, které v sociálních vědách převažuje, je často (ne však vždy) cílem rozhodnout, zda je parametr statisticky významný na základě prahové hodnoty, např. p ≤ 0,05. Naproti tomu ústřední charakteristikou bayesovského modelu je „pravděpodobnostní popis rozdělení daného parametru“ [Gill 2008: 5-6]. Uvědomíme-li si tyto základní vlastnosti bayesovského pojetí statistického modelování, je zřejmé, že Kingův model EI můžeme rozšířit, pokud vlastnosti společného rozdělení βim a βiw nebudeme a priori předpokládat, a naopak je v prvním kroku určíme empiricky. Podrobnosti specifikace a odhadování hierarchického bayesovského modelu pro model ekologického usuzování jsou příliš technické. Pro stručnost zde podávám krátký neformální přehled. Zájemce o matematické podrobnosti odkazuji na Rosena a kol. [2001] a Wakefielda [2004: 404-409]. Jak jsem naznačil výše, prvním krokem v bayesovském hierarchickém modelu ekologického usuzování o podmíněnosti volebního chování pohlavím je modelování očekávaného počtu mužů a žen účastnících se referenda. King a kol. [2004] modelovali volební účast s využitím binomického rozdělení.8 Tento model pravděpodobné volební účasti může být přímo vztažen k tomografickému znázornění v obrázcích 2a a 2b a může být určitým sledem matematických operací prokázáno, že řešení maximální pravděpodobnosti v tomto modelu je shodné s tomografickou čarou. Předpokladem zde je, že podíl žen hlasujících v referendu pro nebo proti (βiw) je výsledkem výběru z beta-rozdělení. Beta-rozdělení jsou užitečná, protože mohou mít i více vrcholů, na rozdíl od podoby znázorněné v obrázku 2a. To odpovídá předpokladu, že v celém elektorátu neexistuje jen jediná nejpravděpodobnější míra podmíněnosti volebního rozhodování pohlavím. Ve třetím kroku se předpokládá, že všechny neznámé parametry v prvních dvou krocích procesu modelování mají exponenciální rozdělení.9 8 V bayesovské analýze jsou informace vnesené do procesu modelování před provedením pozorování nazývány apriorními a proměnné jsou popisovány pravděpodobnostmi, pomocí „apriorních rozdělení“, tj. předpokladů o pravděpodobném rozdělení proměnné v empirické realitě, založených na teorii nebo doplňkových informacích. Naproti tomu „aposteriorní rozdělení“ je takové, které vyplývá z modelování. Kvalita modelu v bayesovské analýze závisí především na míře, ve které aposteriorní rozdělení přináší nové informace o daném parametru oproti rozdělení apriornímu. 9 Rozdělení parametrů jako volební účast a volební rozhodnutí je v bayesovské statistice – při neexistenci formálního matematického modelu – často určeno podle toho, které rozdělení má žádoucí vlastnosti. Například beta-rozdělení je obvykle definováno v intervalu [0, 1] a jeho tvar umožňuje výhodné uvažování o způsobu rozložení volební účasti mezi volebními okrsky. Přesný tvar beta-rozdělení může být odhadován pomocí MCMC. Naproti tomu z exponenciálního rozdělení při neexistenci formální teorie vyplývá, že řada proměnných ovlivňujících volební účast a rozhodnutí může být s výhodou vnímána jako série házení mincí - 56 - Při použití tohoto třífázového modelu se rozdělení všech neznámých parametrů odhaduje uplatněním techniky MCMC (Markov Chain Monte Carlo) na oficiálních volebních výsledcích ze všech okrsků.10 Důležité je, že tento model zkoumání jednoduchého volebního rozhodování (pro nebo proti) u pouhých dvou skupin může být rozšířen i na volební systém s mnoha stranami a tři nebo více populačních skupin (např. sociální třídy, profesní skupiny apod.). Není překvapivé, že odhadování bayesovského hierarchického modelu ekologického usuzování vyžaduje na straně analytika určitou technickou a statistickou zdatnost.11 Mnoho výzkumníků, kteří neovládají bayesovskou statistiku, se proto uchyluje k použití Kingovy [1997] techniky EI, která je spojena se softwarem EzI, nebo jiné techniky s dostupnými a snadno použitelnými softwarovými aplikacemi. Použití Kingovy [1997] techniky EI v českém systému mnoha politických stran přináší malou hodnotu, protože se tato technika omezuje na tabulky o dvakrát dvou polích, kde je cílem explorace témat jako podmíněnost volební účasti nebo volebního rozhodování v referendu pohlavím. Rozšíření EI vyžaduje schopnost programování a z těchto důvodů věnujeme zbývající část článku ilustraci použití jiné techniky ekologického usuzování, která byla navržena speciálně ke zkoumání přesunů voličů mezi stranami v době mezi jedněmi a druhými volbami v systému mnoha stran. Tato technika je navíc dostupná ve standardním softwarovém balíčku STATA a nevyžaduje znalost pokročilých technik souvisejících s bayesovským modelováním. Ekologické usuzování prostřednictvím techniky latentní struktury Ke zkoumání vztahů mezi proměnnými na různých úrovních analýzy můžeme alternativně přistupovat s předpokladem, že je proces vytváření dat podmíněn latentními – nepozorovanými – faktory. Při ekologickém regresním modelování agregovaných dat jsou používány pouze pozorované proměnné, neboť nejsou používány žádné předpoklady ohledně latentních faktorů, které ovlivňují hlasování, jako například stranictví či sociální třída. Je však také možné považovat sledované nezávislé proměnné za ukazatele nesledovaného, latentního faktoru, který zjištěné agregátní vzorce předurčuje. Například preference strany ve volbách může být určena silou pouta, které občané k dané politické straně cítí. V této situaci je podíl mezi všemi voliči. Například padne-li panna, referenda se zúčastním, jinak se nezúčastním. Padne-li panna, budu v referendu hlasovat pro, jinak proti. MCMC je opět využito k odhadu přesného tvaru exponenciálních rozdělení u každé z těchto proměnných v modelu. To jsou intuitivně podané důvody pro použití beta-rozdělení a exponenciálního rozdělení při odhadování ekologických modelů s volebními daty. 10 MCMC je matematický algoritmus pro výběr vzorku z pravděpodobnostních rozdělení. Obvykle se používá k přibližnému určení cílového rozdělení. Markovův řetězec v algoritmu MCMC zajišťuje mírnou vzájemnou korelaci po sobě jdoucích hodnot ve vytvářeném rozdělení, což usnadňuje tvorbu žádoucích aposteriorních rozdělení ze souhrnných statistických údajů [viz Gill 2008: 343ff.]. 11 To v praxi znamená použití specializovaných statistických programů, které obsahují modul MCMC, např. WinBUGS nebo R. Složitost tohoto softwaru je sice v rozumných mezích, ale analytická zběhlost v bayesovské statistice je nutná. Takovéto schopnosti dnes mezi sociálními vědci nejsou příliš rozšířeny. - 57 - hlasů získaný touto stranou v každém okrsku vysvětlován sklonem voličů ke konzistentní podpoře stran v čase.12 Z toho vyplývá, že míry loajality a přesunů k jiným stranám pozorované v agregovaných jednotkách (okrsky či volební obvody) závisejí na latentní míře stranickosti – dlouhodobého emocionálního pouta občanů k určité straně. V řadě zemí je síla stranického pouta nejsilnějším prediktorem volebního rozhodování na individuální úrovni [Lyons, Linek 2007: 196; Lebeda a kol. 2007: 208]. Tato latentní stranickost je zřejmá na výši podpory, kterou strana obdržela v předchozích volbách. Je rovněž možné přidat sociodemografické proměnné každého okrsku ze sčítání lidu, které umožní zohlednit faktory, jako jsou ekonomické podmínky, třídní příslušnost, náboženské vyznání, etnická příslušnost apod., a modelovat volební rozhodování v sérii voleb na různých úrovních (komunální, krajské, parlamentní a evropské) s použitím závislé proměnné, např. volby strany nebo volební účasti. Ekologická faktorová analýza s využitím konceptu stranictví Považujeme-li agregovaná volební a sociodemografická data za ukazatele latentní stranickosti, pak lze za užitečný postup pro vytváření modelu ekologického usuzování o voličských přesunech mezi po sobě následujícími volbami považovat analýzu hlavních komponent (PCA). V těchto ekologických modelech PCA je stranickost operacionalizována jako míra loajality ve volbách po sobě navazujících, zatímco faktor sám představuje stranickost na úrovni územních jednotek. Mezi politology má uvedený pohled na volební chování, který považuje kontinuitu volebního rozhodování v navazujících volbách za stranictví, mnoho zastánců. Tento přístup dává větší smysl než Goodmanův model ekologické regrese, ve kterém jsou míry voličských přesunů vnímány deskriptivně a minulá volba není považována za faktor, který by mohl pomoci vysvětlit pozdější volební chování [Achen, Shively 1995: 167-168]. Nevýhoda použití ekologické faktorové analýzy na více voleb v řadě spočívá v předpokladu neměnnosti struktury volebního chování v čase. Jinými slovy, ekologická faktorová analýza počítá se stabilním elektorátem.13 Volební změna je samozřejmě také důležitá, ale ke studiu mezivolební dynamiky stranické podpory je vhodnější regresní model na spojených datových souborech. Obecný model faktorové analýzy pro jednoduchý systém dvou stran se stoprocentní volební účastí lze vyjádřit rovnicí Dtj = qt + (pt – qt)Dj + Etj. V pomyslné územní jednotce je podíl voličů projevujících přízeň straně 1 vyjádřen jako Dj, za12 Sklon vybírat v dlouhé řadě voleb stále stejnou stranu může být sociálně psychologicky interpretován jako pociťovaná vazba ke straně [Campbell a kol. 1960] nebo může být důsledkem použití stran jako zdrojů politických informací [Schumpeter 1976], posouzení výkonu stran a vlád v minulosti [Fiorina 1981] nebo racionálního hodnocení toho, co strany podle předpokladů udělají v budoucnu [Lewis Beck 1988], může to být indikátor jiných faktorů – třídy, etnické příslušnosti apod. Obecně lze říci, že většina voličů konzistentně hlasuje pro jednu stranu bez ohledu na to, jaké důvody to ovlivňují. 13 Ekologická faktorová analýza by mohla být využita ke studiu kratší časové řady voleb. V takovém případě by bylo možné interpretovat faktory vyvozené z každé analýzy pouze v rámci daného modelu. Navíc by bylo obtížné porovnávat jednotlivé modely podle faktorové zátěže. - 58 - tímco podíl příznivců soupeře (strany 2) je logicky 1 - Dj. Podíl hlasů pro stranu 1 v konkrétních volbách je Dtj, kde pt vyjadřuje podíl věrných příznivců strany 1 a qt podíl příznivců strany 2, kteří odešli ke straně 1. Etj je statistická chyba, jejíž předpokládaná střední hodnota se rovná nule a která nemá souvislost se závisle proměnnou – rozhodnutím hlasovat pro stranu 1 (Dtj). Podíl podpory straně 1 mezi mnoha voliči v dané územní jednotce (Dtj) lze považovat za pozorovanou proměnnou; následně pak Dj představuje tento faktor a qt a (pt – qt) jsou faktorové zátěže. Tento model lze odhadovat pomocí standardní analýzy hlavních komponent, pokud jsou k dispozici data za nejméně troje volby. Jeho interpretace na individuální úrovni je jednoduchá, měří-li faktorové zátěže loajalitu dané straně, respektive odchody od ní, a faktor vyjadřuje míru stranickosti v daném okrsku. Lze tedy říci, že hlasování pro stranu v aktuálních volbách se rovná síle vazby ke straně v dané územní jednotce zvýšené o čistý přírůstek hlasů od minulých voleb [Achen, Shively 1995: 173-174]. Pomocí ekologické faktorové analýzy lze určovat míru změny stranické vazby, ale nikoli o mnoho zajímavější míru přesunů voličů. Tu je ovšem možné z odhadované míry změny stranické vazby vypočítat.14 Je třeba poznamenat, že tento přístup předpokládá dichotomickou povahu vazby, tj. volič se ke straně cítí blízko nebo ne. To je předpoklad nerealistický. Naštěstí může být model latentní struktury pro ekologické usuzování rozšířen tak, aby stranickost byla chápána jako ordinální proměnná s rozsahem od „velmi silná“ přes „silná“, „střední“ a „slabá“ až po „žádná“. Nyní v krátkosti popíši důležité technické podrobnosti. Za předpokladu, že rozdělení pravděpodobnosti hlasování pro jednou stranu v jakékoli územní jednotce je normální, pak odhady získané modelováním stranické podpory s pomocí ekologické faktorové analýzy (tj. podíly transformované na probitovou nebo logitovou škálu) spolu vzájemně souvisejí. Měřené hodnoty voličské podpory jsou proto prostě částmi každého z těchto normálních rozdělení (určenými počtem stran v modelu a počtem voličů, kteří nehlasovali). Ve statistice je souvislost mezi normálními rozděleními dobře prozkoumána a je známa pod pojmem tetrachorická korelace. Pomocí tetrachorické korelace je možné k odhadu míry voličských přesunů použít koncept latentní vazby ke straně. Uvedený výklad lze shrnout slovy, že podle latentního přístupu k ekologickému usuzování platí, že je-li stranická volba primárně určena dvěma nebo více štěpeními, např. třídou a hranicí mezi městem a venkovem, pak lze vztah mezi vzorci hlasování na agregované a individuální úrovni zjednodušit přijetím dvou předpokladů, které činí odhad modelu řešitelným. Tyto předpoklady jsou: a) determinanty volebního rozhodování na individuální a agregované úrovni jsou stejné, tj. je přítomen isomorfismus, b) rozptyl vysvětlený latentními faktory (třídou a odlišností mezi městem a venkovem) má na individuální i agregované úrovni obdobně vysokou hodnotu. 14 K odhadu pravděpodobnosti hlasování pro konkrétní stranu x ve volbách 1 a 2 mohou být použity modely stranictví. Vývoj volebních rozhodnutí mezi volbami se považuje za nezávislý (nepodmíněný stranickostí), a tak je pravděpodobnost konzistentního hlasování pro jednu stranu v obou případech voleb vyjádřena jednoduše jako pravděpodobnost hlasování dvakrát pro stranu x vydělená pravděpodobností hlasování pro stranu x ve volbách 1. - 59 - Zároveň se pro jednoduchost předpokládá, že celkové počty voličů jsou v po sobě následujících volbách stejné. To je rozumný předpoklad v případě, že mezi volbami nenastanou velké demografické změny. Model však umožňuje specifikovat změnu velikosti elektorátu skrze mechanismy registrace, úmrtí a migrace v době mezi volbami technikou iterativního odhadování. Je třeba zdůraznit, že do tohoto modelu jsou zahrnuti všichni registrovaní voliči. Ti voliči, kteří k volbám nepřijdou, se považují za příznivce „strany nevoličů“. Matematické podrobnosti techniky latentní struktury, které nejsou součástí tohoto neformálního úvodu, popisuje Thomsen [1999, 2007]. Předpoklad isomorfismu znamená, že ty samé latentní dimenze, které v konkrétní územní jednotce popisují rozdíly mezi jednotlivci, by měly popisovat i rozdíly mezi homogenními politickými regiony v rámci země. To bude s větší jistotou platit pro malé oblasti, např. volební okrsky, a s menší jistotou pro oblasti větší, například volební obvody nebo kraje. Tento předpoklad bude také blíže pravdě ve funkčně homogenních regionech, definovaných specifickými strukturami štěpících linií, např. rozložení levice a pravice. V takto politicky homogenních regionech mohou být předpokládány konstantní hodnoty parametrů modelu u všech jednotlivců. Funkčně homogenní regiony s lokálními „politickými kulturami“ určíme pomocí některé z technik redukce dat, například hierarchické shlukové analýzy. Použití techniky latentní struktury na volebních datech z ČR Abych předvedl fungování latentního přístupu v praxi, analyzoval jsem data z okresů o hlasování ve volbách do Poslanecké sněmovny v roce 2002 a do Evropského parlamentu v roce 2004.15 Cílem této analýzy bylo odhadnout vzorce přesunů mezi stranami. V roce 2004 byla volební účast o 30 procentních bodů nižší než v roce 2002 (pokles z 58 % na 28 %) a podpora hlavní vládnoucí strany ČSSD mezi registrovanými voliči poklesla ze 17,5 % na 2,5 %. Základní otázka zní: kteří voliči hlasovali v roce 2002, ale v roce 2004 se rozhodli k volbám nepřijít? Stala se ČSSD větší obětí tohoto rozdílu ve volební účasti než ostatní strany? Prvním krokem v ekologickém usuzování technikou latentní struktury je určení politicky homogenních regionů, na které se území republiky člení. Za účelem empirického určení počtu politických regionů jsem převedl procenta volební účasti a podpory jednotlivých stran na logitové skóry a takto transformovaná data jsem podrobil hierarchické shlukové analýze. Při ní jsem použil a) metodu „blokové vzdálenosti“, a to z teoretických důvodů a z důvodu robustnějšího řešení, b) metodu „vnitroskupinové vazby“, abych zajistil co největší vnitřní homogenitu shluků. K určení optimálního počtu shluků (politicky homogenních regionů) není k dispozici žádný formální statistický test, a tak se rozhodování o jejich „optimálnosti“ musí řídit jejich smysluplností. V této souvislosti výběr konkrétní kombinace shluků odůvodňuji souvislou povahou okresů v daných regionech nebo přítomností význačných urbánních nebo venkovských vzorců volební podpory stran. Na volebních datech za ČR z let 2002 a 2004 jsem zkoumal řešení o jednom až čtyřech shlucích. Jako nejvhodnější se ukázalo řešení o čtyřech shlucích. Grafické znázornění výsledků shlukové analýzy obsahuje obrázek 3. 15 Podrobnější popis tohoto výzkumu přinesli Linek a Lyons [2007a, b; 2008]. - 60 - Obrázek 3. Regiony s podobnou strukturou voliþského chování získané na základČ hierarchické shlukové analýzy výsledkĤ voleb do PS v roce 2002 a EP v roce 2004 Poznámka: Shluková analýza byla provedena na 159 územních jednotkách, jež byly definovány jako okresy, z nichž byly vyþlenČny okresní mČsta; Praha byla rozdČlena do patnácti mČstských þástí. Obrázek ukazuje existenci čtyř lokálních politických kultur: 1) Čechy a urbanizované části Moravy, 2) venkovské části Moravy, 3) Praha, 4) severozápadní Čechy. Tyto čtyři politické shluky představují regiony s odlišnou historií, např. Moravu nebo Sudety (do značné míry obsažené ve shluku severozápadních Čech), nebo se společnou sociální strukturou, např. Čechy spolu s urbánní Moravou. Podobná analýza voličských přesunů mezi volbami v letech 2002 a 2006 dává naprosto stejný výsledek, což prokazuje, že tato regionální struktura je stabilní. Dřívější výzkum voleb v letech 1920 až 1979 v Dánsku rovněž ukázal podobný druh regionálního členění se značnou stabilitou v čase [Thomsen 1987]. Voličské přesuny mezi vládními a opozičními stranami Předběžné zkoumání vzorců voličských přesunů na národní úrovni a v uvedených čtyřech politických regionech odhalilo některé systematické rozdíly. Odhadované výsledky voličských přesunů jsou uvedeny v tabulce 1. Podle nejvlivnějšího vysvětlení rozdílů volebního chování mezi parlamentními a evropskými volbami bychom měli zaznamenat pokles podpory vládních stran (ČSSD, KDU-ČSL a US-DEU) a zároveň zisky stran opozičních (ODS a KSČM).16 16 Zde mám na mysli teorii voleb druhého řádu, kterou původně navrhli Reif a Schmitt [1980]. Ti tvrdili, že voliči pohlížejí na jednotlivé typy voleb hiearchicky. Parlamentní volby považují za nejdůležitější (prvního řádu) a ostatní volby, například krajské nebo evropské, jsou pro ně méně důležité (druhého řádu). Podle této teorie se volby druhého řádu vyznačují relativně - 61 - Odhady uvedené v tabulce 1 ukazují významné regionální rozdíly ve voličských přesunech mezi vládními a opozičními stranami. Například v Praze v roce 2004 přešlo k opozičním stranám 45 % příznivců vládních stran. Národní průměr byl přitom jen 18 %. Silné regionální rozdíly panovaly i v míře volební účasti původních příznivců vládních stran – v severovýchodních Čechách nevolilo 80 % občanů, zatímco v Praze byla míra volební neúčasti 45 %. Ojediněle vysokou míru stranické loajality (37 %) vykazoval moravský venkov [Linek, Lyons 2007a: 348-349]. Voličské přesuny mezi velkými a malými stranami Jednou z charakteristických vlastností evropských voleb je pokles podpory velkých stran ve prospěch stran malých. Označení „velká“, „středně velká“ a „malá“ používám pro strany, jejichž podpora v roce 2002 činila min. 20 % (tj. ČSSD a ODS), 11–19 % (Koalice a KSČM), resp. max. 10 %. Nejvěrnější voliči náleželi středně velkým stranám, křesťanským demokratům a komunistům, které v předchozích výzkumech vykázaly nejvyšší míru stranické identifikace. Tento jev se ovšem liší mezi regiony, protože příznivci středně velkých stran z roku 2002 mimo Prahu, kteří šli v roce 2004 k volbám, většinou zůstávali věrní, případně přecházeli k malým stranám. Ve velkoměstské Praze tito „příznivci středně velkých stran“ (pokud šli v roce 2004 k volbám) většinou nezůstávali své straně věrní (16 %), nýbrž přecházeli k menším stranám, a to v míře třikrát převyšující národní průměr (tj. 39 % oproti 13 %). Obecněji výsledky ekologického usuzování říkají, že voličské přesuny mezi malými a velkými stranami v letech 2002–2004 byly asymetrické. Příznivci vládních stran z roku 2002, kteří v červnu 2004 přešli k malým stranám, tvořili 2,8 % celkového elektorátu. Opačným směrem však přešel mnohem nižší podíl voličů – pouhých 0,4 % (podrobnosti viz Linek, Lyons [2007a: 353-355]). Uvedené dva vzorce voličských přesunů přímo souvisejí s teorií voleb druhého řádu (viz poznámku 16). Tato teorie byla nejčastěji ověřována na agregovaných volebních datech a výsledky byly často vysvětlovány motivací individuálních voličů. Klíčovou předností techniky ekologického usuzování je možnost testovat základní prvky této teorie týkající se individuální úrovně na volebních datech z úrovně agregované. Jak jsem však uvedl výše, všechny techniky ekologického usuzování jsou založeny na předpokladech o analyzovaných datech a odhady získané z modelů ekologického usuzování je důležité validizovat jinými typy dat. Validizace odhadů získaných ekologickým usuzováním Validita techniky latentní struktury při odhadování voličských přesunů na individuální úrovni s pomocí okrskových dat je zcela zásadně podmíněna přijatými předpoklady. Margolis [1988], Cleave a kol. [1995] a King [1997: 121-122] kritizují Thomsenovu [1987] techniku latentní struktury při ekologickém usuzování z volebních dat v Dánsku, Finsku a Švédsku na základě čtyř kritérií. Za prvé, základním předpokladem Thomsenova přístupu je shoda tetrachorických korelací na agregované a individuální úrovni. Porovnání švédských odhadů získaných ekologickým usuzováním a na základě dotazníkového šetření naznačuje konzervativnost tohoto přístupu, tj. fakt, že míru voličských přesunů podceňuje. menší účastí a poklesem podpory velkých stran a stran vládních. Dva z těchto předpokladů zde velmi stručně diskutujeme. Podrobnější zkoumání viz Linek a Lyons [2007a, b]. - 62 - - 63 - 0,5 4,4 0,1 0,2 0,0 0,0 0,2 0,7 6,2 0,7 0,2 4,3 0,3 0,1 0,1 0,3 0,8 6,8 ODS 1,1 0,2 0,1 0,2 0,0 0,0 0,2 0,6 2,4 Venkovská Morava (N=21) 2002/2004 ýSSD KSýM ýSSD KSýM ODS Koalice SN SZ Ostatní Nevoliþi Celkem 0,3 0,1 7,1 0,3 0,0 0,1 0,1 0,8 8,8 1,0 0,1 0,3 0,2 0,0 0,1 0,1 0,9 2,6 0,9 3,3 0,2 0,0 0,0 0,0 0,1 1,2 5,8 ýSSD KSýM ODS Koalice SN SZ Ostatní Nevoliþi Celkem ODS 0,5 0,3 0,1 4,0 0,0 0,1 0,1 0,7 5,7 KDU 0,3 0,1 0,1 1,4 0,0 0,0 0,1 0,4 2,4 KDU 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,1 0,3 ULD 0,1 0,0 0,1 0,1 0,0 0,0 0,0 0,2 0,4 ULD 0,8 0,0 0,3 0,2 0,1 0,0 0,1 0,5 2,1 SNK 0,6 0,0 0,9 0,4 0,0 0,1 0,1 0,9 2,9 SNK 0,1 0,1 0,1 0,1 0,0 0,0 0,1 0,2 0,7 SZ 0,1 0,0 0,2 0,1 0,0 0,1 0,0 0,4 0,9 SZ 0,6 0,3 0,3 0,1 0,0 0,0 0,1 0,8 2,1 NEZ 0,4 0,5 0,2 0,2 0,0 0,0 0,2 0,9 2,4 NEZ 0,2 0,8 0,1 0,4 0,0 0,0 0,1 0,5 2,2 Ostatní 0,2 0,2 0,3 0,2 0,1 0,0 0,6 0,5 2,1 Ostatní Celkem 18,1 10,5 14,4 7,8 1,7 1,4 4,3 41,9 100,0 Celkem 14,1 18,6 6,3 12,6 5,8 11,2 5,7 11,1 1,9 2,2 1,0 1,3 3,4 4,6 33,5 38,4 71,6 100,0 (pokraþování...) Nevoliþi 14,2 6,3 5,2 4,8 1,4 1,0 3,1 35,7 71,7 Nevoliþi PĜesuny voliþĤ mezi volbami do PS v roce 2002 a EP v roce 2004 ve 4 regionech (celková procenta) - 1. þást ýechy a moravská mČsta (N=91) 2002/2004 ýSSD KSýM Tabulka 1. - 64 - 1,1 0,3 0,2 0,2 0,0 0,0 0,0 0,4 2,1 0,9 3,4 0,1 0,1 0,0 0,0 0,1 1,0 5,9 0,1 0,1 5,9 0,1 0,0 0,1 0,2 0,9 6,1 ODS Severozápadní ýechy (N=27) 2002/2004 ýSSD KSýM ýSSD KSýM ODS Koalice SN SZ Ostatní Nevoliþi Celkem 1,2 0,4 7,8 1,8 0,1 0,0 0,1 0,5 11,9 0,5 0,1 0,3 0,4 0,0 0,0 0,1 1,2 2,6 ODS 2,0 2,0 0,2 0,0 0,0 0,0 0,0 0,4 4,7 ýSSD KSýM ODS Koalice SN SZ Ostatní Nevoliþi Celkem KSýM 0,4 0,1 0,0 0,1 0,0 0,0 0,0 0,2 0,9 KDU 0,2 0,0 0,4 0,7 0,0 0,0 0,0 0,4 1,7 KDU 0,1 0,0 0,0 0,1 0,0 0,0 0,0 0,1 0,4 ULD 0,1 0,0 0,2 0,4 0,0 0,0 0,0 0,3 1,0 ULD 0,2 0,0 0,6 0,2 0,0 0,0 0,0 0,8 1,9 SNK 0,1 0,0 1,0 4,6 0,0 0,0 0,0 0,4 6,1 SNK 0,0 0,0 0,3 0,0 0,0 0,0 0,0 0,2 0,6 SZ 0,1 0,0 0,2 0,8 0,0 0,0 0,0 0,3 1,4 SZ 0,1 0,2 0,4 0,0 0,1 0,1 0,3 1,0 2,2 NEZ 0,6 0,6 0,3 0,0 0,0 0,0 0,2 0,6 2,3 NEZ 0,1 0,2 0,2 0,0 0,1 0,0 0,7 0,5 1,7 Ostatní 0,3 0,1 0,5 0,1 0,1 0,1 0,3 0,5 2,0 Ostatní Celkem 15,6 7,0 19,9 10,4 1,3 1,5 3,8 40,5 100,0 Celkem 13,1 16,1 7,9 12,7 4,9 11,3 3,2 4,1 0,9 1,1 1,0 1,4 2,7 1,1 44,4 49,3 78,2 100,0 (pokraþování...) Nevoliþi 10,6 3,8 9,0 1,5 1,0 1,2 3,1 36,0 66,3 Nevoliþi PĜesuny voliþĤ mezi volbami do PS v roce 2002 a EP v roce 2004 ve 4 regionech (celková procenta) - 2. þást Praha (N=20) 2002/2004 ýSSD Tabulka 1. - 65 - ULD SNK SZ NEZ Ostatní Nevoliþi Celkem ýSSD 0,9 1,0 0,5 0,3 0,1 0,5 0,1 0,4 0,2 13,5 17,5 KSýM 0,2 3,4 0,1 0,1 0,0 0,0 0,0 0,5 0,3 6,1 10,7 ODS 0,2 0,2 6,3 0,1 0,1 0,8 0,2 0,3 0,3 5,8 14,2 Koalice 0,2 0,1 0,5 1,6 0,1 1,0 0,2 0,1 0,2 4,2 8,3 SN 0,0 0,0 0,1 0,0 0,0 0,0 0,0 0,0 0,1 1,3 1,6 SZ 0,0 0,0 0,1 0,0 0,0 0,1 0,0 0,0 0,0 1,1 1,4 Ostatní 0,1 0,1 0,2 0,1 0,0 0,1 0,0 0,2 0,4 3,1 4,3 Nevoliþi 0,8 1,0 0,8 0,4 0,2 0,7 0,3 0,8 0,5 36,6 42,1 Celkem 2,5 5,7 8,5 2,7 0,5 3,1 0,9 2,3 2,0 71,8 100,0 Poznámka: Jedná se o podíly voliþĤ na celkovém poþtu oprávnČných voliþĤ. Tím pádem celkové hodnoty podpory stran neudávají bČžnČ známé hodnoty o podpoĜe tČchto stran ve volbách, neboĢ celkových sto procent tvoĜí I nevoliþi. N odkazuje k poþtu územních jednotek. KDU PĜesuny voliþĤ mezi volbami do PS v roce 2002 a EP v roce 2004 ve 4 regionech (celková procenta) - 3. þást Všechny územní jednotky-ýR (N=159) 2002/2004 ýSSD KSýM ODS Tabulka 1. V důsledku toho nemusí být vždy platný předpoklad vysokého poměru rozptylů. Za druhé, tato technika ekologického usuzování vyžaduje volbu „referenční“ kategorie. Tato volba má na získané odhady značný vliv. Za třetí, standardní postup, kdy je vytvářena referenční kategorie nevoličů, se nezakládá na žádném teoreticky odůvodněném kritériu, nýbrž pouze na zkušenostech. Za čtvrté, validita a reliabilita odhadů zásadním způsobem závisí na vymezení politicky homogenních územních celků. Tento klíčový krok je však prováděn čistě induktivně a vůči ekologickému usuzování technikou latentní struktury je vnější. Na obranu své techniky ekologického usuzování pomocí latentní struktury Thomsen [1987, 1999] na jednu stranu uznal, že při neplatnosti čtveřice předpokladů by výsledné odhady byly skutečně zatíženy systematickou chybou. Na stranu druhou ale uvedl, že uvažovaná nepřítomnost systematické nebo náhodné chyby je klíčovým důvodem, proč o odhady prostřednictvím ekologického usuzování voličských přesunů vůbec usilujeme. Postupy ekologického usuzování jsou teoreticky pokročilejší než odhady voličských přesunů na základě dotazníkových šetření, které, jak známo, trpí zkreslením odpovědí (chybnými odpověďmi) a výběrovou chybou vzniklou v procesu šetření [Berglund, Thomsen 1990: 14-17; Thomsen, Berglund, Wörlund 1991: 443-445]. Validizovat odhady získané za použití ekologického usuzování lze vzájemným srovnáním odhadů voličských přesunů z ekologického usuzování a dotazníkových šetření. Přístup k volebním údajům za individuální voliče je vzácný (v důsledku ochrany osobních údajů), a tak většinou nemůžeme správnost technik ekologického usuzování ověřit přímo. Zároveň jsou zřídka dostupná rozsáhlá panelová šetření, která by byla pro účely analýzy prováděná po dvou po sobě jdoucích volbách.17 Nejlepším dostupným postupem je v této souvislosti použití datových souborů z jednorázových šetření, které jsou pro křížové ověření odhadů ekologickým usuzováním snadno dostupné. V České republice máme za volební rok 2004 přístup k (1.) exit-pollovému šetření a (2.) povolebnímu šetření. Exit-pollové šetření provedené agenturou SC&C pro Českou televizi zahrnovalo velký počet respondentů (n = 9028), ale z definice se týkalo pouze těch, kteří přišli k volbám a svolili k rozhovoru. Může proto být zatíženo systematickým zkreslením, pokud jde o profil celého elektorátu, jehož většina (62 %) v roce 2004 nehlasovala. Krátce po evropských volbách (od 29. 6. do 7. 7.) byla dále uskutečněna česká vlna Evropské volební studie (European Election Study) se vzorkem 889 respondentů. Zde byla na vzorku celého českého elektorátu použita dosti široká škála postojových otázek. Retrospektivní měření hlasování nám sice umožňuje sestavit matici voličských přesunů, ale je nepřesné kvůli známému zkreslení odpovědí [Wright 1993; Tourangeau, Rips a Rasinski 2000]. Výsledky tohoto šetření nadhodnocují volební účast o 22 %. Postup validizace je založen na přímém srovnávání tří matic voličských přesunů, z nichž první byla vytvořena technikou ekologického usuzování, druhá pochází 17 Tyto výsledky navíc zkresluje panelový efekt: 1) vliv účasti v panelu na učení – respondenti věnují politice větší pozornost, 2) výběrové zkreslení – respondenti s menším zájmem o politiku opouštějí panel častěji než lidé s větším zájmem. V důsledku toho jsou míry voličské loajality nadhodnocovány. Pokud tedy odhady z ekologického usuzování s panelovými šetřeními úzce souvisejí, může to být paradoxně dokladem nesprávnosti ekologického modelu [Achen, Shively 1995: 176-177]. - 66 - z Evropské volební studie a třetí z exit-pollového šetření SC&C s použitím Duncanova indexu odlišnosti (DDI).18 Předpokladem této valorizace je, že rozpětí hodnot v uvedených třech maticích voličských přesunů vyjadřuje skutečné hodnoty voličských přesunů, které jsou neznámé. Na základě toho si můžeme být jisti, že vzorce voličských přesunů přítomné ve všech třech maticích se blíží pravdivým hodnotám, i když přesné odhady odvozené z jednotlivých datových souborů se nejspíše budou od skutečné hodnoty lišit kvůli přítomnosti jiných zdrojů chyby nebo zkreslení. Velikost matice a použití indexu odlišnosti Pozorný čtenář si asi povšiml, že matice voličských přesunů získané z ekologického usuzování a dotazníkových šetření SC&C a Evropská volební studie v tabulkách 2 a 4 mají rozdílnou velikost (tj. jiný počet řádek a sloupců). Důvodem je skutečnost, že z šetření SC&C byli vyloučeni nevoliči a dvě malé strany, a proto je zde o 40 % méně dat než u zbývajících dvou matic voličských přesunů. Porovnání všech tří odhadů DDI je tedy problematické, neboť podíl v každé podskupině se změní kvůli tomu, že počet sledovaných kategorií již není konstantní. Z toho důvodu jsou pro valorizaci nejzajímavější odhady DDI u matic ekologického usuzování a Evropské volební studie. Je sice možné zmenšit tyto dvě matice na rozměr matice z průzkumu SC&C, ale tím bychom obětovali hodnotné informace a mohli bychom v datech způsobit zkreslení. Proto uvádíme výsledky SC&C velmi neformálním způsobem, především k ilustraci pravděpodobných účinků porovnání vzorců voličských přesunů v celých elektorátech s podmnožinou všech registrovaných voličů. Sladění odhadů z šetření s výsledky voleb v letech 2002 a 2004 Při porovnávání hodnot voličských přesunů mezi různými případy voleb není velikost matice jediným problémem. Aby bylo možné validně porovnávat odhady z ekologického usuzování s výsledky dotazníkových šetření, musíme výsledky šetření sladit se skutečnými výsledky voleb v obou letech, stejně jako to činíme v ekologické analýze. Pokud bychom odhady nesladili, ve skutečnosti bychom porovnávali odhady různého druhu. Kvůli tomu by se porovnávané tři matice voličských přesunů neshodovaly. Jelikož není možné vytvořit jednotnou váhu pro oba případy voleb zároveň, musí být použit iterativní postup vážení [Thomsen 1991: 448]. Při něm se používá technika log contingency. Ta převažuje procenta voličských přesunů získaná z šetření tak, aby odpovídala skutečným volebním výsledkům. Pro účely iterativního vážení předpokládáme, že rozdělení volebních dat je dvourozměrné normální [Kostelecký, Čermák 2003]. Výsledky validizace Porovnání odhadů voličských přesunů získaných z ekologického usuzování a obou šetření komplikuje skutečnost, že z průzkumu SC&C byli vyloučeni nevoliči (z definice) a jedna malá strana, která působila ve vládě, ale nezískala žádné křeslo 18 Tento statistický nástroj [Runcán, Duncan 1955] popisuje celkovou míru, v níž je určitá série skupin nerovnoměrně rozložena mezi územní oblasti (okrsky) nebo zjištěné skupiny (jako v naší studii). Popularita indexu odlišnosti vyplývá částečně z toho, že jeho hodnota není ovlivněna prostými změnami ve složení populace [viz Sakoda 1981; Taylor, Gorard a Fitz 2000]. - 67 - - 68 - 2,1 0,2 0,1 0,0 0,0 0,0 0,0 0,1 2,5 ýSSD KSýM ODS Koalice SN SZ Ostatní Nevoliþi Celkem ýSSD KSýM ODS Koalice SN SZ Ostatní Nevoliþi Celkem 2002/2004 0,9 0,2 0,2 0,2 0,0 0,0 0,1 0,8 2,5 ýSSD Ekologické usuzování ýSSD 2002/2004 1,0 3,4 0,2 0,1 0,0 0,0 0,1 1,0 5,7 KSýM 5,7 4,8 0,1 0,0 0,0 0,0 0,1 0,0 0,8 KSýM 0,5 0,1 6,3 0,5 0,1 0,1 0,2 0,8 8,5 ODS 8,5 0,0 6,5 0,2 0,0 0,0 0,5 0,5 0,8 ODS 0,3 0,1 0,1 1,6 0,0 0,0 0,1 0,4 2,7 KDU 2,7 0,0 0,1 2,1 0,0 0,2 0,1 0,1 0,2 KDU 0,1 0,0 0,1 0,1 0,0 0,0 0,0 0,2 0,5 ULD 0,5 0,0 0,5 0,0 0,0 0,0 0,0 0,0 0,0 ULD 0,5 0,0 0,8 1,0 0,0 0,1 0,1 0,7 3,1 SNK 3,1 0,0 0,6 1,0 0,0 0,0 0,3 0,5 0,7 SNK 0,1 0,0 0,2 0,2 0,0 0,0 0,0 0,3 0,9 SZ 0,9 0,0 0,1 0,1 0,0 0,4 0,0 0,3 0,1 SZ 0,4 0,5 0,3 0,1 0,0 0,0 0,2 0,8 2,3 NEZ 2,3 0,2 0,1 0,3 0,4 0,0 0,1 0,3 1,0 NEZ 0,2 0,3 0,3 0,2 0,1 0,0 0,4 0,5 2,0 Ostatní 2,0 0,0 0,2 0,0 0,0 0,0 0,9 0,3 0,7 Ostatní 13,5 6,1 5,8 4,2 1,3 1,1 3,1 36,6 71,8 Nevoliþi 71,8 5,6 6,0 4,6 1,2 0,9 2,3 40,1 11,1 Nevoliþi 17,5 10,7 14,2 8,3 1,6 1,4 4,3 42,1 100,0 Celkem 100,0 10,7 14,2 8,3 1,6 1,4 4,3 42,1 17,5 Celkem Srovnání voliþských pĜesunĤ mezi volbami do PS v roce 2002 a EP v roce 2004 na základČ Evropské volební studie a ekologického usuzování (celková procenta) - 1. þást Evropská volební studie 2004 Tabulka 2. - 69 - Celkem KSýM ODS Koalice SN SZ Ostatní Nevoliþi ýSSD 2002/2004 0,0 0,0 -0,1 -0,2 0,0 0,0 -0,1 -0,7 1,2 ýSSD 0,0 1,4 -0,1 -0,1 0,0 0,0 0,0 -1,0 -0,2 KSýM 0,0 -0,1 0,2 -0,3 -0,1 -0,1 0,3 -0,3 0,3 ODS KDU 0,0 -0,1 0,0 0,5 0,0 0,2 0,0 -0,3 -0,1 ULD 0,0 0,0 0,4 -0,1 0,0 0,0 0,0 -0,2 -0,1 0,0 0,0 -0,2 0,0 0,0 -0,1 0,2 -0,2 0,2 SNK 0,0 0,0 -0,1 -0,1 0,0 0,4 0,0 0,0 0,0 SZ 0,0 -0,3 -0,2 0,2 0,4 0,0 -0,1 -0,5 0,6 NEZ 0,0 -0,3 -0,1 -0,2 -0,1 0,0 0,5 -0,2 0,5 Ostatní 0,0 -0,5 0,2 0,4 -0,1 -0,2 -0,8 3,5 -2,4 Nevoliþi 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 Celkem Srovnání voliþských pĜesunĤ mezi volbami do PS v roce 2002 a EP v roce 2004 na základČ Evropské volební studie a ekologického usuzování (celková procenta) - 2. þást Rozdíl: Evropská volební studie 2004 mínus ekologické usuzování Tabulka 2. Tabulka 3. Srovnání voliþských pĜesunĤ mezi volbami do PS v roce 2002 a EP v roce 2004 na základČ Evropské volební studie a exit-pollového šetĜení (celková procenta) Evropská volební studie 2004 2002/ 2004 ýSSD KSýM ODS KDU SNK SZ NEZ Ostatní Celkem ýSSD KSýM ODS Koalice Ostatní Nevoliþi 5,7 0,4 0,7 0,0 0,0 2,1 3,5 15,6 0,7 0,0 0,5 0,0 1,1 0,0 22,6 1,0 1,2 4,1 0,2 0,0 0,2 8,3 0,3 0,6 0,8 0,0 1,5 5,1 0,5 3,0 0,1 0,0 0,3 0,6 0,6 1,6 1,7 0,2 0,4 2,0 1,2 2,7 1,1 0,0 2,8 0,0 2,4 2,7 14,2 16,1 29,1 17,0 6,7 16,9 Celkem 8,8 20,3 30,0 9,6 11,0 3,2 8,2 8,9 100,0 Exit-pollové šetĜení 2002/ 2004 ýSSD KSýM Ostatní Celkem ODS KDU SNK SZ NEZ ýSSD 6,4 2,5 1,4 0,4 1,1 0,4 1,3 0,8 14,2 KSýM ODS 0,1 0,6 14,9 0,3 0,1 21,8 0,1 0,4 0,1 2,3 0,0 0,3 0,4 2,3 0,5 1,2 16,1 29,1 Koalice Ostatní 0,3 0,2 0,3 0,2 1,7 0,5 7,5 0,2 4,0 1,5 0,6 1,0 0,6 1,2 2,0 2,1 17,0 6,7 Nevoliþi 1,2 2,2 4,6 1,0 2,1 0,9 2,5 2,4 16,9 Celkem 8,8 20,3 30,0 9,6 11,0 3,2 8,2 8,9 100,0 Rozdíl: Evropská volební studie 2004 mínus exit-pollové šetĜení 2002/ 2004 ýSSD KSýM ODS KDU SNK SZ NEZ Ostatní Celkem ýSSD -0,7 1,0 -0,2 -0,2 -0,3 -0,2 0,3 0,3 0,0 KSýM ODS 0,3 0,0 0,7 0,5 -0,1 0,8 -0,1 0,2 -0,1 -0,8 0,0 0,1 -0,1 -1,9 -0,5 1,6 0,0 0,0 Koalice Ostatní -0,3 -0,2 -0,3 0,3 -0,7 0,7 0,7 0,1 1,1 -0,9 0,1 -0,4 1,3 0,1 -2,0 0,3 0,0 0,0 Nevoliþi 0,9 -2,2 -0,5 -0,4 1,0 0,7 0,3 0,3 0,0 Celkem 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 v Evropském parlamentu (US-DEU, resp. koalice ULD). Chceme-li tedy porovnat všechny matice voličských přesunů, musíme se zaměřit pouze na voliče, kteří přišli k volbám. Zároveň ale jsme schopni porovnávat odhady voličských přesunů za celý elektorát na základě Evropské volební studie a výsledků ekologického usuzování. Všechna tato srovnání jsou uvedena v tabulkách 2, 3 a 4. Pro stručnost opět neuvádím podrobnosti o rozdílech zjištěných v těchto tabulkách a případné zájemce odkazuji k podrobnější diskusi u Linka a Lyonse [2007a: 345-347; 2007b: 255, pozn.). Obrázek 4 znázorňuje shrnutí DDI za všechny tři - 70 - Tabulka 4. Srovnání voliþských pĜesunĤ mezi volbami do PS v roce 2002 a EP v roce 2004 na základČ exit-pollového šetĜení a ekologického usuzování (celková procenta) Exit-pollové šetĜení 2002/ 2004 ýSSD KSýM Ostatní Celkem ODS KDU SNK SZ NEZ ýSSD 6,4 2,5 1,4 0,4 1,1 0,4 1,3 0,8 14,2 KSýM ODS 0,1 0,6 14,9 0,3 0,1 21,8 0,1 0,4 0,1 2,3 0,0 0,3 0,4 2,3 0,5 1,2 16,1 29,1 Koalice Ostatní 0,3 0,2 0,3 0,2 1,7 0,5 7,5 0,2 4,0 1,5 0,6 1,0 0,6 1,2 2,0 2,1 17,0 6,7 Nevoliþi 1,2 2,2 4,6 1,0 2,1 0,9 2,5 2,4 16,9 Celkem 8,8 20,3 30,0 9,6 11,0 3,2 8,2 8,9 100,0 Ekologické usuzování 2002/ 2004 ýSSD KSýM Ostatní Celkem ODS KDU SNK SZ NEZ ýSSD 3,3 3,7 1,8 1,0 1,6 0,3 1,4 1,0 14,2 KSýM ODS 0,5 0,9 11,9 0,6 0,5 22,1 0,3 0,3 0,1 2,5 0,1 0,6 1,6 0,9 1,2 1,1 16,1 29,1 Koalice Ostatní 1,1 0,5 0,3 0,7 2,3 1,0 6,4 0,4 4,1 0,5 1,0 0,3 0,5 1,1 1,5 2,2 17,0 6,7 Nevoliþi 2,5 3,1 2,4 1,2 2,1 0,9 2,7 2,0 16,9 Celkem 8,8 20,3 30,0 9,6 11,0 3,2 8,2 8,9 100,0 Rozdíl: ekologické usuzování mínus exit-pollové šetĜení 2002/ 2004 ýSSD KSýM ODS KDU SNK SZ NEZ Ostatní Celkem ýSSD 3,0 -1,2 -0,4 -0,7 -0,5 0,0 -0,1 -0,2 0,0 KSýM ODS -0,4 -0,2 2,9 -0,3 -0,4 -0,3 -0,2 0,0 0,0 -0,2 0,0 -0,3 -1,3 1,3 -0,7 0,1 0,0 0,0 Koalice Ostatní -0,8 -0,3 0,0 -0,5 -0,5 -0,6 1,2 -0,2 -0,1 0,9 -0,4 0,7 0,2 0,1 0,5 -0,1 0,0 0,0 Nevoliþi -1,3 -0,9 2,2 -0,1 0,1 0,0 -0,2 0,3 0,0 Celkem 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 matice voličských přesunů (vyčíslené ve spodních částech tabulek 2, 3 a 4). Tyto míry odlišnosti naznačují, že odhady voličských přesunů z ekologického usuzování a Evropské volební studie jsou si navzájem více podobné (11,3) než každý z těchto dvou odhadů v porovnání s průzkumem SC&C (13,4). Případná otázka zní: je hodnota 11,3 „dobrá“, nebo „špatná“? K zodpovězení této otázky bude nejvhodnější porovnat skóre odlišnosti, které bylo zjištěné u stejné analýzy voličských přesunů provedené v jiných zemích. Celkově je hodnota DDI 11,3 pro ČR v letech 2002 a 2004 s předchozími výzku- 71 - Obrázek 4. Srovnání matic voliþských pĜesunĤ vytvoĜených na základČ exit-pollového šetĜení SC&C, povolebního šetĜení EES 2004 a ekologického usuzování 11.3 EES04 13.4 Ekologické usuzování SC&C Exit-poll 13.4 Poznámka: Hodnoty odkazují k Duncanovu indexu odlišnosti. V nejjednodušším pĜípadČ, když uvažujeme jen dvČ strany, je tento index definován jako D = 0.5 ƶ ŇAi/X – Bi/YŇ, kde Ai a Bi jsou poþty voliþĤ, kteĜí zmČnili své rozhodnutí ve prospČch druhé ze stran nebo neúþasti ve volbČ. Jestliže srovnáváme zmČny mezi více stranami, každá zmČna mezi párem stran je srovnávána se všemi ostatními páry a je odhadován prĤmČrný index. Odhad generalizovaného indexu nepodobnosti podrobnČ popisuje Sakoda [1981]. my dosti srovnatelná. U Dánska vedla podobná analýza za období let 1968–1975 k průměrnému DDI 12,5. Ve Švédsku odpovídala odlišnost mezi odhady voličských přesunů z ekologického usuzování a šetření v letech 1970 a 1985 hodnotě 12,3 a ve Finsku v letech 1962 a 1983 činila 8,6 [Thomsen, Berglund, Wörlund 1991: 453, 457 a 462]. Vyšší hodnota DDI mezi oběma šetřeními (13,4) nepochybně odráží výše popsané rozdíly ve velikosti matic. V této souvislosti dosavadní výzkum často ukazuje, že odlišnost mezi odhady voličských přesunů z různých šetření bývá nižší než mezi odhady z šetření a ekologického usuzování. Odhady odlišnosti týkající se průzkumu SC&C jsou uvedeny v obrázku 3 pouze jako doplňující informace pro zájemce, a nemají být interpretovány jako doklad o validizaci. Fakt, že hodnoty odlišnosti matice voličských přesunů z exit-pollového šetření SC&C pouze mezi voliči jsou srovnatelné s odlišnostmi mezi odhady z Evropské volební studie a z ekologického usuzování (11,3), naznačuje, že zjištěný rozdíl ve velikosti matice nemá příliš velký zkreslující účinek. Srovnáním políček matic voličských přesunů, která jsou uvedena ve spodní části tabulek 2, 3 a 4, zjišťujeme, že obecně přinášejí obě hromadná šetření vyšší odhad stranické loajality než ekologické usuzování. Kromě toho údaje v tabulkách 2 a 4 prokazují, že metoda ekologického usuzování nadhodnocuje neúčast v roce 2004 u těch, kteří se zúčastnili voleb v roce 2002. Tyto rozdíly bychom mohli připsat na vrub nadhodnocování volební účasti a konzistence stranické podpory v dotazníkových šetřeních. Dokladem pro takovouto interpretaci je skutečnost, že Evropská volební studie [2004] nadhodnocuje volební účast. Naproti tomu průzkum SC&C (tabulka 3) poskytuje nesprávný odhad volebního chování v roce 2002. Obě tato zkreslení jsou typická pro retrospektivní dotazování o volebních rozhodnutích a jsou zdrojem systematické chyby. Ze všech těchto důvodů je zřejmé, že odhady voličských přesunů na základě dotazníkového šetření budou zatíženy náhodnou i systematickou chybou – klíčo- 72 - vým problémem je velikost těchto zdrojů chyb. U metody ekologického usuzování je klíčovým problémem vyčíslení systematické chyby způsobené předpoklady ve statistickém modelování. Teoreticky by systematická chyba měla být v řádně specifikovaném modelu ekologického usuzování nulová. Vzhledem ke všem těmto problémům srovnání je důležité zdůraznit, že odhady z ekologického usuzování se nijak zásadně neliší od odhadů z obou šetření. Zdá se proto rozumné, abychom s ohledem na neexistenci definitivnějšího postupu valorizace a bez nároku na úplnou správnost přijali následující závěr: můžeme se s přiměřenou jistotou domnívat, že se odhady z ekologického usuzování pravděpodobně blíží skutečným hodnotám voličských přesunů. Závěr Agregovaná data o lidském chování jsou pro sociální vědce rozšířeným a nedocenitelným zdrojem informací. Klíčovým problémem při použití těchto dat a správném usuzování o příčinných vztazích je, aby výzkumník konkretizoval úroveň prováděné analýzy a testovanou teorii. V sociálních vědách je řada sociálně psychologických a ekonomických teorií založena na vysvětlení individuálních, a nikoli skupinových jevů. Chce-li tedy analytik použít k ověření teorií vysvětlujících individuální chování agregovaná data, pouští se do usuzování mezi různými úrovněmi. Usuzování napříč úrovněmi je složitá činnost, protože souvislosti mezi proměnnými zjištěné na individuální a agregované úrovni většinou nejsou shodné. To představuje problém ekologického usuzování. K překonání problému ekologického usuzování a provádění usuzování napříč úrovněmi je možné použít statistické metody. Takovéto metody jsou vždy založeny na předpokladech o (1.) rozdělení dat na individuální úrovni, která vedou ke sledovaným agregovaným vzorcům, (2.) vztahu mezi sledovanými proměnnými a o (3.) odhadovaných parametrech modelu. V tomto článku jsem představil a kriticky přezkoumal řadu statistických metod usuzování napříč úrovněmi. V oblasti volebních výzkumů byla použita technika latentní struktury pro ekologické usuzování z oficiálních výsledků na úrovni okresů. Konkrétně byly zkoumány voličské přesuny mezi dvěma po sobě jdoucími volbami. V této souvislosti byly přezkoumány odhady voličských přesunů na individuální úrovni získané ekologickou analýzou s ohledem na očekávání odvozená z konkrétní teorie – teorie voleb druhého řádu. Jelikož jsou veškeré metody ekologického usuzování založeny na určitých předpokladech, je nezbytně nutné ověřit validitu těchto předpokladů pomocí dat jiného druhu, obvykle pomocí dat z šetření na individuální úrovni. Závěrem doufám, že tento stručný přehled usuzování napříč úrovněmi, ve kterém jsem uplatnile statistické metody v politologické perspektivě, povzbudí výzkumníky k plodnějšímu využívání úředních statistik a jiných zdrojů agregovaných dat při ověřování modelů individuálního chování. V metodách ekologického usuzování se skrývá potenciál pro rozšíření a prohloubení vědeckého porozumění individuálnímu jednání nad rámec analytických nástrojů, které obvykle umožňují hromadná šetření. Společné využití datových souborů na individuální a agregované úrovni představuje důležitou příležitost pro ověření a rozšíření stávajících teorií o předmětu, času, způsobech a příčinách lidského chování. - 73 - Literatura: Achen, C.H., Phillips W. Shively. 1995 Cross-level Inference. Chicago, IL: University of Chicago Press. Anselin, L. 2000. „The alchemy of statistics, or creating data where no data exists“. Annals of the Association of American Geographers 90(3): 586-592. Berglund, S., S.R. Thomsen.1990. Modern Political Ecological Analysis. Copenhagen: Abo Academic Press. Campbell, A., P.E. Converse, W.E. Miller, D. Stokes. 1960. The American Voter. New York: Wiley. Cho, W. 1998. „If the assumption fits: A comment on the King ecological inference solution“. Political Analysis 7: 143-163. Duncan, O.B., B. Duncan. 1955. „Residential distribution and occupational stratification“. American Journal of Sociology 20: 210-217. Fiorina, M. 1981. Retrospective Voting in American Elections. New Haven, CN: Yale University Press. Fotheringham, A.S. 2000. „A bluffers guide to A Solution to the Ecological Inference Problem“. Annals of the Association of American Geographers 90(3): 582-586. Freedman, D.A., S.P. Klein, M. Ostland, M.R. Roberts. 1998. „Review of ‘A Solution to the Ecological Inference Problem (by G. King)“. Journal of the American Statistical Association 93: 1518-1522. Gill, J. 2008. Bayesian Methods: A Social and Behavioural Sciences Approach (Second Edition). Boca Raton, FL: Chapman & Hall/CRC. Goodman, L. 1959 „Some alternatives to ecological correlation“. American Journal of Sociology 64: 610-624. King, G. 1996. „Why context should not count“. Political Geography 15: 159-164. King, G. 1997. A Solution to the Ecological Inference Problem: Reconstructing Individual Behavior from Aggregate Data. Princeton, NJ: Princeton University Press. King, G., O. Rosen, M.A. Tanner (eds.). 2004. Ecological Inference: New Methodological Strategies. New York: Cambridge University Press. Kostelecký, T., D.Čermák. 2003. „Surveys and aggregate data analysis, a discussion of the usability of different approaches in a comparative analysis of political behaviour“. Sociologický časopis/Czech Sociological Review 39(4): 529-50 (in Czech). Kostelecký, T., D. Čermák. 2004. „The influence of territorially specific factors on the formation of the political attitudes of voters“. Sociologický časopis/Czech Sociological Review 40(4): 469-487 (in Czech). Linek, L., P. Lyons. 2007a. „What can ecological inference tell about the Second-Order-Election-Thesis in the Czech Republic and Slovakia“. Pp. 327-370 in: Marsh M., Mikhalyov S. and Schmitt H. (eds.): European Elections after Eastern Enlargement: Preliminary Results from the European Election Study 2004. Mannheim: University of Mannheim, Mannheim Centre for European Social Research (MZES), Connex Report Series No. 01. Linek, L., P. Lyons. 2007b. „Přesuny voličů ve volbách do Evropského parlamentu v roce 2004 v České republice: Testování nĕkeyterých implikací teorie národních voleb druhého řadu“. Pp. 249-264 in: Linek L. and Outly J. a kol. (eds.): Volby fo Evropského parlamentu 2004. Praha: Sociologický ústav Akademie vĕd ČR, v.v.i. a Fakulta humanitích studií Univerzita Hradec Králové. Linek, L., P. Lyons. 2008. „Is the Nationalisation of Politics Fact or Artefact? Evidence from the Czech Republic“. Paper presented at the European Consortium for Politi- - 74 - cal Research (ECPR) Joint Sessions, Institut d’Etudes Politiques de Rennes, France, April 11-16 2008. Lebeda, T., a kol. 2007. “Závĕr: Co rozhodlo volby do Poslanecké snĕmovny v roce 2006 a co jsme se dozvĕdĕli o volebním chování v ČR?” Pp. 203-214 in: Lebeda T., Linek L., Lyons P. a Vlachová K (eds.): Voliči a Volby 2006. Praha: Sociologický ústav Akademie vĕd ČR, v.v.i. Lewis-Beck, M. 1988. Economics and Elections. Ann Arbor, MI: Univ.of Michigan Press. Lyons, P., L. Linek. 2007. „Tematické hlasovaní, vliv lidrů a stranictví ve volbách“. Pp. 177-202 in: Lebeda T., Linek L., Lyons P. a Vlachová K (eds.): Voliči a Volby 2006. Praha: Sociologický ústav Akademie vĕd ČR, v.v.i. Margolis, M., Book reviews of Thomsen’s (1987). 1998. „Danish Elections 1920-1979: A Logit approach to Ecological Analysis and Inference“. Journal of Mathematical Sociology, 1988, 13(4), 429-31. Ogburn, W.F., I. Goltra. 1919. „How women vote“. Political Science Quarterly 34(3): 413433. Reif, K.H., H. Schmitt. 1980. „Nine second order national elections: A conceptual framework for the analysis of European election results“. European Journal of Political Research 8: 3-44. Robinson, W.S. 1950. „Ecological correlations and the behaviour of individuals. American Sociological Review 15: 351-357. Rosen, O., W. Jiang, G. King, M.A. Tanner. 2001. „Bayesian and frequentist inference for ecological inference: the R × C case“. Statistica Neerlandica 55(2), 134-156. Sakoda, J.M. 1981. „A generalized index of dissimilarity“. Demography 18(2): 245-250. Schumpeter, J.A. 1976 (1942). Capitialism, Socialism and Democracy. New York: Harper and Row. Taylor, C., S. Gorard, J. Fitz. 2000. „A re-examination of segregation indices in terms of compositional invariance“. Social Research Update, Department of Sociology, University of Surrey, Vol. 30. Thomsen, S.R. 1999. „Ecological inference with the multiple logit model“. Working Paper, Department of Political Science, Aarhus University, Universitetsparken, DK8000 Denmark, February 1999. Thomsen, S.R. 2000. „Issue voting and ecological inference“. Working Paper, Department of Political Science, Aarhus University, Universitetsparken, DK-8000 Denmark, September 2000. Thomsen, S.R. 1987. Danish Elections 1920-1979: A Logit approach to Ecological Analysis and Inference. Arrhus: Politica. Thomsen, S.R., S. Berlund, I. Wörlund. 1991. ‘Assessing the validity of the logit method for ecological inference,’ European Journal of Political Research 19, 441-477. Thomsen, S.R. 2003. „Ecological unstandardised factor and pooled regression analysis“. Paper presented at Meeting of Democratic Participation and Political Communication in Systems of Multi-level Governance Research Group, EU FP5 Programme, Dublin, Ireland, January 14, 2003. Tourangeau, R., L.J. Rips, K. Rasinski. 2000. The Psychology of Survey Response. Cambridge: Cambridge University Press. Wakefield, J. 2004. „Ecological inference for 2 x 2 tables“. JR. Statist. Soc. A 167: 385445. Wright, G.C. 1993. „Errors in measuring vote choice in National Election Studies, 195288“. American Journal of Political Science: 37(1): 291-316. - 75 -
Podobné dokumenty
vybrané metody vícerozměrné statistiky
jejich použitelnost v kriminologickém výzkumu, což by mohlo být prvním krokem k jejich
soustavnějšímu využívání. V řadě zemí jsou vícerozměrné analýzy již desítky let
používány, protože se ukazuje,...
Jak Začít - Synergy Pulse
MĚŘITELNÝ
AUTENTICKÝ (dosažitelný)
RELEVANTNÝ (základní, důležitý)
TERMÍNOVÝ (okreslený časově)
Poselství, vyplývající z těch jednoduchých doporučení Vám
poskytne přímou cestu bez překážek k Vašemu...
Wiliam Saroyan
Její matka byla, dá-li se tak říct, ještě krásnější než Laura sama, a věčná, i
když nenápadná řevnivost mezi nimi se odrážela nejen v zrcadlech po celém
domě, ale i v poznámkách, jež obě ženy proná...
nanofyzika (nf)
23) P. Fiala, I. Richter, Fourierovská optika a optické zpracování signálů, skriptum FJFI ČVUT, Praha 2004.
24) P. Fiala, I. Richter, Fyzikální optika, skriptum FJFI ČVUT, 2. vydání, Praha 2005.
EP - zlom
v zemi. Jelikož takovou „schopnost“ mají pouze volby do národního parlamentu, případně prezidentské volby, nazývají tyto volby národními volbami prvního řádu. Naopak místní, regionální či
evropské ...
listopad 2008
Čím jsem starší, tím více mě zasahuje a dojímá. Rozsvícenými svíčkami, mezi květináči s podzimními květy rozsetými podél silnic, které připomínají
spoustu promarněných mladých životů. Ale také s ve...