Zpracování dat v ekologii společenstev
Transkript
Zpracování dat v ekologii společenstev
ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV David Zelený OSNOVA PŘEDNÁŠKY Typy sbíraných dat Zpracování dat v ekologii společenstev alfa, beta a gamma diverzita, akumulační druhová křivka, rarefaction Design ekologických experimentů lineární regrese, Ellenbergovy indikační hodnoty Indexy druhové bohatosti hierarchická vs nehierarchická, aglomerativní vs divisivní Regrese, kalibrace lineární vs unimodální, přímá vs nepřímá Klasifikace indexy podobnosti a vzdálenosti mezi vzorky Ordinace čištění dat, odlehlé body, transformace, standardizace, EDA Ekologická podobnost kategoriální vs kvantitativní, pokryvnosti, frekvence Příprava dat pro numerické analýzy David Zelený manipulativní experimenty vs přírodní experimenty (pozorování) Případové studie na použití jednotlivých metod 2 LITERATURA David Zelený Doporučená (najdete na bit.ly/zpradat v sekci Studijní materiály) Lepš J. & Šmilauer P. (2001) Mnohorozměrná analýza ekologických dat Zpracování dat v ekologii společenstev v anglické verzi vyšlo v nakladatelství Cambridge v roce 2003 jako Multivariate Analysis of Ecological Data using CANOCO Herben T. & Münzbergová Z. (2003) Zpracování geobotanických dat v příkladech. Část 1. Data o druhovém složení Pro fajnšmekry Wildi O. (2010) Data Analysis in Vegetation Ecology. Wiley-Blackwell. Gotelli N.J. & Ellison A.M. (2004) A Primer of Ecological Statistics. Sinauer Associates. Oksanen J. (2004) Multivariate Analysis in Ecology, Lecture Notes. Palmer M. – Ordination methods for ecologists, website http://cc.oulu.fi/~jarioksa/opetus/metodi/notes.pdf http://ordination.okstate.edu/ Legendre P. & Legendre L. (2012) Numerical Ecology (Third English Edition). Elsevier. 3 SOFTWARE PC-ORD 5 – numerické klasifikace, ordinační analýzy, analýza odlehlých bodů STATISTICA 12 – regresní analýzy, klasifikace, ordinace Zpracování dat v ekologii společenstev CANOCO 5 – ordinační analýzy, kreslení ordinačních diagramů a odpovědních křivek druhů David Zelený Kde co sehnat: CANOCO 5 a PC-ORD – instalace z webových stránek předmětu (http://bit.ly/zpradat, záložka Software) STATISTICA – licenci je třeba získat po přihlášení na http://inet.sci.muni.cz v sekci Nabídka software 4 DALŠÍ INFORMACE Webové stránky předmětu: www.bit.ly/zpradat Cvičení probíhat bude v počítačové učebně v druhé půlce semestru a zaměřené bude na analýzu dat a jejich vizualizaci v programu CANOCO 5 tři čtyřhodinové bloky v případě zájmu o program R je možné (v liché roky) zapsat si souběžně předmět Analýza dat v ekologii společenstev v programu R (Bi7550) Domácí úkol přednášky, software, příklady ke cvičení, studijní materiály některé sekce vyžadují přihlášení Zpracování dat v ekologii společenstev David Zelený dobrovolný, zadání bude sděleno v průběhu semestru Zkouška vypracování závěrečné práce (pokyny viz webové stránky předmětu, sekce Závěrečná práce) půlhodinová diskuze nad závěrečnou prací, doplněná o rozšiřující otázky týkající se probírané látky možné dělat zároveň se zkouškou z předmětu Bi7550 5 David Zelený Zpracování dat v ekologii společenstev TYPY SBÍRANÝCH DAT PŘÍPRAVA DAT PRO ANALÝZY DATA V EKOLOGII SPOLEČENSTEV popisují společenstvo, případně i jeho prostředí ekologická data obsahují více proměnných (multivariate data) a dají se vyjádřit maticí dat (data matrix) společenstvo je typicky sledováno na určité ploše (v případě rostlin a některých málo mobilních živočichů) nebo např. inventarizací jedinců (např. ulovených v pastech v případě mobilních živočichů) složení živého společenstva je popsáno přítomností jednotlivých druhů daného typu organismů, na jedné ploše (v jedné pasti) se většinou vyskytuje více než jeden druh prostředí je popisováno jednou nebo více proměnnými, o kterých se předpokládá, že ovlivňují studovaný typ organismů Zpracování dat v ekologii společenstev David Zelený Společenstvo je skupina druhů, které se vyskytují společně v prostoru a v čase. (Begon 2007) 7 TYPY PROMĚNNÝCH Kategoriální (kvalitativní, nominální, prezenčně-absenční) Ordinální (semikvantitativní) např. geologický substrát, půdní typy, binární proměnné (přítomnost-absence druhu) kategorie jsou unikátní (každý jedinec/pozorování spadá právě do jedné z nich) a nelze je smysluplně seřadit Zpracování dat v ekologii společenstev David Zelený např. Braun-Blanquetova stupnice pro odhad pokryvnosti druhů jednotlivé stupně (kategorie) lze seřadit, rozdíly mezi stupni jsou různě velké Kvantitativní 0 diskrétní (počty jedinců, měření s malou přesností) x kontinuální (přesná měření) relativní stupnice (relative-scale) x intervalová stupnice (interval-scale) 30 0 8 relativní stupnice – nula znamená, že charakteristika chybí intervalová stupnice – nula je stanovena arbitrárně TYPY PROMĚNNÝCH ALTERNATIVNÍ TŘÍDĚNÍ binární (dvoustavový, presence-absence) přítomnost nebo absence druhu Zpracování dat v ekologii společenstev Příklady David Zelený Typ proměnné mnohostavový neseřazený geologický substrát seřazený semikvantitativní (ordinální) stupnice pokryvností druhy kvantitativní (měření) diskontinuální (počty, diskrétní) počet jedinců kontinuální teplota, hloubka půdy 9 Legendre & Legendre 1998 PRIMÁRNÍ DATA David Zelený Zpracování dat v ekologii společenstev 10 PRIMÁRNÍ DATA David Zelený Zpracování dat v ekologii společenstev 11 Zadávání primárních dat Uchování a zpřístupnění primárních dat Zpracování dat v ekologii společenstev spreadsheet, metadata David Zelený http://www.cggveritas.com/data//1/rec_i mgs/5152_Tapes-small.jpg PRIMÁRNÍ DATA problematika dlouhodobé archivace a nosičů dat (nejlepší je stále papír) zpřístupnění primárních dat (některé časopisy, např. Ecological Monographs, Journal of Ecology aj., to mají jako podmínku zveřejnění článku) uložení dat ve veřejně dostupných repositoriích (např. Dryad Digital Repository, www.datadryad.org) nebo databázích (např. Česká Národní Fytocenologická Databáze) Kontrola a čištění dat sloučení taxonomické nomenklatury chyby a chybějící data (možnosti nahrazení chybějících dat) analýza odlehlých bodů (outlier analysis) někdy i vyloučení vzácných druhů (odstranění šumu v datech) EDA – exploratory data analysis 12 David Zelený Zpracování dat v ekologii společenstev Programátorka Madeleine Carey s 60.000 děrnými štítky, na kterých byl uložen program využívaný americkou leteckou obranou. 13 Zdroj: Failures to Compute, Science 342 (6160) 800-801 KONFIRMAČNÍ VS. EXPLORAČNÍ ANALÝZA DAT (hypothesis-driven vs data-driven science) David Zelený Konfirmační analýza dat (confirmatory data analysis, CDA) testuje hypotézy a generuje odhady parametrů např. regrese, ANOVA, testy signifikance Zpracování dat v ekologii společenstev Explorační analýza dat (exploratory data analysis, EDA) průzkum dat a hledání hypotéz, které stojí za to testovat slouží také k tzv. „vytěžování“ dat (data mining, data dredging) grafická EDA slouží k odhalení odlehlých bodů (outlier analysis) distribuce dat (normalita) a nutnost transformace John Tukey (1915-2000) 14 EDA – EXPLORATORY DATA ANALYSIS ANALÝZA ODLEHLÝCH BODŮ – BOX-PLOT & HISTOGRAM David Zelený XERSSW -6 -4 -2 0 2 4 Zpracování dat v ekologii společenstev -8 Median 25%-75% Range Outliers 50 Frequency 40 30 20 10 0 -8 -7 -6 -5 -4 -3 -2 -1 0 XERSSW (head index) 1 2 3 4 15 EDA – EXPLORATORY DATA ANALYSIS ANALÝZA ODLEHLÝCH BODŮ - SCATTERPLOT David Zelený 3 2 1 Zpracování dat v ekologii společenstev -1 -2 -3 -4 -5 -6 -7 -3 -2 -1 0 1 2 3 4 5 3.0 6 XERSW 2.5 2.0 1.5 XERSSW XERSSW 0 1.0 0.5 0.0 -0.5 16 -1.0 -3 -2 -1 0 1 XERSW 2 3 4 5 DETAILY KE KRABICOVÝM GRAFŮM (BOXPLOT) David Zelený Klasický boxplot (střední hodnota = medián) Definice odlehlých bodů a extrémů (STATISTICA) Zpracování dat v ekologii společenstev maximální hodnota Q3 – horní kvartil Q2 - medián Q1 – spodní kvartil minimální hodnota 17 outlier (hodnota nižší než spodní kvartil a interkvartilový rozsah) PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY TRANSFORMACE David Zelený Transformace dat Zpracování dat v ekologii společenstev mění relativní vzdálenosti mezi jednotlivými hodnotami a tím i tvar jejich distribuce Proč data transformovat? protože škála měření je arbitrární a nemusí odpovídat ekologickému významu proměnné protože (některé) statistické testy vyžadují, aby data deset prstů => používání desítkové soustavy byla normálně rozložená (normal distribution) měla homogenní varianci (homoskedasticita, mezi průměrem a směrodatnou odchylkou není žádný vztah) protože lineární vztahy se interpretují lépe než vztahy nelineární 18 PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY TRANSFORMACE David Zelený Na co si dát při transformaci pozor? aby transformace rozložení dat ještě nezhoršila a nevytvořila nové odlehlé body abychom při komentování výsledků používali netransformované hodnoty proměnných Zpracování dat v ekologii společenstev Typy transformace lineární přičtení konstanty nebo vynásobení konstantou nemění výsledky statistického testování nulových hypotéz např. převod teploty měřené ve stupních Celsia na stupně Fahrenheita nelineární log transformace, odmocninová transformace atd. může změnit výsledky statistického testování 19 600 500 400 0 100 200 200 300 symetrické (symetrical) 2 4 6 8 10 12 negativně (doleva) zešikmené (left skewed) 0 0 50 50 100 100 150 200 150 0 -8 -3 -2 -1 0 1 2 -6 -4 -2 0 2 3 * ekologická data jsou často zešikmená pozitivně (doprava), protože jsou omezená nulou na začátku 20 Zpracování dat v ekologii společenstev pozitivně (doprava) zešikmené* (right skewed) David Zelený 700 ROZDĚLENÍ DAT (DATA DISTRIBUTION) PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY TRANSFORMACE David Zelený Logaritmická transformace (log transformation) pro data s výrazně pozitivně (doprava) šikmou distribucí (right skewed), u kterých existuje vztah mezi směrodatnou odchylkou a průměrem (lognormální rozložení) Zpracování dat v ekologii společenstev Y* = log (Y), případně Y* = log (a*Y + c) zdroj: wikipedia.org na základě logaritmu nezáleží (10, 2, e) konstanta a = 1; pokud je Y z intervalu <0;1>, potom a >1 konstanta c se přidává, pokud proměnná Y obsahuje nuly c může být např. 1, nebo arbitrárně zvolené malé číslo (0,001) na konstantě c může záležet výsledek analýz (ANOVA), a proto je dobré vybírat takové číslo, aby transformovaná proměnná byla co nejvíce symetrická 21 PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY TRANSFORMACE David Zelený Odmocninová transformace (square-root transformation) Zpracování dat v ekologii společenstev vhodná pro mírně doprava zešikmená data (right skewed), např. počty druhů (Poisson distribution) Y* = √ Y, případně Y* = √ (Y + c) konstanta c se přičítá, pokud soubor obsahuje nuly c může být např. 0,5, nebo 3/8 (0,325) třetí a vyšší odmocnina je účinnější na více zešikmená data (čtvrtá odmocnina se používá pro abundance druhů s mnoha nulami a několika vysokými hodnotami) Mocninná transformace (power transformation) vhodná pro data negativně (doleva) sešikmená (left skewed) Y* = Yp pokud p < 1 - odmocninová transformace (p = 0,5 – druhá odmocnina, p = 0,25 – čtvrtá odmocnina atd.) 22 PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY TRANSFORMACE David Zelený Zpracování dat v ekologii společenstev odmocninová logaritmická Legendre & Legendre (1998) 23 PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY TRANSFORMACE David Zelený Zpracování dat v ekologii společenstev 24 Münch. Med. Wschr. 124, 1982 PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY TRANSFORMACE David Zelený Transformace pomocí arcsin (angular transformation) vhodná pro procentické hodnoty (a obecně podíly) Zpracování dat v ekologii společenstev Y* = arcsin Y nebo Y* = arcsin √ Y použitelná pro hodnoty v intervalu <-1; 1> transformované hodnoty jsou v radiánech Reciproká transformace (reciprocal transformation) vhodná pro poměry (například výška/hmotnost, počet dětí v populaci na počet žen atd.) Y* = 1/Y 25 PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY TRANSFORMACE David Zelený Box-Cox transformace (zobecněná mocniná transformace) Zpracování dat v ekologii společenstev zobecněná parametrická transformace iterativní hledání parametru λ (lambda), pro které je rozdělení transformované proměnné nejblíže normálnímu rozdělení používá se v případě, že nemáme a priori představu, jakou transformaci použít Neparametrické metody transformace např. metoda Omnibus pro ordinální data 26 Legendre & Legendre 1998 MAJÍ DATA NORMÁLNÍ ROZDĚLENÍ? GRAFICKÁ ANALÝZA Q-Q diagram (Quantile-Quantile plot) 35 Zpracování dat v ekologii společenstev 3 30 2 Oček. normál. hodnoty Počet pozorování David Zelený Histogram s křivkou normálního rozdělení 25 20 15 10 5 1 0 -1 -2 0 -10 0 10 20 30 40 50 60 70 -3 -10 80 Soil depth vizuální zhodnocení normality dat Kolmogorovův-Smirnovův test 0 10 20 30 40 50 60 70 Pozorovaný kvantil porovnání rozdělení dvou proměnných, vynáší proti sobě kvantily jednotlivých proměnných jedna proměnná může být teoretická distribuce (v tomto případě normální rozdělení – rankitový diagram) na stejném principu pracuje Shapiro-Wilk test 27 MAJÍ DATA NORMÁLNÍ ROZDĚLENÍ? GRAFICKÁ ANALÝZA -1 0 1 2 3 150 100 Frequency 0 0 -2 50 100 200 300 400 500 Frequency 150 100 50 0 Frequency 600 200 200 negativně zešikmené Zpracování dat v ekologii společenstev -3 David Zelený pozitivně zešikmené normální rozdělení 0 2 4 8 10 12 -8 -6 -4 variable -2 0 2 variable -2 -1 0 1 Sample quantiles 2 3 2 1 0 -1 Theoretical quantiles -3 0 -3 -2 2 1 0 -1 -3 -2 Theoretical quantiles 2 1 0 -1 -2 -3 Theoretical quantiles 3 3 3 variable 6 5 10 15 Sample quantiles 20 -5 -4 -3 -2 -1 Sample quantiles 0 1 28 BIMODÁLNÍ DATA David Zelený 20 15 0 5 10 Frequency 15 10 Frequency 5 0 6.0 6.5 7.0 7.5 8.0 6.0 6.5 7.0 7.5 8.0 Soil pH 7.0 29 6.0 6.5 6.5 7.0 Soil pH 7.5 7.5 8.0 8.0 Soil pH Soil pH Zpracování dat v ekologii společenstev 20 transformace nepomůže, možnost rozdělit na dva podsoubory 6.0 600 650 700 750 800 850 Annual precipitation [mm] 900 950 600 650 700 750 800 850 Annual precipitation [mm] 900 950 PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY STANDARDIZACE PROMĚNNÝCH David Zelený Centrování výsledná proměnná má průměr roven nule Zpracování dat v ekologii společenstev Yi* = Yi – průměr (Y) Standardizace v úzkém slova smyslu výsledná proměnná má průměr roven nule a směrodatnou odchylku rovnu jedné „synchronizuje” proměnné měřené v různých jednotkách a na různých stupnicích Yi* = (Yi – průměr (Y)) / směrodatná odchylka (Y) Změna rozsahu hodnot (ranging) výsledná proměnná je v rozsahu 0 až 1 Yi* = Yi / Ymax nebo Yi* = (Yi – Ymin) / (Ymax – Ymin) 30 PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY STANDARDIZACE MATICE SPOLEČENSTVA David Zelený Standardizace v případě matice společenstva (vzorky x druhy) standardizace po druzích (by species) dává velkou váhu vzácným druhům ne vždy smysluplná (pokud se druh vyskytuje vzácně v jednom snímku, standardizace po druzích dá tomuto snímku velkou váhu) Zpracování dat v ekologii společenstev standardizace po vzorcích (by samples) pokud je analýza zaměřená na relativní proporce mezi druhy, ne jejich absolutní abundance vhodné v případě, že výsledné abundance závisí na důkladnosti, s jakou sbíráme data (např. při odchytu živočichů doba strávená na ploše nebo počet pastí) 31 PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY STANDARDIZACE MATICE SPOLEČENSTVA David Zelený původní matice Druhy druh 1 druh 2 druh 3 vzorek 1 1 3 5 vzorek 2 2 6 10 vzorek 3 10 30 50 standardizace po druzích standardizace po vzorcích Druhy Druhy Vzorky druh 1 druh 2 druh 3 Vzorky druh 1 druh 2 druh 3 vzorek 1 -0.68 -0.68 -0.68 vzorek 1 -1 0 1 vzorek 2 -0.47 -0.47 -0.47 vzorek 2 -1 0 1 vzorek 3 1.15 1.15 1.15 vzorek 3 -1 0 1 32 Zpracování dat v ekologii společenstev Vzorky PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY matematická funkce, jejíž argumenty nejsou odvozené z dat, na která je transformace aplikovaná (data independent) nejčastější důvod je změnit tvar rozložení proměnné, případně zajistit homoskedasticitu STANDARDIZACE mění data pomocí statistiky, která je spočtená na datech samotných, např. průměr, součet, rozsah aj. (data dependent) nejčastější důvod použití je vyrovnat rozdíly v relativním významu (váze) jednotlivých ekologických proměnných, druhů nebo vzorků ve své podstatě je to další typ transformace Zpracování dat v ekologii společenstev David Zelený TRANSFORMACE 33 PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY KÓDOVÁNÍ DAT (DATA CODING) David Zelený Dummy variables Zpracování dat v ekologii společenstev metoda, jak převést kvalitativní (kategoriální) proměnnou na kvantitativní (binární) proměnné použitelné v analýzách pokud má kategoriální proměnná n stavů (hodnot), pro její vyjádření stačí n-1 dummy proměnných (jedna z proměnných je vždy lineárně závislá na ostatních) dummy proměnné hodnoty KAMB kambizem 1 litozem LITO RANK FLUVI 0 0 0 0 1 0 0 ranker 0 0 1 0 fluvizem 0 0 0 1 34 PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY KÓDOVÁNÍ DAT (DATA CODING) David Zelený např. nahrazení kódů u alfa-numerických stupnic, např. BraunBlanquetovy stupnice dominance-abundance Br.-Bl.: ordinální hodnoty: střední hodnoty procent: Zpracování dat v ekologii společenstev r + 1 2 3 4 5 1 2 3 4 5 6 7 1 2 3 15 38 63 88 35 SOUBORY S VELKÝM POČTEM NUL (ANEB VÝZNAM NULY V EKOLOGII) dva možné významy nuly: 1. hodnota může být ve skutečnosti nenulová, ale díky našim možnostem měření jsme ji naměřili jako nulovou (například koncentrace látky v roztoku) hodnota je skutečná nula – například absence druhu Zpracování dat v ekologii společenstev 2. David Zelený data obsahující „pravé nuly“ obsahují dva typy informace: 1. 2. druh chybí nebo je přítomen? pokud je druh přítomen, jaká je jeho abundance? v datech obsahujících velké množství „pravých nul“ je většina informace prvního typu problém „pravých“ nul při logaritmické transformaci – soubor s velkým počtem „pravých“ nul není vhodné logaritmicky transformovat (přičítat k nim konstantu c), ale lépe ji nahradit binární proměnnou (prezence-absence) 36 99.0 98.5 98.0 97.5 Zpracování dat v ekologii společenstev více než 90% hodnot tvoří nuly, u velkých souborů až 99% David Zelený (SPARSE MATRIX, ŘÍDKÁ MATICE) 97.0 EKOLOGII SPOLEČENSTEV Zastoupení nul v matici [%] MATICE „VZORKY × DRUHY“ V 100 2000 4000 6000 8000 vzorky Počet vegetačních snímků v matici 37 druhy David Zelený (ECOLOGICAL RESEMBLANCE) Zpracování dat v ekologii společenstev EKOLOGICKÁ PODOBNOST EKOLOGICKÁ PODOBNOST David Zelený jedinec společenstvo Zpracování dat v ekologii společenstev jedinci stejného druhu 39 EKOLOGICKÁ PODOBNOST David Zelený Zpracování dat v ekologii společenstev 40 EKOLOGICKÁ PODOBNOST David Zelený Zpracování dat v ekologii společenstev 41 EKOLOGICKÁ PODOBNOST Q VS R ANALÝZA David Zelený Vzorky druh 1 druh 2 druh 3 vzorek 1 0 1 1 vzorek 2 1 0 0 vzorek 3 0 4 4 vztahy mezi druhy (nebo obecně mezi deskriptory) R analýza vztahy mezi vzorky Q analýza 42 Zpracování dat v ekologii společenstev Druhy PODOBNOSTI X VZDÁLENOSTI (Q ANALÝZA) David Zelený Indexy podobnosti slouží k vyjádření podobnosti mezi vzorky, ne k jejich umístění do mnohorozměrného prostoru (například ordinace) nejnižší hodnota 0 – vzorky nesdílejí žádný druh nejvyšší hodnota (1 nebo jiná) – vzorky jsou identické Zpracování dat v ekologii společenstev Vzdálenosti mezi vzorky slouží k umístění vzorků v mnohorozměrném prostoru nejnižší hodnota 0 – vzorky jsou identické (ve stejné lokaci) hodnota se zvyšuje se zvyšující se nepodobností mezi vzorky 43 INDEXY PODOBNOSTI David Zelený kvalitativní vs kvantitativní kvalitativní – pro presenčně-absenční data kvantitativní – pro data vyjadřující abundance, počty aj. Zpracování dat v ekologii společenstev symetrické vs asymetrické dvojité nepřítomnosti („double-zero“) – počet druhů, které chybí zároveň v obou vzorcích, v kontrastu s počtem druhů které se vyskytují zároveň v obou vzorcích symetrické – dvojité nepřítomnosti hodnotí stejně jako dvojité přítomnosti (totiž že vyjadřují podobnost mezi vzorky); v ekologii se prakticky nepoužívají asymetrické – dvojité nepřítomnosti ignorují; nejčastější typ indexů podobnosti v ekologii 44 PROBLÉM DVOJITÝCH NEPŘÍTOMNOSTÍ (DOUBLE-ZEROS) David Zelený Skutečnost, že druh chybí zároveň v obou snímcích, může znamenat, že: vzorky leží mimo ekologickou niku druhu Zpracování dat v ekologii společenstev nemůžeme ale říci, zda oba vzorky leží na stejné straně ekologického gradientu mimo niku druhu (a jsou si tedy docela podobné) nebo na stranách opačných (a jsou pak úplně odlišné) vzorky leží uvnitř ekologické niky druhy, ale druh se ve vzorku nevyskytuje, protože se tam nedostal (dispersal limitation) jsme ho přehlédli a nezaznamenali (sampling bias) nachází se právě v dormantním stadiu a není proto vidět (jednoletky, geofyty) 45 vlhkomilný druh 2 mezický druh 1 mezický druh 2 suchomilný druh 1 suchomilný druh 2 1 1 0 0 0 0 vzorek 2 0 1 1 1 1 0 vzorek 3 0 0 0 0 1 1 vzorky 1 až 3 jsou seřazeny podle vlhkosti stanoviště – vzorek 1 je nejvlhčí, vzorek 3 nejsušší vzorek 1 a 3 neobsahují ani jeden mezický druh – vzorek 1 je pro tyto druhy příliš vlhký, vzorek 3 příliš suchý symetrické indexy podobnosti: dvojitá nepřítomnost mezických druhů bude zvyšovat podobnost vzorků 1 a 3 asymetrické indexy: dvojité nepřítomnosti budou ignorovány Zpracování dat v ekologii společenstev vzorek 1 David Zelený vlhkomilný druh 1 PROBLÉM DVOJITÝCH NEPŘÍTOMNOSTÍ (DOUBLE-ZEROS) 46 INDEXY PODOBNOSTI PRO KVALITATIVNÍ DATA přítomen nepřítomen přítomen a b nepřítomen c d Zpracování dat v ekologii společenstev ve vzorku č. 2 David Zelený ve vzorku č. 1 druh je a – počet druhů přítomných v obou vzorcích b, c – počet druhů přítomných jen v jednom vzorku d – počet druhů, které chybí v obou vzorcích („double zeros“) Pokud nebereme v úvahu druhy nepřítomné v obou vzorcích (d), lze zobrazit i pomocí Vennova diagramu c a b 47 vzorek č. 1 vzorek č. 2 INDEXY PODOBNOSTI PRO KVALITATIVNÍ DATA Jaccardův koeficient Sørensenův koeficient S = 2a / (2a + b + c) J = a / (a + b + c) přítomnosti druhu v obou vzorcích (a) přisuzuje dvojnásobnou váhu Simpsonův koeficient Zpracování dat v ekologii společenstev David Zelený Si = a / [a + min (b,c)] vhodný pro vzorky velmi odlišné počtem druhů c a b 48 vzorek č. 1 vzorek č. 2 INDEXY PODOBNOSTI PRO KVANTITATIVNÍ DATA David Zelený zobecněný Sørensenův koeficient (procentická podobnost, percentage similarity) Zpracování dat v ekologii společenstev PS = [2 Σ min (xi, yi)] / Σ (xi + yi) xi, yi ... kvantita i-tého druhu ve srovnávaných vzorcích má rozsah od 0 do 1 pro presenčně absenční data přechází v 2a / (2a + b + c) velmi vhodný pro ekologická data percentage dissimilarity (PD, Bray-Curtis index) = 1 – PS 49 VZDÁLENOSTI MEZI VZORKY (DISTANCE MEASURES) David Zelený všechny indexy podobnosti (kvalitativní i kvantitativní) lze převést na distance Zpracování dat v ekologii společenstev D = 1 – S, nebo D = √ (1 – S) kde D je vzdálenost (distance) a S je podobnost (similarity) odmocninový převod se používá například pro Sørensenův koeficient neplatí obráceně (ne všechny vzdálenosti se dají převést na podobnosti – např. Euklidovská vzdálenost) 50 VZDÁLENOSTI MEZI VZORKY (DISTANCE MEASURES) David Zelený Euklidovská vzdálenost (Euclidean distance) ED = √ Σ (xi – yi)2 tětivová vzdálenost (chord distance, relativized Euclidean distance) rozsah: od 0 (identické vzorky), horní mez není dána rozsah hodnot výrazně záleží na použitých jednotkách míra citlivá na odlehlé body - nevhodná pro ekologická data Zpracování dat v ekologii společenstev Euklidovská vzdálenost použitá na datech standardizovaných přes vzorky (by sample norm) rozsah: od 0 (identické vzorky) do √2 (vzorky nesdílí žádný druh) Chi-kvadrát vzdálenost (chi-square distance) málokdy se používá přímo na výpočet vzdálenosti mezi vzorky vyjadřuje vzdálenost mezi vzorky v unimodálních ordinačních metodách (např. v korespondenční analýze, CA) 51 EUKLIDOVSKÁ VZDÁLENOST PARADOX David Zelený Druhy Vzorky druh 1 druh 2 druh 3 vzorek 1 0 1 1 vzorek 2 1 0 0 vzorek 3 0 4 4 1,732 4,243 Eucl (vzorek 1, vzorek 2) = √ (0-1)2 + (1-0)2 + (1-0)2 = 1,732 Eucl (vzorek 1, vzorek 3) = √ (0-0)2 + (1-4)2 + (1-4)2 = 4,243 52 Zpracování dat v ekologii společenstev může se stát, že dva vzorky, které sdílí některé druhy (vzorky 1 a 3), budou mít větší vzdálenost než dva vzorky, které nesdílí ani jeden druh (vzorky 1 a 2) INDEXY PODOBNOSTI MEZI DRUHY (R ANALÝZA) V kolika vzorcích je ... Diceův index přítomen nepřítomen přítomen a b nepřítomen c d Zpracování dat v ekologii společenstev druh č. 2 David Zelený druh č. 1 Dice = 2a / (2a + b + c) stejný jako Sørensenův index pro podobnost mezi vzorky uveden dříve než Sørensen (Dice 1945 vs Sørensen 1948) Pearsonův korelační koeficient r není vhodný pro data s velkým počtem nul, ani po transformaci 53 MATICE PODOBNOSTÍ (VZDÁLENOSTÍ) MEZI VZORKY (NEBO DRUHY) diagonála obsahuje pouze nuly (matice vzdáleností) nebo pouze jedničky (matice podobností) 1 2 3 4 5 6 7 8 9 10 1 0 12.37 11.70 17.92 13.86 10.58 11.92 10.54 13.82 15.59 2 12.37 0 11.14 13.34 16.58 13.96 9.64 13.56 13.64 13.42 3 11.70 11.14 0 14.42 16.16 11.53 10.34 13.71 14.90 13.78 4 17.92 13.34 14.42 0 18.36 15.78 9.64 17.03 14.42 7.48 5 13.86 16.58 16.16 18.36 0 13.71 14.49 9.00 14.04 15.46 6 10.58 13.96 11.53 15.78 13.71 0 11.31 11.87 10.54 12.85 7 11.92 9.64 10.34 9.64 14.49 11.31 0 13.82 12.77 9.43 8 10.54 13.56 13.71 17.03 9.00 11.87 13.82 0 10.95 14.35 matice Euklidovských vzdáleností mezi 10 vzorky 9 13.82 13.64 14.90 14.42 14.04 10.54 12.77 10.95 0 10.39 Zpracování dat v ekologii společenstev je symetrická (podobnost mezi 2. a 3. snímkem = podobnost mezi 3. a 2. snímkem) David Zelený 10 15.59 13.42 13.78 7.48 15.46 12.85 9.43 14.35 10.39 0 54 David Zelený Zpracování dat v ekologii společenstev ORDINAČNÍ ANALÝZA KONCEPCE MNOHOROZMĚRNÉHO PROSTORU David Zelený Prostor může být definován: Zpracování dat v ekologii společenstev druhy (species space) vzorky (sample space) 56 Zuur et al. (2007) ORDINACE RŮZNÉ FORMULACE PROBLÉMU najdi skryté gradienty v druhovém složení (ordinační osy) 2) rozmísti vzorky v zobrazitelném prostoru (ordinační prostor) David Zelený 1) Zpracování dat v ekologii společenstev 57 http://ordination.okstate.edu/ NEPŘÍMÁ VS PŘÍMÁ ORDINACE UNCONSTRAINED VS CONSTRAINED ORD. ordinační osy – směry největší variability dat popisu dat a generování hypotéz ordinační osy – variabilita dat vztažená k daným proměnným testování hypotéz vzorky druhová matice a matice proměnných prostředí proměnné prostředí druhy Přímá ordinace druhová matice druhová matice + vzorky Zpracování dat v ekologii společenstev pouze druhová matice vzorky Nepřímá ordinace David Zelený druhy matice proměnných prostředí 58 MODELY ODPOVĚDI DRUHŮ NA GRADIENT PROSTŘEDÍ David Zelený unimodální Zpracování dat v ekologii společenstev abundance 1.5 1.0 abundance 2.0 lineární 0.0 0.2 0.4 0.6 gradient 0.8 gradient 59 LINEÁRNÍ MODEL ODPOVĚDI DRUHU JEN PŘI KRÁTKÉM EKOLOGICKÉM GRADIENTU David Zelený abundance druhu abundance druhu dlouhý ekologický gradient Zpracování dat v ekologii společenstev krátký ekologický gradient gradient prostředí (pH, nadm. výška) gradient prostředí (pH, nadm. výška) 60 Lepš & Šmilauer (2003) Multivariate analysis of ... ZÁKLADNÍ TYPY ORDINAČNÍCH TECHNIK (ZALOŽENÝCH NA PRIMÁRNÍCH DATECH) nepřímá ordinace (unconstrained) PCA (Principal Component Analysis, analýza hlavních komponent) CA (Correspondence Analysis, korespondenční analýza) DCA (Detrended Correspondence analysis, detrendovaná korespondenční analýza) přímá ordinace (constrained) RDA (Redundancy Analysis, redundanční analýza) CCA (Canonical Correspondence Analysis, kanonická korespondenční analýza) Zpracování dat v ekologii společenstev unimodální odpověď druhů David Zelený lineární odpověď druhů 61 David Zelený Zpracování dat v ekologii společenstev NEPŘÍMÁ ORDINAČNÍ ANALÝZA NEPŘÍMÁ ORDINACE PRINCIP první ordinační osa (ordination axis) a skóre vzorků na této ordinační ose (sample scores) odhad optima (odpovědi) jednotlivých druhů na této ose (species scores) druhá a vyšší ordinační osy – musejí být lineárně nezávislé na všech nižších ordinačních osách Zpracování dat v ekologii společenstev hledání skryté proměnné (gradientu), který nejlépe reprezentuje chování všech druhů podél tohoto gradientu David Zelený 63 PRINCIP VÝPOČTU PCA (ANALÝZA HLAVNÍCH KOMPONENT) 2 1 samp2 3 4 samp3 5 0 samp4 7 6 samp5 9 2 samp4 sp2 samp1 Zpracování dat v ekologii společenstev sp2 David Zelený sp1 samp2 samp5 samp1 samp3 sp1 a) b) c) d) rozmístění vzorků v prostoru definovaném druhy výpočet těžiště shluku centrování os rotace os 64 Legendre & Legendre (1998) PRINCIP VÝPOČTU PCA (ANALÝZA HLAVNÍCH KOMPONENT) David Zelený Zpracování dat v ekologii společenstev 3D 2D 65 http://cnx.org Příklad: rozeznávání písmen v analýze obrazu pomocí PCA David Zelený Zpracování dat v ekologii společenstev A B C D E F . . . X Y Z a11 a12 a13 a14 a15 a21 a22 a23 a24 a25 a31 a32 a33 a34 a35 a41 a42 a43 a44 a45 a51 a52 a53 a54 a55 0 1 1 1 0 1 0 0 0 1 1 1 1 1 1 1 0 0 0 1 1 0 0 0 1 1 1 1 1 0 1 0 0 0 1 1 1 1 1 0 1 0 0 0 1 1 1 1 1 0 0 1 1 1 1 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 1 1 1 1 1 1 1 1 0 1 0 0 0 1 1 0 0 0 1 1 0 0 0 1 1 1 1 1 0 1 1 1 1 1 1 0 0 0 0 1 1 1 0 0 1 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 1 1 1 0 0 1 0 0 0 0 1 0 0 0 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 0 0 0 1 0 1 0 1 0 0 0 1 0 0 0 1 0 1 0 1 0 0 0 1 1 0 0 0 1 0 1 0 1 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 1 1 1 1 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 1 1 1 1 66 Inspired by work of François Labelle (http://www.cs.mcgill.ca/~sqrt/dimr/dimreduction.html) David Zelený PCA1 (O-X) PCA2 (H-I) Zpracování dat v ekologii společenstev vztah proměnných A11 a A12 výsledek PCA (1. a 2. PCA osa) 67 David Zelený PCA1 (O-X) PCA2 (H-I) Zpracování dat v ekologii společenstev vztah proměnných A11 a A12 výsledek PCA (1. a 2. PCA osa) 68 KTERÉ OSY PCA JSOU DŮLEŽITÉ? David Zelený Summary Table: Statistic Eigenvalues Explained variation (cumulative) Axis 1 0.242 24.2 Axis 2 0.2002 44.22 Axis 3 0.1608 60.3 Axis 4 0.0843 68.73 Axis 5 0.0608 74.81 Axis 6 0.0501 79.82 Axis 7 0.0389 83.71 Axis 8 0.0369 87.4 ... ... ... Axis 23 0.0002 99.99 Axis 24 0.0001 100 Zpracování dat v ekologii společenstev 25 % eigenvalue Broken stick model 15 10 5 PC24 PC23 PC22 PC21 PC20 PC19 PC18 PC17 PC16 PC15 PC14 PC13 PC12 PC11 PC10 PC9 PC8 PC7 PC6 PC5 PC4 PC3 PC2 0 PC1 % variation 20 69 PODSTATA MODELU „ZLOMENÉ HOLE“ (BROKEN-STICK MODEL) David Zelený 10 20 30 40 Zpracování dat v ekologii společenstev 0 hůl hůl se po pádu na zem rozpadne na 6 různě dlouhých částí 70 PCA: circle of equilibrium contribution (kruh rovnovážného příspěvku proměnné) poloměr = 𝑑/𝑝 kde d = počet os v zobrazení, p = počet všech os v PCA (rovno počtu deskriptorů) vektory = deskriptory body = vzorky Legendre P. & Legendre L. (2012) Numerical Ecology, p. 447 Interpretace: deskriptory (druhy n. jiné proměnné) s vektory delšími než poloměr kruhu výrazně přispívají k interpretaci daných ordinačních os (v tomto případě první a druhé) 71 PRINCIP VÝPOČTU CA (KORESPONDENČNÍ ANALÝZA) David Zelený 5 výpočetních kroků 1. 3. Zpracování dat v ekologii společenstev 2. začni s arbitrárním (náhodným) skóre vzorků (xi) vypočti nové skóre pro jednotlivé druhy (species score, yi) jako průměr skóre vzorků xi vážený abundancí druhu ve vzorcích vypočti nové skóre pro jednotlivé vzorky (sample score, xi) jako průměr skóre druhů yi vážený abundancí druhů ve vzorku 4. standardizuj skóre jednotlivých vzorků (natáhni osu) 5. pokud se skóre nemění, zastav, pokud ano, pokračuj krokem 2 72 PRINCIP VÝPOČTU CA (KORESPONDENČNÍ ANALÝZA) David Zelený Zpracování dat v ekologii společenstev 73 Lepš & Šmilauer (2003) Multivariate analysis of ... PRINCIP VÝPOČTU CA (KORESPONDENČNÍ ANALÝZA) David Zelený Zpracování dat v ekologii společenstev 74 Lepš & Šmilauer (2003) Multivariate analysis of ... PRINCIP VÝPOČTU CA (KORESPONDENČNÍ ANALÝZA) David Zelený Zpracování dat v ekologii společenstev 75 Lepš & Šmilauer (2003) Multivariate analysis of ... PRINCIP VÝPOČTU CA (KORESPONDENČNÍ ANALÝZA) David Zelený Zpracování dat v ekologii společenstev 76 Lepš & Šmilauer (2003) Multivariate analysis of ... PRINCIP VÝPOČTU CA (KORESPONDENČNÍ ANALÝZA) David Zelený Zpracování dat v ekologii společenstev 77 Lepš & Šmilauer (2003) Multivariate analysis of ... CA2 CA2 CA1 pravidelné rozložení bodů na konci procesu CA2 CA2 Zpracování dat v ekologii společenstev CA1 David Zelený náhodné rozložení bodů na začátku iterativního procesu 78 CA1 CA1 SIMULOVANÁ DATA JEDEN EKOLOGICKÝ GRADIENT 300 druhů s unimodální odpovědí, různými šířkami nik 500 vzorků náhodně rozmístěných podél gradientu Zpracování dat v ekologii společenstev simulovaný gradient dlouhý 5000 jednotek David Zelený 79 SIMULOVANÁ DATA ARTEFAKTY David Zelený PCA - podkova CA - oblouk Zpracování dat v ekologii společenstev o vzorky + druhy 80 ARTEFAKTY V ORDINACÍCH PŘÍČINY důsledek algoritmu (lineární nezávislost všech os) důsledek projekce (nelineární vztahy mezi druhy -> lineární prostor) David Zelený Zpracování dat v ekologii společenstev http://ordination.okstate.edu 82 ORDINAČNÍ DIAGRAMY David Zelený Zpracování dat v ekologii společenstev lineární metoda unimodální metoda 83 DETRENDOVANÁ KORESPONDENČNÍ ANALÝZA (DCA) PROCES ODSTRANĚNÍ TRENDU David Zelený Krok 1 – rozdělení první osy na několik segmentů Zpracování dat v ekologii společenstev http://ordination.okstate.edu Krok 2 – vycentrování druhé osy každého segmentu kolem nuly 85 DETRENDED CORRESPONDENCE ANALYSIS PROCES ODSTRANĚNÍ TRENDU David Zelený Krok 3 – nelineární přeškálování první osy Zpracování dat v ekologii společenstev http://ordination.okstate.edu Výsledek škálování: • osy naškálované v jednotkách směrodatné odchylky (SD) • celé druhové složení se obmění na 4 SD 86 ROZDÍL MEZI CA A DCA NA STEJNÝCH DATECH David Zelený CA CA 1 DCA DCA 0 -4 -2 -3 -1 -2 CA2 DCA2 -1 1 0 2 Zpracování dat v ekologii společenstev -1 0 1 CA1 2 3 4 -2 -1 0 1 2 3 DCA1 87 DCA – ROZDÍLNÉ VÝSLEDKY PŘI POUŽITÍ RŮZNÉHO POČTU DETRENDOVACÍCH SEGMENTŮ David Zelený DCA, # segments = 15 0 DCA2 -1 0 -2 -1 -2 -1 0 1 2 3 -2 -1 0 1 DCA1 DCA1 DCA, # segments = 26 DCA, # segments = 40 2 3 2 3 -2 0 -2 -1 -1 0 DCA2 1 1 2 2 -2 DCA2 Zpracování dat v ekologii společenstev DCA2 1 1 2 2 3 DCA, # segments = 5 -2 -1 0 1 DCA1 2 3 -2 -1 0 1 DCA1 88 DCA NA SIMULOVANÝCH DATECH (JEDEN GRADIENT) David Zelený Zpracování dat v ekologii společenstev o vzorky + druhy 89 VÝBĚR ORDINAČNÍ METODY NA ZÁKLADĚ DCA LINEÁRNÍ NEBO UNIMODÁLNÍ? David Zelený Pokud je délka 1. osy DCA menší než 3 SD – homogenní data - lineární metoda větší než 4 SD – heterogenní data - unimodální metoda v rozmezí 3-4 SD – obě techniky pracují rozumně Zpracování dat v ekologii společenstev Platí jen pro detrendování po segmentech a délku první osy! 90 David Zelený Zpracování dat v ekologii společenstev 91 ANALÝZA HLAVNÍCH KOORDINÁT (PCOA) (PRINCIPAL COORDINATE ANALYSIS) alternativní metoda nepřímé ordinace vstupní data – matice nepodobností mezi vzorky výpočet matice nepodobností – jakýkoliv index nepodobnosti Zpracování dat v ekologii společenstev syn. MDS – Metric Dimensional Scaling David Zelený pokud zvolím Euklidovskou vzdálenost -> identické s PCA pokud zvolím Chi-kvadrát vzdálenost -> obdoba CA 92 PCOA – PŘÍKLAD NA VZDÁLENOSTECH MEZI MĚSTY 1000 Copenhagen Hamburg Hook of Holland Calais Cologne Brussels Cherbourg Paris 0 204 583 206 966 677 2256 597 ... ... ... ... ... ... ... ... ... ... ... ... Lisbon Lyons Geneva Marseilles Milan Madrid Gibraltar Munich Vienna Barcelona -1000 1318 1326 1294 1498 2218 803 1172 2018 ... Brussels PCoA2 Barcelona Stockholm Zpracování dat v ekologii společenstev Barcelona Brussels Calais Cherbourg Cologne Copenhagen Geneva Gibraltar Hamburg ... Athens 3313 2963 3175 3339 2762 3276 2610 4485 2977 ... David Zelený Vzdálenosti mezi městy (km) Rome Athens -2000 -1000 0 1000 2000 PCoA1 93 NMDS (NON-METRIC MULTIDIMENSIONAL SCALING) ORDINACE ZALOŽENÁ NA DISTANCÍCH vstupní data – matice nepodobností mezi vzorky výpočet matice nepodobností – jakýkoliv index nepodobnosti iterativní algoritmus, který nemusí pokaždé dojít ke stejnému výsledku (lokální optima) nutno určit počet dimenzí, se kterými bude metoda pracovat při větším množství dat VELMI časově náročná Zpracování dat v ekologii společenstev nemetrická varianta PCoA David Zelený 94 NMDS NON-METRIC MULTIDIMENSIONAL SCALING David Zelený Zpracování dat v ekologii společenstev náhodné rozmístění vzorků v prostoru rozmístění vzorků v prostoru respektuje jejich nepodobnost 95 Ukázka datového souboru (kódy A,B,C,D,E): Rothkopfův experiment s morseovkou -.-. -.. . 0 167 169 159 180 167 0 96 79 163 169 96 0 141 166 159 79 141 0 172 180 163 166 172 0 Zpracování dat v ekologii společenstev 50 100 . - -- NMDS2 0 -. .. -50 • 598 účastníkům byly přehrány všechny dvojice kódů a pokaždé měli rozhodnout, jestli jsou shodné nebo jiné matice nepodobností = počet odpovědí „různé“ -... David Zelený • .-... -.-. -.. . .- -100 .- ----.----.---.-----.----.. -.--.. .--. .-..---.-.-.---... .-. -.. .-.. -... -.....-..-. -.... ..- .... ...- ....... ..... --. --- -50 0 NMDS1 50 96 NMDS – SHEPARDŮV DIAGRAM David Zelený 2.5 1.0 1.5 2.0 < 0.05 – vynikající < 0.1 – výborný < 0.2 – dobrý > 0.3 – špatný 0.5 (Clarke & Warwick 2001) 0.0 vzdálenost mezi vzorky v ordinačním Distance Ordination diagramu Pro stress-value přibližně platí: Non-metric fit, R2 = 0.968 Linear fit, R2 = 0.852 Zpracování dat v ekologii společenstev 3.0 stress-value = 0.18 50 100 150 nepodobnost vzorky Observed mezi Dissimilarity 97 POROVNÁNÍ METOD DCA A NMDS David Zelený DCA NMDS Zpracování dat v ekologii společenstev 98 data z údolí Vltavy, klasifikace metodou TWINSPAN (Zelený & Chytrý 2007) POROVNÁNÍ METOD DCA A NMDS David Zelený DCA NMDS Zpracování dat v ekologii společenstev 99 při větším počtu vzorků tvoří trojúhelník nebo pěticípou hvězdu (artefakt) má tendenci jakákoliv data zobrazit jako kouli POROVNÁNÍ METOD DCA A NMDS SIMULOVANÁ DATA (JEDEN GRADIENT) David Zelený DCA NMDS Zpracování dat v ekologii společenstev o vzorky + druhy 100 SIMULOVANÁ DATA DVA RŮZNĚ DLOUHÉ GRADIENTY David Zelený Gradient 2 (kratší) Zpracování dat v ekologii společenstev Gradient 1 (delší) 101 SIMULOVANÁ DATA DVA RŮZNĚ DLOUHÉ GRADIENTY NMDS Zpracování dat v ekologii společenstev PCA David Zelený DCA CA 102 SIMULOVANÁ DATA DVA STEJNĚ DLOUHÉ GRADIENTY NMDS Zpracování dat v ekologii společenstev PCA David Zelený DCA CA 103 SIMULOVANÁ DATA DVA RŮZNĚ DLOUHÉ GRADIENTY David Zelený krátké gradienty dlouhé gradienty Zpracování dat v ekologii společenstev 104 TŘI ALTERNATIVNÍ PŘÍSTUPY K NEPŘÍMÉ ORDINAČNÍ ANALÝZE David Zelený (a) Klasický přístup Zpracování dat v ekologii společenstev (b) Transformace dat (např. Hellingerova) (tb-PCA) (c) Přes matici nepodobností (PCoA, NMDS) 105 Legendre & Legendre (2012) POUŽITÍ PROMĚNNÝCH PROSTŘEDÍ V ORDINACI DVA ALTERNATIVNÍ POSTUPY vzorky ordinační osy korelace, regrese proměnné prostředí přímé srovnání oba přístupy jsou relevantní a navzájem se doplňují! vzorky vzorky matice: Y – druhové složení X – proměnné prostředí přímá ordinace 106 Legendre & Legendre (1998) Zpracování dat v ekologii společenstev nepřímé srovnání druhy vzorky David Zelený proměnné prostředí druhy PASIVNĚ POUŽITÉ FAKTORY PROSTŘEDÍ V NEPŘÍMÉ ORDINACI David Zelený DCA2 Zpracování dat v ekologii společenstev DCA1 107 Proměnné prostředí v nepřímé ordinaci skóre vzorků na první a druhé ose DCA ... sam2 ... sam2 sam2 sam3 ... sam3 sam3 sam4 ... sam4 sam4 ... ... ... ... ... sam1 ... ... SOILDPT korelace sam1 PH DCA DCA2 DCA1 ... spe4 spe3 spe2 spe1 matice druhových dat proměnné prostředí ... ... sam1 ... r1 ordinační diagram DCA vztah proměnných prostředí (vektory) a ordinačních os SOILDPT r2 PH DCA2 DCA2 DCA1 DCA1 r1 r3 DCA2 r2 r4 korelace proměnných prostředí a ordinačních os 108 David Zelený Zpracování dat v ekologii společenstev PŘÍMÁ ORDINAČNÍ ANALÝZA 10 60 5 15 20 25 30 sam 7 20 10 15 gradient sam 3 25 30 sam 2 sam 3 sam 4 sam 5 -20 sam 4 20 0 5 species 1 (residual) 0 residuály 20 40 sam 1 sam 2 sam 6 sam 5 sam 6 sam 7 spe 3 sam 6 gradient 0 env 2 env 1 sam 1 spe 3 sam 5 40 species 1 sam 7 spe 2 sam 4 0 sam 6 spe 2 sam 5 spe 1 40 sam 3 80 sam 4 sam 2 60 80 100 sam 3 species 1 (predicted) sam 2 sam 1 20 regrese abundance druhu na proměnné prostředí sam 1 predikované hodnoty 0 spe 3 spe 2 spe 1 100 matice vzorky × druhy spe 1 PRINCIP PŘÍMÉ ORDINAČNÍ ANALÝZY (RDA) matice s vysvětlujícími proměnnými sam 7 0 5 10 15 gradient 20 25 30 Princip přímé ordinační analýzy - pokračování ordinační osy s omezením (constrained axes) spe 3 spe 2 spe 1 matice predikovaných hodnot počet ordinačních os s omezením = počet vysvětlujících proměnných sam 2 PCA ordinace sam 3 RDA2 sam 1 sam 4 sam 5 sam 6 sam 7 spe 3 spe 2 spe 1 RDA1 (pokud je vysvětlující proměnná kategoriální, počet os je roven počtu kategorií minus 1) sam 2 sam 3 PCA ordinace PCA2 sam 1 sam 4 sam 5 sam 6 sam 7 matice residuálů PCA1 ordinační osy bez omezení (unconstrained axes) 111 Nepřímá a přímá ordinační analýza – PCA a RDA na datech z Vltavy (log + Hellinger) Total variation is 55.45736, supplementary variables account for (adjusted explained variation is 5.8%) Axis 1 0.1149 11.49 0.4470 Axis 2 0.0871 20.20 0.5316 7.8% Axis 3 0.0672 26.92 0.2164 Axis 4 0.0455 31.48 0.1728 Zpracování dat v ekologii společenstev Summary Table: Statistic Eigenvalues Explained variation (cumulative) Pseudo-canonical correlation (suppl.) David Zelený Method: PCA with supplementary variables (modře označená pole v PCA se objeví jen pokud jsou do analýzy přidány pasivní proměnné prostředí a ukazují, kolik by tyto proměnné vysvětlily v přímé ordinační analýze) Method: RDA Total variation is 55.45736, explanatory variables account for (adjusted explained variation is 5.8%) Summary Table: Statistic Eigenvalues Explained variation (cumulative) Pseudo-canonical correlation Explained fitted variation (cumulative) Axis 1 0.0470 4.70 0.7638 60.39 Permutation Test Results: On All Axes pseudo-F=4.0, P=0.002 Axis 2 0.0308 7.79 0.6880 100.00 7.8% Axis 3 0.0983 17.61 0.0000 Axis 4 0.0716 24.77 0.0000 113 TŘI ALTERNATIVNÍ PŘÍSTUPY K PŘÍMÉ ORDINAČNÍ ANALÝZE David Zelený (a) Klasický přístup: RDA zachovává euklidovské distance, CCA chi-kvadrát distance Zpracování dat v ekologii společenstev (b) Transformace dat (tb-RDA): používá distance vzniklé transformací dat (např. Hellingerova distance) (c) Přes matici nepodobností (db-RDA): zachovává distance použité ve vstupní distanční matici 114 Legendre & Legendre (2012) podle Legendre & Gallagher (2001) POČTY ORDINAČNÍCH OS David Zelený Nepřímá ordinační analýza počet os = počet vzorků – 1 Zpracování dat v ekologii společenstev = počet druhů (pokud počet vzorků > počet druhů) Přímá ordinační analýza počet všech os = stejný jako v případě nepřímé ordinace počet os s omezením ≤ počet kvantitativních proměnných = počet kategorií faktoru - 1 115 Nepřímá a přímá ordinační analýza – PCA a RDA na datech z Vltavy (log + Hellinger) RDA s vysvětlujícími proměnnými prostředí David Zelený PCA s pasivně promítnutými proměnnými prostředí Zpracování dat v ekologii společenstev 116 ORDINAČNÍ DIAGRAMY KONVENCE -> body zobrazení druhů -> šipky (lineární metody) -> body, centroidy (unimodální metody) zobrazení ordinačních os zobrazení proměnných prostředí vodorovná bývá osa vyššího řádu (např. první) orientace os je arbitrární šipky (kvantitativní proměnné) centroidy (kategoriální proměnné) typ ordinačního diagramu: scatterplot - 1 typ dat (vzorky nebo druhy) biplot - 2 typy dat (např. vzorky a druhy) triplot - 3 typy dat (např. vzorky, druhy a proměnné prostředí) 117 Zpracování dat v ekologii společenstev David Zelený zobrazení vzorků Lepš & Šmilauer (2003) Multivariate analysis of ... ORDINAČNÍ DIAGRAMY David Zelený Zpracování dat v ekologii společenstev přímá ordinace 118 Lepš & Šmilauer (2003) Multivariate analysis of ... nepřímá ordinace unimodální metoda lineární metoda HISTORICKÉ ORDINAČNÍ DIAGRAMY BRAY & CURTIS 1957 - NEPŘÍMÁ GRADIENTOVÁ ANALÝZA David Zelený Zpracování dat v ekologii společenstev 119 Bray & Curtis (1957): An ordination of the upland forest communities of Southern Wisconsin. Ecological Monographs 27: 326-349 KOEFICIENT DETERMINACE V REGRESI David Zelený celková suma čtverců residuální suma čtverců Zpracování dat v ekologii společenstev 120 http://en.wikipedia.org/wiki/Coefficient_of_determination David Zelený vysvětlená variabilita VYSVĚTLENÁ VARIABILITA (R2) ● R2 ○ R2Adj Zpracování dat v ekologii společenstev počet vysvětlujících proměnných počet vzorků v datovém souboru vysvětlená variabilita stoupá s počtem vysvětlujících proměnných (i když jsou náhodné) a klesá s počtem vzorků v datovém souboru platí pro přímou (kanonickou) ordinační analýzu i mnohonásobnou regresi Peres-Neto et al. (2006) Ecology 121 ● R2 ○ R2Adj Zpracování dat v ekologii společenstev počet vysvětlujících proměnných David Zelený vysvětlená variabilita VYSVĚTLENÁ VARIABILITA (R2) A ADJUSTOVANÝ R2 počet vzorků v datovém souboru adjustovaný R2 se nemění s počtem vysvětlujících proměnných a počtem vzorků v souboru 122 Peres-Neto et al. (2006) Ecology Výpočet adjustovaného R2 pomocí Ezekielovy formule (RDA) n ... počet vzorků p ... počet vysvětlujících proměnných R2Y|X ... vysvětlená variabilita bez adjustace Výpočet adjustovaného R2 permutačním modelem (RDA, CCA) 2 𝑅perm variabilita vysvětlená proměnnými prostředí po jejich znáhodnění R2 variabilita vysvětlená proměnnými prostředí 𝑅2 𝑅 2 adj o kolik variability vysvětlí proměnné prostředí víc než by vysvětlily náhodné proměnné? 2 𝑅adj = 1− 1 1 − 𝑅2 2 1 − 𝑅perm 123 VYSVĚTLENÁ VARIABILITA A ADJUSTOVANÝ R2 i náhodná proměnná vysvětlí nenulové množství variability (při následném testování signifikance ale bude neprůkazná) množství vysvětlené variability stoupá s počtem vysvětlujících proměnných (i když tyto jsou třeba úplně náhodné) nelze srovnávat variabilitu vysvětlenou modelem s různým počtem vysvětlujících proměnných (čím víc proměnných, tím víc vysvětlené variability) možné řešení – použití tzv. adjustovaného R2, tzn. vysvětlené variability ošetřené o variabilitu, kterou by vysvětlil stejný počet náhodných proměnných adjustovaný R2 je možné spočítat pro lineární ordinační metody, pro unimodální je třeba použít metody založené na permutacích Zpracování dat v ekologii společenstev nelze srovnávat vysvětlenou variabilitu v analýzách založených na různém počtu vzorků a druhů David Zelený 124 PŘÍMÁ ORDINAČNÍ ANALÝZA MONTE-CARLO PERMUTAČNÍ TEST test první kanonické osy – vliv jen jedné kvantitativní proměnné test všech kanonických os – vliv všech proměnných, nebo vliv jedné kategoriální proměnné s více kategoriemi (počet os = počet kategorií – 1) testová statistika – Fdata (pseudo-F) Zpracování dat v ekologii společenstev testuje nulovou hypotézu, že druhové složení je nezávislé na jedné nebo více vysvětlujících proměnných David Zelený P – hladina signifikance nx – počet permutací, kde Fperm >= Fdata N – celkový počet permutací 125 PŘÍMÁ ORDINAČNÍ ANALÝZA MONTE-CARLO PERMUTAČNÍ TEST David Zelený Zpracování dat v ekologii společenstev 126 Herben & Münzbergová (2001) PŘÍMÁ ORDINAČNÍ ANALÝZA MONTE-CARLO PERMUTAČNÍ TEST David Zelený Zpracování dat v ekologii společenstev randomizace ploch bez omezení (unrestricted randomization) randomizace ploch v blocích (randomization within blocks defined by covariables) 127 Herben & Münzbergová 2001 POSTUPNÝ VÝBĚR VYSVĚTLUJÍCÍCH PROMĚNNÝCH FORWARD SELECTION v každém kroku testuje zvlášť vliv jednotlivých proměnných (MonteCarlo permutační test) vybere tu proměnnou, která vysvětlí nejvíce variability a zároveň je signifikantní; tuto proměnnou pak do modelu zahrne jako kovariátu v dalším kroku znovu testuje vliv jednotlivých proměnných na druhová data (s odstraněním vlivu kovariát) a opakuje předchozí kroky testy signifikance jsou zatíženy mnohonásobným porovnáním, a jsou proto poměrně liberální (počet signifikantních proměnných je často nerealisticky vysoký a vyžaduje např. Bonferroniho korekci) Zpracování dat v ekologii společenstev ze souboru vysvětlujících proměnných umožňuje vybrat jen ty, které mají průkazný vliv David Zelený 128 PROBLÉM MNOHONÁSOBNÉHO POROVNÁNÍ David Zelený Simulace: 25 náhodně vygenerovaných proměnných otestování průkaznosti korelace každé proměnné s každou (čtvercová matice) průkazné korelace (p < 0.05) jsou označeny červeně dohromady 300 analýz, z nich je 16 průkazných Zpracování dat v ekologii společenstev 129 PARCIÁLNÍ ORDINACE PARTIAL ORDINATION následně se přímou nebo nepřímou ordinací analyzuje zbytková variabilita „nezajímavé“ proměnné se definují jako kovariáty pokud následuje přímá ordinace – ordinační osy představují čistý vliv ostatních vysvětlujících proměnných bez vlivu kovariát pokud následuje nepřímá ordinace – ordinační osy zachycují zbytkovou variabilitu v druhových datech po odstranění vlivu kovariát Zpracování dat v ekologii společenstev odstraňuje část variability vysvětlené proměnnými, které jsou pro nás nezajímavé (například vliv umístění ploch do bloků) David Zelený 130 ROZKLAD VARIANCE VARIANCE PARTITIONING Zpracování dat v ekologii společenstev vysvětlená variabilita sdílená proměnnou 1 a proměnnou 2 David Zelený variabilita vysvětlená proměnnou 1 variabilita vysvětlená proměnnou 2 Borcard et al. 1992, Ecology 73: 1045–1055 zbytková variabilita 131 ROZKLAD VARIANCE VARIANCE PARTITIONING vysvětlená variabilita 1a2 není [a]+[b]+[c] 1 2 [a] 2 1 [c] [d] [a] proměnná 1 [b] Zpracování dat v ekologii společenstev kovariáta David Zelený vysvětlující proměnná [c] proměnná 2 sdílená variabilita [b] = ([a]+[b]+[c]) – [a] – [c] nevysvětlená variabilita [d] = Total inertia – ([a]+[b]+[c]) [a]+[b] – celkový (marginal) vliv proměnné 1 [a] – čistý (partial, conditional) vliv proměnné 1 (bez vlivu prom. 2) Borcard et al. 1992, Ecology 73: 1045–1055 132 NEVYSVĚTLENÁ VARIABILITA [d] variance nevysvětlená modelem (složka D) ve skutečnosti obsahuje variabilitu, která by mohla být vysvětlena některou z proměnných, pokud by se data chovala podle teoretického modelu varianci nevysvětlenou modelem tedy nelze interpretovat jen jako zbytkovou variabilitu, která je dána šumem v datech a tím, že ne všechny proměnné prostředí byly měřeny Total inertia proto není měřítkem celkové variability v druhových datech, ale variability, kterou je možné zachytit pomocí zvoleného modelu (lineárního nebo unimodálního) variabilita vysvětlená danou proměnnou prostředí a vypočtená jako eigenvalue / total inertia je proto podhodnocená vedle procenta vysvětlené variability (eigenvalue / total inertia) uvádějte také relativní množství variability, kterou daná proměnná vysvětlí z celkové variability vysvětlené všemi proměnnými prostředí 133 Zpracování dat v ekologii společenstev David Zelený ordinační metody jsou založené na modelu (lineární nebo unimodální) odpovědi druhu na gradient prostředí, který je velkým zjednodušením skutečnosti Økland (1999) J. Veg.Sci. 10: 131-136 JAK ČÍST VÝSLEDKY ORDINAČNÍCH METOD? procento variability vysvětlené hlavními osami CANOCO: cummulative percentage variance of species data vypočte se také jako eigenvalue / total variance ukazuje, jak úspěšný byl celý proces ordinace čím více jsou jednotlivé druhy korelované, tím více variability bude vysvětleno několika málo hlavními osami má smysl srovnávat vysvětlenou variabilitu hlavních os různými ordinačními technikami na stejných datech nemá smysl srovnávat vysvětlenou variabilitu hlavních os stejnými ordinačními technikami na různých datech (eigenvalues jsou závislé na počtu hráčů ve hře – druhů, vzorků) Zpracování dat v ekologii společenstev David Zelený skóre (souřadnice) závisle proměnných (druhů) na osách u lineárních technik skóre = regresní koeficient, v ordinačních diagramech zobrazeny jako šipky u unimodálních technik skóre = optimum druhu, v ordinačních diagramech zobrazeny jako body 134 JAK ČÍST VÝSLEDKY ORDINAČNÍCH METOD? skóry vzorků (snímků) na osách skóry nezávislých (vysvětlujících proměnných) * v ordinačních diagramech vzorky zobrazeny jako body (lineární i unimodální techniky) vzdálenost mezi body v ordinačním prostoru odpovídá nepodobnosti mezi vzorky (ne ale nepodobnosti celého floristického složení, ale jenom té části, která je vyjádřena zobrazenými ordinačními osami) Zpracování dat v ekologii společenstev David Zelený regresní koeficienty, důležitá jsou jejich znaménka test signifikance (Monte-Carlo permutační test) * ukazuje na statistickou významnost použitých vysvětlujících proměnných 135 * jen přímé ordinační techniky JEDNOTLIVÉ PROMĚNNÉ TERMINOLOGIE vysvětlované / závislé proměnné vysvětlující / nezávislé proměnné, prediktory * CANOCO: proměnné prostředí (environmental variables) měřené nebo odhadované proměnné vzorky, objekty, případy (cases) CANOCO: druhy (species) Zpracování dat v ekologii společenstev David Zelený CANOCO: snímky (samples) kovariáty, nezajímavé vysvětlující / nezávislé proměnné * CANOCO: kovariáty (covariables) proměnné, jejichž vliv nás nezajímá a chceme ho z analýzy odstranit 136 * jen přímé ordinační techniky PŘÍKLAD NA ROZKLAD VARIANCE SPOLEČENSTVA MĚKKÝŠŮ NA PRAMENIŠTÍCH pH Ca cond Mg Na … Zpracování dat v ekologii společenstev Otázka: Je druhové složení společenstev měkkýšů na slatiništích ovlivněno více druhovým složením vegetace, nebo stanovištními podmínkami? David Zelený druhové složení společenstev měkkýšů druhové složení slatiništní vegetace měřené proměnné prostředí (ve vodě) 138 Horsák M. & Hájek M. (2003) PŘÍKLAD NA ROZKLAD VARIANCE SPOLEČENSTVA MĚKKÝŠŮ NA PRAMENIŠTÍCH druhové složení vegetace –> DCA (krátký gradient) -> PCA postupný výběr proměnných (RDA) na měkkýších Zpracování dat v ekologii společenstev druhové složení měkkýšů (Hellingerova transformace) -> RDA David Zelený mezi PCA osami reprezentujícími vegetaci mezi proměnnými prostředí reprezentujícími stanovištní podmínky výsledek z vegetačních dat nejlépe vysvětlí měkkýše první dvě osy PCA z proměnných prostředí je nejlepší obsah vápníku a konduktivita slatiništní vody rozklad variance mezi vegetaci a proměnné prostředí test marginálních a parciálních frakcí vysvětlené variability 139 PŘÍKLAD NA ROZKLAD VARIANCE SPOLEČENSTVA MĚKKÝŠŮ NA PRAMENIŠTÍCH David Zelený 6% p < 0.01 proměnné prostředí [Ca + conduct] 20% Zpracování dat v ekologii společenstev vegetace [PC1 + PC2] 2% p = 0.072 [d] = 72% 140 ROZKLAD VARIANCE MEZI PROMĚNNÉ PROSTŘEDÍ A PROMĚNNÉ POPISUJÍCÍ PROSTOROVÉ VZTAHY David Zelený Zpracování dat v ekologii společenstev 141 ROZKLAD VARIANCE MEZI PROMĚNNÉ PROSTŘEDÍ A PROMĚNNÉ POPISUJÍCÍ PROSTOROVÉ VZTAHY David Zelený Zpracování dat v ekologii společenstev 142 PCNM (PRINCIPAL COORDINATES OF NEIGHBOUR MATRICES) ROZKLAD VARIANCE MEZI PROMĚNNÉ PROSTŘEDÍ A PROMĚNNÉ POPISUJÍCÍ PROSTOROVÉ VZTAHY David Zelený Zpracování dat v ekologii společenstev 144 ROZKLAD VARIANCE MEZI PROMĚNNÉ PROSTŘEDÍ A PROMĚNNÉ POPISUJÍCÍ PROSTOROVÉ VZTAHY David Zelený Zpracování dat v ekologii společenstev 145 PŘEHLED METOD ORDINAČNÍ ANALÝZY raw-data-based (založené na primárních datech) transformationbased linear unimodal (lineární) (unimodální) (založené na transformovaných primárních datech) CA, DCA tb-PCA distancebased (založené na distanční matici) (analýza hlavních koordinát) PCoA unconstrained (nepřímé) constrained (přímé) PCA (analýza hlavních komponent) RDA (redundanční analýza) (korespondenční a detrendovaná korespondenční analýza) (analýza hlavních komponent na transformovaných primárních datech) NMDS (nemetrické mnohorozměrné škálování) CCA tb-RDA db-RDA (kanonická korespondenční analýza) (redundanční analýza na transformovaných primárních datech) (redundanční analýza založená na distanční matici) 146 MANTEL TEST KORELACE MEZI MATICEMI NEPODOBNOSTÍ David Zelený Zpracování dat v ekologii společenstev 147 Legendre & Legendre 1998 MANTEL TEST David Zelený De proměnná prostředí 1 0 1 4.5 2 0.4 0 2 4.1 3 0.3 0.1 0 3 4.2 4 0.7 0.4 0.3 0 4 3.8 1 2 3 4 druhová data Dsp sp1 sp2 1 0 1 0 3 2 1.41 0 2 1 2 3 0.3 0.1 0 3 1 2 4 0.7 0.4 0.3 0 4 2 1 1 2 3 4 (eucl.) De Dsp 0.4 1.41 0.3 1.41 0.1 0 0.7 2.5 0.4 1.41 0.3 1.41 Zpracování dat v ekologii společenstev pH r = 0.965 p = 0.015 148 SHRNUTÍ David Zelený Zpracování dat v ekologii společenstev 149 Legendre & Legendre 1998 POUŽÍVÁNÍ ORDINAČNÍCH METOD A SOFTWARE (VEGETAČNÍ STUDIE) David Zelený Zpracování dat v ekologii společenstev 150 von Wehrden et al. (2009) JVS PCA – PŘÍKLAD TRENDY V NÁZVECH ČLÁNKŮ V EKOLOGICKÝCH ČASOPISECH David Zelený Zpracování dat v ekologii společenstev 151 Nobis & Wohlgemuth (2004) Oikos David Zelený Zpracování dat v ekologii společenstev 152 Nobis & Wohlgemuth (2004) Oikos DCA – PŘÍKLAD FLORISTICKÁ DATA Z NP PODYJÍ David Zelený Zpracování dat v ekologii společenstev skóre pro jednotlivé kvadráty z 1. a 2. osy DCA (na základě jejich floristického složení) byly promítnuty do síťové mapy 153 Chytrý et al. (1999) Preslia PCA – PŘÍKLAD Zpracování dat v ekologii společenstev Výrazný úbytek druhové bohatosti bylinného (E1) a keřového (E2) patra v posledních 50ti letech. Data jsou založená na zopakování fytocenologických snímků na plochách snímkovaných Jaroslavem Horákem v šedesátých letech. David Zelený ZMĚNY V DRUHOVÉM SLOŽENÍ PÁLAVSKÝCH DUBOHABŘIN (R. HEDL 2005, DISERTAČNÍ PRÁCE) Změna v druhovém složení vegetace v průběhu 50ti let samovolné sukcese (PCA diagram). 154 NMDS PŘÍKLAD VLIV SUCHA NA SLOŽENÍ SPOLEČENSTEV V EXPERIMENTÁLNÍ David Zelený STUDII Zpracování dat v ekologii společenstev 155 Chase (2007) PNAS NMDS PŘÍKLAD ZOBRAZENÍ ZMĚN V DRUHOVÉM SLOŽENÍ V PROSTORU NA David Zelený PŘÍKLADU TRVALÝCH PLOCH V TROPICKÉM LESE Zpracování dat v ekologii společenstev 157 Baldeck et al. (2013) RDA – PŘÍKLAD VLIV ZÁSAHU NA KLÍČENÍ SEMENÁČŮ David Zelený RDA: počet semenáčů jednotlivých druhů v ploškách 10×10 cm jako závislá proměnná, zásah jako vysvětlující proměnná; eig. 1. osy: 0,046, eig. 4. osy: 0,331, MC test 1. osy: p < 0,01 Zpracování dat v ekologii společenstev 158 Špačková et al.(1998) Folia Geobotanica CCA – PŘÍKLAD ROZDÍL MEZI PRADÁVNÝMI A DRUHOTNÝMI LESY David Zelený Zpracování dat v ekologii společenstev Vojta (2007) Preslia 159 CCA – PŘÍKLAD STANOVENÍ EKOLOGICKÉHO OPTIMA JEDNOTLIVÝCH David Zelený DRUHŮ MĚKKÝŠŮ PODÉL EKOLOGICKÝCH GRADIENTŮ Zpracování dat v ekologii společenstev 160 Horsák et al. (2007) Acta Oecologica David Zelený Zpracování dat v ekologii společenstev NUMERICKÁ KLASIFIKACE PROČ MÁ SMYSL VĚCI KLASIFIKOVAT? Zpracování dat v ekologii společenstev http://wfc3.gsfc.nasa.gov David Zelený vlnová délka (~ ekologický gradient) 162 PROČ MÁ SMYSL VĚCI KLASIFIKOVAT? Zpracování dat v ekologii společenstev http://wfc3.gsfc.nasa.gov David Zelený vlnová délka (~ ekologický gradient) 163 PROČ MÁ SMYSL VĚCI KLASIFIKOVAT? David Zelený Zpracování dat v ekologii společenstev 164 http://www.existentialennui.com/ Knihovna Ústavu botaniky a zoologie, PřF MU v Brně. Knihy rozklasifikované podle velikosti hřbetu. KLASIFIKACE David Zelený O klasifikaci obecně platí: smyslem je najít diskontinuity v jinak kontinuální realitě, které můžeme pojmenovat – například proto, abychom si usnadnili komunikaci cílem je seskupit podobné objekty (vzorky, druhy) do skupin, které jsou vnitřně homogenní, dobře popsatelné a zároveň dobře odlišitelné od ostatních skupin Zpracování dat v ekologii společenstev O klasifikaci ekologických dat platí: pokud analyzuji vzorky – daná skupina obsahuje vzorky s podobným druhovým složením (např. podobná stanoviště) pokud analyzuji druhy – daná skupina obsahuje druhy s podobným ekologickým chováním 165 KLASIFIKACE OBECNÉ ROZDĚLENÍ neřízená (unsupervised, bez učitele) cílem je vytvořit novou klasifikaci pomocí datového souboru výslednou klasifikaci můžeme ovlivnit pouze výběrem metody (kombinace klasifikačního algoritmu a míry podobnosti), případně požadovaného počtu shluků numerické metody klasifikace (cluster analysis, TWINSPAN) Zpracování dat v ekologii společenstev David Zelený řízená (supervised, s učitelem) cílem je aplikovat již existující klasifikaci („danou učitelem“) na datový soubor klasifikační systém musíme nejdříve naučit, jak má vypadat výsledná klasifikace (training), a systém ji pak reprodukuje na dalších vzorcích ANN – artificial neural networks, klasifikační stromy, náhodné lesy (random forests), COCKTAIL 167 KLASIFIKACE OBECNÉ ROZDĚLENÍ subjektivní vs objektivní v době rozkvětu metod numerické klasifikace se věřilo, že numerické metody přinášejí klasifikaci založenou na objektivních kritériích, tedy tu která „skutečně existuje“ (narozdíl od té subjektivní, která je „výmyslem badatele“) všechny klasifikace jsou ale z principu subjektivní – v případě, že Bůh není, pak není nikdo, kdo by řekl, která klasifikace je jediná správná Zpracování dat v ekologii společenstev David Zelený neformalizovaná vs formalizovaná formalizovaná klasifikace je taková, která je provedena na základě jasných kritérií a díky tomu je možné ji znovu reprodukovat – opakem je klasifikace založená na neformálních kritériích (například pocitu), kterou pak není snadné zopakovat 168 OTÁZKY, KTERÉ BYCH SI MĚL POLOŽIT PŘED TÍM, NEŽ ZAČNU NĚCO KLASIFIKOVAT David Zelený Pro jaký účel klasifikaci dělám? chci klasifikovat můj datový soubor (srovnat knihy v mojí domácí knihovničce) chci vytvořit obecný klasifikační systém, který bude použitelný i na další soubory (vytvořit knihovnický systém kategorizace knih, používaný i v jiných knihovnách) Zpracování dat v ekologii společenstev Podle jakých kritérií budu objekty klasifikovat? kritérium, podle kterého budu posuzovat, jestli si jsou objekty více či méně podobné (knihy budu třídit podle obsahové podobnosti nebo např. podle velikosti) odpovídá výběru indexu podobnosti mezi vzorky Jak stanovím hranice mezi jednotlivými skupinami? pravidla, podle kterých budu přiřazovat objekty do skupin odpovídá výběru klasifikačního algoritmu 169 KLASIFIKACE David Zelený klasifikační metody Zpracování dat v ekologii společenstev nehierarchické (K-means clustering) hierarchické divisivní (TWINSPAN) aglomerativní (klasická cluster analysis) 170 KLASIFIKACE David Zelený klasifikační metody Zpracování dat v ekologii společenstev nehierarchické (K-means clustering) hierarchické divisivní (TWINSPAN) aglomerativní (klasická cluster analysis) 171 KLASIFIKACE HIERARCHICKÁ A AGLOMERATIVNÍ David Zelený Shluková analýza (cluster analysis ) hierarchická metoda aglomerativní metoda shluky jsou hierarchicky uspořádány Zpracování dat v ekologii společenstev shluky jsou tvořeny ‘odspodu’, tzn. postupným shlukováním jednotlivých vzorků do větších skupin základní volby: míra nepodobnosti mezi vzorky (distance measure) shlukovací (klastrovací) algoritmus (clustering algorithm) 172 SHLUKOVÁ ANALÝZA (CLUSTER ANALYSIS) David Zelený Zpracování dat v ekologii společenstev Výsledek shlukové analýzy je ovlivněn celou řadou rozhodnutí, které provádíme na různých úrovních zpracování dat výsledná klasifikace matice nepodobností primární data sběr dat • transformace • strandardizace • míra nepodobnosti (Euklidovská, Bray-Curtis atd.) • volba důležitostní hodnoty (pokryvnost, početnost) • výběr klastrovacího algoritmu (single linkage, complete linkage atd.) 173 SHLUKOVÁ ANALÝZA (CLUSTER ANALYSIS) SHLUKOVACÍ ALGORITMY páry vzorků seřazené podle podobností 174 výsledný dendrogram Zpracování dat v ekologii společenstev Legendre & Legendre 1998 matice podobností David Zelený Metoda jednospojná (single linkage) SHLUKOVÁ ANALÝZA (CLUSTER ANALYSIS) SHLUKOVACÍ ALGORITMY David Zelený Metoda jednospojná (single linkage, nearest neighbour) vzorky se pojí ke shluku, ve kterém je jim nejpodobnější vzorek přidám se ke skupině, ve které je ten, kdo je mí nejvíc sympatický Zpracování dat v ekologii společenstev Metoda všespojná (complete linkage, farthest neighbour) vzorky se připojí ke shluku až v okamžiku, kdy shluk obsahuje všechny podobné vzorky přidám se ke skupině ve které je ten, kdo je mi nejmíň nesympatický single linkage complete linkage 175 SHLUKOVÁ ANALÝZA (CLUSTER ANALYSIS) DENDROGRAM nezáleží na tom, který vzorek (skupina) je vpravo a který vlevo 9 8 3 4 12 13 20 15 16 14 19 17 18 11 10 2 7 6 5 1 0.0 0.5 1.0 1.5 2.0 2.5 Zpracování dat v ekologii společenstev distance záleží na tom, které vzorky jsou spojeny na které úrovni David Zelený 176 METODA JEDNOSPOJNÁ VS VŠESPOJNÁ David Zelený Bray-Curtis distance / Complete linkage Zpracování dat v ekologii společenstev metoda jednospojná se výrazně řetězí 14 15 20 6 7 4 3 8 9 13 12 2 10 5 11 18 16 8 9 5 6 7 4 3 10 2 15 20 11 18 16 13 12 14 19 1 1 17 17 19 Bray-Curtis distance / Single linkage 177 METODA JEDNOSPOJNÁ VLIV TRANSFORMACE DRUHOVÝCH DAT David Zelený Single linkage / Euclidean distance / LOG transformation Zpracování dat v ekologii společenstev 1 8 19 2 9 3 5 15 20 11 18 16 6 7 15 20 7 10 6 5 18 11 13 12 10 4 16 14 2 14 12 17 19 13 8 3 17 4 9 1 Single linkage / Euclidean distance / no transformation transformace dat (např. logaritmická) může výrazně ovlivnit výsledný dendrogram – v případě euklidovských vzdáleností a jednospojné metody obzvlášť 178 SHLUKOVÁ ANALÝZA (CLUSTER ANALYSIS) SHLUKOVACÍ ALGORITMY 4 8 3 13 12 9 14 15 20 5 7 16 přidám se ke skupině, ve které jsou mi všichni v průměru nejvíc sympatičtí 1 11 18 UPGMA (unweighted pair-group method using arithmetic averages) – vzorek se připojí ke shluku, ke kterému má největší (neváženou) průměrnou podobnost se všemi jeho vzorky 2 10 17 19 6 zahrnuje řadu metod, které stojí mezi single a complete linkage a v ekologii jsou smysluplnější Euclidean distance / UPGMA Zpracování dat v ekologii společenstev David Zelený Average linkage (např. UPGMA) 179 SHLUKOVÁ ANALÝZA (CLUSTER ANALYSIS) SHLUKOVACÍ ALGORITMY 4 9 8 3 16 15 20 13 12 14 1 neměla by se kombinovat se Sørensenovým (Bray-Curtis) indexem podobnosti 11 18 2 10 6 5 7 17 19 ke shluku se připojí vzorek, jehož vzdálenost od centroidu shluku je nejmenší (počítáno přes čtverce vzdáleností mezi vzorky a centroidy shluků) Euclidean distance / Ward's method Zpracování dat v ekologii společenstev David Zelený Wardova metoda (Ward’s minimum variance method) 180 SHLUKOVÁ ANALÝZA (CLUSTER ANALYSIS) SHLUKOVACÍ ALGORITMY nejvíc se řetězí pro β ~ 1, nejméně pro β = -1 optimální reprezentace vzdáleností mezi vzorky je při β = -0,25 Zpracování dat v ekologii společenstev nastavení parametru β ovlivňuje řetězení dendrogramu David Zelený Legendre & Legendre 1998 Flexible clustering (beta flexible) 181 KLASIFIKACE David Zelený klasifikační metody Zpracování dat v ekologii společenstev nehierarchické (K-means clustering) hierarchické divisivní (TWINSPAN) aglomerativní (klasická cluster analysis) 182 KLASIFIKACE HIERARCHICKÁ A DIVISIVNÍ David Zelený TWINSPAN (Two Way INdicator Species ANalysis) divisivní metoda polytetická metoda začíná dělením celého souboru vzorků a postupuje směrem dolů Zpracování dat v ekologii společenstev každé dělení závisí na několika (indikačních) druzích (x monotetická metoda – dělení ovlivňuje jediný druh) metoda velmi oblíbená mezi vegetačními ekology ale – algoritmus je poměrně složitý, s řadou arbitrárních kroků, a proto má také řadu zarytých odpůrců vzorky jsou uspořádány podle první osy korespondenční analýzy (CA, DCA) a podle ní jsou rozděleny do dvou shluků (vzorky s pozitivním skóre a negativním skóre) metoda ošetří vzorky, které leží blízko středu osy, a které tak mají velkou pravděpodobnost, že budou špatně klasifikovány 183 KLASIFIKACE HIERARCHICKÁ A DIVISIVNÍ David Zelený TWINSPAN (Two Way INdicator Species ANalysis) pseudospecies Zpracování dat v ekologii společenstev metoda primárně funguje pro kvalitativní data kvantitativní informace se dodává rozdělením druhů na pseudospecies podle abundance (cut levels) 184 Lepš & Šmilauer (2003) KLASIFIKACE HIERARCHICKÁ A DIVISIVNÍ David Zelený TWINSPAN (Two Way INdicator Species ANalysis) pseudospecies Zpracování dat v ekologii společenstev metoda primárně funguje pro kvalitativní data kvantitativní informace se dodává rozdělením druhů na pseudospecies podle abundance (cut levels) výsledkem je (mimo jiné) tabulka podobná fytocenologické snímky z určitých klastrů a druhy s vysokou fidelitou k dané skupině jsou seskupeny dohromady metoda vhodná v případě, že jsou data strukturovaná podle jednoho výrazného gradientu vhodné na hledání (několika málo) ekologicky interpretovatelných skupin v datech PC-ORD, JUICE 185 TWINSPAN David Zelený Zpracování dat v ekologii společenstev 186 MODIFIKOVANÝ TWINSPAN (ROLEČEK ET AL. 2009) algoritmus se po každém dělení na dvě skupiny rozhoduje, kterou ze skupin bude dále dělit – vybere tu, která je více „heterogenní“ na základě její betadiverzity míru betadiverzity je nutné zvolit (např. Jaccardův index podobnosti) JUICE Zpracování dat v ekologii společenstev na rozdíl od původního algoritmu (a) umožňuje modifikovaný TWINSPAN (b) dopředu stanovit cílový počet skupin David Zelený 187 KLASIFIKACE David Zelený klasifikační metody Zpracování dat v ekologii společenstev nehierarchické (K-means clustering) hierarchické divisivní (TWINSPAN) aglomerativní (klasická cluster analysis) 188 NEHIERARCHICKÁ (shlukování metodou K-průměrů) nehierarchická metoda – všechny shluky jsou si rovny analogie Wardovy metody - minimalizuje sumy čtverců vzdáleností vzorků od centroidů shluku na začátku uživatel zvolí počet shluků (k) iterativní metoda, začne od náhodného přiřazení vzorků do shluků, postupně přehazuje vzorky mezi shluky a hledá optimální řešení výsledek do určité míry záleží na počátečním rozmístění shluků do vzorků a je proto dobré proces mnohokrát zopakovat (najít stabilní řešení), protože metoda má tendenci nacházet lokální minima STATISTICA, SYN-TAX 2000, R Zpracování dat v ekologii společenstev David Zelený K-means clustering Legendre & Legendre 1998 KLASIFIKACE 189 INTERPRETACE VÝSLEDKŮ NUMERICKÉ KLASIFIKACE porovnání skupin na základě externích kritérií (např. měřených proměnných prostředí) porovnání skupin na základě druhového složení – stanovení charakteristických druhů Zpracování dat v ekologii společenstev promítnutí výsledků do ordinačního diagramu David Zelený 190 PROMÍTNUTÍ VÝSLEDKŮ NUMERICKÉ KLASIFIKACE DO ORDINAČNÍHO DIAGRAMU David Zelený DCA + TWINSPAN NMDS (Bray-Curtis) + TWINSPAN Zpracování dat v ekologii společenstev Je vhodné, aby míra nepodobnosti mezi vzorky byla v obou metodách (numerické klasifikaci i ordinační analýze) stejná (ze zvolených příkladů ten vlevo je vhodné řešení, vpravo nevhodné) data z údolí Vltavy, klasifikace metodou TWINSPAN (Zelený & Chytrý 2007) 191 SILHOUETTE DIAGRAM Borcard et al. (2011) Numerical Ecology with R Zpracování dat v ekologii společenstev 192 David Zelený • hodnotí stupeň podobnosti daného vzorku ke klastru, do kterému byl zařazen, a srovnává ho s jeho podobností k nejbližšímu jinému klastru • negativní hodnoty – tyto vzorky byly s velkou pravděpodobností špatně klasifikovány (ve skutečnosti patří jinam) HEAT MAP David Zelený (intenzita barvy se zvyšuje s abundancí druhu ve vzorku) Zpracování dat v ekologii společenstev 193 Borcard et al. (2011) Numerical Ecology with R HEAT MAP David Zelený Zpracování dat v ekologii společenstev 194 Borcard et al. (2011) Numerical Ecology with R David Zelený Zpracování dat v ekologii společenstev 195 STANOVENÍ DRUHŮ TYPICKÝCH PRO JEDNOTLIVÉ SHLUKY David Zelený Analýza indikačních druhů (Dufrêne & Legendre 1997) - IndVal bere v potaz dva parametry: specificita𝑘𝑗 = Zpracování dat v ekologii společenstev průměrná abundance druhu 𝑗 uvnitř shluku 𝑘 součet průměrných abundancí druhu 𝑗 uvnitř ostatních shluků fidelita 𝑘𝑗 = počet vzorků ve shluku 𝑘 obsahující druh 𝑗 celkový počet vzorků ve shluku 𝑘 IndVal𝑘𝑗 = specificita𝑘𝑗 * fidelita 𝑘𝑗 (pro druh j ve shluku k) IndVal𝑗 = max (IndVal𝑘𝑗 ) (pro druh j celkově) možnost testování signifikance Monte-Carlo permutačním testem dostupné v PC-ORD 196 STANOVENÍ DRUHŮ TYPICKÝCH PRO JEDNOTLIVÉ SHLUKY David Zelený Analýza indikačních druhů (Dufrêne & Legendre 1997) - IndVal Zpracování dat v ekologii společenstev (příklad z knihy Legendre & Legendre 2013) 197 STANOVENÍ DRUHŮ TYPICKÝCH PRO JEDNOTLIVÉ SHLUKY David Zelený Fidelita (věrnost) druhu ke vzorku (Chytrý et al. 2002) Zpracování dat v ekologii společenstev Phi koeficient asociace (analogie Pearsonova korelačního koeficientu r) ϕ = (ad – bc) / √ (a + b)(c + d)(a + c)(b + d) Počet vzorků ve shluku A mimo shluk A obsahující daný druh a b neobsahující daný druh c d rozsah <-1, 1>, 0 při shodné frekvenci uvnitř a vně shluku v JUICE možnost standardizace na velikost skupiny exaktní Fisherův test pro testování signifikance dostupné v programu JUICE 198 David Zelený Zpracování dat v ekologii společenstev REGRESE VS KALIBRACE METODY GRADIENTOVÉ ANALÝZY Apriorní znalost vztahů mezi druhy a prostředím? Použijeme: Dostaneme: počet druhů 1, n 1 ne regrese závislost druhu na prostředí žádné n ano kalibrace odhady hodnot charakteristik prostředí žádné n ne nepřímá ordinace osy variability v druhovém složení 1, n n ne přímá ordinace variabilita ve druhovém složení vysvětlená charakteristikami prostředí Zpracování dat v ekologii společenstev počet charakteristik prostředí David Zelený Data, která máme: 200 Lepš & Šmilauer (2003) Multivariate analysis of... REGRESE VS KALIBRACE • odhad směrnice regresní přímky metoda nejmenších čtverců • odhad hodnoty proměnné prostředí metoda váženého průměrování (váhy = směrnice regresních přímek) nepoužívá se • • kalibrace • • • • • • Zpracování dat v ekologii společenstev unimodální model David Zelený regrese lineární model odhad optima druhu na gradientu prostředí metoda váženého průměrování odhad hodnoty proměnné prostředí metoda váženého průměrování (váhy = abundance druhu ve vzorku) používá se často 201 REGRESE UNIMODÁLNÍ ODPOVĚĎ DRUHU David Zelený Odhad optima druhu váženým průměrováním 𝑛 𝑗=1 Env𝑗 × Abund𝑗 𝑛 𝑗=1 Abund𝑗 Zpracování dat v ekologii společenstev WA Sp = Env 𝑗 – hodnota gradientu prostředí ve vzorku j Abund 𝑗 – abundance druhu ve vzorku j n – celkový počet vzorků v souboru abundance druhu abundance druhu v jednotlivých vzorcích vypočtený vážený průměr 202 gradient prostředí KALIBRACE UNIMODÁLNÍ ODPOVĚĎ DRUHU ignoruje toleranci druhu abundance druhu WA Samp = Zpracování dat v ekologii společenstev odhad hodnoty gradientu pro vzorek je stanoven průměrem optim jednotlivých druhů, vážených jejich abundancí David Zelený 𝑠 𝑖=1 IV𝑖 × Abund𝑖 𝑠 𝑖=1 Abund𝑖 IV𝑖 – indikační hodnota druhu i Abund 𝑗 – abundance druhu i ve vzorku s – celkový počet druhů ve vzorku Druh 3 Druh 4 Druh 2 Druh 1 204 gradient prostředí KALIBRACE UNIMODÁLNÍ ODPOVĚĎ DRUHU David Zelený Příklady použití: saprobní index v limnologii (založený na rozsivkách) použití v paleoekologii k rekonstrukci ekologických poměrů v minulosti na základě fosilních nálezů Ellenbergovy (nebo jiné) indikační hodnoty pro rostlinné druhy (viz dále) CWM (community-weighted mean) – počítá vážený průměr funkčních vlastností druhů pro vzorek (functional traits) Zpracování dat v ekologii společenstev 205 David Zelený ELLENBERGOVY INDIKAČNÍ HODNOTY Zpracování dat v ekologii společenstev 2 5 3 2 6 6 ELLENBERGOVY INDIKAČNÍ HODNOTY (EIH) hodnoty na ordinální škále (1-9, případně 1-12 pro vlhkost) optima stanovená na základě terénních pozorování, v některých případech upřesněna experimentálně hodnoty tabelované původně pro Německo, ale používané i v okolních zemích, pro vzdálenější státy (Anglie, Itálie, Řecko) byly tyto hodnoty překalibrovány, jinde (Maďarsko, Švýcarsko) se používají alternativní hodnoty od jiných autorů (Borhidi, resp. Landolt) tabulky obsahují pouze údaje o druhových optimech, ne o šířkách druhové niky v případě, že nemám měřená data o proměnných prostředí, průměrné EIH nabízejí ekologicky intuitivní odhad stanovištních podmínek Zpracování dat v ekologii společenstev optima druhů rostlin na gradientu živin, vlhkosti, půdní reakce, kontinentality, teploty, světla a salinity (salinita se ve Střední Evropě nepoužívá) David Zelený 207 ELLENBERGOVY INDIKAČNÍ HODNOTY (EIH) POUŽITÍ PRO KALIBRACI David Zelený 1 2 3 6 7 7 4 7 5 3 2 1 2 3 1 0 1 0 1 0 1 0 1 0 0 0 1 0 1 1 0 1 1 1 0 1 0 1 1 0 0 1 0 1 0 1 0 Zpracování dat v ekologii společenstev Mycelis muralis Moehringia trinervia Mercurialis perennis Lathyrus vernus Myosotis sylvatica Milium effusum Melica nutans Melampyrum pratense Myosotis ramosissima Lychnis viscaria Melittis melissophyllum EIV pro půdní reakci 4.8 průměr 208 ELLENBERGOVY INDIKAČNÍ HODNOTY (EIH) POUŽITÍ PRO KALIBRACI David Zelený 1 2 3 6 7 7 4 7 5 3 2 1 2 3 1 0 1 0 1 0 1 0 1 0 0 0 1 0 1 1 0 1 1 1 0 1 0 1 1 0 0 1 0 1 0 1 0 průměrná hodnota: 4.8 3.9 4.6 Zpracování dat v ekologii společenstev Mycelis muralis Moehringia trinervia Mercurialis perennis Lathyrus vernus Myosotis sylvatica Milium effusum Melica nutans Melampyrum pratense Myosotis ramosissima Lychnis viscaria Melittis melissophyllum EIV pro půdní reakci 209 VÝPOČET PRŮMĚRNÝCH EIH David Zelený Empirická zkušenost s ekologií druhů průměrné Ellenbergovy indikační hodnoty Zpracování dat v ekologii společenstev H. Ellenberg Data o druhovém složení průměrná EIH pro daný vegetační snímek obsahuje dvojí informaci: 1. 2. ekologicky relevantní informaci o charakteru stanoviště, a to díky použití tabelovaných druhových EIH, které jsou založeny na empirických pozorování ekologických nároků druhů v terénu informaci o podobnosti druhového složení daného snímku k ostatním snímkům v datovém souboru, která je v nich „uložena“ díky způsobu, jak jsou průměrné EIH počítány 211 VÝPOČET PRŮMĚRNÝCH EIH David Zelený Empirická zkušenost s ekologií druhů průměrné Ellenbergovy indikační hodnoty Zpracování dat v ekologii společenstev H. Ellenberg Data o druhovém složení díky způsobu jak jsou počítány, obsahují průměrné EIH informaci o podobnosti v druhovém složení mezi vegetačními snímky vegetační snímky s úplně stejným druhovým složením budou mít přesně stejné průměrné EIH – pro měřené faktory toto ale neplatí malý rozdíl v druhovém složení mezi vegetačními snímky povede jen k malému rozdílu v jejich průměrných EIH 212 VÝPOČET PRŮMĚRNÝCH EIH David Zelený Empirická zkušenost s ekologií druhů průměrné Ellenbergovy indikační hodnoty Zpracování dat v ekologii společenstev H. Ellenberg Data o druhovém složení ‼ problém nastává v okamžiku, kdy jsou průměrné EIH analyzovány současně s daty o druhovém složení, ze kterých jsou vypočteny 213 VYTVOŘENÍ PRŮMĚRNÝCH EIH, KTERÉ NEOBSAHUJÍ EKOLOGICKOU INFORMACI David Zelený Zpracování dat v ekologii společenstev průměrné reálné EIH pro půdní reakci: průměrné znáhodněné EIH pro půdní reakci: průměrné reálné EIH – obsahují ekologicky relevantní informaci a informaci o podobnosti v druhovém složení průměrné znáhodněné EIH – obsahují pouze informaci o podobnosti v druhovém složení (ekologicky relevantní informace byla zničena promícháním druhových EIH mezi druhy) 214 KORELACE PRŮMĚRNÝCH EIH SE SKÓRY SNÍMKŮ NA OSÁCH DCA David Zelený Počet signifikantních korelací mezí osami DCA a průměrnými znáhodněnými EIH (šedé sloupečky) nebo náhodnými čísly (bílé sloupečky) – 1000 opakování Zpracování dat v ekologii společenstev průměrná EIH bude s velkou pravděpodobností signifikantně korelovaná s DCA, i když neobsahuje ekologickou informaci! 215 PRŮMĚRNÉ EIH V NEPŘÍMÉ ORDINACI David Zelený DCA2 R2 Porig Pmodif Světlo 0,477 0,879 0,600 < 0,001 0,004 Teplota 0,350 0,937 0,471 < 0,001 0,011 Kontinentalita 0,726 0,688 0,148 0,004 0,452 Vlhkost -0,925 0,381 0,897 < 0,001 < 0,001 Živiny -0,998 0,066 0,831 < 0,001 < 0,001 Půdní reakce -0,653 0,757 0,429 < 0,001 0,032 Zpracování dat v ekologii společenstev DCA1 216 + + + + + + + + + + 3 + + 4 3 2 1 + 2 + 3.5 náhodná čísla 5 ++ + + + + + ++ ++ + ++ + + + ++ + + +++ + ++ + ++ + + ++ + + + + + + + + + + + + + + ++ + + + + + + + + + + ++ + + ++ + průměrné znáhodnéné EIH + + ++ průměrné reálné EIH 6 + náhodná čísla + + měřené pH + ++ [%] Explained variability variabilita vysvětlená [%] Ellenberg Mean půdní reakci proreaction EIH průměrná Zpracování dat v ekologii společenstev 5 7 4 David Zelený POROVNÁNÍ MĚŘENÉHO PŮDNÍHO PH A VYPOČTENÉ PRŮMĚRNÉ EIH PRO PŮDNÍ REAKCI VYSVĚTLUJÍCÍ PROMĚNNÉ V CCA 0 4.0 4.5 měřené pH Measured soil pH 5.0 real pH měřené pH Ellenberg reaction EIH pro půdní reakci Průměrná EIH pro půdní reakci vysvětlí víc variability než měřené pH, i když obě proměnné jsou spolu těsně korelované 217 PRŮMĚRNÉ ELLENBERGOVY INDIKAČNÍ HODNOTY PRAVIDLA POUŽITÍ pokud jsou k dispozici relevantní měřené faktory prostředí, není třeba používat zároveň i průměrné EIH jen proto, že je tak snadné je vypočíst průkaznost jejich vztahu s jinými proměnnými, které jsou odvozeny ze stejných druhových dat, by měla být testována modifikovaným permutačním testem, který bere v potaz skutečnost, že testované proměnné na sobě nejsou nezávislé průměrné EIH by neměly být bez dalšího statistického ošetření srovnávány s analogickými měřenými faktory prostředí, protože se oproti nim mohou neoprávněně jevit lepšími, než ve skutečnosti jsou (například tím, že jsou lépe korelované nebo častěji a více průkazné) Zpracování dat v ekologii společenstev použití průměrných EIH v analýze spolu s jinými proměnnými vypočtenými z těchto dat může vést k závěrům, které jsou optimističtější, než by ve skutečnosti měly být David Zelený 219 PŘÍKLADY NA POUŽÍTÍ PRŮMĚRNÝCH EIH David Zelený Zpracování dat v ekologii společenstev Použití na floristická data z NP Podyjí – ekologické gradienty v krajině (Chytrý et al. 1999, Preslia) 220 David Zelený Zpracování dat v ekologii společenstev Ekologická kalibrace vegetačních jednotek v přehledu Vegetace ČR (Chytrý [ed.] 2007) 221 David Zelený Zpracování dat v ekologii společenstev INDEXY DIVERZITY ALFA, BETA A GAMA DIVERZITA Alfa diverzita druhová bohatost vzorku Beta diverzita (species turnover) změna v druhovém složení mezi vzorky Zpracování dat v ekologii společenstev David Zelený Gama diverzita celková druhová bohatost regionu Robert Harding Whittaker (1920-1980) © Cornel University Library Jurasinski et al. (2009) 223 David Zelený Zpracování dat v ekologii společenstev http://ordination.okstate.edu/ ALFA, BETA A GAMA DIVERZITA 224 MÍRY ALFA DIVERZITY DRUHOVÁ BOHATOST VS VYROVNANOST vyrovnanost (evenness, equitability) vyjadřuje relativní zastoupení jednotlivých druhů ve vzorku (nejvyšších hodnot dosahuje při rovnoměrném relativním zastoupením všech druhů) jednotlivé indexy alfa diverzity (např. Shannonův nebo Simpsonův) se liší právě tím, jestli kladou větší důraz na bohatost (Shannon) nebo vyrovnanost (Simpson) alfa a gama diverzita se někdy označují jako inventární diverzita (inventory diversity) – podstata je pro obě míry stejná (vyjádřené počty druhů, případně indexem diverzity), liší se ale škálou (alfa je diverzita na lokální škále, gama na regionální) beta diverzita je výrazně odlišný koncept – jiná filozofie, jiné jednotky Zpracování dat v ekologii společenstev druhová bohatost (species richness) vyjadřuje počet druhů ve vzorku David Zelený 225 n MÍRY ALFA DIVERZITY SHANNONŮV INDEX H′ = − pi × ln(pi ) i=1 David Zelený pi ... relativní abundance druhu i n ... počet druhů ve společenstvu označovaný také jako Shannon-Wiener index (nesprávně jako ShannonWiever) odvozen z informační teorie (entropie systému - s rostoucí entropií vzrůstá neuspořádanost systému, očekávatelná míra překvapení) vyjadřuje nejistotu, se kterou jsem schopen předpovědět, jakého druhu bude náhodně vybraný jedinec ze vzorku; nejistota klesá s klesajícím počtem druhů a s klesající vyrovnaností (více dominantních druhů) hodnoty v ekologických datech většinou v rozmezí 1,5 – 3,5 maximální velikost indexu pro počet druhů S nastane, pokud mají všechny druhy stejnou relativní frekvenci: Zpracování dat v ekologii společenstev H’max = ln (S) efektivní počet druhů (kolik druhů by se vyskytovalo ve vzorku s diverzitou H, pokud by se všechny druhy vyskytovaly se stejnou frekvencí): eH‘ vyrovnanost odvozená ze Shannonova indexu (Shannon’s evenness) J = H’ / H’max = H’ / ln (S) 226 n MÍRY ALFA DIVERZITY SIMPSONŮV INDEX D= pi2 𝑆𝐷 = 1 − 𝐷 i=1 vyjadřuje pravděpodobnost, že dva náhodně vybraní jedinci budou patřit ke stejnému druhu jeden z nejlepších (z hlediska interpretace) indexů diverzity se zvyšující se diverzitou hodnota indexu klesá – proto se častěji používá komplementární (1-D) nebo reciproká forma indexu (1/D) zdůrazňuje dominanci druhu (při počtu druhů > 10 záleží jeho velikost prakticky už jen na dominanci druhů) efektivní počet druhů: vyrovnanost odvozená ze Simpsona (Simpson’s evenness): E = (1/D) / S Zpracování dat v ekologii společenstev David Zelený pi ... relativní abundance druhu i n ... počet druhů ve společenstvu 1/(1-SD) = 1/D (efektivní počet druhů/reálný počet druhů) 227 PŘÍKLAD – EFEKTIVNÍ POČET DRUHŮ Simpson efektivní druhů index počet druhů 1122334455 5 0,81) 5,03) Spol. 2: 1111112345 5 0,62) 2,54) Zpracování dat v ekologii společenstev Spol. 1: David Zelený počet Výpočet: 1) 1 – ∑ p2 = 1 - 5*(2/10) 2 = 1 – 5*0,04 = 1 – 0,2 = 0,8 2) 1 – ∑ p2 = 1 – ((6/10)2 + 4*(1/10)2) = 1 – (0,36 + 0,04) = 0,6 3) 1/(1-SD) = 1/(1-0,8) = 5 4) 1/(1-SD) = 1/(1-0,6) = 2,5 228 MÍRY ALFA DIVERZITY ad hoc doporučení: nemá smysl počítat velké množství indexů alfa diverzity a všechny je používat – vhodnější je rozhodnout se hned na začátku, který z aspektů alfa diverzity (bohatost nebo vyrovnanost) mě zajímá, a podle toho vybrat index nejjednodušší volba je použítí druhové bohatosti (počtu druhů) Simpsonův index je intuitivně interpretovatelný, naopak interpretace Shannonova indexu je obtížná a je lépe ho nepoužívat (i když je populární) Zpracování dat v ekologii společenstev David Zelený kde spočítat: EstimateS (R. Colwell, http://viceroy.eeb.uconn.edu/estimates) BioDiversityPro (Neil McAleece, http://www.sams.ac.uk/research/software/research/software/bdpro.zip) 229 MÍRY BETA DIVERZITY David Zelený popisuje rozdílnost v druhovém složení mezi vzorky Zpracování dat v ekologii společenstev Dva základní typy beta diverzity: turnover (obrat druhů podél ekologického, prostorového nebo časového gradientu) 1. Kolik nových druhů přibude a kolik jich ubude, když se pohybuji podél gradientu? variation (variabilita v druhovém složení mezi vzorky, bez ohledu na směr nějakého gradientu) 2. Opakují se v různých vzorcích pořád ty samé druhy? Jak moc celkový počet druhů v regionu přesahuje průměrnou druhovou bohatost vzorku? 230 Anderson et al. (2011) MÍRY BETA DIVERZITY KLASICKÉ INDEXY Whittakerova beta diverzita (multiplikativní míra): Zpracování dat v ekologii společenstev klasické indexy neberou v potaz druhové složení, ale jen počty druhů na lokální (alfa) a regionální (gamma) úrovni David Zelený βw = (γ / α’) - 1 α’ ... průměrná druhová bohatost vzorků kolikrát bohatost regionu přesahuje průměrnou bohatost vzorku Additivní míra beta diverzity: βAdd = γ – α‘ průměrný počet druhů, které chybí v jednom náhodně vybraném vzorku/ploše výhodou je, že jednotkami jsou počty druhů Multiplikativní míra, která bere v potaz vyrovnanost: βShannon = Hγ / Hα místo počtu druhů používá Shannonův index diverzity vypočtený pro regionální a lokální druhovou bohatost 231 MÍRY BETA DIVERZITY MNOHOROZMĚRNÉ INDEXY používá indexy podobnosti (případně nepodobnosti) v druhovém složení mezi páry vzorků/ploch Zpracování dat v ekologii společenstev mnohorozměrné indexy pracují přímo s druhovým složením a hledají rozdíly v druhovém složení dvou a více vzorků/ploch David Zelený Bray-Curtis, Jaccard, Sorensen, Euclidovská vzdálenost atd. beta diverzita skupiny vzorků/ploch se spočte jako průměrná hodnota těchto podobností délka první osy DCA také vyjadřuje beta diverzitu (v jednotkách SD) 232 MÍRY BETA DIVERZITY MNOHOROZMĚRNÉ INDEXY David Zelený Rozdíly v interpretaci beta diverzity založené na Bray-Curtis indexu nepodobnosti a Euklidovské vzdálenosti Anderson et al. (2011) na příkladu rozdílu v druhovém složení korálových útesů (Indonésie) v letech 1981, 1983 a 1985 (zásah El Nino v roce 1982) NMDS ordinace Zpracování dat v ekologii společenstev 233 MÍRY BETA DIVERZITY MNOHOROZMĚRNÉ INDEXY Roleček et al. (2009) J. Veg. Sci. 234 Zpracování dat v ekologii společenstev Průměrná Jaccardova nebo Sorensenova nepodobnost mezi páry vzorkůindexy nezávislé na počtu vzorků David Zelený Whittakerova beta a Total inertia indexy závislé na počtu vzorků INDEXY FUNKČNÍ DIVERZITY druhová bohatost se často považuje za odhad funkční diverzity, ale nepřesný – dva různé druhy mohou ve společenstvu plnit stejnou funkci (mít stejnou kombinací funkčních typů) Rao index (Lepš et al. 2006 Preslia) Zpracování dat v ekologii společenstev funkční diverzita – zohledňuje diverzitu funkčních typů (functional traits), které se ve vzorku vyskytují David Zelený FD = ∑i ∑j dij pi pj dij ... nepodobnost mezi druhem i a j pi, pj ... relativní abundance druhu i a j zobecněná forma Simpsonova indexu diversity 235 AKUMULAČNÍ DRUHOVÁ KŘIVKA SPECIES ACCUMULATION CURVE zvláštním typem je species-area curve (ale jen v případě, že plocha narůstá v rámci určitého území, neplatí pro ostrovy) čte se zleva doprava může být extrapolována (zvýší intenzita průzkumu celkový počet nalezených druhů?) Zpracování dat v ekologii společenstev vynáší kumulativní počet druhů S v závislosti na intenzitě vzorkování n (počet jedinců, počet ploch, čas) David Zelený 236 RAREFAKČNÍ KŘIVKA RAREFACTION CURVE porovnání druhové bohatosti mezi společenstvy s různým počtem jedinců/vzorků čte se zprava doleva rozdíl mezi sample based a individual based rarefaction Zpracování dat v ekologii společenstev cílem je zjistit, jaká by byla druhová bohatost, pokud bychom v daném společenstvu nasbírali menší počet jedinců/vzorků (to rarefy – rozředit) David Zelený 237 Michalcová et al. (2011) Journal of Vegetation Science David Zelený Zpracování dat v ekologii společenstev 238 SOFTWARE (MIMO R, VE KTERÉM SPOČTETE VŠECHNO) indexy alfa diverzity (Shannon, Simpson atd.) a beta diverzity Biodiversity Pro (Neil McAleece, http://www.sams.ac.uk/research/software) EstimateS (Robert Colwell, http://viceroy.eeb.uconn.edu/estimates) PC-ORD 5 JUICE Zpracování dat v ekologii společenstev David Zelený species accumulation curve a rarefaction PC-ORD 5 EstimateS (Robert Colwell, http://viceroy.eeb.uconn.edu/estimates) 239 David Zelený Zpracování dat v ekologii společenstev TESTOVÁNÍ PRŮKAZNOSTI A POUŽÍVÁNÍ HODNOTY P ZÁKLADNÍ DEFINICE David Zelený Hodnota P (P value) Zpracování dat v ekologii společenstev pravděpodobnost, že bychom získali stejně velkou nebo větší hodnotu testové statistiky za předpokladu platnosti nulové hypotézy čím menší je hodnota P, tím silnější je argument ukazující na neplatnost nulové hypotézy ale pozor – vysoké hodnoty P nejsou důkazem, že nulová hypotéza je pravdivá! (např. pokud nemůžete najít statisticky signifikantní rozdíl mezi dvěma druhy, neznamená to, že můžete tvrdit, že oba druhy jsou stejné) V případe porovnání dvou výběrů (např. t-test) se hodnota P snižuje pokud se skutečný rozdíl mezi průměry výběrů zvýší snižuje se zvyšujícím se počtem opakování zvyšuje s variabilitou v datech 241 P HODNOTA – DŮKAZ, KTERÝ EXISTUJE PROTI PLATNOSTI NULOVÉ HYPOTÉZY David Zelený Zpracování dat v ekologii společenstev P hodnota náznak důkazu, ale přesvědčivý nepřesvědčivý středně silný ne máme důkaz proti platnosti nulové hypotézy? Ramsey & Schaffer (2002) 242 DOPORUČENÍ Neklást důraz na binární rozhodnutí (signifikantní vs nesignifikantní) Spolu s hodnotou P je třeba uvádět i tzv. velikost účinku (effect size), (např. R2 u regrese, Pearsonův korelační koeficient r u korelace) Vhodné je testovaný vztah vizualizovat (boxploty pro porovnání výběrů, bodový diagram závislosti dvou proměnných aj.), a pokud není vztah z obrázku patrný, věc důkladně prošetřit (není třeba průkaznost způsobena výskytem jednoho odlehlého – a vlivného – pozorování?) Obecně platí, že k výsledkům by měly být dostupná i primární data (v elektronické podobě v příloze, případně na vyžádání), a detailní postup, jak byla analyzována (např. R skript). Sdílení dat a detailní popis metodiky je základem transparentního výzkumu a umožňuje zopakování analýz a případné odhalení chyb. Zpracování dat v ekologii společenstev P hodnoty by měly být posuzovány jako důvěryhodnost důkazu, který máme proti platnosti nulové hypotézy (Dá se rozdílu věřit? Je důkaz důvěryhodný?) David Zelený 243 David Zelený EKOLOGICKÝCH EXPERIMENTŮ “To call in the statistician after the experiment is done may be no more than asking him to perform a post mortem examination: he may be able to say what the experiment died of.” Sir Ronald Fisher, Indian Statistical Congress, Sankhya 1939 Zpracování dat v ekologii společenstev DESIGN ZÁKLADNÍ OTÁZKA: CO CHCI EXPERIMENTEM ZJISTIT? David Zelený Jaká je variabilita proměnné Y v čase nebo prostoru? Zpracování dat v ekologii společenstev pattern description nejčastější otázka v ekologických observačních studiích Má faktor X vliv na proměnnou Y? hypothesis testing, otázka pro manipulativní experiment může platit i pro některé přírodní experimenty, ale výsledky těchto testů jsou podstatně slabší (nemáme kontrolu nad vlivem ostatních faktorů, které mohou výsledky ovlivnit) Chová se proměnná Y tak, jak předpovídá hypotéza H? klasická konfrontace mezi teorií a reálnými daty platí pro data získaná jak manipulativním tak přírodním experimentem ne vždy je snadné najít správnou hypotézu Jaký model nejlépe vystihuje vztah mezi faktorem X a proměnnou Y? experimentem sbíráme podklady pro matematické modelování 245 MANIPULATIVNÍ VS PŘÍRODNÍ EXPERIMENTY Manipulativní experimenty uměle manipulujeme vysvětlující proměnnou (X) a sledujeme reakci vysvětlované proměnné (Y) umožňuje přímé testování hypotéz známe směr vztahu mezi příčinou a důsledkem - kauzalita Zpracování dat v ekologii společenstev David Zelený Přírodní experimenty (pozorování, observační studie) vysvětlující proměnnou „manipuluje“ sama příroda slouží spíše ke generování než testování hypotéz neznáme směr vztahu mezi příčinou a důsledkem - korelace 246 MANIPULATIVNÍ VS PŘÍRODNÍ EXPERIMENTY SROVNÁNÍ TESTOVANÝCH HYPOTÉZ David Zelený Příklad: na ostrovech v Karibiku sledujeme vztah mezi počtem ještěrek na určité ploše a počtem pavouků (Gotelli & Ellison 2004) Zpracování dat v ekologii společenstev Manipulativní experiment Provedení: Nulová hypotéza: v jednotlivých plochách (klecích) je uměle ovlivněn počet ještěrek a sledováno množství pavouků počet ještěrek nemá vliv na počet pavouků v klecích Alternativní hypotéza: se vzrůstající hustotou ještěrek klesá počet pavouků (ještěrky žerou pavouky) 247 MANIPULATIVNÍ VS PŘÍRODNÍ EXPERIMENTY SROVNÁNÍ TESTOVANÝCH HYPOTÉZ David Zelený Přírodní experiment (pozorování, observační studie) Provedení: na vybraných plochách je sledován počet ještěrek a počet pavouků Zpracování dat v ekologii společenstev Možné hypotézy: 1. 2. 3. 4. počet ještěrek (negativně) ovlivňuje počet pavouků (ještěrky žerou pavouky) počet pavouků má vliv na počet ještěrek (draví pavouci napadají mláďata ještěrek) počet ještěrek i pavouků je ovlivňován neměřeným faktorem prostředí (třeba vlhkostí) některý faktor prostředí ovlivňuje sílu vztahu mezi ještěrkami a pavouky (třeba zase vlhkost) 248 MANIPULATIVNÍ EXPERIMENT „PRESS“ VS „PULSE“ EXPERIMENT David Zelený „Press“ experiment (experiment „pod stálým tlakem“) zásah je proveden na začátku experimentu a pak znovu v pravidelných intervalech měří resistenci systému na experimentální zásah – jak je systém (společenstvo) schopné odolávat, případně se přizpůsobit změnám v podmínkách prostředí Zpracování dat v ekologii společenstev závisle proměnná čas „Pulse“ experiment (pulzní experiment, „jednou a dost“) zásah je proveden jen jednou, obvykle na začátku experimentu měří resilienci systému – jak pružně je systém (společenstvo) schopné reagovat na experimentální zásah závisle proměnná 249 čas PŘÍRODNÍ EXPERIMENT (POZOROVÁNÍ) „SNAPSHOT“ VS „TRAJECTORY“ EXPERIMENT „Snapshot“ experiment (momentka) opakuje se v prostoru, ale ne v čase sběr vzorků provedu na několika (mnoha) lokalitách v relativně krátkém čase (týden, sezóna, dva roky sběru dat pro diplomku ...) představuje většinu přírodních experimentů v ekologii zahrnuje i sukcesní studie, kdy sledujeme zároveň různá sukcesní stadia Zpracování dat v ekologii společenstev David Zelený „Trajectory“ experiment (sledujeme trajektorii procesu v čase) opakuje se v čase (a případně i v prostoru) sběr vzorků se na daných (většinou pevně vymezených plochách) opakuje několikrát za sebou sukcesní studie prováděné několik let, trvalé plochy v lesních porostech opakovaně měřené jednou za x let 250 MANIPULATIVNÍ EXPERIMENT ZÁKLADNÍ TYPY ROZMÍSTĚNÍ PLOCH kompletně znáhodněný design nebere v úvahu heterogenitu prostředí ne vždy je nejvhodnější Zpracování dat v ekologii společenstev David Zelený znáhodněné bloky vlastní bloky jsou vnitřně homogenní (pokud možno) počet bloků = počet opakování bloky jsou umístěné podle gradientu prostředí v každém bloku je právě jedna replikace každého zásahu 251 gradient prostředí MANIPULATIVNÍ EXPERIMENT ZÁKLADNÍ TYPY ROZMÍSTĚNÍ PLOCH David Zelený latinský čtverec gradient 1 252 Zpracování dat v ekologii společenstev gradient 2 předpokládá přítomnost dvou gradientů v prostředí každý sloupec a každý řádek obsahuje právě jednu variantu zásahu možno použít i několik latinských čtverců MANIPULATIVNÍ EXPERIMENT NEJČASTĚJŠÍ CHYBY David Zelený pseudoreplikace Zpracování dat v ekologii společenstev testovat lze jen rozdíly v průměrech jednotlivých bloků plochy se stejným zásahem jsou umístěny blízko sebe, a mají proto větší pravděpodobnost, že si budou podobné i bez vlivu vlastního zásahu gradient prostředí neúplně znáhodněný design v podstatě pseudoreplikace, jen méně zřejmá gradient prostředí 253 MANIPULATIVNÍ EXPERIMENT NEJČASTĚJŠÍ CHYBY David Zelený správně gradient prostředí Zpracování dat v ekologii společenstev gradient prostředí design se znáhodněnými bloky – špatná orientace bloků gradient prostředí špatně špatně 254 MANIPULATIVNÍ EXPERIMENT S VÍCE NEŽ JEDNÍM TYPEM ZÁSAHU David Zelený faktoriální design ano Zpracování dat v ekologii společenstev každá hladina prvního faktoru je kombinovaná s každou hladinou druhého faktoru (případně třetího atd.) například kombinace koseno vs nekoseno hnojeno vs nehnojeno jednotlivé kombinace mohou být rozmístěny v prostoru např. v rámci latinského čtverce ne koseno 255 hnojeno MANIPULATIVNÍ EXPERIMENT S VÍCE NEŽ JEDNÍM TYPEM ZÁSAHU David Zelený split-plot design N C C N P P P C N C N C P N N P Zpracování dat v ekologii společenstev faktory jsou strukturovány hierarchicky (nested) například plochy hnojené různými hnojivy (C, N, P) v rámci bloků umístěných na vápenci (modrá) a žule (červená barva) P C 256 MANIPULATIVNÍ EXPERIMENTY – PŘÍPADOVÉ STUDIE plán zásahů letecký pohled Zpracování dat v ekologii společenstev Silvertown et al. (2006) J. Ecol. David Zelený ROTHAMSTED (ENGLAND) – PARK GRASSLAND EXPERIMENT (ZALOŽEN 1843) 257 MANIPULATIVNÍ EXPERIMENTY – PŘÍPADOVÉ STUDIE ROTHAMSTED (ENGLAND) – PARK GRASSLAND EXP. David Zelený Zpracování dat v ekologii společenstev 258 Třídění bylinné biomasy do druhů (kolem roku 1930) (http://www.rothamsted.ac.uk) MANIPULATIVNÍ EXPERIMENTY – PŘÍPADOVÉ STUDIE KOMPETICE O SVĚTLO V EXPERIMENTÁLNÍM PROSTŘEDÍ David Zelený Zpracování dat v ekologii společenstev Při vyšším přísunu živin rostou rostliny rychleji a začnou si konkurovat o světlo – tak proč jim trochu nepřisvítit? 259 Hautier et al. (2009) Science 324: 636-638 MANIPULATIVNÍ EXPERIMENTY – PŘÍPADOVÉ STUDIE KOMPETICE O SVĚTLO V EXPERIMENTÁLNÍM PROSTŘEDÍ David Zelený Zpracování dat v ekologii společenstev 260 Hautier et al. (2009) Science 324: 636-638 MANIPULATIVNÍ EXPERIMENTY – PŘÍPADOVÉ STUDIE STANOVENÍ POTENCIÁLNÍ STANOVIŠTNÍ PRODUKTIVITY V David Zelený DOUBRAVÁCH PĚSTOVÁNÍM ŘEDKVIČEK VE SKLENÍKU Zpracování dat v ekologii společenstev 261 Veselá et. al (2008): Bioassay experiment for assessment of site productivity in oak forests. - 17th International Workshop European Vegetation Survey, Brno, Czech Republic, 1-4. 5. 2008. MANIPULATIVNÍ EXPERIMENTY – PŘÍPADOVÉ STUDIE MEZOKOSMOVÝ EXPERIMENT S HMYZEM A PREDÁTORY David Zelený Zpracování dat v ekologii společenstev na začátku experimentu ... Kádě, které samy o sobě nejsou obsazeny predátory (larvy vážek a pstruzi), ale jsou v blízkosti kádí s predátory, jsou pro létající hmyz kladoucí vajíčka stejně neatraktivní jako vlastní kádě s predátory. http://nwdragonflier.blogspot.cz http://www.jjphoto.dk Wessner et al. (2012) Ecology 93: 1674-1682 262 MANIPULATIVNÍ EXPERIMENTY – PŘÍPADOVÉ STUDIE VLIV HERBIVORNÍCH RYB NA DRUHOVÉ SLOŽENÍ David Zelený KORÁLOVÝCH ÚTESŮ na začátku experimentu ... řídká klec – zabrání jen velkým rybám ... a po čtyřech měsících pod klecí Atol Agatti (Lakedivy, Indie) 263 Autor: Nicole Černohorská (v rámci disertační práce) Zpracování dat v ekologii společenstev hustá klec – zabrání všem rybám detailní pohled na korálový útes s nárostem řas (autor: Nicole Černohorská) David Zelený Zpracování dat v ekologii společenstev 264 PŘÍRODNÍ EXPERIMENT (OBSERVAČNÍ STUDIE) ROZMÍSTĚNÍ VZORKOVACÍCH PLOCH David Zelený Preferenční Zpracování dat v ekologii společenstev 265 PŘÍRODNÍ EXPERIMENT (OBSERVAČNÍ STUDIE) ROZMÍSTĚNÍ VZORKOVACÍCH PLOCH David Zelený Systematické rozmístění v síti (lattice) Zpracování dat v ekologii společenstev 266 PŘÍRODNÍ EXPERIMENT (OBSERVAČNÍ STUDIE) ROZMÍSTĚNÍ VZORKOVACÍCH PLOCH David Zelený Systematické rozmístění v síti (grid) Zpracování dat v ekologii společenstev 267 PŘÍRODNÍ EXPERIMENT (OBSERVAČNÍ STUDIE) ROZMÍSTĚNÍ VZORKOVACÍCH PLOCH David Zelený Systematické rozmístění na transektu Zpracování dat v ekologii společenstev 268 PŘÍRODNÍ EXPERIMENT (OBSERVAČNÍ STUDIE) ROZMÍSTĚNÍ VZORKOVACÍCH PLOCH David Zelený Náhodné rozmístění Zpracování dat v ekologii společenstev 269 PŘÍRODNÍ EXPERIMENT (OBSERVAČNÍ STUDIE) ROZMÍSTĚNÍ VZORKOVACÍCH PLOCH Preferenční rozmístění statistické hledisko: snímky nejsou náhodným výběrem, což limituje jejich použití při statistických analýzách (Lajer 2007, Folia Geobotanica) hledisko vegetačního ekologa: popisují maximální variabilitu vegetace praktické důsledky: snímky bývají druhově bohatší, obsahují větší počet diagnostických nebo vzácných druhů Zpracování dat v ekologii společenstev David Zelený Náhodné (a systematické) rozmístění statistické hledisko: snímky jsou náhodným výběrem v reálném prostoru (ne ale v ekologickém hyperprostoru) hledisko veg. ekologa: nezachytí celou variabilitu vegetace - chybí maloplošné a vzácné vegetační typy, převládají velkoplošné a běžné typy, zahrnují řadu špatně klasifikovatelných vegetačních přechodů praktické důsledky: snímky odrážejí reálnou strukturu a bohatost vegetace v krajině, ale metoda je neúměrně pracná 270 PŘÍRODNÍ EXPERIMENT (OBSERVAČNÍ STUDIE) ROZMÍSTĚNÍ VZORKOVACÍCH PLOCH David Zelený Stratifikované náhodné rozmístění Zpracování dat v ekologii společenstev 271 STRATIFIKACE KRAJINY V GIS Teplota David Zelený Srážky Zpracování dat v ekologii společenstev Půdní typy Stratifikované jednotky 272 Austin et al. 2000 PROSTOROVÁ AUTOKORELACE David Zelený bližší plochy jsou si podobnější Zpracování dat v ekologii společenstev 273 PROSTOROVÁ AUTOKORELACE běžná vlastnost prakticky všech reálných ekologických dat – příroda se nechová podle zákonů statistiky může být pozitivní (bližší vzorky jsou si podobnější než by odpovídalo jejich náhodnému výběru) nebo negativní (sousední vzorky jsou si méně podobné než kdyby byly vybrány náhodou, např. v důsledku tzv. Janzen-Connellovy hypotézy) Zpracování dat v ekologii společenstev vlastnosti určitého pozorování (vzorku) mohou být do určité míry odvozeny z pozorování v jeho okolí – jednotlivá pozorování na sobě nejsou nezávislá David Zelený „Vše souvisí se vším, ale bližší věci spolu souvisejí více než ty vzdálené“ Waldo Tobler (1969), První zákon geografie 274 PROSTOROVÁ AUTOKORELACE David Zelený Co způsobuje prostorovou autokorelaci biologických dat? omezené možnosti disperze, genetický tok nebo klonální růst – sousedé jsou si podobnější organismy jsou omezeny ekologickými faktory (například vlhkost nebo teplota), které jsou samy o sobě prostorově autokorelovány Zpracování dat v ekologii společenstev Jak se prostorová autokorelace projevuje při analýze dat? pozitivní PA zvyšuje pravděpodobnost chyby prvního druhy (Type I error), totiž že zamítneme nulovou hypotézu, která platí (statistické testy vycházejí průkazněji než by měly) negativní PA způsobuje opačný efekt problém je v počtu stupňů volnosti (degrees of freedom): pokud si stupně volnosti představíme jako množství informace, kterou každý nový vzorek přináší, pak každý nový nezávislý vzorek přináší jeden stupeň volnosti, ale prostorově autokorelovaný vzorek přináší méně 275 PROSTOROVÁ AUTOKORELACE David Zelený Příklad: Vliv nadmořské výšky na vegetaci, studovaný pomocí transektů vedených podél nadmořské výšky prostorově autokorelované transekty (paralelně vedle sebe na jedné hoře) × 276 Zpracování dat v ekologii společenstev prostorově neautokorelované transekty (každý transekt na různé hoře) PROBLÉM PROSTOROVÉ ŠKÁLY (SCALE OF THE STUDY) rozsah (extent) – velikost studovaného území, zachycení různých ekologických faktorů interval – vzdálenost mezi vzorkovanými plochami Zpracování dat v ekologii společenstev zrno (grain size) – velikost nejmenší studované jednotky, zpravidla vzorkované plochy, dána vlastností a velikostí studovaných organismů David Zelený Platí pravidlo, že studie malého rozsahu jsou hůře zobecnitelné 277 Legendre & Legendre (1998) TVAR PLOCHY David Zelený obdélníková kruhová čtverec obdélník kruh celková plocha 100 m2 100 m2 100 m2 rozměr tvaru 10 × 10 m 20 × 5 m poloměr ≈ 5,64 m obvod 40 m 50 m Zpracování dat v ekologii společenstev čtvercová ~ 35 m 278 VLIV TVARU A ORIENTACE PLOCHY NA ZAZNAMENANOU DRUHOVOU BOHATOST David Zelený obdélníkové plochy mohou mít vyšší druhovou bohatost než čtvercové plochy (o stejné ploše) gradient prostředí Zpracování dat v ekologii společenstev 280 Stohlgren et al. (1995) Vegetatio 117:113-121; Condit et al. (1996) J.Ecol. 84: 549-562; Keeley & Fotheringham (2005) J.Veg.Sci. 16: 249-256. VELIKOST PLOCHY STUDIUM VEGETACE NA VÍCE MĚŘÍTCÍCH SOUČASNĚ David Zelený Zpracování dat v ekologii společenstev 281 VELIKOST PLOCHY STUDIUM VEGETACE NA VÍCE MĚŘÍTCÍCH SOUČASNĚ David Zelený Vztah mezi velikostí snímku a počtem druhů ve snímku – bělokarpatské louky ve srovnání s jinými typy travinné vegetace Zpracování dat v ekologii společenstev Jongepierová [ed.](2008): Louky Bílých Karpat. 282 VELIKOST PLOCH SPOLEČNÁ ORDINACE PLOCH O RŮZNÉ VELIKOSTI David Zelený Zpracování dat v ekologii společenstev Otýpková & Chytrý (2006), J.Veg.Sci. 17: 465-472 283
Podobné dokumenty
Konfirmační analýza dat
probíhat bude v počítačové učebně blokově v dohodnutých termínech a zaměřené bude na analýzu dat a jejich vizualizaci v
programu CANOCO 5
tři čtyřhodinové bloky
v případě zájmu o program R je možné...