Návod ke cvičení v prostředí Idrisi Selva
Transkript
Vysoká škola báňská – Technická univerzita Ostrava Hornicko-geologická fakulta DÁLKOVÝ PRŮZKUM ZEMĚ (Analýza hlavních komponent) Tomáš Peňáz Ostrava, 2014 Vysoká škola báňská – Technická univerzita Ostrava Hornicko-geologická fakulta DÁLKOVÝ PRŮZKUM ZEMĚ (Analýza hlavních komponent) Tomáš Peňáz Ostrava, 2014 Obsah 1 Úvod .................................................................................................................................... 2 2 Cíle cvičení ......................................................................................................................... 2 3 Data a programové vybavení .............................................................................................. 2 4 Časová náročnost ................................................................................................................ 3 5 Geografické vymezení území.............................................................................................. 3 6 Postup zpracování ............................................................................................................... 4 7 Úkoly pro samostatnou práci .............................................................................................. 6 1 Úvod Při práci digitálními obrazovými záznamy získanými z družice je celkem obvyklým jevem vysoký stupeň korelace mezi různými pásmy. Takové korelace indikuje, že pokud je odrazivost určité oblasti v jednom pásmu vysoká, bude vysoká i v jiném pásmu, v ideálním případě (vysoká korelace) nesou tato pásma identickou informaci. Je tedy možno konstatovat, že multispektrální obraz, snímaný například v devíti pásmech (digitální obrazové záznamy Landsat 7 ETM+) nese mnohem méně informací, než činí devítinásobek informační hodnoty jednoho pásma. Vyvstává tedy otázka, zdali by pro charakteristiku odrazivosti zemského povrchu nebylo možno využít méně vlnových pásem. Abychom mohli na tuto otázku odpovědět, podívejme se na charakteristiky digitálních obrazových záznamů Landsat 7 ETM+, pomocí analýzy hlavních komponent (Principal Components Analysis – PCA). 2 Cíle cvičení Absolvováním cvičení budou dosaženy následující cíle: ● seznámíte se s praktickou stránkou využití techniky nazývané analýza hlavních komponent, ● naučíte se základní kroky, nutné ke zpracování multispektrálních obrazových dat touto metodou, ● získáte základní zkušenosti při volbě parametrů, ovlivňujících výpočet syntetických pásem, tzv. hlavních komponent, ● vyzkoušíte si transformaci multispektrálních dat na syntetický vícepásmový obraz. 3 Data a programové vybavení Analýzu hlavních komponent si vyzkoušíte v prostředí programu IDRISI Selva, který je vynikajícím nástrojem pro výuku zpracování obrazových dat v dálkovém průzkumu Země. Pro zpracování využijeme digitální obrazový záznam L71189025_02520030421, získaný systémem Landsat 7, jehož skener ETM+ vytváří obrazová data v 9 pásmech. Tato obrazová data z 21. 4 2003, pokrývají území o rozměrech 191x185 km. Předzpracování dat zahrnuje pouze systémové korekce. Data jsou doplněna o georeferenční údaje, které umožňují tzv. předběžnou geometrickou transformaci prováděnou při zobrazování ve vhodném programovém prostředí. Analýzou hlavních komponent budeme zpracovávat data pokrývající oblast o rozměrech 11,6 x 9 km, s rozlohou přesahující 100 km2. Cvičná data pro toto cvičení jsou připravena jako výřez z původní scény 189-25. Pro klasifikaci budeme nadále používat pouze pásma 1,2,3,4,5 a 7, která jsou vybrána ve výřezu. 4 Časová náročnost Cvičení by mělo být zpracováno v průběhu 45 minut. Aktivity cvičení jsou připraveny tak, abyste je mohli provádět samostatně a to jak pod dohledem pedagoga, tak v jeho nepřítomnosti. Části, které nestihnete provést ve vymezeném časovém limitu v počítačové laboratoři, můžete dokončit samostatně. Předpokládá se, že zpracování samostatné části cvičení bude vyžadovat 45 minut. 5 Geografické vymezení území Oblast, kterou se pokusíme klasifikovat na základě dat ze systému Landsat 7 ETM+, se nachází v Moravskoslezském kraji. Ve výřezu se nacházejí obce Dolní Benešov, Háj ve Slezsku, Bolatice, Jilešovice, Kozmice a další. V území je zastoupena především zemědělská krajina a lesní plochy (obrázek 1). Významnou součást krajiny tvoří trvale zastavěné území sídel, letiště a průmyslových objektů a dále též povrchové vodní objekty (rybníky, zatopené štěrkovny a vodní toky). Obrázek 1 Ukázka zájmového území na syntéze v pravých barvách 6 Postup zpracování Analýza hlavních komponent je příbuzná faktorové analýze (Factor Analysis). Může být využita k transformaci multispektrálního obrazového záznamu (v našem případě se 6 pásmy v 6 různých intervalech vlnových délek) do nového multispektrálního obrazového záznamu se syntetickými pásmy, označovaných jako hlavní komponenty - components) tak, že informace v nových pásmech spolu nekorelují a pásma jsou seřazena podle množství rozptylu, který vysvětlují. Komponenty jsou vytvořeny statistickou abstrakcí rozptylu obsaženého v originální sadě pásem. Protože každá komponenta vytvořená touto transformací není korelovaná s jinými, každá obsahuje nové informace. Protože komponenty jsou seřazeny podle množství informace, které obsahují, první z celé sady ponese maximální množství informace původní sady, zatímco ty další již popisují pouze menší variance (odchylky). Jednou možností využití této analýzy je komprimace dat - je možno uchovat pouze několik prvních komponent, které nesou největší množství informace, méně důležité komponenty není nutno uchovávat. S růstem diskové kapacity a rychlosti procesoru je komprimace dat méně významným důvodem. Většina klasifikátorů dovoluje vstup mnoha pásem a je běžné použít všechna pásma ke klasifikaci bez ohledu na to, zda jsou či nejsou korelovaná. Avšak jedna z neřízených klasifikačních technik, kterou vyzkoušíme v pozdějším cvičení je omezena na vstup 3 pásem. PCA může být použita pro identifikaci 3 pásem, které nesou nejvíce původní informace z celé sady. Navíc pomocí PCA se naučíme více o charakteristice dat Landsat 7 ETM+ nesoucích multispektrální obrazovou informaci. ● Zobrazte si vyrez_Idrisi4.rst (blízké infračervené pásmo) s paletou Grey256 a Equal Interval autoscaling. Stejným způsobem si prohlédněte všechna ostatní pásma. Kontrolní otázka 1) Vypadá nějaké pásmo podobně jako pásmo 4 (vyrez_Idrisi4.rst)? Které? ● Spusťte PCA z menu Analysis/Image Processing/Transformation. Vložte informace o tom, že si přejete přímý výpočet kovariance, že vkládáte 6 pásem multispektrálního obrazu. Klikněte do seznamu Image Band Name, klikněte na tlačítko výběru ze seznamu a vyberte vyrez_Idrisi1.rst. Totéž opakujte pro každé ze sedmi pásem. Zadejte, že si přejete extrahovat 6 nových komponent. Vložte vyrez_Idrisi jako prefix nově vytvořených výstupních souborů. Specifikujte, že si přejete použít nestandardizované proměnné. ● Analýza bude pokračovat výpočtem transformačních rovnic a výsledkem bude 6 nových komponent s názvy vyrez_IdrisiCMP1 až vyrez_IdrisiCMP6 Jakmile modul PCA dokončí výpočty, výsledek se objeví na monitoru v podobě sumární tabulky. Pokud si přejete tabulku vytisknout, vyberte ikonu tiskárny v jejím pravém rohu. Kontrolní otázka 2) Prohlédněte si korelační matici. Nalézáte nějakou podobnost? Která pásma korelují nejvíce s pásmem 1? Koreluje nějaké pásmo s pásmem 4? Jak se odpovědi liší od odpovědi na otázku č. 1? ● Nyní si prohlédněte sumární tabulku komponent, ve které jsou uvedeny vlastní hodnoty (eigenvalues) a vlastní vektory (eigenvectors) pro jednotlivé komponenty. Vlastní hodnoty (vlastní hodnoty matice) popisují množství rozptylu pro každou komponentu a vlastní vektory jsou transformační rovnice. Jednotky těchto veličin jsou procenta vysvětleného rozptylu (% var). Kontrolní otázka 3) Jaké množství rozptylu je popsáno zvlášť komponentami 1, 2 a 3? Jaké množství rozptylu je popsáno celkem u komponent 1a 2 (sečtěte)? Jaké množství rozptylu je popsáno celkem u komponent 1, 2 a 3? 4) jaké množství informace si udržíte v případě archivace pouze komponent 1, 2 a 3? Jaké je to množství originálních dat (fyzický objem dat)? Jakého množství informace byste se zbavili? Jakého množství původních dat byste se zbavili? ● Nyní se podívejte na tabulku saturací (loadings). Tato tabulka udává stupeň korelace mezi novými komponentami (sloupce) a původními vlnovými pásmy (řádky). Kontrolní otázka 5) Které pásmo má nejvyšší stupeň korelace s komponentou 1? Je tato korelace vysoká? 6) Které pásmo má nejvyšší stupeň korelace s komponentou 2? Pokud jste si tabulku nevytiskli, toto okno nezavírejte (pouze ho minimalizujte), protože zde obsažené informace budeme později potřebovat. ● Znázorněte komponentu 1 (vyrez_IdrisiCMP1) s Equal interval autoscaling a s paletou Grey256. Postupně dále zobrazte se stejnými parametry obrázky vyrez_IdrisiCMP4, vyrez_IdrisiCMP2 a vyrez_IdrisiCMP3. Uspořádejte tyto obrázky tak, abyste je viděli na monitoru vedle sebe všechny současně. Kontrolní otázka 7) Jak se komponenta 1 podobá obrazu v infračerveném pásmu? Jak se podobá komponenta 2 obrazu v červeném pásmu? ● Zobrazte nyní komponentu 6 (vyrez_IdrisiCMP6) s funkcí autoscale. Kontrolní otázka 8) Jak tato komponenta koreluje s původními sedmi vlnovými pásmy (viz tabulka saturací nebo graf saturací (loadings chart))? Co si myslíte, že tato komponenta obsahuje? Kolik informace ztratíte, nebudete-li již tuto komponentu používat (smažete-li ji)? Vztahy, které jsme mohli pozorovat při tomto cvičení, budou rozdílné v jiném typu krajiny, avšak nejsou příliš neobvyklé. Pokud si musíte vybrat pouze jedno pásmo, ve kterém budete pracovat, tak často blízké infračervené pásmo (ETM+ pásmo 4) nese největší množství informace. Druhým nejdůležitějším bývá pásmo viditelných červených vlnových délek. Dále již se informační hodnota liší, avšak je možno říci, že kandidátem na 3. místo může být pásmo viditelných zelených vlnových délek (ETM+ pásmo 2) nebo pásmo středních infračervených vlnových délek (ETM+ pásmo 5). Vrátíme-li se k naší původní otázce, je možno říci, že tři pásma mohou nést enormní množství informace. Dále vidíme, že vybraná pásma používaná ke klasické kompozici v nepravých barvách (zelená, červená, infračervená) nesou většinu informací z celé datové sady. Pro potřeby neřízené klasifikace, o které budeme hovořit v následujícím cvičení, použijeme pouze informace ze tří vlnových pásem. Nyní můžete vymazat šest hlavních komponent (vyrez_IdrisiCMP1-6), které již dále nebudeme potřebovat. 7 Úkoly pro samostatnou práci ● Prostudujte elektronickou nápovědu a další zdroje informací, které jsou k dispozici pro ArcGIS. Najděte modul pro zpracování multispektrálních obrazových dat metodou analýzy hlavních komponent. Zjistěte, kolik vstupních pásem současně umožňuje tento modul zpracovat. Je možno touto metodou v ArcGIS zpracovat hyperspektrální data, zahrnující desítky až stovky obrazových pásem? ● Metodou analýzy hlavních komponent proveďte v prostředí ArcGIS zpracování digitálního obrazového záznamu L71189025_02520030421, který jste získali v předchozím cvičení nazvaném Digitální obrazový záznam, jednoduché techniky zpracování. Autor Název Vydavatel Rozsah Rok Copyright Zdroj financování Ing. Tomáš Peňáz, Ph.D. Dálkový průzkum Země VŠB-TU Ostrava 9 stran 2014 © Tomáš Peňáz, 2014 Financováno z projektu CZ.1.07/2.2.00/28.0308 Inovace bakalářských a magisterských studijních oborů na Hornicko-geologické fakultě VŠB-TUO, spolufinancovaného Evropským sociálním fondem a státním rozpočtem České republiky
Podobné dokumenty
Dělitel a násobek
48 je dělitelné 6
Číslo 38 je dělitelné 3
Číslo 99 je dělitelné 7
Číslo 78 je dělitelné 6
Číslo 180 je dělitelné 9
Číslo
Návod pro cvičení Idrisi Andes
Jinou cestou k ocenění popisných souborů je jejich vykreslení na dvoupásmovém rozptylogramu
(scatterplot nebo scattergram). Rozptylogram ukazuje rozmístění všech pixelů ve dvou pásmech
v grafu, kd...
Kamerový systém PTZ řady AutoDome® 200
inteligentních, výměnných modulů, které umožňují rychlou
a finančně úspornou aktualizaci funkcí kamer. Vzhledem
k použití společných komponentů je možné nejprve
nainstalovat základní kamerový systé...
Program LabTutor Firmy ADI
přehrávání, analýzu a manipulaci s nimi. Technologie je odvozena do vybavení jako je Ludwigův
bubínkový kymograf (Marriottův bubínek) zaznamenávající data na otáčející se válec. Ten byl později
nah...
Česká pravidla ke hře Scrabble Original
vyznačené bodové hodnoty, které můžete použít místo
jakéhokoliv písmene. Jakmile tento kámen použijete,
není možné jeho význam během hry měnit.
PŘÍPRAVA
Nasypte všechny hrací kameny do plátěného sá...
Návod pro cvičení Bilko
V tomto cvičení si ukážeme posloupnost nejdůležitějších kroků řízené spektrální klasifikace,
které se provádějí v rámci trénovací a klasifikační etapy. Vyzkoušíme si řízenou klasifikaci digitálního...
Nedbalost, či neznalost
Statistický problém. Václav Klaus tvrdí, že přehlížím nemalý statistický problém, protože se
změnily statistické systémy, struktura ekonomik a tak dále. Nepřehlížím. Přesně touto statistickou
probl...
Analýza Krušnohorské lyžařské magistrály na území Karlovarského
techniku nebo pro bruslení. Odpovídá to také změnám ve vybavení běžkařů. Současné lyže, vázání i boty jsou mimo kvalitní stopy jen
omezeně použitelné.
Výraz lyžařská magistrála nebo také Krušnohors...