Modelování hydrogramů průtokových vln v říčním systému s využitím
Transkript
Modelování hydrogramů průtokových vln v říčním systému s využitím neuronových sítí 1.1. Úvod Ochrana lidských životů před přírodními katastrofami, jako jsou povodně, hurikány, požáry, sopečná činnost a mnoho dalších je jednou ze základních povinností lidské společnosti. V důsledku globálního oteplování dochází zejména v posledních dvaceti letech k významnějšímu nárůstu výkyvů počasí, zejména teplotních výkyvů, intenzity atmosférických poruch (hurikány, tornáda, sucho) a četnosti výskytu povodňových událostí, které jsou pouze důsledkem sílící srážkové činnosti doprovázející tyto jevy. V České republice po katastrofální povodni v roce 1997 a 2002 vzrostl zájem obyvatelstva o řešení otázky protipovodňové ochrany v postižených oblastech. V důsledku povodňových událostí v uplynulých letech vzrostly obavy obyvatelstva před případnými dalšími povodňovými událostmi. Kombinace uplynulých povodňových událostí a vyšší informovanosti obyvatelstva ze strany médií o případné hrozící povodňové či jiné katastrofě může mít pozitivní vliv na snížení ztrát lidských životů v případě výskytu další přírodní katastrofy. Hlavním zdrojem informací o výskytu meteorologických a hydrologických situací je v České republice hlásná a předpovědní služba Českého hydrometeorologického ústavu (ČHMÚ). Hlásná a předpovědní služba ČHMÚ sestává z tzv. meteoprognózy a hydroprognózy. Hlavním úkolem meteoprognózy je vydávání předpovědí počasí a varovných zpráv o výskytu nebezpečných meteorologických situací. Jedním z hlavních úkolů hydroprognózy je vydávávání předpovědí průtoků v systému hlásných stanic na tocích na území České republiky a varovných zpráv o případném hrozícím nebezpečí v důsledku vzestupu hladin vodních toků. 1.2. Hlavní cíle projektu Tato část výzkumu se zabývá předpovědními simulacemi hydrogramů průtokových vln ve vybraných říčních úsecích v povodí Berounky aplikací metody neuronových sítí založené na vstupně – výstupním vztahu. Cílem řešení metodou neuronových sítí bylo: a) prokázat vhodnost použití této metody založené na hodnocení vstupně-výstupních vztahů při odvozování hydrogramů průtoků v předpovědních profilech ze známých údajů pozorovaných veličin ve vstupních profilech a mezipovodí jako alternativu k dosud používaným metodám b) ověřit možnost odhadu průtoku (vodního stavu) způsobem založeným na tzv. hydrometrických metododách (metodě tendencí a metodě odpovídajících si průtoků) a metodě hydrometeorologické předpovědi na základě znalosti předchozího průběhu průtoku (vodního stavu) v řešeném profilu a vstupních profilech a znalosti předchozích, současné a budoucích hodnot srážkového úhrnu. c) analyzovat vliv jednotlivých komponent (zejména hydrogramů průtoků či průběhu vodních stavů ve vstupních profilech a srážek) na výsledné hydrogramy ve výstupním profilu 2. Metodika Hlavní pozornost je zaměřena zejména na vyšetření optimálního počtu vstupů a typu komponent ovlivňujících významným způsobem simulovaný průběh hydrogramů průtokových vln metodou umělých neuronových sítí. 2.1. Základy metody neuronových sítí 2.1.1. Charakteristiky umělých neuronových sítí Za umělou neuronovou síť se obecně uvažuje taková struktura pro distribuované paralelní zpracování dat, která se sklásá z jistého, obvykle velmi vysokého, počtu vzájemně propojených výkonných prvků. Každý z nich může současně přijímat libovolný konečný počet různých dat. Na další výkonné prvky může předávat libovolný konečný počet shodných informací o stavu svého jediného, avšak velmi rozvětveného výstupu. Každý výkonný prvek transformuje vstupní data na výstupní podle jisté přenosové funkce. Přitom se též může uplatnit obsah jeho lokální paměti. Funkci umělé neuronové sítě můžeme chápat jako jistou transformaci T vstupního signálu X na výstupní signál _ _ Y = T (X ) . Cestu k obecnějšímu poznání transformační funkce ukázali R. Hecht-Nielsen a K. Hornik. Ta vede ke Komogorově teorému o řešení tzv. třináctého Hilbertova problému. Třináctý Hilbertův problém se týká možnosti reprezentace spojitých funkcí n proměnných pomocí konečného součtu a superpozice spojitých funkcí jedné proměnné. Hilbert vyslovil domněnku, že kořeny rovnice x 4 + ax 3 + bx 2 + cx + 1 = 0 nelze vyjádřit jako funkce koeficientů a, b, c konečnými součty spojitých funkcí pouze dvou proměnných. Teprve po 57 létech dokázal Kolmogorov, že tato domněnka není správná a že každou reálnou spojitou funkci f, mající n proměnných definovanou v n-rozměrné krychli o hranách (0,1) lze vyjádřit jako f ( x1 ,..., x n ) = 2 n +1 n q =1 p =1 ∑ψ q (∑φ pq ( x p )), kde ψq a φpq jsou spojité funkce jedné proměnné a p = 1,…,n q = 1,…,(2n+1). Přitom pro danou funkci jsou specifické pouze ψq, zatímco funkce φpq jsou pro dané n a f nezávislé. Hecht-Nielsen ukázal, že tuto univerzální vlastnost funkcí φpq lze využít též pro reprezentaci funkcí s hodnotami v prostoru vyšších rozměrů. Kolmogorův teorém doplňovali v pozdějších letech někteří další autoři, např. Lorenz, který dokázal, že je možno vystačit pouze s jedinou funkcí ψ a D.A. Sprecher, který našel podmínky pro to, aby funkce ψq měly tvar λpφq, kde λp jsou konstanty. Aplikace Kolmogorovova teorému na problematiku neuronových sítí vede k poznatku, že k tomu, aby bylo transformační funkcí T neuronové sítě možno aproximovat libovolnou funkci f postačí, aby příslušná neuronová síť měla alespoň tři vrstvy o odpovídajících počtech neuronů ( výkonných prvků ) v jednotlivých vrstvách. Funkci T lze implementovat jako transformační funkci neuronové sítě, která má nejméně tři vrstvy s dopřednou vzájemnou vazbou, z nichž první vstupní vrstva má n výkonných prvků, uskutečňujících pouze distribuci vstupních signálů xi, druhá (vnitřní, skrytá) vrstva má 2n+1 výkonných prvků a výstupní vrstva má m výkonných prvků. Výkonný prvek umělé neuronové sítě Výkonným prvkem umělé neuronové sítě je formální neuron, který zpravidla vstupní údaje zpracovává podle vztahu. N y = S (∑ wi xi + Θ) i =1 kde xi jsou vstupy neuronu a jejich celkem N wi jsou synaptické váhy S je obvykle nelineární přenosová funkce neuronu Θ je práh Výraz v závorce je vnitřní potenciál neuronu. Obr. 1. Základní model jednoduchého neuronu Obr. 2. Možné varianty přenosových funkcí Nelineární přenosová funkcí Přenosová funkce označovaná též jako funkce aktivační převádí vnitřní potenciál neuronu do definovaného oboru výstupních hodnot. Nejčastější přenosové funkce jsou čtyři: lineární, skoková omezená a sigmoida. Nejčastěji je obor výstupních hodnot omezen intervalem [0,1]. Sigmoida nebo logistická funkce má potom tvar zpravidla f (ξ ) = kde λ je parametr strmosti. 1 1 + e − λξ Alternativní variantou sigmoidní funkce ( která je monotónní a neklesající ) je pro obor výstupních hodnot [-1,1] hyperbolická tangenta. Přenosová funkce kromě jiného určuje, zda je výkonný prvek binární nebo spojitý. Pracovní fáze umělé neuronové sítě Rozlišujeme 2 fáze – adaptivní, kde se síť učí a aktivní, kde vykonává naučenou činnost – vybavuje si. Paměť je nejčastěji reprezentována hodnotami váhových koeficientů jednotlivých vstupních neuronů. Umělá neuronová síť je tzv. asociativní pamětí, ve které jsou uloženy různé vzory a která si tyto vzory vybavuje. Možné jsou prostorové (jednoduché statické) vzory a časoprostorové vzory ( posloupnosti statických obrazů ). Též vybavování může mít jednu ze dvou variant: při autoasociativním vybavování se z paměti čtou vektory X 1 ,..., X m . Umělá neuronová síť je heteroasociativní, pokud jsou v ní uloženy páry vzor-obraz ( X 1 , Y1 ),..., ( X m , Ym ). Učení Učení se v umělé neuronové síti realizuje nastavováním vah mezi uzly. V praxi se vahám přisoudí počáteční hodnoty, které mohou být buďto náhodně zvolené, nebo vybrané podle nějakého podobného případu. Pak se do sítě přivede trénovací vstup. Síť poskytne výstup, odezvu. Rozeznáváme dva typy učení: s učitelem a bez učitele. Při učení s učitelem existuje nějaké vnější kritérium určující, který výstup je správný a v síti se nastavují váhy pomocí zpětné vazby podle toho, jak blízko je výstup kritériu. Vypočítává se rozdíl mezi žádaným a skutečným výstupem. Váhy se nastavují podle nějakého algoritmu, který zabezpečuje snižování chyby mezi skutečným a žádaným výstupem. Velikost změn vah je obvykle malá. Pak se síti předloží nový výstup a celý proces se zopakuje. Po provedení velkého počtu pokusů se síť naučí vydávat stabilní výstup jako reakci na vstupy, které přijímá. Odvozena a dokázána byla celá řada teorémů o konvergenci a stabilitě učících algoritmů. Při učení s učitelem se umělá neuronová síť učí srovnáváním aktuálního výstupu s výstupem požadovaným a nastavováním vah synapsí tak, aby se snížil rozdíl mezi skutečným a žádaným výstupem. Metodika snižování rozdílu je určena učícím algoritmem. Jednou z metod učení s učitelem je Back-propagation, která bude nejvíce použita v rámci disertační práce. Dále existují metody: učení s korekcí chyby, posilové učení, stochastické učení atd. Učení bez učitele nemá žádné vnější kritérium správnosti. Algoritmus učení je navržen tak, že hledá ve vstupních datech určité vzorky se společnými vlastnostmi. Mnoho algoritmů učení bez učitele jsou paralelní implementace „hroznových“ algoritmů. Učení bez učitele se také říká samoorganizace. Mezi metody učení bez učitele patří: Hebbovské učení, diferenciální Hebbovské učení, min-max učení a kompetice. Učící proces probíhá většinou v živých organismech, než je zapamatován. Existuje ale také učení jednorázové – systém si pamatuje hned napoprvé předložený vzor. V praxi ji mají spíše jen modely neuronových sítí, např. Hopfieldova síť. Neuronové sítě se mohou učit nejen změnou synaptických vah, ale i přizpůsobováním přenosové ( prahové ) funkce, počtu neuronů sítě popřípadě i topologickým uspořádáním sítě. Vybavování Aktivní fáze následuje za fází adaptivní a zpracovávají se v ní vstupní data. Na základě vstupu dat vznikne ve vstupní vrstvě nerovnovážný stav. V neuronech zapamatované hodnoty se začnou působením ostatních neuronů přes spoje měnit ( aktualizovat ) a mění se tak dlouho, dokud opět nenastane stabilní rovnovážný stav. Na jejich výstupech je pak požadovaná odezva sítě na tento vstup. Časově se obě fáze mohou překrývat. Základní pojmy Umělé neuronové sítě mají některé výhodné vlastnosti. Jsou schopné realizovat nad vstupními daty libovolnou transformaci, jsou tedy univerzální. Neuropočítač postavený na bázi neuronové sítě tedy není zapotřebí programovat, protože se ke správnému chování naučí pomocí předkládaných příkladů. Neuronové sítě jsou díky velkému množství neuronů a spojů a díky tomu, že informace je v celé síti rozprostřena, robustní. Poruchy neuronů vedou jen k postupné degradaci sítě. Mají schopnost zobecnění ( generalizace ), schopnost abstrakce, tj. schopnost stejně reagovat na jistou množinu vstupních dat, nikoli jen na prvky z této množiny. Predikce znamená předpovídání výstupní hodnoty jisté veličiny na základě jejího průběhu v minulosti. Při predikci jde o to, abychom v průběhu nějaké známé číselné řady, jejíž hodnoty se mění v závislosti na některém nezávisle proměnném parametru sledovaného jevu ( může být fyzikální veličina i čas ) nalezli co nejpravděpodobnější průběh závislé proměnné. Predikce je vlastně speciálním případem extrapolace, tou se rozumí odvození nebo závěr plynoucí z chování funkce uvnitř známého oboru pro její chování mimo tento obor. Rozpoznávání je rozhodováním na základě vstupního vektoru o tom, do které kategorie předmět, daným vektorem popsaný zařadit. Někdy se hovoří o klasifikaci. Asociace je klasifikaci podobná, ale umělá neuronová síť se v tomto případě učí na bezchybných datech a klasifikuje data poškozená. Filtrace vyhlazuje průběh vstupního signálu. Podstatou filtrace je získání úplného, šumem nezatíženého výstupního signálu ze signálu vstupního. Ten produkují vstupní senzory, čidla. Jejich technické řešení a funkce závisí na konkrétní aplikaci, pro kterou jsou určeny. Mohou to být například optické snímače ( při zpracování obrazové informace ) nebo ultrazvukové detektory ( ve zpracování dat ze sonaru ). Filtrace však není předmětem disertační práce a proto jí nebude dále věnována pozornost. Optimalizace slouží k určení optimální hodnoty nějaké optimální hodnoty nějaké proměnné, např. k minimalizaci délky cesty. Adaptace – schopnost umělé neuronové sítě k samoorganizaci. Realizuje se obvykle změnami vah během učení. Architektura – struktura sítě výkonných prvků, jejich vzájemné propojení. Back – propagation ( zpětné šíření ) – učící algoritmus vícevrstvých dopředných (nerekurentních) neuronových sítí. Při něm se chyba výstupní vrstvy zpětně přepočítává do předchozích vrstev ( zpětně se šíří ) a podle její hodnoty se upravují jednotlivé váhy. Dopředná (nerekurentní) síť – moderní vícevrstvá a částečně samoorganizující se síť. Samostatně klasifikuje vsupní vektory tak, že jim přiřazuje odpovídající výstupní hodnoy. Je v ní jednoznačně definován informační tok. V takové síti neexistují spoje mezi neurony z vyšších vrstev zpět do vrstev nižších, dokonce ani spojení mezi neurony v téže vrstvě. Energetická funkce – energie je mírou naučenosti, tedy odchylky mezi skutečnými a požadovanými hodnotami výstupů neuronové sítě pro danou trénovací množinu. Kohonnenova síť – samoorganizující se síť, nepotřebuje k trénování učitele. Neuron – buňka nervového systému. Neuron je anatomicky i funkčně základním stavebním kamenem nervového systému a posloužil jako vzor pro výkonný prvek v umělých neuronových sítích. Neuronová síť – počítačová architektura podobná mozku. Proti klasickým počítačům má výhody: je odolná proti chybám, má schopnost učit se, dovede abstrahovat i generalizovat. Perceptron – jednoduchá dopředná síť bez skrytých vrstev. To znamená, že jednu vrstvu této sítě lze učit. Klasickou hranicí schopností perceptronu je XOR-problém. Práh – hodnota, kterou musí součet všech vážených vstupů neuronu překročit, aby se stal aktivním. Přeučování – učící proces, ve kterém se maže jistý počet vah. V kontrastu k normálnímu učení už při přeučování síť jistý objem vědomostí obsahovala. Rozpoznávání vzorů, obrazů- - rozpoznávání naučených vzorů v zašuměných vstupních datech. Vstupní i výstupní data se obvykle prezentují vektorovou formou. Rozpoznávání znaků – interpretace vizuálních symbolů. Rozpoznávání číslic, alfabetických znaků nebo jiných, třeba i ručně psaných, symbolů. Jde o klasický, ale velmi složitý problém. Topologie – popisuje druh a počet výkonných prvků sítě a strukturu (graf) jejich propojení. Učící fáze – časový interval, během kterého se podle nějakého učícího algoritmu mění parametry sítě a tyto se do sítě nahrávají. Učící krok – reálné číslo mezi 0 a 1, který udává, jak silně se jednotlivý učící krok ve změně vah projeví. K tomu, aby se naučený vzor zrušil, lze použít negativní hodnoty tohoto parametru. Učící pravidlo (algoritmus) – předpis, který udává, jak se budou síti předkládat vzory k učení a jak se budou vypočítávat změny vah. Váha – hodnotou vyjádřená míra vazby mezi dvěma spojenými výkonnými prvky. Jejím prostřednictvím se v síti předávají informace. Paměť sítě představují právě tyto váhy, resp. jejich velikosti. Vážený vstup – součin výstupního signálu jiného neuronu a váhy tohoto spoje. Tento příspěvek vstupuje v součtu s ostatními váženými vstupy konkrétního neuronu a vytváří s nimi jeho nový vnitřní potenciál. Vrstva – základní komponenta architektury neuronové sítě. Vrstvu tvoří jistý počet stejných buněk majících v síťové struktuře identickou funkci. Vybavovací fáze – časový interval, ve kterém neuronová síť na základě předchozího naučení generuje výstupní data jako odezvu na vstupní data. Výstupní funkce ( přenosová ) funkce – část výkonného prvku zajišťující výstup vnitřního potenciálu na další neurony. Někdy je vnitřní potenciál a výstup neuronu identický. 2.1.2. Základní typy neuronových sítí a učící algoritmy Mezi nejvíce používané sítě patří: Hopfieldova síť ART síť Vícevrstvá perceprtonová síť Kohonenova síť RBF ( Radial Basic Function ) Lineární síť Vzhledem k faktu, že v této práci nebyly použity všechny typy sítí a tedy předmětem zájmu byly pouze některé z výše uvedených typů modelů neuronových sítí, budou následně popsány právě použité typy neuronových sítí. Podrobným popisem např. Hopfieldovy sítě a ART sítě a Kohonenovy sítě se zabývá ve skriptu Šnorek, Jiřina. Vícevrstvé perceptronové sítě Vícevrstvé perceptronové sítě (Multilayer Perceptron Neural Network – MLP) patří mezi nejznámější a nejpoužívanější neuronové sítě, které již aplikovala řada odborníků při řešení řady problémů v oblasti vodního hospodářství (viz. Starý, Fošumpaur a další). Základním prvkem sítě je tzv. perceptron. Aktivační funkcí perceptronu je právě zde nejčastěji již zmíněná logistická funkce – sigmoida. MLP je síť s učitelem – trénovací vzory musí kromě vstupních hodnot obsahovat i hodnoty příslušných odpovídajících výstupů. Použití této sítě je vhodné zejména pro regresní úlohy a predikce, ale též i pro klasifikace. MLP se skládá z několika vrstev perceptronů, viz. obr. Bude doplněn Každý perceptron ve vstupní vrstvě je propojen s každým perceptronem v první skryté vrstvě, obdobně je tomu mezi skrytými vrstvami a mezi skrytou a výstupní vrstvou. Počty skrytých vrstev a počtů neuronů ve skrytých vrstvách závisí na charakteru řešené úlohy. Například pro perceptronovou síť se dvěma skrytými vrstvami a výstupní vrstvou se v první skryté vrstvě volí o něco více perceptronů, než je vstupů, a v druhé vrstvě se volí počet perceptronů jako aritmetický průměr počtu perceptronů v první skryté vrstvě a počtu výstupů. Pokud je počet perceptronů malý, síť nedokáže postihnout všechny závislosti v trénovacích datech. Pokud je naopak počet perceptronů velký, zvyšuje se doba učení a navíc vlivem nadměrného počtu trénovacích dat má síť špatnou schopnost generalizace způsobenou přeučením (overfiting, overtraining). Problém lokálního minima, metody zlepšující chování sítě Vzhledem k faktu, že vícevrstvá perceptronová síť využívá při učení gradientní metodu, může se stát, že při pohybu po chybové funkci, se síť dostane do nežádoucího minima, ve kterém uvázne. To je způsobeno tím, že není možné pokračovat ve směru minimalizace chybové funkce. V literatuře je doporučeno proto zvětšit počet skrytých neuronů a snížit hodnotu parametru učení. Velikost parametru učení η Ta může významně ovlivnit chování sítě, zejména rychlost učení a konvergenci k řešení. Při malé hodnotě parametru učení klesá chyba jen pomalu. Naopak při velké hodnotě je sice učení rychlejší, ale síť může divergovat. Literatura doporučuje tento parametr nastavit na začátku učení malý a postupně ho zvyšovat. Někdy je nutné zopakovat celý proces učení znova pro jiné počáteční hodnoty vah. Moment Přidání momentu do rovnice pro adaptaci vah je nejrozšířenější způsob ochrany proti uváznutí v lokálním minimu. Potom platí ∆wij (t ) = −η ∂E + α∆wij (t − 1), ∂wij kde α je parametr momentu, 0<α<1. Hodnota parametru se volí blízko jedné. Moment představuje jednokrokovou ,,setrvačnost”, se kterou se pohybujeme po chybové funkci. Mířímeli k lokálnímu minimu, lze ho překonat tím, že ho překročíme právě o jeden krok, jehož velikost je dána velikostí předchozího kroku upravenou parametrem momentu. RBF sítě ( Radial Basic Function ) Síť RBF navrhli D. S. Broomheadem a D. Lowem jako samostatnou neuronovou síť v roce 1988. Struktura – viz. obr. níže. Síť má jednu vstupní, jednu skrytou a jednu výstupní vrstvu čili počet skrytých vrstev není libovolný. Neurony ve skryté vrstvě jsou radiálního typu, tj. počítá se vzdálenost vstupního vektoru od vektoru vah. Počet neuronů ve skryté vrstvě je volitelný. Aktivační funkce skrytých neuronů má nejčastěji charakter Gaussovy křivky. Potom platí, že vzory, které jsou daleko od centra (neuronu) mají nižší vliv na chování sítě. Výstupy ze skryté vrstvy vedou do všech výstupních neuronů, které jsou perceptronového typu s tím rozdílem, že aktivační funkce těchto neuronů je lineární či identita. Váhy v první vrstvě (mezi vstupní a skrytou vrstvou) se nastavují na začátku učení a jsou pevné po celou dobu učení. Hodnoty vektorů vah vedoucích k jednotlivým skrytým neuronům jsou reprezentovány centry shluků ve vstupních datech. Kvalita nastavení center ovlivňuje chování sítě. Pro nastavení center se nejčastěji používají metody shlukové analýzy, ale i jiné. Literatura uvádí, že nejjednodušší způsob výběru center je náhodný způsob výběru z trénovací množiny. Toto řešení se ukazuje pro řadu jednoduchých úloh dostačující, protože je pravděpodobný výběr vzorů z oblastí se zvýšenou koncentrací dat – shluků. Váhy v druhé vrstvě (mezi skrytou a výstupní vrstvou) se nastavují buď stejným způsobem jako u MLP ( na náhodné hodnoty) pokud je použit pro učení klasický iterační algoritmus jako u MLP, nebo se tyto váhy mohou určit přímo (regresí). Princip RBF sítě spočívá v pokrytí dat oblastmi, které mohou být připodobněny ke kruhům v dvourozměrném prostoru a obecně k hyperkoulím ve vícedimenzionálním prostoru, přičemž jejich středy jsou umístěny do středů shluků. Šířka je parametrem aktivační funkce a je u každého neuronu nastavována individuálně odhadem z trénovacích dat. Výstupní vrstva tyto oblasti kombinuje a vytváří tak jednotlivé skupiny odpovídající třídám. Síť RBF je považována za jednoduchou síť se snadným a rychlým učením a je vhodná pro klasifikaci a regresi. Zde je nutné zmínit, že RBF síť byla aplikována vzhledem k těmto výhodám pro jednotlivá i složitější řešení předpovědí vodních stavů a průtoků průtokových vln a pro řešení křivek postupových dob vodních stavů ( průtoků ). Predikce s použitím neuronových sítí Velkými výhodami neuronových sítí je schopnost učit se na příkladech a schopnost vystihnout nelineární závislosti. Nevýhodou je, že zpravidla nelze předem odhadnout velikost chyby nebo stanovit interval spolehlivosti. Teorie pro to neposkytuje vodítka a proto většina těchto odhadů vychází z heuristických postupů. Pro všechny typy predikcí se hodí neuronové sítě, které jsou univerzálními aproximátory funkcí, tedy zejména sítě typu Back-propagation a jejich odvozených typů, dále Kohonenovy mapy upravené pro učení s učitelem atd. Predikcí jednoduché časové řady např. Marksovou neuronovou sítí se zabývá Šnorek, Jiřina. V rámci disertační práce bude pro predikci určité veličiny zpravidla volen speciální výběr parametrů. Posouzena bude i možnost použití jednoduché řady pro krátkodobou předpověď. 2.2. Předpovědní metody 2.2.1. Metoda tendencí Zakládá se na extrapolaci změn vodního stavu či průtoku v daném profilu na určitou dobu dopředu. Dosud se prokázalo, že nejlepší podmínky užití této metody jsou na velkých rovinných tocích. Na menších tocích, u nichž celková doba trvání ustálené tendence stoupání nebo poklesu vodních stavů či průtoků nepřevyšuje 5 dní, nemůže být tato metoda používána pro větší předstih než 1 den. Celkově rozeznáváme dva druhy extrapolace – lineární a nelineární. Metoda lineární tendence Předpokládá se, že gradient vzestupu nebo poklesu vodní hladiny za určitou časovou jednotku je stálý ∆H = konst. ∆t kde H je vodní stav odečítaný na stejném vodočtu, t – čas Zvolíme-li časový interval, v němž je známa změna vodního stavu jako ∆t0 = konst. a délku předstihu rovněž jako ∆t = konst., potom při platnosti výše uvedeného předpokladu obdržíme ∆H t + ∆t = konst. ∆H t Pro předpověď je tedy možné určit funkci H t + ∆t = f (∆H t ) Metoda lineární tendence slouží též jako kritétium pro posouzení oprávněnosti používání jiných hydrometrických předpovědních metod. Jejich zavedení do praxe se považuje jen tehdy za účelné, převyšují-li efektivní způsob předpovídání na základě lineární tendence. Metoda nelineární tendence Více se blíží fyzikální podstatě průtokového režimu nelineárnost gradientu vodního stavu či průtoku ∆H ∆Q ≠ konst . nebo ≠ konst . ∆t ∆t Extrapolovanou částí čáry vodních stavů (průtoků) je pak křivka, jejíž tvar se stanoví analytickou či grafickou cestou podle rovnice odvozené na základě známých předcházejících změn vodních stavů či průtoků. Pro předpovědi s poměrně velmi krátkým předstihem se užívají rovnice typu H = H 0 + at + bt 2 nebo kde H = H 0 + ct m t je čas od okamžiku výskytu počátečního vodního stavu H0, a, b, c, m jsou parametry předpovědní rovnice Při extrapolaci se však předpokládá stálost zákona, jímž se řídí změny odtoku. Dodržení této podmínky bývá často narušováno výskytem srážek. Je prokázáno, že v takových případech může chyba podle nelineární tendence činit až dvojnásobek chyby, kterou bychom obdrželi při uvažování lineárních změn. Proto je tato metoda vhodná ponejvíce pro bezsrážková období. Jelikož tato bývají doprovázena poklesem vodních stavů, omezuje se používání metody nelineární tendence převážně k předpovědím na poklesových větvích hydrogramů. Na základě metod tendencí jsou založena varianta určování předpovědí s využitím neuronových sítí. Podstatou řešení je, že se na základě předchozích údajů o vodním stavu či průtoku, které tvoří vstupy a předpovídaného průtoku o určité délce předpovědi jako výstupu natrénuje (nakalibruje) model neuronové sítě. Předpokládá se, že počet předchozích údajů o vodním stavu (průtoku) závisí na tvaru průtokové vlny či obecně na tvaru záznamu. Hledaný vztah mezi vstupními a výstupní proměnnou lze zapsat do tvaru H t + ∆t = f ( H t − n ......H t ) kde H – vodní stav [cm] či průtok [m3.s-1] ∆t – délka předpovědi [hod.] n – počet hodin předcházejících současnosti [hod.] t – vodní stav (průtok) v daném časovém kroku 2.2.2. Srážko-odtokový model Předpokládaný tvar srážko-odtokového předpovědního modelu neuronové sítě vychází se znalosti vstupních údajů – předchozí srážky na mezipovodí, předpovídané srážky na mezipovodí a informace o předchozím průtoku ve vstupním profilu nebo výstupním profilu (posouzeny budou obě varianty) a výstupních údajů – předpovídaný vodní stav či průtok ve výstupním profilu. Cílem tohoto řešení je najít nejvhodnější model neuronové sítě pro dané podmínky a dosažené výsledky vzájemně porovnat. Tvar hledané funkce modelu neuronové sítě závisí na významu vstupních dat a lze zapsat přibližně takto: H d t + ∆t = f (ht − n ....ht + n ; H ht − n ....H h0 ; H d t − n ....H d 0 ) nebo H d t + ∆t = f ( H t − n ....H t + n ; H ht − n ....H h0 ) nebo H d t + ∆t = f ( ht − n ....ht + n ; H dt − n ....H d 0 ) kde Hd – vodní stav v horním vstupním profilu [cm] Hh – vodní stav v dolním výchozím profilu [cm] H – srážka na mezipovodí [mm] t – čas [hod.] ∆t – časový předstih předpovědi [hod.] n – počet časových kroků před současností [hod.] Přesný tvar výsledné funkce je právě předmětem trénování, testování a statistického posouzení navržených modelů. 2.2.3. Metoda odpovídajících si průtoků Metoda odpovídajících si průtoků (též metoda korespondujících průtoků) je poměrně jednoduchou metodou, která je založena na sledování naměřených výkyvů vodních stavů, resp. průtoků v horní a dolní stanici a z nich odvozené závislosti postupové doby na průtoku resp. vodním stavu. Hladný [1972] její podstatu definuje takto: „Princip této metody spočívá na možnosti přiřadit průtoku z horní stanice sdružený, geneticky stejnorodý průtok ve stanici dolní. Odpovídajícími si průtoky se rozumí geneticky stejnorodé průtoky v horní a dolní stanici a postupovou dobou čas, který uplyne mezi jejich výskytem.“ Metoda korespondujících si průtoků je metodou hydrometrickou, založenou na popisu hydrodynamických procesů probíhajících v říční síti. Výchozími podklady pro ni jsou údaje zjistitelné přímo ve sledovaném úseku toku tj. drsnost a tvaru koryta, délka úseku, sklon hladiny a v neposlední řadě záznamy o vodních stavech resp. průtocích v měrných profilech. Postupovou dobu lze vyjádřit jako funkci všech výše zmíněných faktorů: τ = f(Q Z ,J,s,ρ, k ) je průtok v horní stanici úseku, kde QZ J sklon hladiny toku, s délka úseku, ρ drsnost koryta, k koeficient charakterizující tvar koryta. Vzhledem k tomu, že délka úseku mezi profily je stálá a změny drsnosti a tvaru koryta v úseku lze považovat za zanedbatelné, je postupová doba nejvíce závislá na průtoku v horní stanici a na sklonu hladin, který se při průchodu především velkých průtokových vln mění: τ = f(Q Z ,J ) Tato tradiční metoda se úspěšně využívá v předpovědních provozech zejména na středních a dolních úsecích větších toků, kde většina odtékající vody z povodí je již koncentrována v korytě řeky a kde lze uspokojivě rozlišit přítokové a bezpřítokové úseky. Na malých povodích, kde se povrchový odtok z povodí podílí na celkovém odtoku relativně větší měrou, je nutné řešit odtokovou situaci jinými postupy, např. metodou jednotkového hydrogramu. Základní předpoklady metody Výchozí podmínkou je, že v daném povodí existuje pozorování vodních stavů v soustavě vodoměrných stanic, ve kterých jsou odvozeny měrné křivky průtoků umožňující převádět hodnoty vodních stavů na hodnoty průtoků. V posledních letech byly vyvinuty přístroje, které zaznamenávají přímo průběh průběhu prostřednictvím měření rychlostí proudění pomocí ultrazvuku. Takto vybavené stanice však rozhodně nejsou v staniční síti ČR běžné. Základním předpokladem metody odpovídajících si průtoků je že průtok v dolní stanici úseku je funkcí průtoku ve stanici horní: QtP+τ = f (QtZ ) kde QtZ je průtok v horní stanici v čase t, QtP+τ je průtok v dolní stanici v čase t zvětšeným o postupovou dobu τ, horní indexy v tomto případě vyjadřují pouze označení polohy profilu: Z – základní tj. horní stanice, P – předpovědní, tj. dolní stanice. V ideálním případě, kdyby se objem vody v úseku mezi sledovanými profily nezměnil, průtok by se v dolním profilu rovnal průtoku v horním profilu v čase zpožděném o postupovou dobu τ. Platil by vztah: QtP+τ = QtZ V reálných podmínkách je tento vztah neplatný, protože objem vody v říčním korytě je navyšován z mnoha zdrojů, z výronů podzemní vody, při výskytu srážek také z povrchového a hypodermického odtoku z mezipovodí, z přítoků aj. Souhrnně se tento objem vody, která přitéká do koryta mezi profily, nazývá boční přítok nebo přírůstek přítoku z mezipovodí. Průtok v předpovědním profilu je v konkrétním okamžiku t tvořen komponentami: - průtokem z horní stanice, který za postupovou dobu dospěje v okamžik t do dolního profilu, průtoky ze stanic na přítocích, které dotékají za svou charakteristickou postupovou dobu do dolního profilu v okamžik t, - povrchovým a podpovrchovým odtokem z části povodí mezi horním a dolním profilem, ze které dobíhá voda do dolního profilu v okamžik t. Konečně průtok může být v dolním profilu ovlivněn transformací povodňové vlny při postupu z horního profilu, která vytváří dodatečný sklon hladiny za povodně. Mírou ovlivnění předpovídaného průtoku transformací povodňové vlny se zabývali např. Delemeau, Velikanov a Kalinin. Všichni tito hydrologové došli k podobnému závěru, že pro předpověď průtoku na typech řek, které se vyskytují i u nás, lze dodatečný sklon hladiny zanedbat, resp. účinek zploštění vlny se pohybuje v rozmezí běžných chyb hydrometrických měření. [Hladný, 1972] Při uvažování těchto závěrů zůstává nezanedbatelným činitelem v rovnici odpovídajících si průtoků v jednoduchém říčním úseku pouze rozdíl průtoků v horním a dolním profilu: QtP+τ = QtZ + ∆qt +τ kde Δq t+τ je přírůstek průtoku z mezipovodí (boční přítok). Z této rovnice vyplývá, že při známé postupové době τ , lze rozdílem korespondujících si průtoků horního a dolního profilu získat velikost bočního přítoku. Hledáme-li korespondující průtok s využitím neuronové sítě pro větší počet vln s odlišnými postupovými dobami průtoků, je funkce výsledného modelu odvozována na základě znalosti většího rozsahu postupových dob průtoku (informací o předchozích hodnotách průtoků v určitém časovém intervalu) v horní stanici (vstupy) a průtoku v čase t v dolním profilu (výstup). Výsledný tvar funkce (modelu) je vždy předmětem řešení a posouzení. 2.3. Problematika třídění vzorů a jejich role při návrhu modelů neuronových sítí Výběr vzorů pro trénování, validaci a testování má významný vliv na strukturu navrženého modelu neuronové sítě. Celá řada zahraničních i domácích autorů volí specifický výběr vzorů v závislosti na použitém softwaru. Při navrhování modelů neuronových sítí pro predikci vodních stavů či průtoků na určitou délku předpovědi bych chtěl porovnat některé přístupy při rozdělování vstupních vzorů do jednotlivých skupin. Budu vycházet z předpokladu, že toto rozdělení stupních vzorů do jednotlivých skupin významně ovlivňuje navrženou strukturu modelu. Tento předpoklad se budu snažit ověřit. Pokud se zabýváme předpověďmi vodních stavů či průtoků v průběhu povodňových epizod, zpravidla vstupní vzory určité povodňové epizody začleňujeme do určité skupiny jako celek. Avšak pokud bychom tyto vzory podrobili náhodnému rozdělení do jednotlivých skupin, potom považuji za významné uskutečnit řadu návrhů modelů neuronových sítí vždy pro odlišné rozdělení vstupních vzorů. To znamená, že v tomto pojetí by určitá povodňová epizoda obsahovala jak vzory pro trénování, tak i pro validaci a testování. 3. Nejistoty při modelování hydrogramů průtokových vln aplikací neuronových sítí Nejistoty, které se vyskytují při modelování hydrogramů průtokových vln aplikací neuronových sítí lze rozdělit do dvou skupin: a) nejistoty při pořizování vstupních dat b) nejistoty vlivem zpracování a analýzy vstupních dat 3.1. Nejistoty při pořizování vstupních dat Hlavními druhy dat, které byly pro řešení této problematiky získány, jsou časové řady vodních stavů či průtoků ve vodoměrných stanicích a časové řady srážkových úhrnů ve srážkoměrných stanicích v zájmové oblasti povodí Berounky. Obecně je možné konstatovat, že nejistoty měření těchto veličin je možné při řešení daného problému zanedbat, neboť je snahou pořizovatele dat (ČHMÚ) částečně tyto nejistoty odstranit před jejich dalším použitím. Při pořizování kontinuálního záznamu vodních stavů je zejména v poslední době, kdy je záznam pořizován pomocí automatické stanice, ověřována jeho věrohodnost porovnáním s údajem na vodočetné lati. Záznam z automatické stanice je pak opraven bez lidského zásahu pomocí softwaru V případě použití limnigrafického záznamu je zapotřebí jeho věrohodnost ověřit pomocí časových odečtů na vodočetné lati. Další nejistota se vyskytuje při digitalizaci záznamu zpravidla v důsledku nerovnosti papíru a v případě rozpití inkoustu, kdy pak nelze přesně odhadnout průběh skutečné čáry průběhu vodních stavů. Lze říci, že nejistota při pořizování vstupních dat je oproti nejistotě vlivem zpracování a analýzy vstupních dat zanedbatelná. 3.2. Nejistoty při zpracování a analýze vstupních dat aplikací metody neuronových sítí Nejistoty při vlastním modelování hydrogramů průtokových vln v říčním systému aplikací neuronových sítí za delší časové období je možné rozdělit na: - nejistoty vlivem změny vztahu mezi vodním stavem a průtokem, který je důsledkem přeměn průtočného profilu v průběhu řešeného období - nejistoty vlivem extrapolace měrných křivek průtoku (MKP) do oblasti N-letých průtoků - nejistoty při způsobu rozdělení vstupních dat na trénovací, validační, testovací - nejistoty v důsledku volby množství dat a tvaru průtokových vln Simulace hydrogramů průtokových vln pro účely předpovědi postupu povodňové vlny v říční síti v sobě tedy skrývá řadu nejistot. Srážko - odtokový proces je ovlivňován řadou faktorů, u nichž není jasné zda–li jsou dostatečně zahrnuty ve vstupně-výstupním vztahu dostupných datových podkladů. Výsledná nejistota je zde chápána jako rozdílnost řady průběhů simulované veličiny (průtoku či vodního stavu) od veličiny pozorované a podílejí se na ní všechny výše uvedené složky nejistot. Cílem je tedy identifikovat takový model neuronové sítě, který výrazně nezvětšuje nejistoty plynoucí ze zpracování vstupních dat. 4. Použitý software STATISTIKA Neuronové sítě 7.0 Během posledních deseti let se proslavila firma StatSoft a. s. svoji rozsáhlou nabídkou programových produktů STATISTICA i v České republice. STATISTICA je komplexní systém, který obsahuje prostředky pro analýzu dat, vytváření grafických výstupů, správu dat a vývoj uživatelských aplikací. Poskytuje široký výběr základních i pokročilých procedur pro obchodní i inženýrské aplikace, vytěžování dat i vědu. Obsahuje také mnoho metod specializovaných na analýzu dat (vytěžování dat, prostředky pro výzkum v biomedicíně, sociálních vědách, obchodu a pro inženýrské aplikace). Všechny nástroje nabízené v produktové řadě softwaru STATICTICA je možné ovládat pomocí několika alternativních uživatelských prostředí a komplexního, v oboru standardního programovacího jazyka (založeného na Visual Basicu). Interaktivní uživatelská prostředí lze snadno přizpůsobit a jazyk STATISTICA Visual Basic lze použít k zjednodušení provádění úloh jakékoli obtížnosti. Hlavní významné rysy řady STATISTICA jsou: - - široký výběr a obsáhlost implementovaných analytických procedur výjimečně adaptabilní (nebo flexibilní) a kvalitní grafika vhodně propojená s výpočetními procedurami výkonné a snadno ovladatelné intuitivní uživatelské prostředí plně integrovaný jazyk STATISTICA Visual Basic, který přidává více než 11 000 nových funkcí k obsáhlé syntaxi Microsoft Visual Basicu široký výběr pokročilých softwarových technologií, které jsou základem prakticky neomezené kapacity, výkonu a možností uživatelských úprav aplikace STATISTICA. Mezi řadou programů postupně představovala sofistikované verze programu STATISTICA Neuronové sítě, který lze v současné době zakoupit i v české verzi. Je vhodné říci, že zmíněný software STATISTICA Neuronové sítě 7.0 v české verzi byl použit k analýze předpovědí a křivek postupových dob vodních stavů či průtoků v systémech stanic na vybraných vodních tocích. Tato sofistikovaná verze programu byla pro řešení zvolena s ohledem na její výhody. Hlavní výhodou tohoto produktu je fakt, že s tímto produktem mohou pracovat i začínající odborníci v oblasti neuronových sítí, kteří by však měli mít alespoň základní znalosti v oblasti neuronových sítí. Tito začátečníci mohou provádět rutinní úlohy pomocí přednastavených základních dialogů spouštění analýz a mohou mít k systému přístup i prostřednictvím internetového prohlížeče. Obecně lze říci, že zmíněný software umožňuje vlastní návrh neuronových sítí zejména pro zkušené analytiky profesionální statistiky a pracovníky vyvíjející pokročilé aplikace, kteří mohou navíc začlenit jakoukoli z vysoce optimalizovaných procedur systému STATISTICA do uživatelských aplikací nebo výpočetních systémů a mohou použít libovolnou z nejmodernějších objektově orientovaných a internetových softwarových technologií. Ale právě pro začátečníky je k dispozici tzv. inteligentní poradce řešení, který výrazným způsobem usnadňuje řešení – vytváří a testuje nejrůznější topologie neuronových sítí na základě typu a množství předložených vstupních vzorů. Další výhodou je snadná komunikace s ostatními programy. Osobně upřednostňuji možnost přímé komunikace s programem MS Excel. Lze tedy přímo načítat soubory s příponou xls. nebo dále txt. a řada dalších. Řešitel si může tak například předem připravit rozsáhlé matice vstupních vzorů a později volit jednotlivé kombinace a testovat tak závislost mezi nimi. Způsob řešení tak závislí na možnostech každého řešitele. Dále lze přidat i generátor kódu v jazyce C. Dalšími možnostmi řešení jsou: - Vícevrstvé perceptrony - Sítě s radiální bází (RBF sítě) - Kohonenovy samoorganizační mapy - Lineární sítě - Bayesovské sítě - Metoda zpětného šíření (Backpropagation) - Četné analytické grafy - Opakované vzorkování (křížové ověřování, bootstrap) - Analýza citlivosti, ROC křivky - Soubory sítí - API prostředí a další Software STATISTIKA Neuronové sítě 7.0 vychází ze základních teoretických principů umělých neuronových sítí popsaných v řadě domácích či zahraničních publikacích autorů např. Bíla(1998), Šnorek, Jiřina (1996), Drbal, Starý (1996), Fošumpaur (1998), P. Varoonchotikul (2003), Robert J. Abrahart, Pauline E. Kneale & Linda M. See (2004). Použitý software je dosti sofistikovaný a výrazně usnadňuje řešiteli cestu k požadovaných výsledkům. Pro řešení předpovědí vodních stavů i průtoků byly použity RBF sítě (Radial Basis Function). RBF sítě se vyznačují jednoduchostí a rychlostí učení (kalibrace). Skládají se ze tří vrstev neuronů – vstupní, skryté a výstupní a jednotlivé vrstvy neuronů jsou propojeny vahami - viz. Obr. 4 Neurony ve skryté vrstvě jsou radiálního typu. Počet neuronů ve skryté vrstvě je volitelný, jejich aktivační funkce má charakter Gaussovy křivky. Aktivační funkce výstupních neuronů je volena lineární. Správnost funkčnosti modelu RBF sítě je zaručena vhodným nastavením vah, což je předmětem učení sítě. Hodnoty vektorů vah, které vedou k jednotlivým skrytým neuronům reprezentují centra shluků ve vstupních datech. Učení sítě bylo prováděno s využitím metody sdružených gradientů. Vstupní v rstv a neuronů Skrytá v rstv a neuronů Výstupní v rstva neuronů Obr. 4. Příklad topologie radiální neuronové sítě 5. Aplikace metod a výsledky Metoda RBF sítí byla aplikována při řešení výpočtových schémat vzcházejících z hydrometrických metod ( metoda tendencí, metoda odpovídajících si průtoků) a metody hydrometeorologické předpovědi. 5.2. Metoda tendencí Metoda tendencí patří mezi tzv. předpovědi hydrometrické. Vycházejí ze zákonitostí, kterými se řídí pohyb vody v otevřených korytech. Umožňují takový předstih, jaký dovoluje postupová doba vody z horního do dolního (předpovědního) profilu. Z toho důvodu je výhodnější jejich používání na větších nebo středních tocích s větší délkou koryta. Základním předpokladem pro metodu lineární tendence je platnost vztahu ∆H = konst. ∆t kde H t - vodní stav odečítaný na stejném vodočtu - čas Pro předpověď možné určit funkci H t + ∆t = f (∆H t ) Pro nelineární tendenci potom platí ∆H ≠ konst. nebo ∆t ∆Q ≠ konst. ∆t 5.2.1. Aplikace RBF sítí: Řešený vztah pomocí RBF sítí lze zapsat ve tvaru H t + ∆t = f ( H t − n ......H 0 ) kde H t n - vodní stav [cm] - čas [hod.] - počet předcházejících hodnot sledované veličiny v kroku jedné hodiny Lokalita: Povodí: Tok: Úsek: Délka úseku: Plocha mezipovodí: Vstupní profil: Předpovědní profil: Radbuza Radbuza Staňkov–Lhota 37,6 km 2 479 km Staňkov Lhota Z hydrofondu ČHMÚ a digitalizací limnigrafických záznamů byl získán soubor 9 průtokových vln. V prvním případě byl rozdělen na trénovací a testovací p. vlny v poměru 2:1 dle velikostí jejich kulminací. Do trénovací matice byly zahrnuty průtokové vlny s nejširším rozsahem průtoků (vodních stavů) a to následně: 8.7. – 18.7.1996 28.3. – 7.4.2000 10.4. – 26.4.2001 20.6. – 26.6.2002 4.8. – 25.8.2002 – – – – – trénovací testovací trénovací testovací trénovací 1.3. – 29.3.2003 12.3. – 12.4.2004 15.7. – 29.7.2004 17.9. – 30.9.2004 – – – – trénovací testovací trénovací trénovací Obr.5 Mezipovodí mezi profily Staňkov-Lhota na toku Radbuza V druhém případě byly jednotlivé sestavené vzory ponechány pro automatické náhodné rozdělení do trénovací, validační a testovací skupiny. V tomto případě byly vzory obsažené v jednotlivé průtokové vlně rozděleny na trénovací, validační a testovací. Řešeny byly předpovědi s časovým předstihem 2, 5 a 12 hodin. Za vstupy bylo použito 5 předchozích a současná hodnota vodního stavu nebo průtoku v předpovědním profilu. Výstupem při trénování byla předpovídaná hodnota sledované veličiny o délce předstihu předpovědi. 5.2.2. Výsledky: Statistické hodnocení spolehlivosti odvozených modelů RBF sítí: Spolehlivost navrženého modelu lze posoudit: a) velikostí trénovací, testovací, případně validační chyby. Jejich velikosti známe v průběhu výpočtu. Při výběru nejspolehlivějšího modelu se předpokládá, že je specifikován shodností těchto chyb a charakterizován jejich nejmenšími hodnotami. Dále zde platí, že je-li např. trénovací chyba až několikanásobně nižší, než chyba testovací, došlo pravděpodobně k přeučení neuronové sítě a model je hodnocen jako nespolehlivý. b) podle statistických ukazatelů: koeficient determinace N ∑ (H R2 = i =1 N − H i )2 m ,i ∑ (H i =1 − H )2 i průměrná absolutní odchylka 1 N Ep = N ∑H i =1 m ,i − Hi směrodatná odchylka odhadu 1 E sh = N kde Hm,i Hi N N ∑ (H i −1 − Hi ) 0,5 2 m ,i - modelovaná hodnota vodního stavu v čase i - měřená hodnota vodního stavu v čase i - počet všech prvků ( testovacích vzorů) Tab. 1-3. Statistické posouzení odvozených modelů RBF sítí pro předpověď na: 2 hodiny Dělení vzorů vlastní automatické 1.pokus automatické 2.pokus automatické 3.pokus automatické 4.pokus automatické 5.pokus Train Topologie 2 R Ep modelu Veličina H 6-122-1 0.997 2.0 Q 6-204-1 0.998 0.6 H 2-41-1 Q 3-121-1 H 6-153-1 Q 6-161-1 H 2-37-1 Q 6-108-1 H 6-85-1 Q 6-79-1 H 6-246-1 Q 2-141-1 5 hodin Esm R2 3.8 1.9 0.996 0.992 Test Ep Esm 1.6 0.4 2.3 0.7 Train, Select, Test R2 Ep Esm 0.996 0.999 0.996 0.997 0.997 0.982 0.997 0.984 0.998 0.997 1.7 0.8 1.8 0.6 1.6 0.9 1.6 1.1 1.7 0.5 3.7 1.2 3.7 1.9 3.2 4.4 3.3 4.2 2.8 1.7 Dělení vzorů vlastní automatické 1.pokus automatické 2.pokus automatické 3.pokus automatické 4.pokus automatické 5.pokus Topologie Train 2 R Ep modelu Veličina H 6-93-1 0.987 4.1 Q 6-88-1 0.982 1.9 H 6-121-1 Q 3-59-1 H 2-62-1 Q 4-164-1 H 6-179-1 Q 6-187-1 H 6-258-1 Q 6-108-1 H 6-50-1 Q 6-325-1 Esm R2 7.7 5.4 0.982 0.968 Test Ep Esm 3.2 0.8 4.9 1.3 Train, Select, Test R2 Ep Esm 0.984 0.962 0.985 0.981 0.985 0.981 0.990 0.986 0.983 0.992 3.8 1.4 4.1 1.4 4.0 2.1 3.7 1.5 3.6 1.9 7.6 6.4 7.3 4.5 7.3 4.5 6.1 3.9 7.8 3.0 12 hodin Dělení vzorů vlastní automatické 1.pokus automatické 2.pokus automatické 3.pokus automatické 4.pokus automatické 5.pokus Topologie Train 2 R Ep modelu Veličina H 6-394-1 0.960 8.3 Q 6-484-1 0.985 2.6 H 6-113-1 Q 6-384-1 H 6-58-1 Q 6-54-1 H 6-71-1 Q 6-85-1 H 6-53-1 Q 6-58-1 H 6-62-1 Q 6-116-1 Esm R2 13.6 4.7 0.792 0.823 Test Ep 11.7 2.1 Esm Train, Select, Test R2 Ep Esm 16.6 3.1 0.929 0.973 0.930 0.885 0.929 0.898 0.921 0.943 0.925 0.941 9.0 3.2 9.0 3.6 9.1 3.5 10.1 2.8 8.9 4.1 16.0 5.4 16.0 11.2 16.1 10.5 17.0 7.9 16.5 8.0 Průběh vodních stavů 500 Měření Simulace1 Simulace2 Simulace3 Simulace4 Simulace5 450 400 350 H [cm] 300 250 200 150 100 50 0 0 500 1000 1500 2000 2500 3000 3500 Pořadí vzorů Průběh vodních stavů 500 Měření Trénink 450 400 350 H [cm] 300 250 200 150 100 50 0 0 500 1000 1500 Pořadí vzorů 2000 2500 Průběh vodních stavů 250 Měření Test 200 H [cm] 150 100 50 0 0 200 400 600 800 1000 1200 Pořadí vzorů Průběh průtoků 400 Měření Simulace1 Simulace2 Simulace3 Simulace4 Simulace5 Simulace6 350 300 Q [m3.s-1] 250 200 150 100 50 0 0 500 1000 1500 2000 Pořadí vzorů 2500 3000 3500 Průběh průtoků 400 Měření Trénink 350 300 Q [m3.s-1] 250 200 150 100 50 0 0 500 1000 1500 2000 2500 -50 Pořadí vzorů Průběh průtoků 40 Měření Test 35 30 Q [m 3.s-1] 25 20 15 10 5 0 0 200 400 600 800 1000 1200 Pořadí vzorů Obr. 6-11 Příklady porovnání měřených a předpovídaných vodních stavů a průtoků s předstihem 2 hodiny metodou tendence v profilu Lhota Průběh vodních stavů 600 Měření Simulace1_trvate Simulace2_trvate Simulace3_trvate Simulace4_trvate Simulace5_trvate 500 H [cm] 400 300 200 100 0 0 500 1000 1500 2000 2500 3000 3500 Pořadí vzorů Průběh vodních stavů 500 Měření Trénink 450 400 350 H [cm] 300 250 200 150 100 50 0 0 500 1000 1500 Pořadí vzorů 2000 2500 Průběh vodních stavů 250 Měření Test 200 H [cm] 150 100 50 0 0 200 400 600 800 1000 1200 Pořadí vzorů Průběh průtoků 450 Měření Simulace_trvate1 Simulace_trvate2 Simulace_trvate3 Simulace_trvate4 400 350 Q [m3.s-1] 300 250 200 150 100 50 0 0 500 1000 1500 2000 -50 Pořadí vzorů 2500 3000 3500 Průběh průtoků 400 Měření Trénink 350 300 Q [m3.s-1] 250 200 150 100 50 0 0 500 1000 1500 2000 2500 Pořadí vzorů Průběh průtoků 45 Měření Test 40 35 Q [m3.s-1] 30 25 20 15 10 5 0 0 200 400 600 800 1000 1200 -5 Pořadí vzorů Obr. 12-17 Příklady porovnání měřených a předpovídaných vodních stavů a průtoků s předstihem 5 hodin metodou tendence v profilu Lhota Průběh vodních stavů 600 Měření Simulace1 Simulace2 Simulace3 Simulace4 Simulace5 500 H [cm] 400 300 200 100 0 0 500 1000 1500 2000 2500 3000 3500 Pořadí vzorů Průběh vodních stavů 500 Měření Trénink 450 400 350 H [cm] 300 250 ; 200 150 100 50 0 0 500 1000 1500 Pořadí vzorů 2000 2500 Průběh vodních stavů 300 Měření Test 250 H [cm] 200 150 100 50 0 0 200 400 600 800 1000 1200 Pořadí vzorů Průběh průtoků 600 Měření Simulace1 Simulace2 Simulace3 Simulace4 Simulace5 500 Q [m3.s-1] 400 300 200 100 0 0 500 1000 1500 2000 -100 Pořadí vzorů 2500 3000 3500 Průběh průtoků 400 Měření Trénink 350 300 200 3 -1 Q [m .s ] 250 150 100 50 0 0 500 1000 1500 2000 2500 -50 Pořadí hodnot Průběh průtoků 50 Měření Test 40 Q [m3.s-1] 30 20 10 0 0 200 400 600 800 1000 1200 -10 Pořadí vzorů Obr. 18-23 Příklady porovnání měřených a předpovídaných vodních stavů a průtoků s předstihem 12 hodin metodou tendence v profilu Lhota Z výše uvedených obrázků lze konstatovat, že RBF sítě jsou vhodným nástrojem pro předpovídání s velmi krátkým časovým předstihem i v případě použití minimálního počtu vstupů. S rostoucím časovým předstihem předpovědí klesá spolehlivost odvozených modelů RBF sítí. Nepříznivě se projevilo dosažení záporných hodnot průtoků v oblasti jejich nízkých hodnot jak při trénování, tak při testování modelů RBF sítí. Tento fakt se projevil pro délku předstihu předpovědi 5 a 12 hodin. Za vhodné se proto považuje provádět veškeré další analýzy za použití vodních stavů s následným převodem na průtoky dle platné měrné křivky průtoků pro řešené období. 5.3. Metoda odpovídajících si průtoků Metoda odpovídajících si průtoků (též metoda korespondujících průtoků) je poměrně jednoduchou metodou, která je založena na sledování naměřených výkyvů vodních stavů, resp. průtoků v horní a dolní stanici a z nich odvozené závislosti postupové doby na průtoku resp. vodním stavu. Pro jednoduchý úsek mezi vstupním a předpovědním profilem platí: QtP+τ = QtZ + ∆qt +τ kde QtP+τ QtZ - odpovídající průtok v předpovědním profil, zvětšený o boční přítok a postupovou dobu τ - průtok ve vstupním profilu v čase t Δq t+τ - přírůstek průtoku z mezipovodí (boční přítok). 5.3.1. Aplikace RBF sítí a výsledky Povodí Radbuza Zájmová lokalita zůstává totožná, jako v předcházejícím případě. Výpočtové schéma bylo následující. Za vstupy bylo použito 5 předchozích hodnot a hodnota vodního stavu v čase t v předpovědním profilu a 20 předchozích hodnot a hodnota vodního stavu v čase t ve vstupním profilu sledovaného úseku. Trénovací matice navíc obsahovala hodnotu předpovídaného vodního stavu v předpovědním profilu s předstihem předpovědi 12 hodin. Takto široký rozsah časových posunů řady vodních stavů ve vstupním profilu byl volen s ohledem na větší rozsah postupových dob mezi obratovými body ve vstupním a předpovědním profilu. V průběhu výpočtu se ukázalo, že model RBF sítě vyžadoval pouze 15 předchozích hodnot vodního stavu ve vstupním profilu místo 20. Zbývající nebyly tedy v modelu využity. Výsledný vztah pro odvozený model lze zapsat ve tvaru: H tP+12 = f ( H tZ−15 ..... H tZ , H tP−5 ..... H tP ) Tab. 4 Statistické posouzení odvozených modelů RBF sítí pro předpověď na 12 hodin Dělení vzorů vlastní Topologie modelu Veličina H 22-457-1 R Train Ep Esm R 0.99 2.9 4.9 0.913 2 2 Test Ep Esm 7.9 10.8 Průběh vodních stavů 500 Měření Trénink 450 400 350 H [cm] 300 250 200 150 100 50 0 0 500 1000 1500 2000 2500 Pořadí vzorů Průběh vodních stavů 250 Měření Test 200 H [cm] 150 100 50 0 0 200 400 600 800 1000 1200 Pořadí vzorů Obr.24-25. Porovnání měřených a předpovídaných vodních stavů s předstihem 12 hodin v profilu Lhota po přidání informace o předchozím průběhu vodních stavů ve vstupním profilu Staňkov –trénink a testování Soutok Mže, Radbuza a Úhlava Toky: Mže, Radbuza a Úhlava Vstupní profily: Hracholusky, České Údolí a Štěnovice Předpovědní profil: Plzeň – Bílá Hora Data: 13 p. vln – 9 trénovacích, 4 testovací Období: 3/1994, 4/1995, 6/1995, 9/1995, 10/1998, 3/2000, 4/2001, 6/2002, 8/2002, 10/2002, 4/2003, 3/2004, 10/2004 Obr.26. Schéma soutoku toků Mže – Radbuza - Úhlava V tomto případě byly obdobně sestaveny matice s časovými posuny vodních stavů ve vstupních profilech oproti času, ve kterém je vydávána předpověď. Počet předchozích hodnot sledované veličiny byl odhadnut dle vzdálenosti vstupních profilů od předpovědního profilu. Vzhledem k neznalosti přesného vztahu mezi postupovými dobami mezi profily byl volen širší interval časových posunů. Posouzení jejich významu a jejich případná filtrace z výpočtového schématu kalibrovaného modelu RBF sítě bylo předmětem trénování a testování. Odvozené předpovědní modely RBF sítí lze zapsat ve tvaru pro: BH H H CU CU S S Předpověď 1 hodina H t +1 = f ( H t − 21 .....H t , H t − 7 .....H t , H t −17 .....H t ) BH H H CU CU S S Předpověď 2 hodiny H t + 2 = f ( H t − 20 .....H t , H t −6 .....H t , H t −16 .....H t ) BH H H CU CU S S Předpověď 4 hodiny H t + 4 = f ( H t −18 .....H t , H t −4 .....H t , H t −14 .....H t ) Předpověď 6 hodin H H CU CU H tBH , H tS−12 ..... H tS ) + 6 = f ( H t −16 ..... H t , H t − 3 ..... H t kde BH H CU S - vodoměrná stanice (profil) Plzeň – Bílá Hora - vodoměrná stanice (profil) Hracholusky - vodoměrná stanice (profil) České Údolí - vodoměrná stanice (profil) Štěnovice Tab. 5 Statistické posouzení odvozených modelů RBF sítí Předpověď t+1 t+1_přetrénování t+2 t+4 t+6 Veličina H H H H H Topologie modelu 48-245-1 48-831-1 43-133-1 39-145-1 34-219-1 R 2 0.987 0.998 0.990 0.989 0.988 Train Ep Esm R 4.4 2.1 5.0 5.2 5.4 9.0 3.7 7.9 8.5 8.8 0.936 0.790 0.949 0.942 0.923 2 Test Ep 6.3 13.3 6.0 6.5 7.3 Esm 10.7 18.9 9.4 10.1 11.7 Průběh vodních stavů - trénink 900 Měření Předpověď 1 hod. Předpověď 1 hod. - přetrénování Předpověď 2 hod. Předpověď 4 hod. Předpověď 6 hod. 800 700 H [cm] 600 500 400 300 200 100 0 0 1000 2000 3000 4000 Pořadí vzorů 5000 6000 7000 Průběh vodních stavů - test 350 Měření Předpověď 1 Předpověď 1 Předpověď 2 Předpověď 4 Předpověď 6 300 H [cm] 250 hod. hod.- přetrénování hod. hod. hod. 200 150 100 50 0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 Pořadí vzorů Obr. 27-28. Porovnání měřených a předpovídaných hodnot vodních stavů pro předpovědi na 1, 2, 4 a 6 hodin v profilu Bílá Hora - testování 5.4. Hydrometeorologické předpovědi Hydrometeorologické předpovědi umožňují tím, že berou v úvahu i spadlé srážky, delší časový předstih, než předpovědi hydrometrickými metodami – metodou tendencí a metodou odpovídajících si průtoků. Prodloužení spočívá v získání doby, která je zapotřebí k doběhu srážkové vody do koryt toků. Cílem řešení bylo v tomto případě odvození a posouzení spolehlivosti předpovědních srážkoodtokových modelů neuronových sítí – RBF sítí a porovnání výsledků simulací pro určitý předstih předpovědi s výsledky řešení metodami hydrometrickými. 5.4.1. Aplikace RBF sítí a výsledky Do výpočtového schématu vstupovali kromě hydrologických údajů i hodnoty hodinových průměrů srážkového úhrnu spadlého na mezipovodí Radbuzy-viz. kap. 5.2.1. Údaje o srážkových úhrnech byly vypočítány pomocí GIS Arcwiew 3.2. Řešené výpočtové schéma lze zapsat ve tvaru ST MP MP L L H tL+12 = f ( H tST −15 .....H t , it −30 .....it +12 , H t −5 .....H t ) kde ST MP - vodoměrná stanice (profil) Staňkov - mezipovodí Radbuzy L - vodoměrná stanice (profil) Lhota Průběh vodních stavů 600 Měření Trénink 500 H [cm] 400 300 200 100 0 0 500 1000 1500 2000 2500 Pořadí vzorů Průběh vodních stavů 250 Měření Test 200 H [cm] 150 100 50 0 0 200 400 600 800 1000 1200 Pořadí vzorů Obr.29-30. Porovnání měřených a předpovídaných vodních stavů s předstihem 12 hodin v profilu Lhota po přidání další informace o předchozích a budoucích (předpovídaných) průměrných hodinových srážkových úhrnech spadlých na mezipovodí Radbuzy 6. Závěr Prokázány výhody aplikace neuronových sítí při řešení předpovědí hydrometrickými metodami v jednoduchých i složitějších říčních systémech. S rostoucím předstihem předpovědi roste počet požadovaných vstupů pro odvození spolehlivého modelu neuronových sítí. Při řešení předpovědi na 12 hodin se příznivě projevilo přidání informace o předchozích hodnotách vodních stavů ve vstupním profilu, kde se schopnost předpovídání metodou tendence výrazně zhoršila. V oblasti nízkých hodnot průtoků byly modelovány jejich záporné hodnoty, což je nereálné. Proto byly v dalších výpočtech vždy uvažovány vodní stavy. Prokázán nepříznivý vliv extrapolace měrných křivek průtoků na spolehlivost odvozených modelů. Prokázán předpoklad, že rozdělení vstupních vzorů do skupin má vliv na počet neuronů ve skryté vrstvě a spolehlivost odvozeného modelu. Průběžné výsledky řešení hydrometeorologických předpovědí bude třeba zpřesňovat dalšími pokusy se snahou stanovit vhodnější skladbu časových posunů hodnot plošného srážkového úhrnu oproti času, ve kterém je vydávána předpověď. V neposlední řadě bude cílem dalšího výzkumu provést analýzu vlivu dalších vybraných faktorů na srážkoodtokový proces v zájmovém povodí. 7. Literatura Fošumpaur P.: Použití umělých neuronových sítí ve vodním hospodářství. Doktorská disertační práce, ČVUT Praha, 1998, 143 s. Hladný, J.: Hydrologická prognóza. ČHMÚ, Praha, 1972, 111 s. Nacházel K., Starý M., Zezulák J a kol.: Využití metod umělé inteligence ve vodním hospodářství, Academia, nakladatelství Akademie věd České republiky, 2004, 301 s. Polách D.: Použití neuronových sítí pro operativní předpovědi říčních průtoků. Diplomová práce. ČVUT Fsv, Praha, 2001 Robert J. Abrahart, Pauline E. Kneale and Linda M. See: Neural Networks for hydrological modeling. A. A. Balkema Publishers, a member of Taylor and Francis Group plc, London, 2004. Starý M.: Užití umělých neuronových sítí v aplikované hydrologii. Habilitační práce.VUT FAST, Brno, 2004 Šnorek M., Jiřina M.: Neuronové sítě a neuropočítače, Nakladatelství ČVUT, 1998, 124 s. Varoonchotikul Pichaild: Flood Forecasting using Artificial Neural Networks. A. A. Balkema Publishers, a member of Swetst Zeitliner Publishers, Lisse, The Netherlands, 2003
Podobné dokumenty
Výzkum a činnost katedry vodního hospodářství a
jmenovaného neuronu je vypočtená hodnota předpovědi. Všechny neurony v každé vrstvě jsou spojeny se všemi neurony následující vrstvy. Výše
zmíněné základní stavební prvky sítě (neurony) fungují jak...
Model proudové vektorové regulace asynchronního motoru pro
hlásí Scicos chybu2. Pokud jsou porty číslovány správně, po překliknutí do nadřazeného schématu
se u Super bloku objeví přesně takové počty kontaktů (šipek), jaké jsou definovány v bloku.
Stejně ja...
Změny podnebí - EnviMod
Podrobné poznání podnebí vyžaduje kvalitní a dlouhodobá měření meteorologická, která však
většinou nemáme. Je to dáno tím, že teprve od sedmnáctého století nastává postupný rozvoj
přístrojové techn...
Diplomová práce
3.1.4 Koncepční modely (“grey box“)
Pro tyto modely je typické formulovat jednotlivé části hydrologického cyklu
nebo cyklus jako celek matematickými vztahy. Jedná se o modely konceptuální,
odrážejí...
Možné dopady klimatické změny na vodní zdroje
hydrologické bilance vodohospodářskými operacemi v povodí. Pro tyto
potřeby je možno aplikovat simulační model vodohospodářských soustav
a jako jeho vstupy využít výsledné neovlivněné řady z Bilanu.
šablona zprávy - CityPlan spol. s r.o.
Tato příručka nenahrazuje technickou normu nebo technické podmínky. Lze ji chápat jako jejich
doplnění a rozšíření, a to zejména v případech, které jsou mimořádně vhodné pro aplikaci mikroskopickýc...
hydrologie - Rozšíření akreditace studia učitelské geografie na PřF
Úvod
Vážení studenti, do rukou se Vám dostává pracovní verze studijního textu Základy fyzické geografie 1 –
Hydrologie. Tento text je vytvořen v souladu se zásadami pro tvorbu distančních studijní...