Rozhodovací stromy
Transkript
Dobývání znalostí z databází T9: genetické algoritmy Evoluční algoritmy Použítí evoluční principů, založených na metodách optimalizace funkcí a umělé inteligenci, pro hledání řešení nějaké úlohy. Populace – množina jedinců, potenciálních řešení Fitness function – hodnocení kvality jedince Genetické operátory – selekce, křížení, mutace Genetický algoritmus(fit,N,K,M) Inicializace 1. přiřaď t:= 0 (počítadlo generací) 2. náhodně vytvoř populaci P(t) velikosti N 3. urči hodnoty funkce fit pro každého jedince v P(t) Hlavní cyklus 1. dokud není splněna podmínka pro zastavení 1.1. proveď selekci: 1.1.1. vyber z P(t) jedince kteří se přímo přenesou do P(t+1) 1.2. proveď křížení: 1.2.1. vyber z P(t) jedince určené k reprodukci 1.2.2. aplikuj na každou dvojci [h1,h2] z výběru operaci křížení 1.2.3. zařaď potomky do P(t+1) 1.3. proveď mutaci: 1.3.1. vyber jedince z P(t+1) určené k mutaci 1.3.2. aplikuj na každé vybrané h operaci mutace 1.4. přiřaď t:= t + 1 (nová populace má opět velikost N) 1.5. spočítej pro každé h P(t) hodnotu fit(h) 2. vrať hypotézy h s nejvyšší hodnotu fit(h) Podmínka zastavení počet iterací kvalita nejlepšího jedince v populaci změna kvality nejlepšího jedince mezi iteracemi P. Berka, 2011 1/8 Dobývání znalostí z databází Selekce (1 – K) ruletové kolo T9: genetické algoritmy N jedinců přímo pravděpodobnost, že bude vybrán jedinec h je úměrná poměru fit(h) , i fit(hi) pořadová selekce nejprve jsou jedinci v populaci uspořádáni podle hodnoty fit, selekce se pak provádí na základě pravděpodobnosti, která je úměrná pořadí jedince v tomto uspořádání, turnajová selekce nejprve se náhodně vyberou dva jedinci, s předefinovanou pravděpodobností p se pak vybere jedinec s vyšší hodnotou fit, s pravděpodobností 1-p se vybere jedinec s nižší hodnotou fit. Křížení K N dvojic 2 jednobodové 111010010 111000101 000100101 000110010 dvoubodové Mutace 111010010 111000100 000100101 000110011 M N jedinců 111010010 P. Berka, 2011 111011010 2/8 Dobývání znalostí z databází T9: genetické algoritmy GA Demo (Obitko, 1998) počáteční populace selekce P. Berka, 2011 3/8 Dobývání znalostí z databází T9: genetické algoritmy křížení mutace P. Berka, 2011 4/8 Dobývání znalostí z databází T9: genetické algoritmy GA pro učení se konceptům paralelní náhodné prohledávání GABIL (deJong, 1993) Jedinci jsou pravidla: If konto(nízké) příjem(nízký) If konto(vysoké) then úvěr(ne) then úvěr(ano) 100 10 01 001 11 10 zpřesnění základního algoritmu 1. funkce fit(h) je druhou mocninou správnosti klasifikace fit(h) = ( a )2, a+b 2. počet jedinců v populaci je mezi 100 a 1000 v závislosti na konkretní úloze, 3. parametr K vyjadřující podíl křížení má hodnotu 0.6, 4. parametr M vyjadřující podíl mutací má hodnotu 0.001, 5. použitý operátor křížení je rozšířením výše uvedeného dvoubodového křížení; provedené rozšíření umožňuje křížit řetězce různých délek, 6. mutace je použita tak, jak je uvedeno výše. P. Berka, 2011 5/8 Dobývání znalostí z databází T9: genetické algoritmy GA jako součást jiných algoritmů učení GA-CN4 (Bruha, Kralik, 1999) – algoritmus pokrývání množin, pravidlo se generuje pomocí GA procedure GA-CN4(T) Let ListOfRules be an empty list Until T is empty do 1. Let Cond be the best condition found by the genetic algorithm GA(T) for the given set T 2. If Cond is not nil then Let T' T be examples covered by Cond Let T become T \ T' Add the rule If Cond then class is C to the end of ListOfRules where C is the majority class in T' enddo Add the default rule If true then class is majority class to the end of ListOfRules Return ListOfRules procedure GA(T) Initialize randomly a new population Until stopping condition is satisfied do 1. Select objects by tournament selection routine 2. Generate offsprings by two-point crossover procedure 3. Perform the bit mutation 4. Check whether each new object has the correct attribute and class values (within their ranges); if not the object's fitness is set to 0 enddo Select the fittest object (rule) If this objet is statistically significant then return this object P. Berka, 2011 6/8 Dobývání znalostí z databází T9: genetické algoritmy GA jako nástroj pro optimalizaci parametrů GA pro optimalizaci nastavení neuronové sítě GA pro hledání topologie bayesovské sítě (Weka) GA pro selekci atributů (Weka) P. Berka, 2011 7/8 Dobývání znalostí z databází T9: genetické algoritmy Genetické programování jedinci jsou funkce + sin + x ^ x y 2 Stromová (prefixová) reprezentace funkce sin(x) + (x2+y) Křížení dvou stromů P. Berka, 2011 8/8
Podobné dokumenty
5.5 Evoluční algoritmy
tohoto řešení vyjádřená pomocí funkce fit (fitness function). V případě učení se konceptům je touto
funkcí např. přesnost jedince (hypotézy) při klasifikaci, v případě hledání extrému nějaké funkce...
slajdy - Sorry
V případě uspořádaných pravidel (rozhodovacího seznamu) se
hledají pravidla ke všem třídám najednou
Algoritmus CN4 – rozhodovací seznam
1. nechť ListOfRules je prázdný seznam
2. dokud trénovací mno...
Návod k instalaci a uvedení do provozu (česky)
1. Odstraňte kryt baterie a vložte baterie dodané spolu s výrobkem (2x AA LR6 alkalické baterie).
nebo
PLAY pin, tune, LED_mask (jen pro PICAXE řady M2)
Pin – konstanta, označující I/O kontakt. U osmipinových PICAXE je pevně určen vývod C.2.
Tune – proměnná nebo konstanta, určující, která melodie se zahraje
Návrh na zrušení části zákona č. 202/1990 Sb., o loteriích a jiných
Lokální loterijní systém (dále jen „LLS“) je vícemístné herní zařízení. Objektově je LLS 3
nábytkové kabinety, zapojené sériově. Každý kabinet je samostatně vybavený počítačovým
hardwarem a softwar...