Počítačové vidění - Vysoké učení technické v Brně
Transkript
FAKULTA ELEKTROTECHNIKY A KOMUNIKA NÍCH TECHNOLOGIÍ VYSOKÉ U ENÍ TECHNICKÉ V BRN Po íta ové vid ní Ing. Karel Horák, Ph.D. Ing. Ilona Kalová, Ph.D. Ing. Petr Petyovský Ing. Miloslav Richter, Ph.D. Brno 16.4. 2008 2 FEKT Vysokého u ení technického v Brn Obsah 1 ÚVOD...........................................................................................................................10 2 ZA AZENÍ P EDM TU VE STUDIJNÍM PROGRAMU (HORÁK)....................11 2.1 ÚVOD DO P EDM TU ..................................................................................................11 2.2 VSTUPNÍ TEST ............................................................................................................12 3 APLIKACE PO ÍTA OVÉHO VID NÍ (RICHTER) ............................................13 3.1 3.2 3.3 3.4 3.5 4 MOTIVACE .................................................................................................................13 SYSTÉM PO ÍTA OVÉHO VID NÍ .................................................................................14 P EHLED ÚLOH PO ÍTA OVÉHO VID NÍ ......................................................................15 ZKRESLENÍ KAMER.....................................................................................................15 MOTIVA NÍ P EHLED APLIKACÍ ..................................................................................17 REPREZENTACE A VLASTNOSTI OBRAZOVÝCH DAT (PETYOVSKÝ) .......22 4.1 4.2 4.3 4.4 REPREZENTACE OBRAZOVÝCH DAT.............................................................................22 REPREZENTACE DVOUROZM RNÉHO SYSTÉMU ............................................................22 2D DIRACOVA FUNKCE A ROZPTYLOVÁ FUNKCE (PSF)................................................23 PODMÍNKY DIGITALIZACE 2D OBRAZOVÉ FUNKCE .......................................................24 4.4.1 Interval vzorkování .................................................................................24 4.4.2 Volba vzorkovací m ížky .........................................................................24 4.4.3 Kvantování hodnot obrazové funkce........................................................25 4.5 REPREZENTACE DISKRÉTNÍHO OBRAZU JAKO 1D/2D SIGNÁLU .....................................25 4.6 KONVOLU NÍ INTEGRÁL PRO DISKRÉTNÍ SYSTÉMY ......................................................26 4.7 LINEÁRNÍ FILTRACE OBRAZU V SIGNÁLOVÉ OBLASTI ...................................................27 4.7.1 Vyhlazování šumu v obraze .....................................................................27 4.7.2 Realizace diskrétního operátoru pro pr m rování...................................27 4.7.3 Detekce hran v obraze.............................................................................28 4.7.4 Operace ost ení obrazu...........................................................................31 5 BARVY V PO ÍTA OVÉ GRAFICE (PETYOVSKÝ) ...........................................32 5.1 5.2 5.3 5.4 5.5 5.6 5.7 6 BAREVNÉ MODELY .....................................................................................................32 ADITIVNÍ MODELY RGB, RGBA ................................................................................32 SUBSTRAKTIVNÍ MODELY CMY, CMYK ....................................................................32 BAREVNÝ MODEL H,S,V ............................................................................................33 BAREVNÝ MODEL H,L,S.............................................................................................33 MODELY PRO TELEVIZNÍ A VIDEO TECHNIKU YUV ......................................................34 CHROMATICKÝ DIAGRAM XYZ-CIE...........................................................................34 5.7.1 Pravidla pro tvorbu barev v chromatickém diagramu..............................35 5.7.2 D sledky plynoucí z chromatického diagramu.........................................35 P EDZPRACOVÁNÍ OBRAZU A SEGMENTACE (KALOVÁ)............................37 6.1 SNÍMÁNÍ OBRAZU.......................................................................................................37 6.2 P EDZPRACOVÁNÍ OBRAZU ........................................................................................38 Zkreslení...............................................................................................................38 6.2.1 Bodové jasové transformace....................................................................39 6.2.2 Geometrické transformace ......................................................................40 Po íta ové vid ní 3 6.2.3 6.2.4 6.2.5 Lokální operace p edzpracování .............................................................41 Restaurace obrazu ..................................................................................44 Matematická morfologie .........................................................................45 6.3 SEGMENTACE OBRAZU ...............................................................................................45 6.3.1 Segmentace prahováním .........................................................................45 6.3.2 Segmentace na základ hran ...................................................................46 6.3.3 Segmentace nar stáním oblastí ...............................................................48 6.3.4 Segmentace srovnáním se vzorem ...........................................................49 6.3.5 Sub-pixelové ur ení hranice....................................................................49 7 INTEGRÁLNÍ TRANSFORMACE OBRAZU (RICHTER) ....................................50 7.1 7.2 7.3 7.4 8 FORMÁTY KOMPRESE (PETYOVSKÝ)................................................................51 8.1 8.2 8.3 8.4 8.5 8.6 8.7 8.8 8.9 9 FOURIÉROVA TRANSFORMACE ....................................................................................50 RYCHLÁ FOURIÉROVA TRANSFORMACE ......................................................................50 DISKRÉTNÍ KOSINOVÁ TRANSFORMACE.......................................................................50 WAVELETOVÁ TRANSFORMACE ..................................................................................50 ROZD LENÍ ZOBRAZOVACÍCH MÉDII ...........................................................................51 REPREZENTACE GRAFIKY V PAM TI PO ÍTA E ............................................................51 RASTROVÉ ZOBRAZENÍ ...............................................................................................52 VEKTOROVÉ ZOBRAZENÍ ............................................................................................52 KOMPRESE RASTROVÉHO OBRAZU ..............................................................................53 8.5.1 Komprese RLE........................................................................................53 8.5.2 Komprese LZ77/LZW ..............................................................................54 8.5.3 Huffmanova kompresní metoda ...............................................................54 8.5.4 Diskrétní kosinová transformace (DCT)..................................................55 GRAFICKÉ FORMÁTY ..................................................................................................56 8.6.1 Formát PCX ...........................................................................................56 8.6.2 Formát GIF ............................................................................................56 8.6.3 Formát PNG ...........................................................................................56 8.6.4 Formát .JPEG.........................................................................................56 8.6.5 Formát TIFF...........................................................................................57 KOMPRESE DIGITÁLNÍHO VIDEA..................................................................................58 8.7.1 Bezeztrátové kompresní metody...............................................................58 8.7.2 Ztrátové kompresní metody .....................................................................58 STANDARDY DIGITÁLNÍHO VIDEA ...............................................................................58 8.8.1 MPEG-1 .................................................................................................58 8.8.2 MPEG-2 .................................................................................................59 8.8.3 MPEG-4 .................................................................................................60 P ÍKLADY FORMÁT DIGITÁLNÍHO VIDEA ...................................................................60 8.9.1 DivX 3.11a Alpha....................................................................................60 8.9.2 DivX 5.x..................................................................................................61 8.9.3 XviD .......................................................................................................61 8.9.4 MJPEG...................................................................................................61 8.9.5 ASF.........................................................................................................61 8.9.6 QuickTime ..............................................................................................61 8.9.7 VCD (video CD), SVCD (super video CD) ..............................................61 8.9.8 DVD (digital versatile disc) ....................................................................62 8.9.9 Blue-Ray, HD DVD, VMD ......................................................................62 MORFOLOGIE OBRAZU (HORÁK) .......................................................................63 4 FEKT Vysokého u ení technického v Brn 10 DETEKCE A PARAMETRIZACE GEOMETRICKÝCH TVAR (KALOVÁ) ....64 10.1 HOUGHOVA TRANSFORMACE ......................................................................................64 10.1.1 Detekce p ímek .......................................................................................64 10.1.2 Detekce kružnic.......................................................................................66 10.1.3 Zobecn ná Houghova transformace ........................................................66 10.2 DALŠÍ SEGMENTA NÍ METODY....................................................................................67 10.2.1 Vypl ování oblastí ..................................................................................67 10.2.2 Vypl ování geometricky ur ené hranice – ádkové vypl ování................67 10.2.2.2 Barvení oblastí........................................................................................69 10.2.3 Aktivní kontury (snakes, active contours) ................................................70 10.2.4 Level-set .................................................................................................70 10.2.5 Watershed ...............................................................................................71 10.2.6 Shluková analýza ....................................................................................72 10.3 ÚPRAVY OBRAZU .......................................................................................................72 10.3.1 Transformace barev – omezení barevného prostoru ................................72 10.3.2 Barevný Šedo-tónový..........................................................................72 10.3.3 Šedo-tónový binární ...........................................................................73 10.3.4 Geometrické transformace obrazu...........................................................74 11 KLASIFIKÁTORY A AUTOMATICKÉ T ÍD NÍ (PETYOVSKÝ)......................78 11.1 POJMY .......................................................................................................................78 11.2 ROZD LENÍ KLASIFIKÁTOR :......................................................................................80 11.3 LINEÁRNÍ KLASIFIKÁTOR ............................................................................................80 11.4 BAYES V KLASIFIKÁTOR............................................................................................82 11.5 ZLEPŠENÍ P ESNOSTI KLASIFIKACE – BOOSTING ..........................................................84 11.6 MARKOVOVY MODELY ...............................................................................................86 11.7 SKRYTÉ MARKOVOVY MODELY (HMM).....................................................................86 11.8 PRINCIPAL COMPONENTS ANALYSIS (PCA, LDA)........................................................87 12 POPIS OBJEKT (HORÁK) .....................................................................................89 12.1 CO SE ROZUMÍ POPISEM OBJEKTU? ..............................................................................89 12.2 P ÍPRAVA OBRAZU PRO POPIS .....................................................................................90 12.3 P ÍZNAKOVÝ VEKTOR ................................................................................................91 12.4 D LENÍ P ÍZNAK ......................................................................................................92 12.5 IDENTIFIKACE OBLASTÍ ..............................................................................................93 12.6 RADIOMETRICKÉ DESKRIPTORY ZALOŽENÉ NA REGIONECH ..........................................94 12.7 RADIOMETRICKÉ DESKRIPTORY ZALOŽENÉ NA HRANICÍCH ..........................................98 12.8 FOTOMETRICKÉ DESKRIPTORY ....................................................................................99 12.9 GEOMETRICKÉ MOMENTY A MOMENTOVÉ INVARIANTY .............................................100 13 LOKÁLNÍ P ÍZNAKY A KORESPONDENCE (HORÁK)...................................102 14 STROJOVÉ U ENÍ (HORÁK)................................................................................103 14.1 KLASIFIKACE P ÍZNAK OBRAZU .............................................................................103 14.2 NEURONOVÉ SÍT PRO KLASIFIKACI OBRAZU .............................................................104 14.2.1 Model neuronu......................................................................................105 14.2.2 U ení ....................................................................................................106 14.2.3 Aproximátory – aproxima ní klasifikátory ............................................107 14.2.4 Asociativní pam ti – Hopfieldova sí .....................................................107 14.2.5 Realizovatelnost klasifikátoru ...............................................................108 Po íta ové vid ní 5 14.3 KLASIFIKA NÍ ÚLOHY ..............................................................................................109 14.3.1 Klasifikace obrazu íslice......................................................................109 14.3.2 Klasifikace obrazu vady ........................................................................110 14.3.3 Klasifikace obraz znak ......................................................................111 15 ANALÝZA DYNAMICKÝCH OBRAZ (HORÁK).............................................. 114 15.1 POHYB V OBRAZE.....................................................................................................114 15.2 OBRAZOVÁ SEKVENCE .............................................................................................115 15.3 ANALÝZA POHYBU ...................................................................................................117 15.4 ROZDÍLOVÉ METODY................................................................................................118 15.5 ESTIMACE MODELU PROST EDÍ.................................................................................121 15.6 OPTICKÝ TOK...........................................................................................................123 15.7 DETEKCE VÝZNAMNÝCH BOD .................................................................................124 15.8 KOMPRESE VIDEA ....................................................................................................125 15.9 METODA RANSAC .................................................................................................126 16 DODATKY ................................................................................................................ 129 16.1 VSTUPNÍ TEST ..........................................................................................................129 16.1.1 Vstupní test – zadání .............................................................................129 16.1.2 Vstupní test – ešení ..............................................................................129 16.2 OBRAZOVÁ GALERIE ................................................................................................130 17 SEZNAM POUŽITÉ LITERATURY....................................................................... 131 6 FEKT Vysokého u ení technického v Brn Seznam obrázk OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. 3.1. PROJEKCE TROJROZM RNÝCH DAT ULTRAZVUKU, JASOVÁ SLOŽKA P EDSTAVUJE HUSTOTU ................13 3.2. OBRAZ ROZLOŽENÍ TEPLOTY V PSEUDO-BARVÁCH .............................................................................13 3.3. ZM NA VZHLEDU OBJEKTU SE ZM NOU SV TLA VLIVEM POHYBU ODRAZU..........................................14 3.4. SNÍMANÝ OBRAZ (VLEVO) A ZVÝRAZN NÍ RYS POMOCÍ HRANOVÉHO DETEKTORU (VPRAVO) .............14 3.5. HOUGHOVA TRANSFORMACE OBRAZU (VLEVO) A HRANY VYBRANÉ POMOCI MAXIM HT......................15 3.6. NEJEDNOZNA NOST ÚLOHY ROZPOZNÁVÁNÍ .....................................................................................15 3.7. GEOMETRICKÉ ZKRESLENÍ SNÍMACÍ SOUSTAVY ..................................................................................16 3.8. K IVKY ZKRESLENÍ POSUNU O JEDEN PIXEL V X A Y ............................................................................16 3.9. ROZLOŽENÍ VELIKOSTI CHYB VE SM RU X V PLOŠE PRO 6 PARAMETR A PRO M ÍTKO ........................16 3.10. AZENÍ DESTI EK Z TVRDOVKOVU ..................................................................................................17 3.11. SNÍMEK OCELOVÉ TY KY P I TAHOVÉ ZKOUŠCE ..............................................................................17 3.12. SNÍMEK VOZIDLA PRO KONTROLU RYCHLOSTI ..................................................................................18 3.13. SNÍMEK SVAR Z PR MYSLOVÉ KAMERY .........................................................................................19 3.14. SNÍMEK HRDLA (VLEVO) A DNA LÁHVE (VPRAVO) ............................................................................19 3.15. VÝ EZ SNÍMKU PRO DETEKCI PROFILU (VLEVO) A SNÍMACÍ HLAVA (VPRAVO)....................................19 3.16. SNÍMEK ZE STEREO-PÁRU (VLEVO) A DRÁTOVÝ MODEL REKONSTRUOVANÉ SCÉNY (VPRAVO) ............20 3.17. REKONSTRUOVANÝ MODEL VRAT ....................................................................................................20 3.18. M ENÁ KAPKA S NASVÍCENÝM VZOREM (VLEVO) A PRINCIP M ENÍ (VPRAVO) ...............................21 3.19. INTERFEREN NÍ OBRAZEC MOIRE METODY ......................................................................................21 3.20. VSTUPNÍ SNÍMEK SPEKLY (VLEVO), YOUNGOVY PROUŽKY P ED A PO FILTRACI (UPROST ED) A EZY PRO DETEKCI PARAMETR DRSNOSTI POVRCHU ( VPRAVO).........................................................................21 4.1. TYPY VZORKOVACÍCH M ÍŽEK ..........................................................................................................24 4.2. FILTRACE OBRAZU (A) S ŠUMEM (B) MASKOU 3X3 (C) A MASKOU 5X5 (D) ...........................................27 4.3. FILTRACE OPERÁTOREM DIFERENCE PRVNÍHO ÁDU...........................................................................29 4.4. APLIKACE LAPLACEOVA OPERÁTORU ................................................................................................31 4.5. APLIKACE LAPLACEOVA OPERÁTORU PRO OST ENÍ ............................................................................31 4.6. APLIKACE LAPLACEOVA A LOG OPERÁTORU .....................................................................................31 5.1. BAREVNÉ SPEKTRUM ........................................................................................................................32 5.2. RGB KRYCHLE .................................................................................................................................32 5.3. CMY KRYCHLE ................................................................................................................................33 5.4. BAREVNÝ MODEL HSV.....................................................................................................................33 5.5. BAREVNÝ MODEL HLS .....................................................................................................................34 5.6. CHROMATICKÝ DIAGRAM .................................................................................................................35 5.7. DOPL KOVÉ BARVY V CHROMATICKÉM DIAGRAMU ...........................................................................35 5.8. OMEZENÍ BAREVNÉHO GAMUTU TECHNICKÝCH ZA ÍZENÍ ...................................................................36 6.1. SEKVENCE ÚKON ZPRACOVÁNÍ OBRAZU ..........................................................................................37 6.2. RADIÁLNÍ ZKRESLENÍ A) SOUDEK, B) PODUŠKA, C) NATO ENÍ DETEKTORU ..........................................38 6.3. P VODNÍ SNÍMEK, SNÍMEK POZADÍ, SNÍMEK ZA TMY, OBRAZ PO KOREKCI ............................................39 6.4. TRANSFORMACE JASOVÉ STUPNICE ...................................................................................................39 6.5. P VODNÍ A EKVALIZOVANÝ OBRÁZEK S HISTOGRAMEM .....................................................................40 6.6. GEOMETRICKÉ TRANSFORMACE ........................................................................................................40 6.7. JASOVÁ TRANSFORMACE ..................................................................................................................41 6.8. KONVOLUCE OBRÁZKU S MASKOU.....................................................................................................41 6.9. GAUSSOVO ROZLOŽENÍ SE ST EDEM V (0,0) A =1 A ODPOVÍDAJÍCÍ MASKA 5X5..................................42 6.10. ROTUJÍCÍ MASKY ............................................................................................................................43 6.11. UR ENÍ PRAHU Z HISTOGRAMU .......................................................................................................46 6.12. SLEDOVÁNÍ HRANIC V OSMI-OKOLÍ..................................................................................................46 6.13. GENEROVÁNÍ ORIENTOVANÉHO GRAFU, RELAXACE HRAN ................................................................47 6.14. DEFINICE HRAN PRO RELAXACI .......................................................................................................47 6.15. SPOJOVÁNÍ OBLASTÍ .......................................................................................................................48 6.16. ŠT PENÍ A SPOJOVÁNÍ .....................................................................................................................49 6.17. SUB-PIXELOVÉ UR ENÍ HRANY ........................................................................................................49 8.1. OBRAZOVÁ FUNKCE V PAM TI PO ÍTA E ...........................................................................................51 8.2. BAREVNÝ RASTROVÝ OBRAZ - BITPLÁN .............................................................................................52 8.3. BAREVNÝ RASTROVÝ OBRAZ – BAREVNÁ PALETA ..............................................................................52 8.4. VEKTOROVÁ REPREZENTACE OBRAZU ...............................................................................................52 Po íta ové vid ní OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. 7 8.5. KOMPRESE METODOU RLE .............................................................................................................. 53 8.6. HUFFMANOVO KÓDOVÁNÍ ................................................................................................................ 55 8.7. KOMPRESNÍ METODA JPEG.............................................................................................................. 57 10.1. REPREZENTACE P ÍMKY V PROSTORU (X,Y) A PROSTORU (K,Q) ........................................................ 64 10.2. REPREZENTACE P ÍMKY V PROSTORU (X,Y) A PROSTORU ( ,R)......................................................... 65 10.3. ORIGINÁLNÍ SNÍMEK A SNÍMEK HRAN JAKO VSTUP HT ..................................................................... 65 10.4. HOUGH V PROSTOR MAXIM A P VODNÍ SNÍMEK S NALEZENÝMI P ÍMKAMI ...................................... 65 10.5. DETEKCE KRUHOVÝCH OBJEKT (R=50 PXL) POMOCÍ HT ................................................................ 66 10.6. POPIS HRANICE OBECNÉHO TVARU POLOHOVÝMI VEKTORY ............................................................. 66 10.7. SESTAVOVÁNÍ HOUGHOVA PROSTORU ............................................................................................ 66 10.8. GEOMETRICKY UR ENÁ HRANICE OBJEKTU ..................................................................................... 67 10.9. KROKY 1A, 1B A 1C ALGORITMU VYPL OVÁNÍ OBLASTI................................................................... 67 10.10. KROKY 2A, 2B+C A 3 ALGORITMU VYPL OVÁNÍ OBLASTI............................................................... 68 10.11. SEMÍNKOVÉ VYPL OVÁNÍ – PO ÁTE NÍ BODY............................................................................... 68 10.12. POSTUP ÁDKOVÉHO SEMÍNKOVÉHO VYPL OVÁNÍ ........................................................................ 69 10.13. SLEDOVANÉ PIXELY PRO 4 OKOLÍ A 8 OKOLÍ .................................................................................. 69 10.14. KOLIZE BAREV 4 OKOLÍ ................................................................................................................ 69 10.15. P ÍKLADY KOLIZNÍCH OBJEKT .................................................................................................... 69 10.16. P VODNÍ A PRAHOVANÝ OBRAZ (VLEVO), PRVNÍ A DRUHÝ PR CHOD ALGORITMU (VPRAVO)........... 70 10.17. AKTIVNÍ KONTURY – PO ÁTE NÍ STAV, STANDARDNÍ POSTUP A MODIFIKOVANÁ VERZE .................. 70 10.18. LEVEL-SET FUNKCE PRO UZAV ENOU 2D K IVKU C ...................................................................... 71 10.19. PO ÁTE NÍ, PR B ŽNÝ A KONCOVÝ STAV SEGMENTACE METODOU LEVEL-SET .............................. 71 10.20. ÁRY REPREZENTUJÍCÍ HRÁZE (WATERSHED LINES)....................................................................... 71 10.21. P ÍKLAD SHLUKOVÁNÍ DVOU P ÍZNAK VE 2D PROSTORU............................................................. 72 10.22. DETEKCE REGISTRA NÍCH ZNA EK POMOCÍ SHLUKU VERTIKÁLNÍCH AR ....................................... 72 10.23. P EVOD BAREVNÉHO OBRAZU NA ŠEDO-TÓNOVÝ .......................................................................... 73 10.24. R,G A B SLOŽKY BAREVNÉHO OBRAZU ......................................................................................... 73 10.25. PRAHOVANÝ ŠEDO-TÓNOVÝ SNÍMEK A SNÍMKY HRAN (SOBEL, CANNY) ......................................... 73 10.26. NÁHODNÉ ROZPTÝLENÍ, MATICOVÉ ROZPTÝLENÍ ........................................................................... 74 10.27. ZM NA ROZLIŠENÍ........................................................................................................................ 75 10.28. OKÉNKO VYTY UJÍCÍ OBLAST PRO O EZÁNÍ .................................................................................. 76 10.29. O EZÁVÁNÍ OBDÉLNÍKU – POSTUP ................................................................................................ 77 10.30. O EZÁVÁNÍ OBDÉLNÍKU – VÝSLEDEK ........................................................................................... 77 11.1. P ÍSTUP KLASICKÉHO ZPRACOVÁNÍ DAT (VLEVO) A STROJOVÉ KLASIFIKACE (VPRAVO) .................... 78 11.2. VSTUPY A VÝSTUPY KLASIFIKÁTORU .............................................................................................. 79 11.3. KOMPLETNÍ A KONZISTENTNÍ MODEL ZNALOSTÍ .............................................................................. 79 11.4. P ETRÉNOVÁNÍ (OVER-FITTING) KLASIFIKÁTORU ............................................................................ 80 11.5. LINEÁRN SEPARABILNÍ PROSTOR P ÍZNAK ................................................................................... 81 11.6. SCHÉMA LINEÁRNÍHO KLASIFIKÁTORU............................................................................................ 81 11.7. ERGODICKÝ MARKOV V MODEL .................................................................................................... 86 11.8. LEVO-PRAVÝ MARKOV V MODEL .................................................................................................. 86 11.9. MODEL PO ASÍ .............................................................................................................................. 87 11.10. DV T ÍDY VZORK V P ÍZNAKOVÉM PROSTORU .......................................................................... 87 11.11. ZM NA SOU ADNICOVÉHO SYSTÉMU P ÍZNAKOVÉHO PROSTORU ................................................... 88 11.12. METODA LDA A PCA .................................................................................................................. 88 12.1. SEKVENCE ZPRACOVÁNÍ OBRAZU ................................................................................................... 89 12.2.: JEDNODUCHÁ KLASIFIKA NÍ ÚLOHA „N ŽKY – KLEŠT “................................................................. 89 12.3.: P ÍPRAVA BINÁRNÍHO OBRAZU PRO POPIS ...................................................................................... 90 12.4.: P ÍPRAVA OBECNÉHO OBRAZU PRO POPIS ...................................................................................... 90 12.5. VÝPO ET P ÍZNAKOVÉHO VEKTORU X............................................................................................ 91 12.6. P ÍZNAKOVÝ PROSTOR X | DIM(X)=3 .............................................................................................. 92 12.7. ÍSELNÉ INDEXOVÁNÍ OBJEKT ...................................................................................................... 93 12.8. MASKA TY A OSMI OKOLÍ PRO IDENTIFIKACI OBLASTÍ .................................................................. 93 12.9. KONFLIKT INDEX P I ZNA ENÍ OBLASTÍ ........................................................................................ 94 12.10. P ÍZNAK VELIKOST DVOU R ZNÝCH OBJEKT .............................................................................. 94 12.11. P ÍZNAK OBVOD DVOU R ZNÝCH OBJEKT .................................................................................. 95 12.12. P ÍZNAK NEKOMPAKTNOST DVOU R ZNÝCH OBJEKT .................................................................. 95 12.13. P ÍZNAK KONVEXNOST DVOU R ZNÝCH OBJEKT ........................................................................ 95 12.14. P ÍZNAK HLAVNÍ OSA DVOU R ZNÝCH OBJEKT ........................................................................... 96 12.15. P ÍZNAK VEDLEJŠÍ OSA DVOU R ZNÝCH OBJEKT ......................................................................... 96 8 OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. OBR. FEKT Vysokého u ení technického v Brn 12.16. P ÍZNAK ORIENTACE DVOU R ZNÝCH OBJEKT .............................................................................96 12.17. P ÍZNAK VÝST EDNOST DVOU R ZNÝCH OBJEKT ........................................................................97 12.18. P ÍZNAK PRAVOÚHLOST DVOU R ZNÝCH OBJEKT ........................................................................97 12.19. P ÍZNAK GENUS DVOU R ZNÝCH OBJEKT ....................................................................................97 12.20. HRANICE OBJEKT POPSANÁ ET ZOVÝM KÓDEM VE TY OKOLÍ ..................................................98 12.21.: HRANICE OBJEKTU POPSANÁ ET ZOVÝM KÓDEM V OSMI OKOLÍ ...................................................98 14.1. MECHANISMUS ROZPOZNÁVÁNÍ Z HLEDISKA KLASIFIKACE .............................................................103 14.2. METODY REALIZACE KLASIFIKA NÍCH MECHANISM .....................................................................103 14.3. BIOLOGICKÁ NEURONOVÁ SÍ .......................................................................................................104 14.4. HIERARCHICKÉ ROZD LENÍ SÍTÍ.....................................................................................................104 14.5. TRANSFORMA NÍ FUNKCE UNS ....................................................................................................105 14.6. MODEL NEURONU .........................................................................................................................105 14.7. TYPY ZÁKLADNÍCH P ENOSOVÝCH FUNKCÍ ....................................................................................106 14.8. PRINCIP U ENÍ ZNALOSTÍ KLASIFIKÁTORU .....................................................................................106 14.9. TOPOLOGIE P ÍKLADU APROXIMA NÍHO KLASIFIKÁTORU ...............................................................107 14.10. TOPOLOGIE HOPFIELDOVY SÍT ...................................................................................................108 14.11. REPREZENTACE OBRAZOVÉ INFORMACE V SÍTI .............................................................................109 14.12. TRÉNOVACÍ MNOŽINA RU N PSANÝCH ZNAK ............................................................................109 14.13. ZOBECN NÍ OBRAZOVÉHO VZORU ...............................................................................................110 14.14. ROZD LENÍ KLASIFIKA NÍCH T ÍD S OSTRÝMI A PRAVD PODOBNOSTNÍMI P ECHODY ...................111 14.15. REPREZENTACE IDEÁLN (VLEVO) A REÁLN (VPRAVO) SNÍMANÉHO ZNAKU A..............................111 14.17. ARCHITEKTURA SÍT ...................................................................................................................112 14.18. ROZPOZNÁVÁNÍ ZNAK BEZ A SE ŠUMEM .....................................................................................113 14.19. REKONSTRUKCE ZAŠUM NÉHO OBRAZU ZNAKU ...........................................................................113 15.1. ZOBRAZENÍ PROSTORU NA POHYBOVÉ POLE ...................................................................................114 15.2. JEDNOZNA NÉ ZOBRAZENÍ POHYBU – SEGMENT NEM NÍ VZDÁLENOST OD OBJEKTIVU .....................114 15.3. NEJEDNOZNA NÉ ZOBRAZENÍ POHYBU – SEGMENT SE P IBLIŽUJE K OBJEKTIVU ..............................115 15.4.: ZJEDNODUŠUJÍCÍ P EDPOKLADY ANALÝZY POHYBU ......................................................................115 15.5.: OBRAZOVÁ SEKVENCE JAKO TROJROZM RNÝ SIGNÁL ...................................................................116 15.6.: SEKVENCE SNÍMK S EKVIDISTANTNÍM ASOVÁNÍM A KAMEROU V KLIDU .....................................117 15.7.: ROZDÍLOVÁ METODA NEUR UJE SM R POHYBU ............................................................................119 15.8.: JEDNOSM RNÉ ROZDÍLOVÉ OBRAZY PO SOB JDOUCÍCH SNÍMK ....................................................119 15.9.: OBOUSM RNÉ ROZDÍLOVÉ OBRAZY PO SOB JDOUCÍCH SNÍMK ....................................................120 15.10. SNÍMKY SEKVENCE .....................................................................................................................120 15.11. KUMULATIVNÍ ROZDÍLOVÝ SNÍMEK .............................................................................................121 15.12. DETEKCE POHYBU POMOCÍ JEDNOSM RNÝCH ROZDÍLOVÝCH OBRAZ ...........................................121 15.13. PR M RNÝ OBRAZ PROST EDÍ PRÁZDNÉ SCÉNY (VLEVO) A ZM NA SCÉNY (VPRAVO) ....................122 15.14. OBJEKTY V POHYBU NALEZENÉ ROZDÍLEM OPROTI MODELU PROST EDÍ ........................................123 15.15. OPTICKÝ TOK VYPO ÍTANÝ ZE DVOU SNÍMK OBRAZOVÉ SEKVENCE ............................................123 15.16. TYP POHYBU V DYNAMICKÉM OBRAZE ......................................................................................124 15.17. VÝPO ET OPTICKÉHO TOKU PRO HORIZONTÁLNÍ POHYB KAMERY .................................................124 15.18. STRUKTURA (DE)KÓDOVÁNÍ VIDEA VYUŽÍVAJÍCÍ METODU KOMPENZACE POHYBU OBJEKT ...........125 15.19. SROVNÁNÍ RANSAC A METODY NEJMENŠÍCH TVERC ...............................................................128 15.20. DETEKCE PÁROVÝCH VÝZNAMNÝCH BOD NA STEREO-SNÍMCÍCH .................................................128 15.21. NALEZENÉ KORESPONDENCE ( ERVENÁ) A VYLOU ENÉ KORESPONDENCE (ZELENÁ) .....................128 Po íta ové vid ní 9 Seznam tabulek TABULKA 3.1. STANDARDNÍ ODCHYLKA PRO ZNÁMOU ROVINU POHYBU BODU ................................................... 18 TABULKA 3.2. STANDARDNÍ ODCHYLKA PRO ZNÁMOU ROVINU A TOLERANCI 5 CM .......................................... 18 TABULKA 3.3. STANDARDNÍ ODCHYLKA UR ENÍ RYCHLOSTI PRO STEREO-FOTOGRAMMETRII ............................. 18 TABULKA 8.1. ETNOSTI VÝSKYT SYMBOL ................................................................................................... 54 TABULKA 8.2. VÝSTUPNÍ ET ZCE PRO VSTUPNÍ SYMBOLY ............................................................................... 55 TABULKA 8.3. ÚROVN KOMPRESE STANDARDU MPEG-2................................................................................. 59 TABULKA 14.1. TRÉNOVACÍ MNOŽINA SYSTÉMU ROZPOZNÁVÁNÍ VAD ............................................................. 110 10 FEKT Vysokého u ení technického v Brn 1 Úvod Tento elektronický text je ur en poslucha m kurzu „Po íta ové vid ní“ vypisovaného Skupinou po íta ového vid ní na Ústavu automatizace a m icí techniky VUT v Brn . Text tvo í základní literaturu kurzu a slouží jako elektronický podklad k pravidelným p ednáškám. Na jednotlivých kapitolách elektronického textu se podíleli r zní auto i ze Skupiny po íta ového vid ní UAMT FEKT VUT Brno podle své odborné p sobnosti. Z toho d vodu je vždy v rámci nadpisu kapitoly uvedeno v závorce i jméno autora p íslušné pasáže. Editaci a formální úpravu textu zajiš uje: Karel Horák, +420541141–3647, [email protected] Po íta ové vid ní 11 2 Za azení p edm tu ve studijním programu (Horák) P edm t „Po íta ové vid ní“ je ur en poslucha m prvního ro níku navazujícího magisterského studia oboru Elektrotechnika, elektronika, komunika ní a ídicí technika. Má statut volitelného oborového p edm tu hodnoceného šesti kredity. Vhodnou, nikoliv však povinnou pre-rekvizitou jsou p edm ty Systémy, procesy a signály I. (UAMT), Praktické programování v jazyce C/C++ (UAMT) a všechny p edm ty vypisované Skupinou po íta ového vid ní na UAMT. Pokra ováním p edm tu je navazující kurz „Aplikace po íta ového vid ní“ vypisovaný v letním semestru prvního ro níku magisterského studia. 2.1 Úvod do p edm tu Kurz Po íta ové vid ní si klade za cíl seznámit studenty s teoretickými základy a vzhledem k zam ení Skupiny po íta ového vid ní i áste n s praktickým ešením n kterých d ležitých úloh po íta ového vid ní. P edevším jde o rozvinutí schopností úlohu po íta ového vid ní správn interpretovat, pochopit a následn efektivn ešit za použití vhodného programovacího jazyka. Pro základní pochopení princip se na p ednáškách a v po íta ových cvi eních kurzu pracuje v interpretu Matlab, který je vzhledem ke své vektorové a maticové orientaci vhodný jako názorný didaktický prost edek a je vhodný i jako prost edek pro optimalizaci výsledného funk ního kódu. Pro práci s obrazovou informací se využívá Image Processing Toolbox a Image Acquisition Toolbox. P ednášky kurzu Po íta ové vid ní nejsou nutnou podmínkou pro spln ní podmínek úsp šného zakon ení kurzu, nicmén jsou z hlediska jasného pochopení látky výrazn doporu eny. Rozd lení kapitol elektronického textu odpovídá chronologickému sledu p ednášek v semestru, studenti tedy mohou text používat k pr b žnému dopl ování poznámek až ke zkoušce. Na konci elektronického textu jsou krom dodatk a výsledk vstupního testu uvedeny také základní i dopl ující literární a internetové prameny. Nápl kurzu tvo í základní teoretické znalosti o principech a aplikacích po íta ového vid ní, reprezentaci obrazových dat, p edzpracování obrazu a jeho následné segmentace. Nechybí kapitoly v nované integrálním transformacím obrazu – Fouriérova defini ní i rychlá transformace, diskrétní kosinová, Waveletová, Walshova a Hadamardova transformace. V druhé ásti textu jsou studenti seznámeni s morfologickými operacemi s obrazem, možnostmi detekce a parametrizace geometrických tvar v obrazu, popisem objekt v p íznakovém prostoru, koresponden ním problémem, klasifikací a automatickým t íd ním a v neposlední ad jsou seznámeni i s prvky strojového u ení, statistickým rozpoznáváním a analýzou dynamických obraz . 12 FEKT Vysokého u ení technického v Brn 2.2 Vstupní test Vstupní test je ur en k vyhodnocení samotným studentem a jeho ú elem je ov ení p edchozích znalostí studenta, pot ebných k úsp šnému zvládnutí p edkládaného výukového textu. Výsledky vstupního testu jsou uvedeny v dodatku v záv ru tohoto textu. 1. Jak lze charakterizovat dvourozm rný diskrétní obraz z hlediska teorie signálu? 2. Co o diskrétním signálu vypovídá charakteristika nazývaná etnost pop . histogram? 3. Co se rozumí filtrací obrazového signálu v prostorové a co ve frekven ní oblasti? 4. K emu se používá Fouriérova transformace? 5. Co je to topologie objektu? Po íta ové vid ní 13 3 Aplikace po íta ového vid ní (Richter) V této kapitole je uveden vý et p íklad realizace úloh po íta ového vid ní spolu s nejd ležit jšími informacemi týkajícími se dané úlohy. 3.1 Motivace Po íta ové vid ní (z anglického Computer Vision) p edstavuje akademickou záležitost, která eší problematiku pochopení vícerozm rných dat – obrazu jako nap . šedo-tónový obraz, barevný, 3D obraz sekvence, ultrazvukový nebo tomografický obraz v nepravých barvách. Rozvoj oboru je p ímo spojen s rozvojem po íta ových za ízení, jejichž výpo etní výkon vždy využívá v maximální možné mí e. Základní terminologie oboru: Po íta ové vid ní: Obor zabývající se realizací inteligentního lidského vid ní po íta ovými prost edky. Image Processing: Zpracování dvourozm rného signálu. Machine Vision: Aplikace po íta ového vid ní v pr myslu – I/O za ízení, optické prvky, osv tlovací za ízení, sníma e atd. Obr. 3.1. Projekce trojrozm rných dat ultrazvuku, jasová složka p edstavuje hustotu Obr. 3.2. Obraz rozložení teploty v pseudo-barvách 14 FEKT Vysokého u ení technického v Brn 3.2 Systém po íta ového vid ní Každý systém po íta ového vid ní obsahuje znalosti z r zných domén: a) Fyzikální principy – geometrie, sv tlo. b) Hardware – po ízení dat, diskretizace, digitalizace. c) Algoritmy – zpracování signálu. d) Interpretace výsledk . e) Velké množství kombinací pro výb r ešení. Základními problémy po íta ového vid ní je velké množství dat, vysoká variabilita obrazových dat, ztráta informace t etího rozm ru vlivem projekce, šum a zm na vzhledu objektu se zm nou sv tla. Obr. 3.3. Zm na vzhledu objektu se zm nou sv tla vlivem pohybu odrazu K ešení reálných aplikací inženýrským zp sobem je nutná komplexní znalost problému a znalost možností ešení. Mezi základní sesterské oblasti pat í geometrie (transformace lineární a nelineární), optika (jasová a geometrická zkreslení, projekce, r zné typy odraz ), teorie signálu, strojové u ení aj. P i realizaci scény je t eba ešit: hardware jako sou ást algoritm a m ícího et zce, osv tlení, objekt zájmu, sníma + objektiv, vzájemné umíst ní. Získání íslicové reprezentace obrazových dat je ovlivn no adou proces : snímání scény, optika, detektor (diskretizace), digitalizace (kvantizace), rušení (šum). Zpracování obrazových dat je zpravidla založeno na extrakci p íznak , na n ž jsou p i klasifikaci aplikovány metody založené na u ení. Zpracováním dat se rozumí p edzpracování, vyhledání objekt (entit, markant), porozum ní obsahu obrazu (OCR, 3D rekonstrukce) atd. Obr. 3.4. Snímaný obraz (vlevo) a zvýrazn ní rys pomocí hranového detektoru (vpravo) Po íta ové vid ní 15 Obr. 3.5. Houghova transformace obrazu (vlevo) a hrany vybrané pomoci maxim HT Upravená obrazová data je t eba správn interpretovat a zpracovat výsledky m ení: kalibrace, p evody mezi m ením a kalibrací, u ení, srovnání se vzorem, ur ení po tu, ur ení polohy, rychlosti, ur ení tvaru, úprava signálu pro lov ka apod. 3.3 P ehled úloh po íta ového vid ní Základní t ídu úloh po íta ového vid ní tvo í rozpoznávání objekt : - podle velikosti, tvaru - binární snímek (prahování) - dotýkající se nebo p ekrývající objekty Obr. 3.6. Nejednozna nost úlohy rozpoznávání Z dalších typ úloh lze rámcov jmenovat alespo sledování objekt v sekvenci snímk , interpretaci obraz (co vidíme), zjiš ování pozice objekt pop . kamery (poloha v obraze). 3.4 Zkreslení kamer Snímací soustava vykazuje stejn jako jakýkoliv jiný m icí systém chyby. Mezi základní chyby, které se projevují negativn p i zpracování obrazu, pat í zkreslení, které je nutné korigovat. 16 FEKT Vysokého u ení technického v Brn Obr. 3.7. Geometrické zkreslení snímací soustavy P i korekci zkreslení je t eba uvažovat: - detekce „k ivosti“ p ímek - detekce k ížení ar – pr se íky p ímek, rohy, pravidelná struktura - testování objektivu, p íprava pro korekce p i m ení - 2D p edloha – n které parametry zkreslení - 3D p edloha – všechny parametry zkreslení Obr. 3.8. K ivky zkreslení posunu o jeden pixel v x a y Výsledky korekce zkreslení jsou reprezentovány pomocí hodnoty jasu, která ur uje velikost korekce. Model korekce pak m že vypadat jak ukazují následující obrázky. Obr. 3.9. Rozložení velikosti chyb ve sm ru x v ploše pro 6 parametr a pro m ítko Po íta ové vid ní 17 3.5 Motiva ní p ehled aplikací - Desti ky z tvrdokovu stanovení po tu ízení stroje pro popis variabilita rozm r desti ek detekce stínu variabilita optických vlastností desti ek (0-100% odrazivost) dopln ní chyb jící informace - desti ky a kalibra ní vzor pro p evod ze sou adnic zapisova e a kamery 14x14cm, desti ka 2-7mm nalezení hran pomocí stínu – hranový filtr dopln ní chyb jící informace – Kalman v filtr transformace mezi kalibra ním vzorem a strojem Obr. 3.10. azení desti ek z tvrdovkovu - Tahová zkouška ocelová ty ka zjišt ní minimálního pr m ru a parametr jeho okolí ízení stroje na konstantní úbytek polom ru, zastavení v okamžiku maximálního nap tí matnice pro difúzní sv tlo sub-pixelové vyhodnocení – na základ v tšího okolí a pr b hu jasu v okolí hrany 5x5cm Obr. 3.11. Snímek ocelové ty ky p i tahové zkoušce 18 FEKT Vysokého u ení technického v Brn - M ení rychlosti vozidel velká zm na sv telných podmínek detekce p ítomnosti auta – hledá se rozdíl oproti pozadí, hrany zjišt ní pohybu zjišt ní reálné polohy ve scén série snímk rychlost Obr. 3.12. Snímek vozidla pro kontrolu rychlosti Tabulka 3.1. Standardní odchylka pro známou rovinu pohybu bodu v [km/h] t [s] [m/s] [km/h] 50 0,22 0,12 0,44 100 0,11 0,25 0,9 150 0,05 0,54 1,9 Tabulka 3.2. Standardní odchylka pro známou rovinu a toleranci 5 cm v [km/h] T [s] [m/s] [km/h] 50 0,22 1,36 4,9 100 0,11 27 9,8 150 0,05 6 21,6 Tabulka 3.3. Standardní odchylka ur ení rychlosti pro stereo-fotogrammetrii v [km/h] t [s] [m/s] [km/h] - 50 0,22 0,5 1,8 100 0,11 1 3,6 150 0,05 2,2 7,92 Svary zm na hodnot jasy v závislosti na kvalit a sm ru osv tlení filtrace – vyhledání jasových p echod v obraze eliminace vlivu jasu okolí vyhledání p esné pozice – eliminace stín na kraji Po íta ové vid ní 19 Obr. 3.13. Snímek svar z pr myslové kamery - Vady lahví transparentní materiál ší ka materiálu ovliv uje optické vlastnosti n které „vady“ jsou výrobní nastavení velikosti a typ vad shluková analýza s generováním p íznak podle p íznak – rozpoznání vady Obr. 3.14. Snímek hrdla (vlevo) a dna láhve (vpravo) - M ení profilu laserového svaru 3D tvar bez výrazných bod aktivní nasvícení vzorem možné typy vzor – rastr, bílý šum, jednozna ný vzor, pruhy kvalita odrazu podle typu povrchu (olej) a úhlu dopadu ešení výpadku pruhu – predikce polohy, spojování pruh lokální prahování, hranování, zten ování, predikce, zp tné dohledání vyhledávání r zného typu vad – rozhoduje velikost Obr. 3.15. Vý ez snímku pro detekci profilu (vlevo) a snímací hlava (vpravo) 20 FEKT Vysokého u ení technického v Brn Stereofotogrammetrie - vyhledání spole ných bod - výpo et prostorových umíst ní bod - tvorba 3D drátového modelu Obr. 3.16. Snímek ze stereo-páru (vlevo) a drátový model rekonstruované scény (vpravo) - M ení pr hybu vrat vodního díla Gab íkovo vyhledání spole ných bod a tvorba 3D posuv epipolární linie testovací a m ící body nasvícení rovinných ploch bílým šumem reprezentace výsledných dat – jas v závislosti na výšce vyhledání shodné plošné kombinace bod na více snímcích, zkreslení úhlem pohledu Obr. 3.17. Rekonstruovaný model vrat - Kapky kalibrace detekce ar s predikcí na základ p edpokládané polohy výsledkem výšková mapa profilu 3x3 a 5x5 mm Po íta ové vid ní 21 Obr. 3.18. M ená kapka s nasvíceným vzorem (vlevo) a princip m ení (vpravo) - Moire interferen ní metoda výsledkem jsou zázn je filtrace nežádoucích složek (rozmazání) detekce vrchol mapa vzdáleností vrchol a jejich sm ru (plošn ) testování objektivu, stanovení velikosti a parametr zkreslení, m ení deformací Obr. 3.19. Interferen ní obrazec Moire metody - Youngovy proužky bez použití optiky operace ve Fouriérov oblasti stanovení drsnosti povrchu výsledkem Youngovy proužky – hledání maxim, minim a dekrementu (pokles obálky) Obr. 3.20. Vstupní snímek spekly (vlevo), Youngovy proužky p ed a po filtraci (uprost ed) a ezy pro detekci parametr drsnosti povrchu (vpravo) 22 FEKT Vysokého u ení technického v Brn 4 Reprezentace a vlastnosti obrazových dat (Petyovský) 4.1 Reprezentace obrazových dat Obraz (obrazová data) lze reprezentovat jako spojité rozložení jasu (intenzity, optické hustoty) v rovin . Rozložení hodnot jasu je definováno obrazovou funkcí: f ( x, y ) pro statický obraz, f ( x, y, t ) pro dynamický obraz (prom nný v ase). Kde f je reálná spojitá (nebo po ástech spojitá) funkce s reálným argumenty (x,y definují bod v rovin a t p edstavuje hodnotu v ase). Po dalším zpracování je obraz prakticky vždy diskretizován v ase a lze si ho tedy p edstavit jako nespojitou sekvenci obrazových funkcí f(x,y). Defini ní obor D hodnot obrazové funkce: x ( xmin , xmax ), y ( y min , y max ) . Obor hodnot H obrazové funkce: 0 f ( x, y ) f max . Takto definovaná obrazová funkce je schopná reprezentovat pouze šedo-tónový (monochromatický) obraz (obraz s prom nnou intenzitou jedné barvy). Barevný obraz lze definovat jako soubor n kolika obrazových funkcí: f R ( x, y ); f G ( x, y ); f B ( x, y ) . Kde jednotlivé funkce reprezentují intenzitu jasu pro danou barevnou složku ve zvoleném barevném modelu (RGB, HSV, YUV atd.). Pozn.: V p ípad , že defini ní obor hodnot obrazové funkce je definován jako diskrétní s pouze dv mi možnými hodnotami, hovo íme o tzv. binárním obraze. 4.2 Reprezentace dvourozm rného systému Dvourozm rný systém lze chápat jako zobrazení 2 : 2 signálu f(x,y) na signál g(x,y): g ( x, y ) f ( x, y ) . Defini ní obor hodnot systému (zobrazení ): { f1 ( x, y), f 2 ( x, y),..., f n ( x, y)} . Obor hodnot systému: Po íta ové vid ní 23 {g1 ( x, y), g 2 ( x, y),..., g n ( x, y)} . Lineární systém je takový systém, pro který platí princip superpozice, který lze pro 2D systém zapsat jako: n a n f n ( x, y ) an multiplikativní konstanta fn() vstupní 2D signál (obrazová funkce) f n ( x, y ) . an n zobrazení (dvourozm rný systém) 4.3 2D Diracova funkce a rozptylová funkce (PSF) 2D Diracova funkce je zobecn ním jednorozm rného p ípadu této funkce do více rozm r . A pro 2D p ípad je definována takto: , pro ( x (x, y) 0 y 0) 0 , jindy ( x, y )dxdy 1 Základní vlastnosti funkce: Translace: (x ,y ) Filtra ní schopnost: f ( x, y ) ( x ,y )dxdy f( , ) Podoba ve 2D frekven ní rovin (u,v): 1 4 ( x, y ) Za p edpokladu linearity zobrazení f ( x, y ) 1 e j ( ux vy ) dudv lze psát: f ( , ) (x g ( x, y ) ,y )d d f ( x, y ) Dosazením lze získat vztah: g ( x, y ) f( , ) (x ,y )d d Zavedeme substituci pro h a nazveme ji rozptylovou funkcí (PSF): 24 FEKT Vysokého u ení technického v Brn h( x, y , , ) (x ,y ) PSF (point spread function) p edstavuje impulsní charakteristiku 2D systému a je analogií impulsní charakteristiky u jednorozm rných systém , kde slouží identifikaci systému. Odezvu systému p i znalosti jeho PSF na obraz f lze zapsat superpozi ním integrálem: g ( x, y ) f ( , ) h( x, y, , )d d Ze superpozi ního integrálu lze vysledovat význam sou adnic u PSF (tj. fce. h ). Dvojici sou adnic x,y lze chápat jako polohu výsledku a dvojici sou adnic , jako polohu (jednoho z mnoha) p ísp vku. Pokud má systém v každém bod obrazu g identickou odezvu na identický obraz f hovo íme o izoplanárním systému (tj. o systému s polohov nezávislou impulsní charakteristikou na vstupní obraz bodu). U PSF již není t eba specifikovat informaci o poloze výsledku a její definice se zm ní takto: h( x , y , , ) h( x ,y ). Odezvu systému na vstupní obraz f je možné vyjád it jako konvolu ní integrál: g ( x, y ) f ( , ) h( x ,y )d d 4.4 Podmínky digitalizace 2D obrazové funkce Digitalizace spo ívá ve vzorkování obrazové funkce do matice o rozm rech MxN a ve kvantování spojité jasové úrovn každého vzorku do jednoho z K interval , ímž nabývá obrazová funkce pouze celo íselných hodnot. ím v tší rozlišení (tj. MxN) a v tší po et kvantovacích úrovní (tj. K), tím lépe je p vodní spojitý obraz aproximován. 4.4.1 Interval vzorkování Definován Shannonovým teorémem zobecn ným pro vícerozm rné signály. Fyzikální interpretace: Interval vzorkování je nutné volit tak, aby byl vždy menší (nebo roven) polovin rozm ru nejmenších detail v obraze. 4.4.2 Volba vzorkovací m ížky Výb r plošného uspo ádání bod p i vzorkování. Výhodné je využít pravidelnou m ížku. Existují pouze t i pravidelné mnohoúhelníky, jejichž sí úpln pokrývá rovinu. Obr. 4.1. Typy vzorkovacích m ížek Po íta ové vid ní 25 4.4.3 Kvantování hodnot obrazové funkce Pro digitální zpracování se nej ast ji využívá kvantování do K stejn velkých interval . V p ípad po íta ového zpracování obrazu je po et interval dán druhou mocninou tedy: 2b . K Kde b je po et bit do kterých je hodnota kvantována (nej ast ji 8). P i malém po tu kvantovacích hodnot dochází v obraze ke vzniku rušivých artefakt . Tento jev je pro lidské oko patrný pokud je po et kvantovacích úrovní v monochromatickém obraze menší než cca. 64, proto je n kdy vhodn jší využívat nelineární kvantování (tj. kvantování s prom nnou délkou intervalu). 4.5 Reprezentace diskrétního obrazu jako 1D/2D signálu Diskretizací obrazu získáváme soubor dat, který lze interpretovat jako 2D strukturu (matici): f f ij $ f 00 " " .. " f ( N 1) 0 # .. f 0(M ! 1) .. .. f(N , 1)( M 1) nebo jako 1D strukturu (vektor po sloupcích): f f 00 ,.., f ( N 1) 0 ; f 01 ,.., f ( N f 1)1;......; 0 ( M 1) ,.., f ( N T 1)( M 1) P evod mezi ob ma formami (pomocí maticového po tu, pokud M=N): f N 1 M n f vn f n 0 N 1 Mn T f vn T n 0 Kde M a v jsou pomocné matice a vektory. Mn $ 0! 0 " ".. % "0 " "1 n " "0 ".. % " N 1 #0 vn $ 0! 0 ".. % " "0 " "1 n "0 " ".. % "0 N 1 # Celková velikost matice M je (NxN2). Velikost vektoru v je (N). Superpozi ní integrál pro diskrétní systémy: g (k , l ) N 1M 1 f (i , j ) h (i , j , k , l ) i 0 j 0 f(i,j) - Vstupní hodnota g(k,l) - Výstupní hodnota h(i,j,k,l) - PSF v maticové podob (i,j adresa p ísp vku), (k,l adresa cíle) 26 FEKT Vysokého u ení technického v Brn Superpozi ní integrál v maticové podob : g 1 $& ! " MxN % " & "# & H f MxN $& "& " "# & & 1 & ! $&! " & " & % MxN & "# & & & K výpo tu výstupního obrazu g je zapot ebí (MxN)2 operací typu násobení a (MxN1)x(MxN) operací s ítání. Pro tvercové obrazy o velikosti N je to N4 násobení a (N2-1)xN2 s ítání. asto matice H p edstavuje pouze operaci s ádky nebo jen se sloupci, potom klesne po et operací na N3 násobení a (N-1)xN2 s ítání. Tvar matice H p i sloupcových operacích: Tvar matice H p i ádkových operacích. Pokud tedy dokážeme matici H rozd lit na dv matice, kde každá z nich p edstavuje pouze sloupcové resp. ádkové operace, dokázali jsme snížit výpo etní náro nost u násobení z N4 na 2N3 ! Systémy mající tyto vlastnosti nazýváme obecn separabilní. 4.6 Konvolu ní integrál pro diskrétní systémy Pokud je systém izoplanární (tj. jeho PSF je ve všech bodech obrazu identická) je možné p ejít z superpozi ního integrálu na konvolu ní integrál zavedením substituce. h(i, j , k , l ) h(i k , j l ) Výsledný tvar pro odezvu izoplanárního diskrétního systému pro PSF (h) lze konvolu ním integrálem zapsat jako: g (k , l ) N 1M 1 i 0 j 0 f ( i , j ) h( i k , j l ) Po íta ové vid ní 27 Pokud je navíc velikost PSF menší než velikost obrazu lze ozna it PSF jako lokální a výpo et odezvy realizovat pomocí klouzavé masky o velikosti X,Y. Jelikož jsou rozm ry lokální PSF (tj. X,Y) vždy výrazn menší než rozm ry obrazu (tj. M,N), dochází k výrazné úspo e výpo etního výkonu. X 2 g (k , l ) i Y 2 X j 2 f (k i , l j ) h(i, j ) Y 2 Pokud je navíc lokální PSF systému separabilní je možné náro nost výpo tu odezvy systému (tj. výpo et výstupního obrazu) dále snížit rozd lení PSF na sloupcovou a ádkovou ást. 4.7 Lineární filtrace obrazu v signálové oblasti 4.7.1 Vyhlazování šumu v obraze Nejsnadn jší je vyhlazování náhodného šumu v obraze v p ípad kdy máme k dispozici n kolik obraz téže p edlohy (scény) lišící se práv jen šumem. V tomto p ípad provedeme pr m rování hodnot pixelu o stejných sou adnicích p es více obraz . Pokud ale máme k dispozici jen jediný obraz scény, nezbývá než p edpokládat že hodnoty okolních pixel v obraze se liší hlavn díky šumu. Proto je možné provést pr m rování p es okolní pixely (pomocí konvolu ní masky). Tento p edpoklad samoz ejm není možné splnit v celém obraze (pokud obraz neobsahuje jen jednu hodnotu jasové úrovn ). Vyhlazení šumu p es jeden obraz tedy povede k degradaci obrazu mající charakter „rozmazání“, tj. zvýrazn ní nižších prostorových frekvencí obrazu. 4.7.2 Realizace diskrétního operátoru pro pr m rování Oby ejné pr m rování, kde nová hodnota každého pixelu je ur ena jako pr m r z hodnot pixel v okolí 3x3 lze provést pomocí konvolu ní masky: h $1 / 9 1 / 9 1 / 9! "1 / 9 1 / 9 1 / 9 " "#1 / 9 1 / 9 1 / 9 $1 1 1! 1" 1 1 1 9" "#1 1 1 Obr. 4.2. Filtrace obrazu (a) s šumem (b) maskou 3x3 (c) a maskou 5x5 (d) Další varianty pr m rovacích masek upravují váhu n kterých bod masky: 28 FEKT Vysokého u ení technického v Brn $1 1 1! $1 2 1 ! 1 " 1 " h2 1 2 1 h3 2 4 2 10 " 16 " "#1 1 1 "#1 2 1 Maska h3 je typickým p íkladem separabilního filtru, protože je možné ji rozložit na dva 1D filtry: h31 h32 g 1 2 1, $1! "2 , " "#1 1 (h31 ' (h32 ' f )). 16 Pozn.: symbol ‘*’ p edstavuje operátor konvoluce. 4.7.3 Detekce hran v obraze Každá hrana v obraze p edstavuje jasovou nespojitost v obrazové funkci. Z teorie signálu je známo že velké skokové zm ny p edstavují místa s výskytem vysokých prostorových frekvencí. Proto jakékoli filtry zvýraz ující hrany v obraze musí zvýraz ovat vysoké frekvence. Oblast vysokých prostorových frekvencí p edstavuje krom informací o hranách v obraze i šum, proto p i jakékoliv operaci zvýraz ující hrany dojde i k zvýrazn ní šumu v obraze. 4.7.3.1 Gradient jasové funkce K ur ení velikosti a sm ru zm ny hodnoty jasové funkce se využívá operace gradientu (. Matematicky ji lze vyjád it jako funkci obsahující první parciální derivace obrazové funkce dle jednotlivých prom nných. Výsledek operace gradientu ( je vektorová veli ina mající absolutní hodnotu (udávající velikost zm ny jasové funkce) a sm r (udávající sm r nejv tší zm ny jasové funkce). (f ( x, y ) (f ( x , y ) /f ( x, y ) i /x /f ( x, y ) j /y . /f ( x, y ) + , ) - /x * 2 . /f ( x, y ) + ,, )) - /y * 2 . /f ( x, y ) /f ( x, y ) + ) , /y )* - /x 0 arg,, Parciální derivace obrazové funkce jsou v diskrétních obrazech nahrazeny diferencemi. Po íta ové vid ní 29 /f ( x, y ) 3 2 x fi , j /x /f ( x, y ) 3 2 y fi , j /y /f ( x, y ) 3 21 f i , j /1 f i, j fi fi , j fi, j n, j n 2 x f i , j cos 1 2 y f i , j sin 1 Kde konstanta n je nej ast ji stanovena na hodnotu 1 nebo 2. V praxi je samotný výpo et absolutní hodnoty gradientu pro zjednodušení nahrazován: (f (i, j ) 3 2 x f i , j 2 y fi , j , (f (i, j ) 3 max( 2 x fi , j , 2 y fi , j ), Realizace diskrétního operátoru gradientu obrazové funkce $ 1! 2 x fi, j : " #1 2 y fi, j : 1 1 $0 2 45 f i , j : : " #1 1! 0 $ 1! "0 " "# 1 1 0 1 $0 0 "0 0 " "#1 0 1! 0 0 Obr. 4.3. Filtrace operátorem diference prvního ádu 4.7.3.2 Další konvolu ní masky aproximující první derivaci obrazové funkce Roberts v operátor: $1 h " #0 0! , 1 $ 0 1! ,... . h " # 1 0 Operátor Prewittové: h $1 "0 " "# 1 1 0 1 Sobel v operátor: 1! 0 , 1 h $0 " 1 " "# 1 1 1! 0 1 , 1 0 h $ 1 0 1! " 1 0 1 ,... " "# 1 0 1 30 FEKT Vysokého u ení technického v Brn h $1 "0 " "# 1 2 1! 0 , 0 2 h 1 $0 " 1 " "# 2 1 2! 0 1 , $1 " 1 " "# 1 1 $ 1 0 1! " 2 0 2 ,... " "# 1 0 1 h 1 0 Robinson v operátor: h $1 "1 " "# 1 1 2 1! 1 , 1 1 h 1! 2 1, $ 1 " 1 " "# 1 h 1 1 1 1! 2 1 ,... 1 1 Kirsch v operátor: h $3 "3 " "# 5 3 3! 3 , 0 5 h 5 $3 " 5 " "# 5 3 3! 3, 0 $ 5 3 3! " 5 0 3 ,... " "# 5 3 3 h 5 3 4.7.3.3 Laplace v operátor jasové funkce Pro detekci hrany v obraze je výhodn jší využít operátor aproximující druhou derivaci obrazové funkci, který je roven nule v oblasti inflexního bodu každé hrany. Detekce pr chodu nulou v obraze je vždy výpo etn výhodn jší než hledání lokálního maxima mající vždy jinou velikost. Pro tento ú el lze využít Laplace v operátor (2 (tzv. Laplacián) obsahující druhé parciální derivace: ( 2 f ( x, y ) / 2 f ( x, y ) 3 22x f i , j 2 /x 2 / f ( x, y ) 3 22y f i , j /y 2 / 2 f ( x, y ) /x 2 / 2 f ( x, y ) . /y 2 2 x fi 1, j 2 x fi, j fi 2 y fi 1, j 2 y f i, j f i, j 1, j 1 fi 1, j fi, j 1 2 fi, j 2 f i, j Výsledný Laplace v operátor pro diskrétní obraz: 22 f i , j 22x f i , j 22y f i , j 4.7.3.4 Realizace diskrétního Laplaceova operátoru obrazové funkce 2 x 2 f : 22y f : 22 f : $1 ! " 2 , " "# 1 1 2 1, $0 "1 " "#0 1 0! 4 1 1 0 , $1 "0 " "#1 0 1! 4 0 0 1 , $1 "1 " "#1 1 1! 8 1 1 1 Po íta ové vid ní 31 Obr. 4.4. Aplikace Laplaceova operátoru 4.7.4 Operace ost ení obrazu Ost ení obrazu p edstavuje zvýrazn ní hran v obraze. K operaci ost ení lze využít n kterého z operátor aproximující derivaci obrazové funkce. S výhodou se využívá zost ující ú inek Laplaceova operátoru (2. P i použití vztahu: g ( x, y ) f ( x , y ) ( 2 f ( x, y ) . Obr. 4.5. Aplikace Laplaceova operátoru pro ost ení Další možností je využít místo Laplaciánu nap íklad (LoG – Laplacián of Gaussian) jenž p esn ji detekuje hrany. Jeho konvolu ní maska pro velikost 5x5 má tvar: h $0 "0 " " 1 " "0 "# 0 0 1 2 1 2 16 0 1 2 0! 0 1 1 0 2 1 1 0 0 0 Obr. 4.6. Aplikace Laplaceova a LoG operátoru 32 FEKT Vysokého u ení technického v Brn 5 Barvy v po íta ové grafice (Petyovský) 5.1 Barevné modely Maximální rozsah viditelného zá ení pro lidské oko: 380nm – 780nm. Obr. 5.1. Barevné spektrum 5.2 Aditivní modely RGB, RGBA Barevné lenitele: Red (630 nm), Green (530 nm), Blue (450 nm) Obr. 5.2. RGB krychle tvrtý lenitel (1 - kanál) funkce pr hlednosti pixelu p i skládání n kolika objekt v obraze. Pojem RGBA tedy neznamená zm nu barevného modelu, ale pouze p idání další informace. Složka A se nej ast ji ukládá do rozsahu jednoho bajtu. & & Koeficient pr hlednosti 1 m žeme chápat ve dvou významech: pixel je zcela pokryt barvou RGB, která má pr hlednost 1 pixel je z 1 procent pokryt nepr hlednou barvou RGB (využíváno pro vyhlazování hran objekt ). 5.3 Substraktivní modely CMY, CMYK Cyan, Magenta, Yellow – barevné pigmenty. Po íta ové vid ní 33 Obr. 5.3. CMY krychle Podmínka, že tiskové barvy nesmí být dokonale krycí, vedla v d sledku k nutnosti zavedení dodatkové BLACK barvy. Hodnota této dodatkové barvy (K) a následn upravené hodnoty C’, M‘, Y‘ se ur ují dle vztah : 5.4 Barevný model H,S,V Barevný tón – Hue, Sytost – Saturation, Jasová hodnota - Value. Obr. 5.4. Barevný model HSV N kdy je nevýhodný pro sv j jehlanovitý tvar, který zp sobuje, že ve vodorovném ezu se musí bod o konstantní hodnot S pohybovat p i zm n H po dráze ve tvaru šestiúhelníku a nikoliv po kružnici, jak by bylo p irozené. Dalším záporným jevem je nesymetrie modelu z hlediska jasu. 5.5 Barevný model H,L,S Barevný tón – Hue, Sv tlost - Lightness, Sytost – Saturation. 34 FEKT Vysokého u ení technického v Brn Obr. 5.5. Barevný model HLS Tvar modelu HLS pln odpovídá skute nosti, že nejvíce r zných barev vnímáme p i „st edním“ sv tlosti. Schopnost rozlišovat barvy klesá jak p i velkém ztmavení, tak p i p esv tlení (oblast obou vrchol kužel ). Další dobrá vlastnost modelu HLS spo ívá v analogii míchání barev p idáváním erných a bílých pigment k základním spektrálním barvám. Zvýšení sv tlosti p i nezm n né sytosti si lze p edstavit jako p idání jistého množství bílých a ubrání stejného množství erných pigment . Samotné zvýšení sytosti odpovídá odebrání stejného množství bílých a erných pigment . 5.6 Modely pro televizní a video techniku YUV Model YUV je n kdy také ozna ován jako p enosech TV signál Využíván pi Z modelu RGB získáme hodnoty YUV takto: (Y, B-Y, v norm R-Y). PAL. Další televizní modely: YIQ (pro NTSC), YCB CR (pro SECAM, JPEG, MPEG) aj. 5.7 Chromatický diagram XYZ-CIE CIE = Mezinárodní komise pro osv tlování. 1931 Mezinárodní standart základních barev. Jeho sou ástí je i Chromatický diagram. Každá skute ná barva je podle tohoto standartu vytvo ena z barev A, B, C, které zapisujeme v normalizovaném tvaru: Protože platí že: Po íta ové vid ní 35 Sta í nám k vyjád ení pouze dv složky. Vybereme x,y a m žeme reprezentovat všechny barvy dvojrozm rným diagramem. Pozor - barvy x,y,z jsou pouze imaginární (mají sytost v tší než 1004). Obr. 5.6. Chromatický diagram 5.7.1 Pravidla pro tvorbu barev v chromatickém diagramu 1. Pro libovolný barevný bod C1 v obrázku definujeme sytost barvy jako relativní vzdálenost barevného bodu od standardního bílého sv tla C. Barva C1 na obrázku je sytá asi z 254, protože leží p ibližn v jedné tvrtin orientované úse ky mezi C a C2. 2. Dominantní vlnová délka jakékoliv barvy je definována jako vlnová délka na spektrální k ivce protínající úse ku spojující C1 a C. Dominantní vlnová délka je tedy na obrázku ozna ena jako C2. 3. Dopl kové barvy leží na spojnici, která prochází bodem C. Pokud mají dv dopl kové barvy stejnou sytost (relativní vzdálenost od C), vznikne jejich složením bílé sv tlo. Obr. 5.7. Dopl kové barvy v chromatickém diagramu 4. P i slou ení dvou barev leží výsledná barva vždy na spojnici dvou vstupních barev. 5. P i slou ení t í barev leží výsledná barva vždy uvnit trojúhelníka vyzna eného t emi vstupními barvami (tzv. barevný rozsah – color gamut). 5.7.2 D sledky plynoucí z chromatického diagramu 1. Není možné nalézt takové t i barvy, které by ur ovali trojúhelník pokrývající celý diagram. To odpovídá skute nosti, že z kone ného po tu základních barev nelze vytvo it 36 FEKT Vysokého u ení technického v Brn všechny existující barvy. Po íta em generované obrazy proto obsahují vždy mén barev než skute ný sv t. 2. R zná technická za ízení mívají r zné základní barvy, emuž odpovídají r zné polohy a velikosti trojúhelník barevných rozsah . Z uvedeného je tedy z ejmé, že obraz popsaný v modelu RGB nemusí být stejn vytišt n na tiskárn CMYK. Barevné rozsahy t chto za ízení jsou odlišné a i p es výpo etní korekce dochází ke ztrátám i posuv m barev. I lidský zrak má sv j omezený barevný rozsah, nebo barvy detekuje pouze n kolika druhy receptor . Obr. 5.8. Omezení barevného gamutu technických za ízení Po íta ové vid ní 37 6 P edzpracování obrazu a segmentace (Kalová) et zec zpracování obrazové informace lze vyjád it následujícím obrázkem: Obr. 6.1. Sekvence úkon zpracování obrazu 6.1 Snímání obrazu Osv tlení Typ zdroje – slune ní sv tlo, žárovka, zá ivka, výbojka, LED dioda, laser. Provedení, orientace – bodové, plošné, kruhové, sv telný pruh, vzor, p ímé, sm rové, rovnob žné, difusní, bo ní, zadní. Vlnová délka – IR, viditelné, UF, vyza ovací charakteristika, intenzita, polarizace, koherence. Objektiv Ohnisková vzdálenost – zorný úhel, zv tšení, rozsah ost ení, hloubka ostrosti. Sv telné íslo (clona) – sv tlo, které propustí na senzor, pr m r clony, sv telná ada. Vady objektiv . Senzor Typ – ádkový (lineární) x plošný (maticový), barevná (jeden x t i ipy), ernobílá. Technologie – CCD, CMOS, progresivní, prokládaný (interlaced). Rozm r senzoru – nej ast ji 1/3“, 1/2“, 2/3“, rozm r pixelu, rozlišení, video standard. Spektrální citlivost, data rate, frekvence hodin, expozi ní doba, záv rka. Kontrolní a ídicí signály, interface. A/D - digitaliza ní (grabbovací) karta V závislosti na použité kame e Vzorkování a kvantování 38 FEKT Vysokého u ení technického v Brn Programovatelná hradlová pole, signálové procesory Mohou ešit i n které operace p edzpracování obrazu – DFT, prahování. 6.2 P edzpracování obrazu Cíl p edzpracování: - potla it šum - odstranit zkreslení - potla it i zvýraznit rysy obrazu, zvýrazn ní hran Vstupem i výstupem p edzpracování je obraz: g(i,j) … element vstupního obrazu f(i,j) … element výstupního (transformovaného) obrazu Využívá se nadbyte nosti údaj v obraze – sousední pixely mají v tšinou podobnou hodnotu jasu. P edzpracování musíme vztahovat k tomu co chceme z obrazu získat, co s ním chceme dále d lat. Šum Vzniká p i digitalizaci a p i p enosu obrazu. & Bílý = idealizovaný, používá se pro simulace nejhorších degradací obrazu, ve výkonovém spektru má rovnom rn zastoupeny všechny frekvence. & Gauss v = aproximace degradace obrazu. & Aditivní = vzniká p i p enosu obrazu nebo snímání. & Pep a s l = u binárních obraz , impulsní šum – u obraz s více jasovými úrovn mi = zrn ní. & Multiplikativní = šum TV rastru, má charakter vodorovných pruh . & Kvantiza ní = není použit dostate ný po et jasových úrovní. Zkreslení & & & & & & turbulence atmosféry vzájemný pohyb sníma e a p edm tu nevhodné zaost ení vada optické soustavy (špatná o ka, …) nelinearita opticko-elektrického senzoru nelinearita nebo zrnitost filmového (záznamového) materiálu Obr. 6.2. Radiální zkreslení a) soudek, b) poduška, c) nato ení detektoru Po íta ové vid ní 39 6.2.1 Bodové jasové transformace Jas v bod výstupního obrazu závisí pouze na jasu bodu ve vstupním obraze = pro úpravu konkrétního jednoho pixelu použijeme jen tento jeden pixel vstupního obrazu. 6.2.1.1 Jasová korekce Poruchy hardwaru – jiná citlivost jednotlivých sv tlo-citlivých prvk sníma e (vadné pixely), nerovnom rné osv tlení, jiná citlivost snímacího a digitaliza ního za ízení = systematické chyby. f(i,j) = e(i,j).g(i,j) e(i,j) … degrada ní funkce Ur ení degrada ní funkce: p i stálých sv telných podmínkách po ídíme obraz o známém g(i,j) - nejlépe obraz o konstantním jase c => fc(i,j). e(i,j) = fc(i,j)/c Nebo po ídím obraz s objektem I0, obraz za stejných sv telných podmínek bez objektu If – korekce osv tlení a obraz za tmy (zakrytý objektiv) Ib – korekce nelinearity sníma e. I c (i, j ) M I 0 (i, j ) I b (i, j ) , kde konstantou M m níme kontrast výsledného obrazu I f (i, j ) I b (i, j ) Obr. 6.3. P vodní snímek, snímek pozadí, snímek za tmy, obraz po korekci 6.2.1.2 Transformace jasové stupnice Jen ur itá hodnota jasu ve vstupním obraze je transformována na jinou hodnotu, bez ohledu na pozici. Transformace T výchozí stupnice jasu p na novou stupnici q: q = T(p) Obr. 6.4. Transformace jasové stupnice 40 FEKT Vysokého u ení technického v Brn Ekvalizace histogramu – algoritmus, který zm ní rozložení intenzit v obraze tak, aby se v n m vyskytovaly intenzity p ibližn se stejnou etností – snaha o zvýšení kontrastu. Má-li p vodní obraz interval jas <p0,pk> a histogram H(p), cílem je najít takovou monotónní transformaci q = T(p), aby výsledný histogram G(p) byl rovnom rný pro celý výstupní interval <q0,qk> . q q0 + q T ( p) , k ) - NxM * p i p H (i ) q 0 Obr. 6.5. P vodní a ekvalizovaný obrázek s histogramem 6.2.2 Geometrické transformace K odstran ní geometrických zkreslení – zkosení v i snímané ploše, širokoúhlé sníma e. Dva kroky – plošná + jasová transformace p .: družicové snímky Zem – zak ivení povrchu. Obr. 6.6. Geometrické transformace 6.2.2.1 Plošná transformace Najde k bodu (x,y) ve vstupním obraze odpovídající bod ve výstupním obraze (x’,y’) T - známa p edem – rotace, translace, zkosení, zv tšení. Hledána na základ znalosti p vodního i transformovaného obrazu – vlícovací body, nap . aproximace polynomem n-tého ádu + metoda nejmenších tverc . Po íta ové vid ní 41 6.2.2.2 Jasová transformace Nalezení jasu, který bude ve výstupním obraze po geometrické transformaci odpovídat jednotlivým pixel m. Obr. 6.7. Jasová transformace Mezi geometrické transformace m žeme adit i nap . vý ez, zm nu m ítka, posun, rotaci. 6.2.3 Lokální operace p edzpracování Využívají pro výpo et jasu bodu ve výstupním obraze jen lokální okolí odpovídajícího bodu ve vstupním obraze. Podle funk ního vztahu: - lineární – jas v bod (i,j) je dán lineární kombinací jas v okolí O (velikosti MxN) vstupního obrazu g s váhovými koeficienty h. Pro izoplanární (nezávislá na poloze) systémy = diskrétní konvoluce: f (i, j ) i M /2 j N /2 h (m i , n j ) g (m, n) m i M /2 n j N /2 Obr. 6.8. Konvoluce obrázku s maskou - nelineární 42 FEKT Vysokého u ení technického v Brn 6.2.3.1 Vyhlazování obrazu = filtrace Potla ení vyšších frekvencí = potla ení náhodného šumu, ale i jiných náhlých zm n (ostré áry a hrany). 1) pr m rování 1 n g k (i, j ) - nerozmazává hrany nk1 - v jednom obraze: lokální aritmetický pr m r – m žeme ešit konvolucí – rozmazává hrany - p es více (n) obraz : f (i, j ) $1 1 1! $1 1 1! 1" 1 " 1 1 1 , zvýšení váhy st edu: h 1 2 1 nebo 4-soused : 9" 10 " "#1 1 1 "#1 1 1 $1 2 1 ! 1 " 2 4 2 h 16 " "#1 2 1 h 5) pr m rování s omezením zm n Povolení jen menších zm n mezi p vodním jasem a výsledkem pr m rování. 6) filtr s Gaussovým rozložením - 1D Gaussovo (normální) rozložení: G ( x) - 2D Gaussovo (normální) rozložení: obrazu a je 1 2 G ( x, y ) x2 e 2 2 x2 y2 1 2 2 e 2 2 , kde x,y jsou sou adnice sm rodatná odchylka (udává velikost okolí, na kterém filtr pracuje) Obr. 6.9. Gaussovo rozložení se st edem v (0,0) a =1 a odpovídající maska 5x5 ) vyhlazování rotující maskou Podle homogenity (nap . rozptylu) jasu hledá k filtrovanému bodu ást jeho okolí, ke které pravd podobn pat í a tu pak použije pro výpo et = mírn ost ící charakter. Po íta ové vid ní 43 Obr. 6.10. Rotující masky Algoritmus: 1. P es všechny body (i,j) obrazu 2. P es všechny pozice masky (9 pozic) 3. Výpo et rozptylu jasu O…okolí (MxN), n…po et bod masky 2 1 n (M ,N ) . , g (i, j ) , O- + 1 g (i, j ) )) n ( M ,N ) O * 2 4. Výb r pozice s nejmenším rozptylem 5. P i azení bodu (i,j) výstupního obrazu hodnotu aritmetického pr m ru jas masky. vybrané 7) medián Medián íselné posloupnosti je íslo, které se po uspo ádání podle velikosti nachází uprost ed této posloupnosti. Výhoda: redukuje rozmazávání hran; nevýhoda: poškozuje tenké áry a o ezává ostré rohy. 6.2.3.2 Detekce hran, ost ení = gradientní metody Zd razn ní vyšších frekvencí = zvýrazn ní obrazových element , kde se jasové funkce náhle m ní (velký modul gradientu), ale bohužel i šumu. Hrana je ur ena velikostí a sm rem, velikost hrany je shodná s velikostí gradientu obrazové funkce. Sm r hrany: (g . /g + , ) - /x * 2 . /g + ,, )) - /y * 2 0 . /g /g + arctg,, / )) - /y /x * - parciální derivace v obrazech nahrazeny diferencemi: 2 i g (i, j ) g (i, j ) g (i 1, j ) 2 j g (i , j ) g (i, j ) g (i, j 1) - ost ení = úprava obrazu tak, aby v n m byly strm jší hrany: f(i,j) = g(i,j) – C.S(i,j) kde C … koeficient udávající sílu ost ení, S(i,j) … strmost zm ny v ur itém bod , nap . gradient nebo Laplacián 1) operátory aproximující derivace obrazové fce pomocí diferencí = diskrétní konvoluce - operátory invariantní v i rotaci = jedna maska: Laplace v, … 44 FEKT Vysokého u ení technického v Brn (2 g /2g /2x /2g /2 y 8 h4 $0 "1 " "#0 1 0! $1 "1 " "#1 4 1 , h8 1 0 1 1! 8 1 1 1 Laplace v - operátory neinvariantní = n kolik masek (rotace jedné): Roberts v, Sobel v, Prewitt v, Kirsch v, … h1 $1 "0 # 0! , h2 1 $ 0 1! " 1 0 , # h1 $1 "0 " "# 1 2 1! 0 , h2 0 2 1 Roberts v h1 $1 "0 " "# 1 1 0 1 1! 0 , h2 1 $0 " 1 " "# 2 1 2! 0 1 , ... 1 0 Sobel v $0 " 1 " "# 1 1 1! 0 1 , ... 1 0 h1 $3 "3 " "# 5 Pr ewit v 3 0 5 3! 3 , h2 5 $3 " 5 " "# 5 3 3! 0 3 , ... 5 3 Kirsch v 5) hledání hran v místech, kde druhá derivace prochází nulou - operátory Marra a Hildretové, Cannyho hranový detektor - druhá derivace hledána pomocí filtru s Gaussovým rozložením G a Laplaceova operátoru: ( 2 (G * g ) (( 2 G ) * g 0 - derivace Gaussova filtru ( 2 G lze spo ítat p edem analyticky (nezávisí na konkrétním obraze). 6.2.4 Restaurace obrazu Snaha o potla ení porušení obrazu na základ znalosti charakteru poruchy nebo jejího odhadu. ím lepší je znalost degradace, tím lepší jsou výsledky, proto se degradace modelují. Modely poruch se d lí: - apriorní – parametry poruchy jsou známy nebo je lze získat p ed obnovením (nap . ohodnocení vlastností snímacího za ízení, rozmazání – modelujeme sm r a rychlost pohybu, …) - aposteriorní – znalosti o poruše jsou získávány až analýzou degradovaného obrazu (ur ování charakteru poruch vyhledáváním osam lých bod nebo p ímek v obraze a nalezením odpovídající p enosové funkce po degradaci, odhadování spektrálních vlastností šumu v oblastech obrazu, o kterých víme, že jsou pom rn stejnorodé, …) P íklady filtr : & inverzní filtr & Wiener v filtr & Kalman v filtr Po íta ové vid ní 45 6.2.5 Matematická morfologie - Používá se pro: p edzpracování (odstran ní šumu, zjednodušení tvaru objekt ) zd razn ní struktury objekt (kostra, zten ování, zesilování, výpo et konvexního obalu, ozna ování objekt ) popis objekt íselnými charakteristikami (plocha, obvod, projekce) úlohu vyhodnocení obrazu geometrizuje základem jsou tvar objekt a transformace, které ho zachovávají jsou realizované jako relace obrázku s jinou menší bodovou množinou = strukturní element – elementem systematicky pohybujeme v obraze: & dilatace a eroze & otev ení a uzav ení 6.3 Segmentace obrazu Cíl segmentace: & roz lenit obraz do ástí, které souvisí s p edm ty i oblastmi reálného sv ta = odd lení objekt od pozadí, analýza obsahu obrazu & obraz chystáme pro další krok = popis & redukce dat Problémy segmentace: & nejednozna nost obrazových dat & informa ní šum & r zné metody nebo metoda s r znými parametry (po átek, práh) dávají r zné výsledky Segmentace: - kompletní – segmenty korespondují s objekty - áste ná – segmenty nemusí p ímo korespondovat s objekty Segmentace vychází z: - globální znalosti obrazu - ur ování hranic mezi oblastmi - vytvá ení oblastí D lení metod segmentace: 1. Segmentace prahováním 2. Segmentace na základ detekce hran 3. Segmentace nar stáním oblastí 4. Segmentace srovnáním se vzorem - sledování hranice - heuristické sledování hranice - ur ování hranice s využitím znalosti o poloze - spojování oblastí - št pení oblastí - št pení a spojování 6.3.1 Segmentace prahováním Objekty i oblasti jsou charakterizovány konstantní odrazivostí i pohltivostí svého povrchu – barva, jas. Objekt a pozadí mají rozdílné vlastnosti. Prahování: - transformace vstupního obrazu g na výstupní binární obraz f s prahem T: 46 FEKT Vysokého u ení technického v Brn f(i,j) = 1 pro g(i,j) 9 T 0 pro g(i,j) : T - prahování s prom nným prahem - prahování s více prahy Zp soby ur ení prahu – z histogramu Histogram – závislost relativních etností jednotlivých jas na t chto jasech, 6.3.1.1 Procentní prahování Nap . tišt ný text pokrývá 20 % plochy stránky = zvolím takovou hodnotu prahu T tak, aby práv 20 % plochy histogramu m lo úrove jasu menší než T. 6.3.1.2 Z tvaru histogramu Obr. 6.11. Ur ení prahu z histogramu 6.3.2 Segmentace na základ hran Využívá se bu nalezení hran n kterým z hranových operátor (p edzpracování) nebo apriorní informace (víme p edem n co o objektech nap . p ibližný tvar nebo barvu) – lepší segmentace, ov ení kvality segmentace. Problémy: absence hran tam, kde hranice probíhá; výskyt hran tam, kde hranice být nemá. 6.3.2.1 Sledování hranice Není znám tvar hranice, ale v obraze jsou ur eny oblasti: Obr. 6.12. Sledování hranic v osmi-okolí 6.3.2.2 Heuristické sledování hranice Využívá postup prohledávání graf , hrany jsou spojovány do et z lépe odpovídající pr b hu hranic. Po íta ové vid ní 47 graf = struktura sestávající z množiny uzl {ni} a z orientovaných spojnic mezi uzly {ni,nj}, hrany mohou být i ohodnoceny (cena – nap . velikost zm ny jasu, délka hrany atd.). generování grafu – soubor pravidel na základ v každém bod obrazu. údaj o velikosti a sm ru hrany Obr. 6.13. Generování orientovaného grafu, relaxace hran Prohledávání grafu – zjednodušení, ucelení grafu – relaxace hran, hledání nejkratší cesty, cesta s nejmenší cenou atd. Relaxace hran: cílem je vytvo it souvislé hranice, všechny vlastnosti hranice v etn té, zda hrana má i nemá existovat, jsou postupn itera ním zp sobem zp es ovány, dokud není hranový kontext zcela z ejmý. Podle pozice a velikosti hran ve vhodn zvoleném okolí se v rohodnost každé hrany bu zv tšuje, nebo zmenšuje. V rohodnosti hran: 0-0, 0-1, 0-2, 0-3 negativní 1-1 pozitivní 1-2, 1-3 st edn pozitivní 2-2, 2-3, 3-3 nemá vliv na relaxaci Obr. 6.14. Definice hran pro relaxaci 6.3.2.3 Ur ování hranice s využitím znalosti o její poloze 1) máme informace o p edpokládané nebo pravd podobné poloze a tvaru hranice - skute ná hranice je hledána jako poloha významných hranových bun k v blízkosti p edpokládaného umíst ní hranice s podobným sm rem, nalezené bu ky jsou proloženy vhodnou aproxima ní k ivkou 5) známe po áte ní a koncové body hranice - iterativn postupn d líme spojnice již detekovaných sousedních element hranice a vyhledáváme další hrani ní elementy na normálách vedených st edy spojnic (zlatý ez). 6.3.2.4 Vyhledávání hranic pomocí Houghovy transformace - známe tvar a velikost p edm tu - eší problémy zkosení, nato ení a zm ny rozm r p edm tu - necitlivost výsledku segmentace na nedokonalá data, šum apod. 48 FEKT Vysokého u ení technického v Brn 6.3.3 Segmentace nar stáním oblastí Snaha o roz len ní obrazu do maximálních souvislých homogenních (z hlediska zvoleného parametru) oblastí. Kritérium homogenity – jasové vlastnosti, textura, barva. 6.3.3.1 Spojování oblastí Algoritmus: 1. Definuj po áte ní rozd lení obrazu do velkého množství malých oblastí (nejlépe jen bod). 2. Definuj kriterium spojování dvou sousedních oblastí. 3. Spojuj sousední oblasti vyhovující kritériu. Pokud již nelze spojit žádné dv oblasti bez porušení kritéria, skon i. Obr. 6.15. Spojování oblastí R zné výsledky pro r zné: - definice po áte ních oblastí - kritéria - po átky spojování - po adí p edkládaných oblastí - postupy spojování 6.3.3.2 Št pení oblastí - principieln opa ný p ístup než spojování - na za átku je jediná oblast (celý obraz) a ten se pak d lí dokud podoblasti nespl ují kritérium - št pení a spojování mohou dávat r zné výsledky 6.3.3.3 Št pení a spojování - využívá pyramidální reprezentaci obrazu – št pení a spojování je realizováno v rámci tvercových oblastí pyramidální datové struktury - je-li oblast v dané úrovni pyramidy nehomogenní -> oblast je rozd lena na ty i podoblasti - jsou-li oblasti navzájem homogenní -> dojde ke spojení do jedné Po íta ové vid ní 49 Obr. 6.16. Št pení a spojování 6.3.4 Segmentace srovnáním se vzorem Vyhledávání známých objekt nebo jen nap . vzor , textury, geometrických útvar v obraze pomocí srovnání se vzorem. Nikdy nem žeme o ekávat absolutní shodu – šum, zkreslení atd. => hledáme jen maximum vhodného kritéria a to pro všechny možné transformace obrazu (nato ení, zm na m ítka, zkreslení,…) - metody: - vzájemná korelace, - srovnání graf vytvo ených podle vlastností sledovaných objekt , - hledání shody ástí obrazu s jen jednotlivými ástmi vzoru, … 6.3.5 Sub-pixelové ur ení hranice I p esto, že je rozlišení obrazu omezeno digitalizací do kone né m ížky MxN pixel , lze ur it hrany s vyšší p esností než jeden pixel. Nap .: hrana je definována jasovou úrovní > 100 (jen pro ilustraci, v tšinou bývá hrana definována nap . jako polovina z inflexe). Obr. 6.17. Sub-pixelové ur ení hrany 50 FEKT Vysokého u ení technického v Brn 7 Integrální transformace obrazu (Richter) Kapitola bude dopln na v akademickém roce 2008/2009. 7.1 Fouriérova transformace Fouriérova transformace. 7.2 Rychlá Fouriérova transformace Rychlá Fouriérova transformace. 7.3 Diskrétní kosinová transformace Diskrétní kosinová transformace. 7.4 Waveletová transformace Waveletová transformace. Po íta ové vid ní 51 8 Formáty komprese (Petyovský) 8.1 Rozd lení zobrazovacích médii & & Podle typu zobrazení: Trvalé zobrazení (tiskárna, plotter) Do asné zobrazení (monitor, LCD panel) & & & & Podle fyzikálního principu zobrazení: Katodová obrazovka Plazmový panel LCD panel LED panel Podle barevné hloubky zobrazení: & & & Binární ( erná / bílá) Šedotónové (stupn šedé) Barevné (RGB, CMYK, další barevné modely) Podle charakteru zobrazení: & & & Rastrové zobrazení (monitor, tiskárna) Vektorové zobrazení (plotter, osciloskop, laserové zobrazova e) Trojrozm rné zobrazení (holografie, 3D brýle) 8.2 Reprezentace grafiky v pam ti po íta e Obr. 8.1. Obrazová funkce v pam ti po íta e 52 FEKT Vysokého u ení technického v Brn 8.3 Rastrové zobrazení Uspo ádání barevného rastrového obrazu v pam ti po íta e do BitPlán (BitPlanes) nej ast ji dle RGB. Obr. 8.2. Barevný rastrový obraz - bitplán Uspo ádání barevného rastrového obrazu v pam ti po íta e s využitím paletových registr . Obr. 8.3. Barevný rastrový obraz – barevná paleta 8.4 Vektorové zobrazení Obr. 8.4. Vektorová reprezentace obrazu Vektorový popis obsahuje pouze parametry základních grafických primitiv. (k ivek, p ímek, kružnic, elips atd.) mezi které pat í: & & & & umíst ní, zkosení, rotace parametry grafických primitiv (umíst ní, polom r, poloosy atd. ) barva tlouš ka ar Po íta ové vid ní 53 8.5 Komprese rastrového obrazu Základní d lení kompresních metod: & & & & Ztrátové (JPEG, Fraktální komprese, MPEG) Neztrátové Primární (RLE, LZW, LZ77) Sekundární (Huffmanova, Aritmetická komprese). & & D lení podle výpo etní náro nosti: Symetrické Asymetrické & & D lení podle po tu pr chod : Jedno-pr chodové Více-pr chodové 8.5.1 Komprese RLE Primární kompresní metoda, tak ka symetrická. Jednoduchá a pro velkou t ídu obrázk i efektivní metoda, vychází z p edpokladu, že v rastrovém obrázku, vzniklém jako kresba í skica, se opakují hodnoty sousedních pixelu. Tehdy do souboru zapíšeme nejprve po et opakujících hodnot a poté hodnotu samotnou. Nap íklad p i kódování pixel definovaných jedním bytem rozlišíme p íznak opakování hodnotou nejvyššího bitu: Obr. 8.5. Komprese metodou RLE Popis algoritmu: 1. Vynuluj íta 2. Do prom nné BarvaA p i a hodnotu pixelu. 3. Dokud jsou na vstupu pixely, opakuj: 3.1 Do prom nné BarvaB p i a hodnotu dalšího pixelu 3.2 Pokud BarvaA == BarvaB a zárove hodnota íta e nep esáhla maximální hranici (danou velikostí bytu, slova), pak íta = íta +1 Jinak: Zapiš íta a BarvaA na výstup Do prom nné BarvaA p i a hodnotu BarvaB Vynuluj íta 4. Zapiš íta a BarvaA na výstup 54 FEKT Vysokého u ení technického v Brn V p ípad , že kódovaný obrázek obsahuje neopakující se hodnoty v sousedních pixelech, dochází u metody RLE k záporné kompresi. Komprese RLE je vhodná pro obrázky kreslené ”od ruky” nebo tzv. ”Cartoons” – ilustrace s v tšími stejnobarevnými plochami. 8.5.2 Komprese LZ77/LZW Primární kompresní metoda, asymetrická. P vodní myšlenka pochází z roku 1977 A. Lempel, J. Ziv. Metoda LZ77 bývá n kdy v literatu e ozna ovaná i jako LZSS. Metoda se snaží nalézt ve vstupních datech opakující se sekvence symbol a ty na výstup p edat ve form odkazu na p edchozí (již odeslaná) data. Odkazem je myšlen údaj o pozici opakující se sekvence v p edchozích datech. Druhým d ležitým parametrem odkazu je délka opakující se sekvence. V praxi je navíc nutné odlišit b žná data od odkaz , abychom p i dekompresi byli schopni data správn dekódovat. Možností je n kolik, b žn používanou je rozší ení symbolu o další bit, který rozhodne, zda jde o data nebo odkaz (pozice, délka). Metoda je jedno-pr chodová což je výhodná vlastnost, zvlášt p i kompresi velkého objemu dat na hardwarové úrovni. Metoda je siln asymetrická, výpo etní náro nost p i kompresi je možné snížit použitím binárního vyhledávácího stromu. P íklad: m jme vstupní soubor o obsahu: ”the_rain_in_Spain_falls_mainly_in_the_plain” Výsledný komprimovaný soubor bude: ” the_rain_<3,3>Sp<9,4>falls_m<11,3>ly_<16,3><34,4>pl<15,3>” Metoda LZW – metoda LZ77 modifikována v roce1984 T. Welchem. Vzniklá metoda LZW bývá n kdy ozna ovaná jako dictionary based encoding. Metoda je patentována. Princip vyhledání d íve se opakujících sekvencí z stala zachována, modifikován je zp sob kódování. Metoda používá místo odkaz (pozice, délka) odkaz na položku slovníku, který je p i kompresi vytvá en a který neustále nar stá. Základní velikost je 512 položek a maximální velikost slovníku bývá v tšinou 4096. Po té je slovník smazán a metoda op t za íná se slovníkem velikosti 512 položek. Modifikací metody je systematické promazávání nejdéle nepoužitých slov ve slovníku. Metoda je také jedno-pr chodová, nesymetrická. 8.5.3 Huffmanova kompresní metoda Sekundární kompresní metoda. Myšlenka kódování pochází z roku 1952 od D. Huffmana je založena na použití r zn dlouhých bitových kód pro symboly s r znou frekvencí výskytu. V praxi používána dávno p ed r. 1952 nap . Morseovka (nej ast ji používané vstupní symboly mají nejkratší výstupní kód). Principem je vytvo ení binárního stromu na základ znalosti frekvencí výskytu jednotlivých symbol ve vstupním souboru. Tabulka 8.1. etnosti výskyt symbol Vstupní symbol Po et výskyt A 10 B 20 C 30 Po íta ové vid ní 55 Obr. 8.6. Huffmanovo kódování Tabulka 8.2. Výstupní et zce pro vstupní symboly Vstupní symbol A B C & & & Délka výstupního et zce Výstupní et zec 2 00 2 01 1 1 Pro dekompresi je nutné znát tvar bin. stromu proto je nutné: Strom ke komprimovaným dat m p ipojit Strom je fixn dán a je znám dop edu. Lze využít tzv. dynamickou tvorbu bin.stromu není nutné jej p enášet, ale menší kompresní pom r. 8.5.4 Diskrétní kosinová transformace (DCT) Nejedná se p ímo o kompresní metodu, pouze o transformaci dat. Diskrétní kosinová transformace je formou diskrétní Fourierovy transformace. Obrazová data jsou považována za barevné vzorky spojitých barevných signál nam ené v diskrétní síti pixel . Výsledkem DCT je pak nalezení sady parametr kosinových funkcí, jejichž složením lze rekonstruovat p vodní obraz. Rozklad na jednotlivé signály je výsledkem dop edné transformace (FDCT), která je vlastn p evodem do tzv. oblasti prostorových frekvencí. Zp tná transformace (IDCT) je potom rekonstrukcí z frekven ní oblasti prostorových frekvencí. Postup: obrazová data jsou rozd lena do tverc 8x8. Každý tverec je podroben samostatn DCT. Výsledkem je 8x8 koeficient F(u,v) získaných výpo tem z hodnot pixel f(x,y) podle vztahu: pro tzv. DC len (pro u,v=0), všude jinde (tj. AC leny C(u)=C(v)=1) Zp tná (inverzní) transformace má tvar: 56 FEKT Vysokého u ení technického v Brn Hodnoty získané dop ednou transformací necelo íselné, což je d ležité pro JPEG. celo íselných vstupních dat jsou 8.6 Grafické formáty 8.6.1 Formát PCX Autor: Zsoft PaintBrush. Komprese: RLE nebo nekomprimovan . Jeden z nejstarších formát , stále zna n rozší en pro svou jednoduchost. Umož uje ukládat obrázky v r zných barevných hloubkách od ernobílých až po 8 nebo 24 bit /pixel. Bitplánové uspo ádání. 8.6.2 Formát GIF Autor: CompuServe. Komprese: LZW. Formát z doby prvních VGA videokaret, specializovaný na obrázky z paletou p ípadn s jedním bitem na pixel. P vodn ur en k p enosu obrázk po telefonních linkách. Existuje ve dvou verzích G87a , G89a vylepšení pro WWW. Základní charakteristiky: & & & & Možnost tvo it animované sekvence (bannery) Možnost prokládání ádk . Definice pr hledné barvy Uložení dalších dopl kových údaj . Omezení na max. po et 256 barev je však kritickým faktorem pro jeho použití v budoucnu, za íná jej nahrazovat formát .PNG. 8.6.3 Formát PNG Autor: ISO (Portable Network Graphics). Komprese: LZ77 Všechny bitové hloubky. Zavádí pojem p edzpracování pixelu p ed samotnou kompresí. Má všechny vlastnosti formátu .GIF a mnohé další nap . dokáže ukládat obrázky v barevném modelu RGBA. V budoucnu pravd podobn nahradí .GIF. 8.6.4 Formát .JPEG Autor: Joint Photograhics Experts Group. Komprese: DCT, Kvantizace (nevratná ztráta informace), Hoffman. Po íta ové vid ní 57 Formát s vynikajícím kompresním pom rem 25:1, vhodný pouze pro snímky s v tší bitovou hloubkou (více než 8 bit na pixel). Využíván všude tam, kde je t eba dosáhnout velkého kompresního pom ru, a nevadí rušivé artefakty vzniklé ztrátovou kompresí. Postup komprese: Obr. 8.7. Kompresní metoda JPEG 8.6.5 Formát TIFF Autor: CCITT. Komprese: Všechny b žn používané komprese. Velice univerzální, velmi složitý formát. Dnešní verze TIFF 6.0. Formát využívaný pro profesionální práci s rastrovými snímky. A koliv je jasn a dob e dokumentovaný, mezi b žnými uživateli panuje ned v ra ke kompatibilit souboru TIFF, i když jsou stejné verze. Tento fakt je zp soben tím, že škála možností zápisu formátu je tak široká, že jen málokterý program dokáže interpretovat všechny povolené varianty. Tvrdí se, že: ”Každý umí zapsat sv j TIFF, ale málokdo umí íst jiný, než práv ten sv j”. 58 FEKT Vysokého u ení technického v Brn 8.7 Komprese digitálního videa Videem se rozumí sekvence obrázk , jdoucích rychle za sebou. Je-li frekvence vyšší než 16 Hz, není lidské oko schopné je od sebe odlišit, ili vzniká iluze pohybu. Pokud má snímek velikost 320x240 bod s 24 bitovou barevnou hloubkou, budeme pot ebovat pro jeho uložení 225KB (320*240*3/1024). P i použití 25 snímk za sekundu bude již pot eba pro uložení jedné sekundy videa p ibližn 5,5MB. To je zna ný objem dat, se kterým je nutné manipulovat. Proto pot ebuje datový tok výrazn zmenšit, k emuž slouží r zné druhy kompresních algoritm (bezeztrátové a ztrátové). 8.7.1 Bezeztrátové kompresní metody 8.7.1.1 RAW Video se ukládá naprosto bez komprese, což vede k neúnosným datovým tok m a velkému objemu uložených dat. P i rozlišení obrazu 720x576 (plný PAL), 25 snímcích za vte inu a 24 bitech na pixel, je výsledný datový tok: 29,7MB/s ! 8.7.1.2 HuffYUV Tento kodek využívá Huffmanova kódování, kdy se asto používané symboly nahrazují kratšími kódy. Typicky dosahuje úrovn komprese 2,5:1. Díky své rychlosti a beze-ztrátovosti je pom rn hodn používán. 8.7.2 Ztrátové kompresní metody MPEG - historie MPEG ( te se jako M-peg) je zkratkou pro Moving Picture Coding Experts Group, což je ozna ení dané rodiny mezinárodních standard používaných pro kódování audio-vizuální informace v digitáln komprimovaném formátu. Rodina MPEG standard obsahuje MPEG-1, MPEG-2 a aktuální MPEG-4, formáln známé jako ISO/IEC11172, ISO/IEC-13818 a ISO/IEC-14496. MPEG je p vodn ozna ení dané skupin expert , která vyvíjela tento standard. Tato skupina byla ustanovena v roce 1988. 8.8 Standardy digitálního videa 8.8.1 MPEG-1 MPEG-1 standard, ustanoven v roce 1992, je navržen k vytvá ení dostate né kvalitních snímk a zvuku p i nízkém datovém toku. Navržen byl pro práci s videem o rozlišení 352x288 bod a 25 snímk /s p i datovém toku 1.5Mbit/s, (ale umož uje práci až s rozlišením 4095x4095 pixel p i 30 snímcích / s). Norma MPEG-1 obsahuje ty i ásti: & IS 11172-1 (System): Popis synchronizace a multiplexování obrazu a zvuku. & IS 11172-2 (Video): Popis komprese neprovázaných video snímku. & IS 11172-3 (Audio): Popis komprese zvuku. Po íta ové vid ní & 59 IS 11172-4 (Compliance Testing): popis testování shody p enesených dat s daty p vodními. 8.8.1.1 Audio IS 11172-3 normy MPEG-1 popisuje kompresi audio signálu. Existují t i kódovací schémata nazývaná Layer 1 až 3. Rostoucí íslo "vrstvy" vyjad uje zvyšující se kvalitu zvuku a tím i v tší složitost kódovacího procesu. Každá vrstva má specifikován formát datového toku a dekodér. V souladu se zvyšující se náro ností a složitostí použitého algoritmu se zvyšujícím se íslem vrstvy je použita hierarchická kompatibilita vrstev. Z toho plyne, že dekodér postavený na ur itou vrstvu je schopen dekódovat i vrstvu s nižším íslem. MPEG-1 Layer-3 formát je více znám jako MP3. 8.8.1.2 Video Formát MPEG používá diskrétní kosinovou transformaci (DCT) obdobn jako JPEG. Snímky jsou rozd leny do t í skupin: I-frame (intraframe) – b žný snímek P-frame (predictive) nebo P-snímkem – rozdílový snímek mezi b žným snímkem a p edchozím I B-frame (bi-directional) snímky. – rozdílový obrázek mezi dv ma nejbližšími I i P- Každý snímek je samostatn komprimován pomocí DCT (JPEG), nejmenší komprese se dosahuje u I-snímk , nejlepší u B-snímk . Typicky jsou objemy snímk I:P:B po kompresi v pom ru 15:5:2. S praktických d vod jsou snímky kódovány v p esn definovaných posloupnostech s periodou 12 snímk : I B B P B B P B B P B B I tak, aby se každé 0.4 sekundy objevil jeden I-snímek. Vzhledem k tomu, že B-snímky jsou vztaženy k okolním snímk m, není p i p enosu i zápisu dat do souboru dodrženo uvedené po adí snímk . První ást posloupnosti I1 B2 B3 P4 B5 B6 P7 B8 B9 P10 B11 B12 I13 je zapsána jako I1 P4 B2 B3 P7 B5 protože pro zobrazení mezilehlých snímk B2 a B3 je pot eba znát snímek P4. 8.8.2 MPEG-2 MPEG-2 standard, ustanoven v roce 1994, byl navrhnut k vytvá ení vysoce kvalitních snímk p i vyšších datových tocích. MPEG-2 není nutn lepší než MPEG-1, dokonce MPEG2 p i nižších datových tocích (odpovídajících MPEG-1) nedává stejnou kvalitu obrazu jako MPEG-1. Na rozdíl ale od svého p edch dce p ináší podporu pro prokládané snímky (p lsnímky) a možnost využít prom nlivý datový tok. MPEG-2 definuje ty i úrovn komprese (level), ur ené maximálním rozlišením snímk , maximálním po tem snímku za sekundu a maximálním datovým tokem: Tabulka 8.3. Úrovn komprese standardu MPEG-2 Level Max. ší ka [pixely] Max. výška [pixely] Max. snímk [Hz] Max. dat. tok, [Mbit/s] Low 352 288 30 4 Main 720 576 30 15 High-1440 1440 1152 60 60 High 1920 1152 60 80 60 FEKT Vysokého u ení technického v Brn 8.8.3 MPEG-4 Vývoj MPEG-4 standardu byl zahájen v roce 1995 a dokon en koncem roku 1998 (ISO 14496). P vodn byl ur en pro velmi nízké datové toky, nyní umož uje kódování od velmi nízkých datových tok (2 Kbit/s pro zvuk, 5 Kbit/s pro video) do velmi vysokých (5 Mbit/s pro video, 64 Kbit/s na kanál pro audio CD kvalitu). Není to již p esná definice komprese a komprima ních algoritm , nýbrž množina parametr a vlastností, které musí kompresor spl ovat, aby byl MPEG-4 kompatibilní. Norma definuje osm ástí, z nichž n které jsou stále ješt ve vývoji. & ISO/IEC 14496-1 (Systems) & ISO/IEC 14496-2 (Visual) & ISO/IEC 14496-3 (Audio) & ISO/IEC 14496-4 (Conformance) & ISO/IEC 14496-5 (Reference Software) & ISO/IEC 14496-6 (Delivery Multimedia Integration Framework) & ISO/IEC 14496-7 (Optimised software for MPEG-4 tools) - stále ve vývoji & ISO/IEC 14496-8 (4 on IP framework) - stále ve vývoji MPEG-4 popisuje složky sluchové, vizuální a audiovizuální, nazývané ”media objects”. Tyto mediální objekty mohou mít p írodní nebo um lý p vod, ímž se myslí, že mohou být uloženy pomocí kamery nebo mikrofonu, nebo generované po íta em. Spojením t chto objekt vznikají ucelené celky, které popisují audiovisuální scénu. Generování scény m že vypadat nap íklad takto: & & & & & umíst ní mediálních objekt kamkoliv na scénu vymezenou sou adnicovým systémem aplikace transformací pro zm nu geometrických a akustických vlastností objektu spojení primitivních mediálních objekt a tím i vytvo ení ucelen jšího objektu aplikace datového toku na mediální objekty pro zm nu jejich vlastností (nap íklad zvuk, pohyblivou texturu náležící objektu, anima ní parametry ídící um lou tvá atd.) m ní se interaktivn sm r pohledu uživatele a poloha zdroje zvuku kdekoliv ve scén . Dále je zabezpe en výb r a synchronizaci dat, spojených s t mito objekty. Umož uje navíc r zné zp soby interaktivity a obsahuje podporu pro správu a ochranu duševního vlastnictví. 8.9 P íklady formát digitálního videa 8.9.1 DivX 3.11a Alpha V roce 1999 vytvo il MS Windows Media Tools 4, které obsahovaly t i kodeky MPEG4 ozna ené V1, V2, V3. V p vodní beta verzi bylo možné používat .avi soubory, ve finální pouze nový formát ASF. DivX 3.11a Aplha je nelegální a upravená verze kodeku ASF MSMPEG4v3, kde je povolené op tné užívání AVI soubor . Vznikly dva kodeky Slow motion a Fast motion. Jak již název napovídá, byla pouze zm n na distribuce bitratu. U Fast motion se Po íta ové vid ní 61 u scén s malým pohybem snižoval bitrate daleko více, takže u rychlých scén bylo možné použít v tší a tím i zvýšit kvalitu. 8.9.2 DivX 5.x V roce 2000 se p vodní autor DivX 3.11a s n kolika dalšími programátory vytvo il projekt OpenDivX (nazývaný také Project Mayo), který m l nahradit dosavadní nelegální DivX a vytvo it kodek MPEG-4, který bude open source a do jeho vývoje se mohl zapojit kdokoliv. Postupem asu založili vlastní firmu DivX Networks, jejíž výsledkem byl vlastní kodek DivX 4, založený na OpenDivX, kompatibilním se starým DivX 3, již ale nebyl open source. Jeho kvalita byla o n co horší, než DivX 3, šlo ale o pln legitimní projekt. Další verze p išly s výrazným zlepšením enkódování a kvalitativn se dostaly až na úrove DivX3 (a tedy MS MPEG-4 V3), kodek byl stále freeware. Za átkem b ezna 2002 pak p išla verze 5.0, která má další vylepšení v kvalit , ovšem vlastn jen v placené verzi DivX Pro. Základní verze je stále zdarma, z stává však kvalitativn na úrovni p edchozí, obsahuje ale r zné optimalizace pro zvýšení rychlosti plus pár v cí navíc. Novinkou je také nový formát soubor DivX, který by m l ešit problémy se synchronizací zvuku v AVI. 8.9.3 XviD Open source kodek, p vodn vycházející z DivX (pozpátku XviD). Jakmile byl projekt OpenDivX p eveden do komer ní báze, jejímž výsledkem byl kodek DivX4, skupina open source vývojá se rozhodla opustit OpenDivX a založit vlastní kodek, zp tn kompatibilní s DivX. 8.9.4 MJPEG Na rozdíl od MPEG formátu se jedná pouze o sekvenci snímk pop ípad p lsnímk , které jsou nezávisle na sob komprimovány pomocí stejným principem, jako snímky u MPEG-1. 8.9.5 ASF ASF je zkratka pro Advanced Streaming Format. Jedná se o chrán ný formát vyvinutý firmou Microsoft pro streaming videa podporující DRM. V tšina ASF soubor je založena na Microsoft MPEG-4 V2 technologii. Maximální rozlišení je 352x288 bod . 8.9.6 QuickTime Nejedná se jen o formát, ale o vlastní video platformu (založenou na MPEG-4), vytvo enou firmou Apple. Oblíben na internetu, umož uje streaming. 8.9.7 VCD (video CD), SVCD (super video CD) Formáty ur ené k ukládání videa na CD. VCD využívá MPEG-1 p i rozlišení 352x280a konstantním datovém toku. Maximální délka videa uložená na VCD je cca. 74minut. 62 FEKT Vysokého u ení technického v Brn SVCD využívá MPEG-2 p i rozlišení 480x576 a variabilní datový tok. Maximální délka videa uložená kolísá mezi 35 – 70 minutami. SVCD umož uje uložit šesti-kanálový zvuk. (5+1). Oba formáty umož ují definovat interaktivní nabídky (menu). 8.9.8 DVD (digital versatile disc) Využívá formát MPEG-2 ale navíc definuje strukturu adresá a další vlastnosti (zvukové a titulkové stopy, menu) kterými je samotné MPEG stream “obalen”. Celé DVD tedy neobsahuje žádný soubor .MPG, ale pouze soubory : .IFO, .VOB, .BUP. 8.9.9 Blue-Ray, HD DVD, VMD Využití laserového paprsku o kratší vlnové délce, umožnilo navýšit, kapacitu nových datových medií oproti DVD a umožnilo ukládat HD (High Definition) video (1920x1080). Kapacita nových medií dosahuje 25-50Gb. V sou asné dob jsme sv dky boje standard Blue-Ray (Sony), HD DVD (Toshiba). Další alternativou je VMD (Versatile multilayer disc). Po íta ové vid ní 9 Morfologie obrazu (Horák) Kapitola bude dopln na v akademickém roce 2008/2009. 63 64 FEKT Vysokého u ení technického v Brn 10 Detekce a parametrizace geometrických tvar (Kalová) 10.1 Houghova transformace Jedná se o metodu pro nalezení objekt v obraze, u níž je t eba je t eba znát analytický popis tvaru hledaného objektu – detekce známého jednoduchého tvaru (p ímka, kružnice, elipsa, trojúhelník). Lze ji ale použít i tam, kde není možný jednoduchý, analytický popis objektu – detekce libovolného tvaru – zobecn ná Houghova transformace (generalized HT). - vyhledávání hranic nebo ur ování orientace objek - nejvhodn jší aplikace na binární (naprahovaný) vyhranovaný snímek - mapování bod na k ivky (do prostoru p íznak a naopak); s ítací bu ky : s ítají kolik bod pat í k p ímce. Výhody: - málo citlivý na šum - necitlivý k porušení hranic - použitelné i p i áste ném zakrytí objekt Nevýhody: - problém p esnosti – blízké rovnob žné áry m žou vlivem diskretizace vytvo it jen jedno maximum - zkreslení „zak iví“ p ímky ve výsledku n kolik maxim = n kolik p ímek. - ne íká nic o po átku a konci k ivek, nap . získáváme p ímky místo úse ek - rychlost, pracnost – vícenásobné vno ené cykly – snaha snížit výpo etní náro nost – RHT (randomized HT) Monte Carlo – náhodný výb r bod – pyramidy – postupné zp es ování (v „zajímavých“ oblastech) – každá další má polovi ní rozlišení, kvadrantové stromy 10.1.1 Detekce p ímek Rovnice p ímky nap íklad ve sm rnicovém tvaru y k x q je mén vhodná, protože intervalem možných hodnot parametru k (sm rnice) je celá množina reálných ísel, p ímka se mapuje na bod, bod na p ímku. Obr. 10.1. Reprezentace p ímky v prostoru (x,y) a prostoru (k,q) Po íta ové vid ní 65 Rovnice v normálovém tvaru r x cos y sin , kde r je délka normály p ímky od po átku, je úhel mezi normálou a osou x, p ímka se mapuje na bod, bod na k ivku; interval hodnot nap . ;0;360 <) a r ;0;velikost úhlop í ky obrázku): Obr. 10.2. Reprezentace p ímky v prostoru (x,y) a prostoru ( ,r) Algoritmus: 1. Pro všechny body binárního snímku hran I, pro které I(x, y) = 1 a pro úhly x cos y sin - ur i r : r - do akumulátoru H o rozm rech 2. =0 : 359;0 : x2 y2 > od 0 do 359: na pozici ,r p i ti jedni ku Nalezni maximum (maxima) akumulátoru H Obr. 10.3. Originální snímek a snímek hran jako vstup HT Obr. 10.4. Hough v prostor maxim a p vodní snímek s nalezenými p ímkami 66 FEKT Vysokého u ení technického v Brn 10.1.2 Detekce kružnic Nej ast ji pracuje s rovnicí: ( x a ) 2 ( y b) 2 x a r cos1 kružnice: y b r sin 1 r 2 nebo parametrickým vyjád ením Hledané parametry jsou a, b a r => Hough v prostor má dimenzi 3, ímž vzr stá výpo etní náro nost. Výhodou je apriorní znalost alespo jednoho parametru (nebo odhad = omezení intervalu hledání). Obr. 10.5. Detekce kruhových objekt (r=50 pxl) pomocí HT 10.1.3 Zobecn ná Houghova transformace Zobecn ná Houghova transformace je ur ena pro objekty, které není možné jednoduše analyticky popsat. Popis hranice hledaného vzoru je realizován pomocí explicitního seznamu (LUT – look up table) všech bod hranice (tvaru) – pozice všech pixel relativn k n jakému referen nímu bodu (p . t žišt ). Obr. 10.6. Popis hranice obecného tvaru polohovými vektory Algoritmus: 1. Pro všechny body binárního snímku I, pro které I(x, y) = 1 a pro každý pixel pi hranice vzoru: 2. - ze seznamu získej relativní pozici bodu pi od referen ního bodu - p idej tento offset k pozici pi - inkrementuj tuto pozici v akumulátoru Ur i lokální maxima v akumulátoru Obr. 10.7. Sestavování Houghova prostoru Po íta ové vid ní 67 Obrázek nazna uje jednoduchý p ípad, kdy je uvažována pouze translace vzoru, pokud chceme ešit i zm nu m ítka a rotaci, musíme p idat další dva parametry (dimenze, vno ené cykly) – s (scale), 1 (nato ení – celého objektu). 10.2 Další segmenta ní metody 10.2.1 Vypl ování oblastí Definice oblasti souvisí s popisem její hranice: & & geometricky ur ená hranice – posloupnost bod definující mnohoúhelník hranice nakreslená v rastru – libovolný tvar, nutná znalost barvy hranice nebo vnit ních bod Barevný p echod dvou barev, vypl ování vzorem, šrafování, vypl ování texturou. 10.2.1.1 Vypl ování geometricky ur ené hranice – ádkové vypl ování Každým ádkem je vedená pomyslná ára a jsou hledány její pr se íky s hranicí oblasti, nalezené pr se íky se se adí podle sou adnic x – dvojice pr se ík ur uje úse ky ležící uvnit oblasti. Obr. 10.8. Geometricky ur ená hranice objektu Problémy s vrcholy a vodorovnými hranicemi, proto vhodn jší algoritmus: 1. 2. 3. Pro všechny hrani ní úse ky ov : a. je-li vodorovná, tak ji vynechej b. uprav orientaci shora dol c. zkra hranice zdola o jeden pixel d. ur i mezní sou adnice celé hranice ymax a ymin Pro všechna y od ymin do ymax prove : a. nalezni pr se íky hrani ních úse ek s ádkem y b. uspo ádej všechny pr se íky podle sou adnice x c. vykresli úseky mezi lichými a sudými pr se íky Vykresli hranici oblasti Obr. 10.9. Kroky 1a, 1b a 1c algoritmu vypl ování oblasti 68 FEKT Vysokého u ení technického v Brn Obr. 10.10. Kroky 2a, 2b+c a 3 algoritmu vypl ování oblasti 10.2.1.2 Vypl ování hranice nakreslené v rastru – semínkové vypl ování Základem je semínko – libovolný vnit ní bod (ur í uživatel nebo dané znalostmi o oblasti). Hranice není jasn definována, všechny informace o oblasti se získávají pouze z obrazu (z obrazové = rastrové pam ti). Od semínka se postupn rozši uje prohledávání obrazové pam ti a nalezeným vnit ním bod m je p i azena nová barva. 4-spojitá x 8-spojitá oblast, 4-spojitá x 8-spojitá hranice. Obr. 10.11. Semínkové vypl ování – po áte ní body & & & Hrani ní vypl ování = bod je vnit ní, pokud má jinou barvu než hranice Záplavové vypl ování (lavinové, p ebarvování) = bod je vnit ní, pokud má stejnou barvu jako semínko M kké vypl ování = bod je vnit ní, pokud má výrazn jinou barvu než hranice (hranice byla vyhlazena a má nestejnou barvu) a) Jednoduché semínkové vypl ování Rekurzivní algoritmus – ší ení semínka do všech stran => prakticky nepoužitelné – každý pixel je testován n kolikrát, mnohonásobné zano ení rekurze - možné ešit pomocí zásobníku. Algoritmus – rekurze: Seminko(x,y) Je-li bod [x,y] vnit ní, pak: 1. obarvi bod [x,y] požadovanou barvou 2. prove Seminko(x+1,y) 3. prove Seminko(x-1,y) 4. prove Seminko(x,y+1) 5. prove Seminko(x,y-1) b) ádkové semínkové vypl ování Vyhledávání sousedních bod je provád no v jednom ádku pixel bezprost edn nad ním a pod ním má smysl hledat nová semínka. (úsek), pouze Po íta ové vid ní 69 Algoritmus – zásobník: 1. 2. Vlož první semínko do zásobníku Dokud není zásobník prázdný, opakuj: a. vyjmi semínko se sou adnicemi [x,y] ze zásobníku b. nalezni hranici xL a xR na ádku y v nejbližším okolí bodu [x,y] c. nakresli úse ku [xL,y],[y,xR] d. na vyšší úse ce [xL,y-1], [xR,y-1] hledej souvislé nevypln né vnit ní úseky a pro každý z nich vlož do zásobníku sou adnici jednoho vnit ního bodu e. na nižší úse ce [xL,y+1], [xR,y+1] hledej souvislé nevypln né vnit ní úseky a pro každý z nich vlož do zásobníku sou adnici jednoho vnit ního bodu Obr. 10.12. Postup ádkového semínkového vypl ování 10.2.1.3 Barvení oblastí Obvyklá metoda – každou samostatnou souvislou oblast opat íme neopakujícím se p irozeným íslem – pozadí má íslo 0, oblastem jsou p i azena ísla postupn od 1. Nejv tší identifika ní íslo oblasti tedy udává po et oblastí v obraze. Jiná možnost – použijeme menší po et identifika ních ísel – pouze zajistíme, aby žádné dv sousední oblasti nem ly stejné identifika ní íslo. Teoreticky sta í ty i barvy (resp. ísla). Pro identifikaci oblastí je pak t eba mít pro každou oblast uloženou informaci o poloze n kterého jejího bodu. Algoritmus: 1. procházíme obraz po ádcích a každému nenulovému obrazovému elementu p i adíme hodnotu podle hodnoty všech jeho již obarvených soused - jsou-li všechny nulové, p i adíme bodu dosud nep id lenou barvu - pokud je jeden nenulový, nebo je více nenulových, ale se stejnou barvou, p i adíme bodu tuto jeho/jejich barvu - pokud je více nenulových s r znou barvou, p i adíme bodu jednu z t chto barev a zaznamenáme barvy do tzv. tabulky ekvivalence barev (došlo k tzv. kolizi barev) Obr. 10.13. Sledované pixely pro 4 okolí a 8 okolí Obr. 10.14. Kolize barev 4 okolí Obr. 10.15. P íklady kolizních objekt 2. projdeme znovu celý obraz po ádcích a p ebarvíme obrazové body kolizních barev podle tabulky ekvivalence barev P .: kolize barev 7 a 9 = všechny pixely s barvou 9 p ebarvíme na 7 (po et oblastí 70 FEKT Vysokého u ení technického v Brn bude od zjišt ného ísla po prvním pr chodu o jednu nižší). Chceme-li aby žádná barva nebyla vynechána (barva 9), musíme zbytek oblastí p e íslovat (p ebarvit). Obr. 10.16. P vodní a prahovaný obraz (vlevo), první a druhý pr chod algoritmu (vpravo) 10.2.2 Aktivní kontury (snakes, active contours) Metoda ur ování hranic mezi oblastmi, metoda postupného tvarování kontur až ke hran objektu v obraze. Aktivní kontura je ízená uzav ená kontura, která se deformuje vlivem tzv. vnit ních, obrazových a vn jších sil. Vnit ní síly kontrolují hladkost pr b hu, obrazové síly sm rují tvarování kontury sm rem ke hran objektu a vn jší síly jsou výsledkem po áte ního umíst ní kontury. M jme konturu reprezentovanou diskrétn jako sadu bod : pn x n , y n , pro n 0,1,...N Výsledná pozice aktivní kontury koresponduje s lokálním minimem energie kontury: Es N EN pn n 1 N n 1 E I pn N ET p n , n 1 kde EN je vnit ní energie kontury (ohyb, zlom), EI reprezentuje energii obrazu a ET energii omezení. Existuje mnoho navržených postup m ení výše uvedených energií. Obr. 10.17. Aktivní kontury – po áte ní stav, standardní postup a modifikovaná verze 10.2.3 Level-set Metoda ur ování hranic mezi oblastmi, obdobný p ístup jako aktivní kontury. K ivka je reprezentována tzv. nulovou hladinou – ezem v rovin xy (zero level set) n jakou vícedimenzionální funkcí. Tato funkce se nazývá level set function a každému bodu roviny xy p i azuje jeho výšku u nad nulovou hladinou (viz obrázek). Povrch funkce se postupn adaptuje vzhledem k zadaným metrikám k ivosti a obrazovým gradient m. Základní rozdíl level-set metody proti klasickým aktivním konturám je ten, že tvar k ivky nem níme p ímo, ale prost ednictvím level-set funkce. Po íta ové vid ní 71 Obr. 10.18. Level-set funkce pro uzav enou 2D k ivku C Level-set segmentace je efektivn jší pro komplexní objekty se složitými tvary, vyžaduje manuální inicializaci, která p ibližn odpovídá cílovému tvaru k ivky. Obr. 10.19. Po áte ní, pr b žný a koncový stav segmentace metodou Level-set 10.2.4 Watershed Metoda vycházející z oblastí, watershed = rozvodí, povodí i vodní p ed l, segmenta ní metoda vycházející z geografie – obraz je chápán jako terén nebo topografický reliéf, který je postupn zaplavován vodou – jas vstupního obrázku ur uje výšku terénu ( erná nejníže, bílá nejvýše). Algoritmus v prvním kroku nalezne nejnižší body (lokální minima obrazu). Potom se povodí za nou z t chto po áte ních bod zapl ovat vodou – hladina stoupá. V místech, kde by se voda ze dvou r zných povodí mohla slít jsou vytvo eny hráze. Proces zaplavování je zastaven až ve chvíli dosažení nejvyššího bodu terénu (maxima obrazu). Výsledkem je obraz rozd lený do region , jednotlivých povodí odd lených hrázemi. - všechny body daného povodí jsou ozna eny stejným unikátním indexem - pro obrazy obsahující šum vytvá í p íliš mnoho oblastí – ešení: o vždy je nutná vhodná p ed-p íprava obrázku o povolení hráze až ur ité prahové výšky o regiony pat ící do stejné oblasti lze pozd ji spojit jinými metodami Obr. 10.20. áry reprezentující hráze (watershed lines) 72 FEKT Vysokého u ení technického v Brn 10.2.5 Shluková analýza P edevším statistická klasifika ní metoda, ale základní postupy lze využít i pro segmentaci. Shlukování pixel nebo ur itých ástí obrazu podobných vlastností. Každý pixel ( ást obrazu) je reprezentován vektorem obsahujícím výsledky jednotlivých m ení – charakteristickými rysy – p íznaky: x x1 , x2 ,...x N Nap . jas (pr m rný jas), barva, vlastnosti okolí – st ední hodnota okolních pixel , rozptyl, apod. - p íznaky musí být voleny tak, aby pixely z jedné oblasti byly ohodnoceny podobn a z r zných oblastí rozdíln = data by m la být v pevném shluku v N-rozm rném prostoru. ne ízená = bez u itele – sama ur í po et t íd a hranice mezi nimi Obr. 10.21. P íklad shlukování dvou p íznak ve 2D prostoru Obr. 10.22. Detekce registra ních zna ek pomocí shluku vertikálních ar 10.3 Úpravy obrazu 10.3.1 Transformace barev – omezení barevného prostoru & & & & & Typy snímk : binární – výhodou je snadn jší vyhodnocení, nevýhodou je nižší p esnost šedotónový – náro n jší a delší výpo ty, dosahuje se v tší p esnosti binární + šedotónový – ernobílý obraz se p evede na binární, tam se „hrub “ nalezne tvar a v p vodním obraze se provede up esn ní barevný – ada možností pro další zp esn ní (rozd lit na složky a každou složku zvláš , vybrat pouze nejvýznamn jší barevnou složku, komplexní ešení ve všech složkách, p evést na jiný-vhodn jší barevný formát (RGB, CMYK, HSL, …), kde vyniknou požadované vlastnosti p evod na vhodný typ je dobré ud lat v HW – jednoduché algoritmy 10.3.2 Barevný & Šedo-tónový z hlediska dalšího zpracování obrazu Po íta ové vid ní 73 - & m žeme každé složce barevného obrazu p i adit stejnou váhu Iz 0, 33R 0, 33G 0, 33B - m žeme pracovat pouze s jednou dominantní složkou z hlediska vnímání obrazu lov kem – využívá se r zné citlivosti oka na r zné složky Io 0,299 R 0,587G 0,114 B Obr. 10.23. P evod barevného obrazu na šedo-tónový Obr. 10.24. R,G a B složky barevného obrazu 10.3.3 Šedo-tónový & binární z hlediska dalšího zpracování - prahování - zvolení vhodného prahu vzhledem ke snímané scén - bu plochy nebo hrany – bu aplikujeme p ímo na p vodní snímek nebo na nahranovaný (hranové filtry) Obr. 10.25. Prahovaný šedo-tónový snímek a snímky hran (Sobel, Canny) & z hlediska vnímání obrazu lov kem - p i snaze o zachování barevného vjemu i u ernobílého obrazu se využívá schopnosti lidského oka vytvá et z n kolika blízkých barevných paprsk vjem paprsku jediného, jehož barva je dána aditivním složením barev p vodních paprsk = rozptylování 74 FEKT Vysokého u ení technického v Brn 10.3.3.1 Náhodné rozptýlení Algoritmus: Cyklus p es všechny sou adnice obrazu x,y: Pokud Cin > random(0:255), tak Cout = 1, jinak Cout = 0. 10.3.3.2 Pravidelné (maticové) rozptýlení P edem vytvo eny vzory erných a bílých bod , které budou zastupovat jednotlivé odstíny v originálním obraze. & & zv tšování obrazu – místo p vodního pixelu vložíme celou vybranou masku zachování velikosti obrazu – místo p vodního pixelu vložíme jen odpovídající pixel masky: Pokud Cin > M[(X mod XmaskSize),(Y mod YmaskSize)], tak Cout = 1, jinak Cout = 0 $0 0! $0 0! "0 0 "0 1 # # Cin 0 Cin 1 M display $0 0! "1 1 # Cin $ 0 12 3 15! " 8 4 11 7 " " 2 14 1 13 " #10 6 9 5 $0 1! "1 1 # 2 Cin M tisk $1 1! "1 1 # 3 Cin 4 $1 5 9 2 ! "8 12 13 6 " "4 15 14 10 " #0 11 7 3 10.3.3.3 Distribuce zaokrouhlovací chyby Algoritmus Floyd-Steinberg, Burkes, Stucki. Obr. 10.26. Náhodné rozptýlení, maticové rozptýlení 10.3.4 Geometrické transformace obrazu Transformace obecn nep i adí diskrétním celo íselným sou adnicím pixelu ve vstupním obraze diskrétní celo íselné sou adnice v obraze výstupním – díry nebo naopak n kolik pixel mapovaných na totéž místo. 10.3.4.1 Zm na rozlišení - zmenšení i zv tšení n kolik r zných algoritm lišících se v kvalit rekonstrukce a v asové náro nosti v tšinou separabilní operace – možné aplikovat na ádek a pak na sloupec zvláš – konvoluce a) Interpolace nejbližším sousedem Po íta ové vid ní - 75 nejjednodušší – nearest neighbour interpolation, point shift, sample and hold výpo et spojité funkce g(x) z diskrétní funkce f(xk) definované v diskrétních bodech xk, k = 1,…n: 1 pro : 0 x : 0.5 xk 1 xk xk xk 1 g ( x ) f ( xk ); , konvolu ní jádro h( x) { :x 0 pro : 0.5 x 2 2 b) Bilineární transformace - postupná aplikace lineární interpolace - dva sousední vzorky v bodech x0 a x1 s hodnotami f0 a f1, body se proloží úse kou a hledaná hodnota v bod x se vypo te jako 1 x pro : 0 x : 1 ! $ x x0 = f1 f 0 > , konvolu ní jádro h( x) { f ( x) f 0 " 0 pro :1 x # x1 x0 Obr. 10.27. Zm na rozlišení c) Další metody - využívají více informací z p vodní p edlohy - aproximace složit jšími funkcemi – polynomiální, goniometrické, exponenciální - výpo etn náro n jší Parzenovo okno – aproximace okolí bodu B-spline plochou h( x) 1 { 6 3x 3 x 3 6x 2 4 6x 2 12 x 8 0 pro : 0 pro : 1 pro : 2 x :1 x :2 x 10.3.4.2 Otá ení diskrétního obrazu - - násobky devadesáti stup – zám na pixel na p íslušných pozicích v matici transformace otá ení – u,v sou adnice vstupního obrazu; x,y sou adnice výstupního obrazu x u cos 1 v sin 1 y u sin 1 v cos 1 otá ení o obecný úhel – dvoupr chodový algoritmus (two-pass algoritm) 1. pr chod – na všechny ádky y 2. meziobraz I = x, v > chod – nelze aplikovat transformaci x u cos 1 v sin 1 , protože ta je funkcí u, se kterým již bylo u sin 1 v cos 1 pr po ítáno. Proto u vyjád íme jako funkci x a v a dosadíme do p edchozího: 76 FEKT Vysokého u ení technického v Brn x sin 1 v cos 1 výpo et hodnoty, která se bude mapovat do výstupního obrazu, lze použít libovolnou metodu p evzorkování v okolí bodu [u,v] y - 10.3.4.3 O ezávání - p i kreslení do okénka nebo do zobrazovacího pole je nutno zrušit ásti grafických prvk , které leží mimo ur enou oblast dále popsané metody (krom e)) p edpokládají obdélníkovou oblast ur enou body: xwmin, xwmax, ywmin, ywmax a) O ezávání bod – test polohy bodu - jednoduché porovnání sou adnic - bod na pozici (x,y) pat í do okénka, pokud spl uje nerovnosti x 9 xwmin ; x xwmax ; y 9 ywmin ; y ywmax b) O ezávání úse ky - nejd íve se ur í, zda úse ka zcela pat í nebo nepat í do okénka. Zbylé úse ky musí být o ezány áste n – ur ení pr se ík s hranicemi okénka kódování – každému vrcholu úse ky je p i azen tyrmístný dvojkový kód – jednotlivé bity znamenají: Obr. 10.28. Okénko vyty ující oblast pro o ezání P .: bod uvnit okénka Algoritmus: ; bod pod okénkem a sou asn vlevo od n j 1. Pokud oba vrcholy úse ky mají kód 2. Pokud logický sou in (and) kód vrchol je r zný od 3. , leží celá úse ka uvnit okénka , leží celá úse ka vn okénka. P .: vrcholy mají kódy , tedy oba leží vlevo od okénka Ostatní p ípady – úse ka prochází n kolika oblastmi a je t eba ji o íznout a. nalezneme pr se ík s jednou z hrani ních ar okénka, ímž ur íme, která ást úse ky má být odstran na. Pozn.: u obdélníkové oblasti je jedna ze sou adnic pr se íku totožná s mezní sou adnicí okénka b. pro nový konec úse ky ur íme kód a vyhodnotíme polohu úse ky c. opakujeme pro ostatní hranice tak dlouho, až zbytek úse ky leží celý uvnit nebo vn okénka c) O ezávání mnohoúhelníku - metoda Sutherlanda a Hogmana – postupné o ezávání mnohoúhelníku ur eného posloupností vrchol jednotlivými hranicemi okénka Po íta ové vid ní 77 Obr. 10.29. O ezávání obdélníku – postup Algoritmus: 1. 2. Pro každý vrchol (vycházíme z S a zpracováváme P). Mohou nastat ty i možné situace (viz p edchozí obrázek): a. S je uvnit a P také => P je uschován b. S je uvnit a P je vn => vypo ítáme pr se ík I a uschováme jej, vrchol P je vylou en c. S je vn a P také => P je vylou en d. S je vn a P je uvnit => vypo ítáme pr se ík I a uschováme jej spolu s vrcholem P Zopakujeme pro další hranici (viz následující obrázek) Obr. 10.30. O ezávání obdélníku – výsledek d) O ezávání textu - metoda „vše nebo nic“ - Je-li celý et zec uvnit okénka, je ponechán, jinak je celý vypušt n - metoda „celý nebo žádný znak“ - z et zce jsou vynechány jen ty znaky, které neleží celé uvnit okénka - metoda „o ezání jednotlivých znak “ - se znaky zacházíme stejn jako s mnohoúhelníky e) O ezávání obecným nekonvexním oknem - nap . obecný Weiler-Atherton v algoritmus pro o ezávání libovolného polygonu nekonvexním oknem. 78 FEKT Vysokého u ení technického v Brn 11 Klasifikátory a automatické t íd ní (Petyovský) 11.1 Pojmy Strojové u ení – Strojová klasifikace “pattern recognition“ – nauka o získávání a zpracování znalostí. Obr. 11.1. P ístup klasického zpracování dat (vlevo) a strojové klasifikace (vpravo) Znalost – informace o dané problematice. Další rozd lení: M lká znalost – vychází z pozorování skute nosti, povrchní popis jev . Hloubková znalost – vyjad uje vnit ní zákonitosti jev (nap . Ohm v zákon). Deklarativní znalost – lze formáln zapsat jako pravidla (nap . pravidla pro hraní šachu). Procedurální znalost – znalost získaná opakovaným provád ním cvi ením (nap . hraní šachu, ízení vozidla). Taková znalost obsahuje mnoho aspekt , pro pot eby strojového u ení obtížn využitelné. (strategie, typické varianty atd.) Inference: postup k dosažení výsledku – odvození. Základní typy jsou dedukce, abdukce, indukce. T F? ? C. Dedukce – pokud známe F, T a ur ujeme C. Vždy jistý správný výsledek (s ohledem na správné T) nap . T: y=x^2; F:x=2; C:y=??). Abdukce – proces, kdy známe C, T a hledáme F. Není zaru en správný výsledek (nap . T: y=x^2; C:y=9; F:x=3 nebo x=-3 ?). Indukce – proces, kdy známe F, C a hledáme T. Není zaru en správný výsledek (nap . F:x=3; C:y=9; T: y=x^2 nebo y=x*3, atd..??). Strojové u ení tedy p edstavuje proces hledání (inference) znalosti pomocí mechanism indukce. Klasifikátor: je algoritmus, který p i vhodné množin znalostí je schopen úsp šn rozd lovat vstupní data s hodnotami atribut (p íznak ), do výstupních p edem zvolených skupin (t íd). Vhodná volba klasifika ního algoritmu p edstavuje nutnou podmínku k úsp šné klasifikaci. Po íta ové vid ní 79 Obr. 11.2. Vstupy a výstupy klasifikátoru Pozn.: v p ípad že po et výstupních t íd klasifikátoru je roven dv ma (ano / ne), jedná se o tzv. úlohy dichotomické klasifikace. - Úkolem strojového u ení je zvolit: Vhodné p íznaky Klasifika ní metodu Metodu u ení, vyhodnocení chyb klasifikace Interpretace výsledk u ení Implementace klasifikátoru do cílové aplikace Postup použití klasifika ní metody: U ení – generování znalostí (modelu) s ohledem na typ klasifikátoru. Ov ování – verifikace znalostí na jiných datech, než byly použity p i u ení a výpo et p esnosti klasifikace. Klasifikace – b žný provoz nau eného klasifikátoru. Ur ení p esnosti klasifikace – lze ji vyjád it jako procentuální pom r mezi po tem správn za azených vzor ku po tu všech p edložených vzor v testovací množin . klas 100 N ok N celk [%] Pozn.: pro dichotomické úlohy p edstavuje chyba klasifikace 50% tzv. nenau ený klasifikátor (Tj. klasifikátor odpovídající naprosto náhodn na p edložené vzory). Kompletní a konzistentní model znalostí klasifikátoru – tyto pojmy p edstavují popis modelu vzhledem k ur ité t íd : Kompletní model – u ením vzniklá množina znalostí pokrývá všechny pozitivní p ípady (ale možná i n které negativní). Konzistentní model – u ením vzniklá množina znalostí nepokrývá žádný negativní p ípad (ale možná nepokrývá i n které pozitivní. Obr. 11.3. Kompletní a konzistentní model znalostí 80 FEKT Vysokého u ení technického v Brn Obr. 11.4. P etrénování (over-fitting) klasifikátoru Na obrázku je patrný problém p etrénování klasifikátoru. Proto je lépe netrvat na konzistenci p ípadn úplnosti popisu pokud to není nutné (brát ohled na aplikaci). P íliš p esný popis vzhledem k trénování množin má velmi asto nižší p esnost vzhledem k reálným dat m. 11.2 Rozd lení klasifikátor : Podle použitých metod klasifikace: Symbolické – metody založené na rozhodovacích stromech (nap . ID3). Sub-symbolické – nebo také “biologicky inspirované” metody (nap . neuronové sít , genetické algoritmy). Statistické – využívající regresní nebo jiné statistické metody (nap . Bayes v odhad). Pam ové – metody založené na ukládání instancí t íd (nap . IBL). Podle charakteru u ení: Dávkové – zpracuje vždy celou cvi nou množinu naráz. Typické pro symbolické metody klasifikace. Inkrementální – cvi né p íklady lze dodávat postupn , nau ená znalost se podle nich pr b žn aktualizuje. Typické pro statistické metody klasifikace. Inkrementální se zapomínáním – zapomínání ástí znalostí se muže jevit jako výhodné v p ípad , kdy je n který významný atribut skryt nebo jsou n které hodnoty atribut cvi né množiny zatíženy šumem více než jiné. 11.3 Lineární klasifikátor P edstavuje jednoduchou klasifika ní metodu založenou na rozd lení prostoru p íznak pomocí po ástech lineárními úseky. Prostor p íznak je obecn prostor s mnoha dimenzemi, proto hovo íme o separaci prostoru p íznak nad-rovinami (pop . nad-plochami). Po íta ové vid ní 81 Obr. 11.5. Lineárn separabilní prostor p íznak Obr. 11.6. Schéma lineárního klasifikátoru sr g1 X 1 g 2 X 2 .... g n X n Úkolem u ení klasifikátoru je zvolit vhodné konstanty g (p ípadn parametry funkce sign). Pokud lze tuto podmínku separace prostoru splnit p i chyb klasifikace 0%, hovo íme o lineární separabilit prostoru p íznak . Návrh lineárního klasifikátoru je možné si také p edstavit jako výb r vhodného reprezentanta t ídy v prostoru p íznak (tzv. etalon, normál). Proces u ení potom p edstavuje výb r vhodného etalonu zastupujícího celou t ídu. Proces klasifikace neznámého vzoru lze v tomto p ípad p evést na hledání nejmenší vzdálenosti neznámého vzoru od n kterého z etalon t íd. Neznámý vzor je následn klasifikován do té t ídy, od které má nejmenší vzdálenost. Funkce pro ur ení míry vzdálenosti se nazývá diskrimina ní funkce, a má nej ast ji tvar eukleidovské vzdálenosti. Vs X (Vs X )T (VS X) Kde Vs p edstavuje informaci o poloze s-tého etalonu v prostoru p íznak . X p edstavuje informaci o poloze klasifikovaného vzoru. Úkolem je nalézt minimum vzdálenosti od n kterého z etalon . min Vs XT X X 2 min( VsT Vs 2 max(VST X 2 VST X 1 2 VsT Vs ) XT X) 82 FEKT Vysokého u ení technického v Brn Výraz XT X má pro každý z etalon konstantní hodnotu, proto ho lze p i výpo tu maxima odstranit (pozn. Stejn jako násobení výsledku konstantou). Výsledná diskrimina ní funkce lze tedy zapsat ve tvaru: (V ST X 1 2 V sT V s ) Hodnota výrazu (1/2 VsT Vs) závisí pouze na poloze daného etalonu, proto je možné ji v rámci zrychlení klasifikace vypo ítat dop edu a uložit spole n s informacemi o poloze etalonu v prostoru p íznak . Pozn. Pro dichotomické úlohy klasifikace není nutné vyhodnocovat hodnoty diskrimina ní funkce vždy pro oba etalony, sta í vyhodnotit rozdíl obou diskrimina ních funkcí a klasifikovat vzor na základ znaménka toho rozdílu. = sign (V0T V1T ) X 1 2 (V0T V0 V1T V1 ) > 11.4 Bayes v klasifikátor Pat í do skupiny statistických klasifikátor , umož uje inkrementální i dávkové u ení. Nau ená znalost (model) je reprezentován pravd podobnostním rozložením t íd. P i klasifikaci je zvolena t ída s nejvyšší pravd podobností. Podmín ná pravd podobnost závislá na konjunkci jev se nahradí funkcí podmín ných pravd podobností jednoduchých jev . Proto metoda požaduje úplnou vzájemnou statistickou nezávislost atribut . U ení – pro t ídy Ci, p íznaky A j a jejich hodnoty Vjk (tzn. k-tá hodnota j-tého p íznaku) se zaznamenává do tabulky, kolikrát se ve cvi né množin : Ni,j,k – vyskytl jev, kdy sou asn : t ída Ci a hodnota Vj,k, p esn ji A j = Vj,k Pro klasifikaci jsou dále ukládány tyto hodnoty: Ti - po et p ípad t ídy Ci Tj,k - po et p ípad , kdy Aj = Vj,k T - celkový po et p íklad . Klasifikace - za p edpokladu, že neznámá instance má hodnoty V1,a,V2,b,...,VN,q, je pravd podobnost, že instance pat í do t ídy C , ur ena podmín nou pravd podobností i P(C |V , V , ..., V ). Pro empirické získání této pravd podobnosti obvykle nejsou k i 1,a 2,b N,q dispozici pot ebná trénovací data. Proto se tato pravd podobnost vypo ítá na základ díl ích empirických pravd podobností P(C |V ), resp. P(V |C ). i jk jk i Pro dosti vysoká ísla T, N ijk ,T P(C ) = T / T i i (1) P(V ) = T / T jk jk (2) P(C |V ) = N / T i jk ijk jk (3) jk ,T : i Po íta ové vid ní 83 P(V |C ) = N / T jk i ijk i (4) Za p edpokladu nezávislosti p íznak lze dosadit : P(C |V ,V ,...,V ) = P(C ) * i 1,a 2,b N,q i j=1 N ( P(C |V ) / P(C ) ), i j,k i (1.1) nebo do P(C |V ,V ,...,V ) = P(C ) * i 1,a 2,b N,q i j=1 N ( P(V j,k |C ) / P(V )), i j,k kde N je po et p íznak . Varianta: Obecn ji lze (1) a (3) nahradit heuristikami (dle Cestnik, ECAI-90): P(C ) = (T + 1) / (T + M), i i N ijk + M * P(C ) i P(C |V ) = ---------------------- , i j,k T j,k +M Vhodné pro p ípady, kdy v trénovací množin není zastoupena n jaká t ída, hodnota p íznaku nebo t ída s hodnotou p íznaku. M se volí uživatelsky, doporu ováno M=2. P íklad: baterie: P,W {silná (power), resp. slabá (weak)} kontakty: C,D { isté (clean), resp. zne išt né (dirty)} t ída: +,- (startuje, nestartuje) Trénovací množina: baterie kontakty | t ída ==================================== P C | + P D | + P C | - W C | + P D | + W C | + P D | - P D | + W D | - W C | + U ením získané tabulku: 84 FEKT Vysokého u ení technického v Brn | Ni,j,k | | t ídy: | Tj,k: | + - | (hodnota) ----------- |---------- |------------ baterka P | 4 2 | 6 baterka W | 3 1 | 4 | | kontakty C | 4 1 | 5 kontakty D | 3 2 | 5 ----------- |---------- |------------ Ti (t ídy) | 7 3 | 10 Použití nap .: Jaká je šance nastartování v p ípad , že baterie je slabá (W) a kontakty jsou zne išt né (D) dle (1.1): P(+ | W,D) = P(+) * P(+ | Vbat,W)/ P(+) * P(+ | Vkont,D)/ P(+) = ... = 64.3% P( - | W,D) = ... = 33.3% Pozn. Z výsledk pravd podobnosti opa ných jev je patrné, že trénovací množina nespl uje dokonale podmínku statistické nezávislosti p íznak . 11.5 Zlepšení p esnosti klasifikace – Boosting Boosting metody p edstavují tzv. meta algoritmy u ení tj. metody jak co nejlépe u it klasifikátory. Boosting zavádí pojem weak learner (špatný žák) tj. klasifikátor který má jen o “trochu” lepší úsp šnost klasifikace než klasifikátor který klasifikuje naprosto nahodile (nenau ený klasifikátor). Boosting metody jak spojit více špatných klasifikátor jednoho tzv. úsp šn jšího klasifikátoru (tzv. Strong classifier). Metoda tedy p edstavuje “vylepšené” u ení využívající obecn mnoha klasifikátor u ených nad stejnými vstupními daty. Metoda AdaBoost: “Adaptive Boosting”, auto i: 1999 – Yoav Freund, Robert Schapire, (obdrželi v roce 2003 Gödel prize). Metoda je ur ena pro dichotomické úlohy klasifikace. Je definována trénovací množina: ( x1 , y 1 ),........ , ( x m , y m ); xi X , yi Y Je definována množina špatných žák (klasifikátor ) ht : X ht @ { 1, 1} { 1, 1} Po íta ové vid ní 85 Hledáme výsledný klasifikátor K(x) (Strong classifier) ve tvaru: . T + sign, 1 t ht = x >) -t1 * K ( x) - Výhody: Jednoduchá metoda Lze implementovat v HW Neklade “prakticky” žádné požadavky na klasifikátory (jen weak learner) Nevýhody: - Velká citlivost na šum Citlivost na over-fitting Popis algoritmu metody AdaBoost: 0) Inicializace: 1 ; i 1,....., m m t 1,.....,T D1 (i ) 1) Hledám klasifikátor ht : X { 1, 1} @ ht Který vykazuje nejmenší chybu klasifikace vzhledem k váhám Di trénovací množiny tj. ht 7j p íklad arg min 7 j hj @ m Dt (i )bool = yi A h j ( xi )> i 1 Pozn.: Kde bool() p edstavuje funkci vracející 1 nebo 0 dle podmínky (platí/neplatí). 2) Pokud 7t < 0,5 pokra uj, jinak ukon í u ení. 3) Ur i váhu klasifikátoru 1t , dle 1 ln ., 1 7 t 2 , 7 - t 1t + )) * 1t 4) P epo ítej váhy trénovací množiny Dt 1 =i > Zt m i 1 Dt =i >e 1 t yiht = xi > Zt Dt =i >e 1t yi ht = xi > vyhodnocené 86 FEKT Vysokého u ení technického v Brn 5) Opakuj, dokud platí podmínka 2 11.6 Markovovy modely Autor: 1865 – 1922 Andrej Andrejevi Markov. Pojem kone ný stavový automat. Metoda pro detekci a vyhodnocení zm n stavu systému popsaného pomocí pravd podobnostního modelu. P edpokládá omezené podmínky pro zm nu stavu kone ného stavového automatu. Markov v p edpoklad – v teorii pravd podobnosti je ozna en náhodný proces jako Markov v, pokud následující stav závisí pouze na nyn jším stavu a nezávisí na stavech d ív jších. Markov v proces – je stochastický proces, který má Markovovu vlastnost, tj. Markovovy modely (MM – Markov Models) – jsou modely s kone ným po tem stav , kde p echod mezi stavy je vyjád en pravd podobností. Mimo modely s diskrétním asem existují také modely se spojitým asem. Ergodické – Všechny stavy jsou mezi sebou propojené p echody. Obr. 11.7. Ergodický Markov v model Levo-pravé – v n kterých p ípadech lze použít jednodušší model, kde nelze p echázet mezi všemi stavy, ale pouze mezi vedlejšími stavy v jednom sm ru. Tento model se používá nap . p i rozpoznávání e i. Obr. 11.8. Levo-pravý Markov v model 11.7 Skryté Markovovy modely (HMM) Jde o kone ný stavový automat formáln zapsaný p ticí = (N, M, A, B, ), kde N – skryté stavy (vektor) M – pozorovatelné stavy (vektor) A – pravd podobnosti p echodu mezi skrytými stavy (matice) B – pravd podobnosti p echod ke pozorovatelným stav m (matice) – po áte ní pravd podobnosti stav (vektor) Po íta ové vid ní 87 P íklad: Model po así – vytvo me jednoduchý model po así. Kterýkoliv den m žeme popsat jedním ze t í stav : stav 1: deštivo stav 2: zataženo stav 3: slune no Obr. 11.9. Model po así P echody mezi stavy lze popsat maticí p echod s hodnotami pravd podobnost: [ 0,4 0,3 0,3 A= {a j }= 0,2 0,6 0,2 0,1 0,1 0,8 ] Sou et ádk je jedna. Základní možné výpo ty: Jaká je pravd podobnost, že následujících osm dní bude následující pr b h po así: slune no, slune no, slune no, deštivo, deštivo, slune no, zataženo, slune no? 11.8 Principal components analysis (PCA, LDA) Pat í do skupiny statistických klasifikátor , využívá faktorovou analýzu dat, definuje pojmy: eigenspace, eigenvector. Principem metody je volba nejd ležit jších prom nných popisující dostate n dané t ídy. Na základ hledání vhodných statických veli in. P íklad: Obr. 11.10. Dv t ídy vzork v p íznakovém prostoru 88 FEKT Vysokého u ení technického v Brn Na obrázku vidíme závislost X1 a X2 pro dv odlišné t ídy. Pro daná X1 a X2 je vícemén jednozna n patrná t ída, ale pro správné p i azení je pot ebná znalost obou prom nných. Správnou volbou sou adnicového systému dokážeme získat informaci, zda daný prvek pat í do té i oné t ídy již z jedné prom nné nebo naopak dokážeme uchovat v jedné prom nné maximum dat. Obr. 11.11. Zm na sou adnicového systému p íznakového prostoru Dv možnosti jak poto it sou adnicový systém tak, aby: a) byl sm rodatný pro klasifikaci b) uchoval nejv tší rozptyl hodnot Je t eba si uv domit, že ást informace byla nenávratn ztracena. V našem p ípad bychom pro pot eby rozd lení do t íd ukládali pouze osu X1 Ale to neznamená, že osa X2 nemá žádnou informa ní hodnotu. Záleží na konkrétním využití, zda tuto informaci m žeme postrádat. Obr. 11.12. Metoda LDA a PCA LDA zohled uje pouze celkové rozložení dat, využívá informaci o t íd , (do které prvky náleží). Maximalizuje rozdíl mezi t ídami a naopak minimalizuje rozdíl v rámci skupiny. Vhodné pro klasifikaci. PCA minimalizuje rozdíly mezi t ídami a maximalizuje rozdíly v rámci skupiny. Vhodné nap . pro kompresi dat. Po íta ové vid ní 89 12 Popis objekt (Horák) 12.1 Co se rozumí popisem objektu? Popis objekt segmentovaných z p edzpracovaného obrazu je p edposledním lánkem v et zci zpracování obrazu (viz obrázek 1) a rozumí se jím získání p íznak ze segmentovaných dat. P íznaky slouží pro klasifikaci objekt , a proto musí p esn vystihovat charakteristické rysy objekt . Obr. 12.1. Sekvence zpracování obrazu Na p íznaky jsou sou asn kladeny asto protich dné požadavky. Mezi základní požadavky pat í: - Invariantnost – na zm n jasu, kontrastu, na translaci, rotaci a zm n m ítka. - Spolehlivost – podobné hodnoty p íznaku pro týž objekt. - Diskriminabilita – r zné hodnoty p íznaku pro r zné objekty. - Efektivita výpo tu – dobrá detekovatelnost. - asová invariance – v p ípad zpracování dynamických obraz . Hlavním problémem popisu segmentovaných dat je volba p íznak . Oproti po íta ovému vid ní není rozpoznávání objekt lidským organismem postaveno na výpo tu p íznak a klasifikaci konkrétních hodnot, ale na využití nau ených analogií rozsáhlou paralelní neuronovou sítí. P es 80 % všech p íchozích informací je v mozku zpracováváno kv li vid ní. Mnoho p edm t reálného sv ta je snadno rozpoznatelných lidským mozkem a p itom nejsou matematicky formáln definovatelné nap . objekty jako lampa, ruka, strom apod. Obr. 12.2.: Jednoduchá klasifika ní úloha „n žky – klešt “ 90 FEKT Vysokého u ení technického v Brn Na výše uvedeném ilustrativním obrázku lov k velmi snadno klasifikuje objekty odpovídající kleštím a objekty odpovídající n žkám. Pro po íta ové vid ní p edstavuje i takovýto triviální p íklad zna ný problém z hlediska segmentace a popisu detekovaných objekt . Pro tedy nerealizovat rozpoznávací systém neuronovou sítí obdobnou jako u lov ka? - Neznámý komplexní model mozku – máme dosud jen áste né znalosti topologie, p enosových funkcí neuron , vnit ních vazeb, zp sob u ení, pamatování atd. - Nedostate ná výpo etní kapacita sekven ních po íta - Nedostate ná pam ová kapacita po íta oproti paralelní neuronové síti. oproti pam ové kapacit mozku. 12.2 P íprava obrazu pro popis Segmentovaná data p ipravená pro popis m že p edstavovat binární obraz, v n mž hodnoty 1 ur ují objekty a hodnoty 0 pozadí. V nejjednodušším p ípad je binární obraz získán prostým prahováním. Obr. 12.3.: P íprava binárního obrazu pro popis Segmentovaná data ur ená k popisu mohou být také tvo ena p ímo obrazovými hodnotami pixel p vodního obrazu. Hodnoty pixel p íslušejících objektu jsou ur eny korespondencí z binárního obrazu nebo ze znalosti hranice objektu získané nap . hranovým detektorem. Obr. 12.4.: P íprava obecného obrazu pro popis Po íta ové vid ní 91 12.3 P íznakový vektor Cílem popisu je reprezentovat obrazové objekty matematicky souborem íselných charakteristik nebo symbol zvolené abecedy. Z obrazu segmentovaných objekt jsou vypo ítány p íznaky xi (viz obrázek), ze kterých je sestaven p íznakový vektor X. P íznakový vektor m že v obecném p ípad obsahovat vysoký po et zcela odlišných charakteristických rys objektu (p íznak ) bez ohledu na jejich konkrétní diskriminabilitu – rozlišovací schopnost. Obr. 12.5. Výpo et p íznakového vektoru X Vzhledem k tomu, že ze segmentovaného obrazu lze velmi asto separovat nep eberné množství p íznak , je nutné provést redukci dimenze p íznakového prostoru. K tomu ú elu lze využít dva základní p ístupy: 1. Extrakce p íznak – transformace p vodního p íznakového vektoru na vektor s nižším po tem len , p i emž nov vybrané p íznaky mají odlišný význam od p vodních. P íkladem metody extrakce p íznak je nap . Karhunen-Loevova transformace (KLT). 2. Selekce p íznak – výb r podmnožiny p íznak z p vodního p íznakového vektoru, které vykazují nejvyšší diskriminabilitu. Výhodou je, že vybraným p íznak m z stává jejich p vodní význam, naopak nevýhodou je ztráta informací o objektu vlivem nevyužitých p íznak . Každý prvek ( len) p íznakového vektoru X tvo í jednu dimenzi p íznakového prostoru. Na p íznakový prostor lze tedy nahlížet jako na grafické vyjád ení hodnot p íznakových vektor segmentovaných dat. 92 FEKT Vysokého u ení technického v Brn Obr. 12.6. P íznakový prostor X | dim(X)=3 12.4 D lení p íznak P íznaky (deskriptory segmentovaných objekt ) lze d lit podle mnoha hledisek. Mezi základní t i pat í doména popisované vlastnosti, oblast výpo tu a oblast popisu. Podle domény popisované vlastnosti objektu mohou být deskriptory: 1. Fotometrické – odráží optické vlastnosti objektu nap . pr m rná jasová úrove , diference pr m rné jasové úrovn objektu od pr m rné jasové úrovn blízkého okolí, rozptyl jasových hodnot objektu apod.). 2. Radiometrické – odráží geometrické vlastnosti objektu nap . velikost, délka hlavní a vedlejší osy, obvod apod. Podle oblasti výpo tu lze rozeznávat deskriptory: 1. založené na regionech – nutná znalost jasových hodnot pixel objektu. 2. založené na hranicích – nutná znalost hranice objektu ur ená bu implicitn indexovaným seznamem pixel objektu, nebo explicitn funk ním p edpisem (mén astá varianta). Podle oblasti popisu jsou deskriptory: 1. Globální deskriptory obrazu – lineární integrální transformace (FT, DCT, Wavelet), nevýhodou je nep ítomnost individuálních znak objekt . 2. Globální deskriptory objektu – jeden p íznak je p i azen celému objektu, jedná se o jednoduché deskriptory jako nap . velikost, podlouhlost, konvexnost, geometrické momenty, Euler-Poincaré charakteristika aj. Nevýhodou je nutnost precizní segmentace objektu a citlivost p íznak na aditivní šum. 3. Lokální deskriptory objektu – výpo et p íznak je proveden jen z ur ité lokální ásti objektu, není tedy t eba jeho d ív jší segmentace. Využívají se význa né body jako rohy, struktury, textury, p ímost nebo zak ivení objektu apod. Po íta ové vid ní 93 Pozn.: Lokální deskriptory celého obrazu nejsou ve vý tu pochopiteln uvažovány, nelze je logicky nijakým zp sobem sestavit. 12.5 Identifikace oblastí Segmentací vzniká v nejjednodušším p ípad binární obraz. Tento obraz obsahuje oblasti vyzna ující se spojitostí ve ty nebo osmi okolí, které je t eba indexovat (ozna it unikátním symbolem). Po et zna ených oblastí (obrázek 7) je pak dán celkovým po tem použitých indexovacích symbol nebo v p ípad p ímého íslování nejvyšší hodnotou indexu. Obr. 12.7. íselné indexování objekt Vstupem identifikace je binární obraz obsahující objekty (hodnoty 1) na pozadí (hodnoty 0), výstupem jsou pak zna ené oblasti (nap . indexy 1 až N). Výpo et index (zna ek, štítk ) pro obrazová data lze provést dv ma zp soby: 1) Dvoupr chodový algoritmus První pr chod realizuje zna ení spojených ástí objektu pomocí posunu masky kontrolující pouze lokální okolí vyšet ovaného pixelu. Algoritmus zna ení lze popsat následovn : Posu se v obraze na následující (v p ípad za átku na první) pixel. I. II. Pokud nemá aktuální pixel hodnotu jedna (nejde o objekt), pokra uj znovu od bodu I. III. Jestli je alespo jeden pixel obrazu odpovídající masce (viz obrázek 8) již opat en indexem i, použij tento index i pro aktuální pixel. Pokud není, použij nový index imax+1. IV. Pokra uj od bodu I. dokud nejsou zpracovány všechny pixely obrazu. Obr. 12.8. Maska ty a osmi okolí pro identifikaci oblastí Druhý pr chod eší problém konfliktu zna ení oblastí, kdy je ozna eno více pixel v rámci masky r znými indexy. 94 FEKT Vysokého u ení technického v Brn Obr. 12.9. Konflikt index p i zna ení oblastí Algoritmus není v prvním pr chodu schopen rozhodnout, jestli pro pole ozna ené „?“ z obrázku 9 použít index m nebo n. ešením je apriorní stanovení priorit pozic v masce podle které se v prvním pr chodu p i adí konfliktnímu pixelu jeden z p ilehlých index a sou asn se do pam ti zaznamenají zbylé nepoužité indexy. V druhém pr chodu pak dojde k p ezna ení zbylých index vybraným indexem (indexem s nejvyšší prioritou). 2) Rekurzivní vypl ování oblastí I. Semínkové hrani ní vypl ování – rekurzivní vypln ní oblasti od zvoleného semínka až po hranici ur ené barvy. II. Semínkové záplavové vypl ování – rekurzivní vypln ní spojité oblasti ur ené barvy od zvoleného semínka. III. Ostatní pokro ilé metody po íta ové grafiky – optimalizace algoritmu vypl ování odstran ním rekurzivního výpo tu. 12.6 Radiometrické deskriptory založené na regionech Radiometrické deskriptory založené na regionech popisují metrické vlastnosti objekt vypo ítané z plošného rozložení pixel objektu. Mezi základní deskriptory této t ídy pat í: 1. Velikost = po et pixel spojité oblasti ur ující plochu objektu. S rostoucím rozlišením obrazu se p íznak velikosti blíží skute né hodnot obsahu fyzického objektu v m2 (p i použití normaliza ní konstanty m ítka snímání). Obr. 12.10. P íznak Velikost dvou r zných objekt 2. Obvod = po et hrani ních pixel . Lze stanovit bu to ve smyslu ty nebo osmi okolí. Zrovnoprávn ní míry ty a osmi okolí lze vy ešit koeficientem 2 u 8 okolí (délka diagonálního p echodu mezi pixely). Deskriptor závisí na rozlišení snímku, proto se vzr stajícím rozlišením roste obvod k nekone nu (nap . délka hranice R neustále roste se zmenšujícím se m ítkem vzdálenosti, ili s rostoucí rozlišovací schopnosti). Po íta ové vid ní 95 Obr. 12.11. P íznak Obvod dvou r zných objekt 3. Nekompaktnost = Obvod2 / Velikost. Jde o míru podobnosti oblasti k ideálnímu kruhu, který má minimální možnou nekompaktnost (nebo obrácen maximální kompaktnost) o hodnot 4 . ím nižší je hodnota p íznaku nekompaktnosti, tím vyšší je podobnost objektu s ideálním kruhem. Obr. 12.12. P íznak Nekompaktnost dvou r zných objekt 4. Konvexnost = Velikost / Plocha konvexního obalu. Udává míru podobnosti objektu ke své konvexní schránce. P íznak m že nabývat hodnot v intervalu <0;1>, p i emž maximální hodnota 1 je platná pro konvexní (vypouklé) objekty a klesá k hodnot 0 s rostoucí konkávností (vydutostí) objektu. Obr. 12.13. P íznak Konvexnost dvou r zných objekt 96 FEKT Vysokého u ení technického v Brn 5. Hlavní osa = délka hlavní osy elipsy v pixelech, jejíž centrální moment druhého ádu má stejnou hodnotu jako centrální moment druhého ádu segmentovaného objektu. Obr. 12.14. P íznak Hlavní osa dvou r zných objekt 6. Vedlejší osa = délka vedlejší osy elipsy v pixelech, jejíž centrální moment druhého ádu má stejnou hodnotu jako centrální moment druhého ádu segmentovaného objektu. Obr. 12.15. P íznak Vedlejší osa dvou r zných objekt 7. Orientace = úhel hlavní osy objektu s n kterou sou adnicovou osou, zpravidla osou x. Vzhledem k tomu, že v tšina rozpoznávacích systém sm uje k invariantnosti p íznak na translaci, rotaci a zm n m ítka se používá jen ve specifických p ípadech, kdy lze z nato ení objektu usuzovat na n jaký charakteristický rys (nap . hlídání správnosti uložení výrobku na transportním pásu). Obr. 12.16. P íznak Orientace dvou r zných objekt 8. Výst ednost = excentricita elipsy, jejíž centrální moment druhého ádu má stejnou hodnotu jako centrální moment druhého ádu segmentovaného objektu. Formáln je rovna pom ru vzdáleností ohnisek elipsy a délky její hlavní osy. Po íta ové vid ní 97 Obr. 12.17. P íznak Výst ednost dvou r zných objekt 9. Podlouhlost = pom r stran obdélníku opsaného objektu. Opsaný obdélník musí spl ovat podmínku minimálního obsahu. Nalezení optimální hodnoty oto ení opisujícího obdélníku z hlediska minimálního obsahu je ešeno postupným natá ením v diskrétních krocích. 10. Pravoúhlost = maximální pom r Velikost / Plocha opsaného obdélníku. Postupným otá ením objektu se hledá minimální plocha jemu opsaného obdélníka. ím se pom r plochy oblasti ke ploše obdélníka blíží hodnot jedna, tím vyšší je pravoúhlost. Obr. 12.18. P íznak Pravoúhlost dvou r zných objekt 11. Eulerovo íslo (genus) = po et souvislých ástí objektu ( erná barva na obrázku) – po et d r (bílá barva na obrázku). Jde o topologicky invariantní p íznak objektu, ili nem ní se s geometrickými transformacemi obrazu. Obr. 12.19. P íznak Genus dvou r zných objekt 12. Vektor tvaru – z t žišt objektu jsou vysílány paprsky všemi sm ry a jejich délky k hranici objektu tvo í vektor, který je nezávislý na rotaci. Pokud je vektor normován nejdelším paprskem na hodnotu jedna, je zaru ena nezávislost i na zm n m ítka. 98 FEKT Vysokého u ení technického v Brn 12.7 Radiometrické deskriptory založené na hranicích Radiometrické deskriptory založené na hranicích op t popisují metrické vlastnosti objekt , ovšem výpo et se provádí ze znalosti hranice objektu. Ta m že být definována implicitn seznamem hrani ních pixel (nap . binárním obrazem) nebo explicitn pomocí geometrických entit (úse ky, k ivky apod.). Mezi základní deskriptory založené na hranicích pat í: 1. et zový kód – popisuje hranici objektu et zcem symbol s ur enými sm ry. Mohou být stanoveny ty i symboly pro ty okolí nebo osm pro osmi okolí. Obr. 12.20. Hranice objekt popsaná et zovým kódem ve ty okolí Pro klasifikaci (rozpoznávání) objekt se využívá korela ní funkce et zového kódu vzoru (reprezentanta t ídy) s et zovým kódem vyšet ovaného objektu. Míra souhlasu kód pak udává míru souhlasu hranic obou objekt . Obr. 12.21.: Hranice objektu popsaná et zovým kódem v osmi okolí Z et zového kódu lze jednoduchým zp sobem ur it délku hranice stanovením po tu symbol kódu. V p ípad osmi okolí je pak nutné použít normaliza ní koeficient 2 u sm r 1,3,5 a 7. Po íta ové vid ní 99 2. Fouriérovy deskriptory – z obrazu hranice objektu je sestavena sekvence komplexních ísel vyjad ující sou adnice pixel od vztažného bodu nap . t žišt objektu, která se nazývá radiální funkce s(n). s (n) x( n) j = y (n) xt y t >, n 1..N Tato funkce je periodická s periodou 2 , lze tedy na ni aplikovat diskrétní Fouriérovu transformaci, kterou jsou získány koeficienty z(u): z (u ) N 1 N s( n ) e jun N , u 1..N n 1 Absolutní hodnoty koeficient z(u) tvo í p íznaky nezávislé na rotaci, protože oto ením obrazu objektu dochází pouze k posunu radiální funkce a tím se zm ní pouze fáze koeficient Fouriérovy transformace, nikoliv jejich amplituda. Z koeficient z(u) lze sestavit Fouriérovy deskriptory F(u), které jsou navíc invariantní i v i translaci a m ítku. z (u ) , u 2..N F (u 2) z (1) 3. B-spline deskriptory – hranice objekt je vyjád ena koeficienty k ivek, které aproximují skute nou hranici objektu. Celá hranice je sestavena z n kolika po ástech spojitých k ivek, nej ast ji t etího stupn . Rozpoznávání pak probíhá na základ korelace koeficient k ivek vzoru a vyšet ovaného objektu. 12.8 Fotometrické deskriptory Fotometrické p íznaky pracují oproti radiometrickým p íznak m p ímo s jasovými hodnotami segmentovaných dat. Vstupem výpo t tedy nejsou binární obrazy, ale segmentovaná data obsahující informace o jasové složce. Mezi základní p íznaky této t ídy pat í: - Pr m rná jasová úrove objektu. - Maximální (Jmax) nebo minimální (Jmin) jasová úrove objektu pop . rozdíl Jmax-Jmin. - Diference pr m rného jasu objektu a blízkého okolí. - Deskriptory histogramu – histogram h(q) udává etnosti zastoupení jasových úrovní q v obraze. Ve spojité oblasti se jedná o statistickou veli inu hustoty pravd podobnosti p(q), udávající pravd podobnost, že náhodn vybraný pixel se vyzna uje jasovou úrovní q. Pro rozpoznávání obraz objekt lze mimo jiné použít p íznaky histogramu: a) pr m rná hodnota: 1 N H mean N q h( q ) q 1 b) kontrast: H mean 1 N N q 1 =q h(q ) H mean > 2 100 FEKT Vysokého u ení technického v Brn c) energie: 1 N H energy N h( q) 2 q 1 d) entropie: 1 N H entropy N q 1 h(q ) log 2 h(q ) 12.9 Geometrické momenty a momentové invarianty Geometrické momenty jsou fotometrické p íznaky založené na regionech, jejich výpo et tedy vychází z tvaru objektu a jasových hodnot jeho pixel . Geometrických moment je pro každý objekt možné sestavit teoreticky nekone n mnoho a ím více moment popisuje daný objekt, tím je tento objekt popsán v rn ji (je p esn ji rekonstruovatelný). Základní geometrický moment ádu p+q se stanoví podle vzorce: x p y q s ( x , y ). m pq Y X Pro výpo et momentových invariant segmentovaných objekt centralizované geometrické momenty, vztažené zpravidla k t žišti objektu: C pq xt ) p ( y (x Y se používají y t ) q s ( x , y ). X T žišt objektu lze vypo ítat p ímo z obrazových dat za použití základních geometrických moment nultého a prvního ádu. Moment nultého stupn m00 je prostý sou et jasových hodnot segmentu, jehož mocnina slouží jako normaliza ní konstanta pro ostatní momenty. Normalizované momenty prvního stupn ur ují hodnoty sou adnic t žišt objektu. Pro sou adnici xt t žišt platí vztah: x s ( x, y ) xt Y X s ( x, y ) Y m10 . m00 X Pro sou adnici yt platí analogický vztah: y s ( x, y ) yt Y X s ( x, y ) Y m01 . m00 X Pro spolehlivé rozpoznávání je nutná normalizace hodnot geometrických moment z hlediska velikosti objekt . Normalizovaný geometrický moment Bpq stupn p+q je pak dán vztahem: Po íta ové vid ní 101 B pq m pq m 00 p q 2 1 . Základní i centrální geometrické momenty jsou deskriptory popisující jasové rozložení hodnot objekt , samy o sob však nejsou nezávislé na obecn afinní transformaci. Z toho d vod se používají pro kompozici složit jších struktur zvaných momentové invarianty, kterých je celá ada pro širokou škálu úloh. Nejstarší a nejznám jší je sada sedmi momentových invariant 1 až 7 sestavených z hlediska nezávislosti na rotaci, translaci (dána p esnou segmentací objektu) a zm n m ítka (dána normalizací geometrických moment ): D1 C 20 D2 =C 20 C 02 >2 4 C 2 . =C 30 3C 12 >2 =3C 21 C 03 >2 . =C 30 C 12 >2 =C 21 C 03 >2 . =C 30 3C 12 > =C 30 C 12 > =C 30 C 12 >2 3 =3C 21 C 03 > =C 21 C 03 > 3 =C 30 C 12 >2 =C 20 C 02 > =C 30 C 12 >2 =C 21 C 03 >2 4 C 2 =C 30 C 12 > =C 21 C 03 >. =3C 21 C 03 > =C 30 C 12 > =C 30 C 12 >2 3 =C 30 3C 12 > =C 21 C 03 > 3 =C 30 C 12 >2 D3 D4 D5 D6 C 02 . 11 =C 21 C 03 >2 =C 21 C 03 >2 . 11 D7 =C 21 C 03 >2 =C 21 C 03 >2 . Pro rozpoznávání objekt se pak používá skupina vybraných momentových invariant s vysokou diskriminabilitou vzhledem ke zpracovávané úloze, asto v kombinaci s n kterými z jednodušších radiometrických nebo fotometrických deskriptor obrazu. 102 FEKT Vysokého u ení technického v Brn 13 Lokální p íznaky a korespondence (Horák) Korespondence Po íta ové vid ní 103 14 Strojové u ení (Horák) 14.1 Klasifikace p íznak obrazu P íznaky pro samotnou klasifikaci jsou získány metodami zpracování obrazu, jak byly uvedeny v p edchozích kapitolách nap . prahování, detekce hran, shluková analýza, analýza ve spektrální oblasti, korelace, morfologie atd. Klasifikace m že probíhat nad íselnými nebo symbolickými p íznaky nebo p ímo nad obrazovými daty. P i návrhu mechanismu klasifikátoru nastává problém tzv. relevantních p íznak , ili sestavení odpov di na otázku jak ze všech možných p íznak vybrat jen ty, které se pozitivn podílejí na správné klasifikaci? Obr. 14.1. Mechanismus rozpoznávání z hlediska klasifikace Pro úlohy s neznámým rozložením nebo vysokým po tem p íznak lze použít klasifikátor na bázi neuronové sít . Jedná se o pseudo-symbolickou metodu klasifikace obdobn jako p i použití genetických algoritm . Efektivita klasifikace je odvozena jak z množství dat tak i jejich struktury nap . trénovací množina sestavená vysokým po tem prvk jen z n kolika málo t íd je nevhodná. Vhodný je rovnom rný výb r mén prvk ze všech t íd, nejlépe tzv. etalony obsahující charakteristické rysy každé t ídy. Obr. 14.2. Metody realizace klasifika ních mechanism 104 FEKT Vysokého u ení technického v Brn 14.2 Neuronové sít pro klasifikaci obrazu Klasifikátory nejen obraz založené na neuronových sítích jsou inspirované biologickými prvky – lidský mozek, klasifikace podle znalostí a zkušeností. Biologická podstata rozpoznávání spo ívá v rozm rné síti paraleln propojených entit pam ti – neuron . Spojení neuron (elementárních výpo etních prvk ) je realizováno axony resp. dendrity, které tvo í výstupy resp. vstupy bun k. Obr. 14.3. Biologická neuronová sí Podle konkrétního typu ešené aplikace rozpoznávacího systému se používá n kolik základních typ neuronových sítí, které se liší svými parametry jako nap . typ vstup , u ící metoda apod. Obr. 14.4. Hierarchické rozd lení sítí Definice: Um lá neuronová sí (UNS) je paralelní distribuovaný systém výkonných prvk modelujících biologické neurony ú eln uspo ádány tak, aby byl tento systém schopen Po íta ové vid ní 105 požadovaného zpracování informací. UNS realizuje podle následujícího transforma ní funkci T zobrazující množinu vstup {N} na množinu výstup {M}. obrázku Obr. 14.5. Transforma ní funkce UNS U NS-klasifikátor zpravidla nejde o dichotomické úlohy, ili klasifikace probíhá do více, než dvou t íd. 14.2.1 Model neuronu Pro výpo etní ú ely se používá aproximace biologického neuronu, p íkladem je p vodní model neuronu podle autor McCullocha a Pittse. Obr. 14.6. Model neuronu První stupe zpracování vstupních informací realizuje vážený sou et vstup vztažený k tzv. prahové hodnot nebo zjednodušen prahu E. s R X (i ) W (i ) E i 1 Práh neuronu E ur uje míru aktivace p enosové funkce a n kdy se zavádí jako nultý prvek vstupního vektoru X(0) s vahou W(0). Aktivace výstupu neuronu je dána jeho p enosovou funkcí f: Y f ( s) . R + f , X (i ) W (i ) E ) -i 1 * 106 FEKT Vysokého u ení technického v Brn P enosové funkce se volí zpravidla pro všechny neurony jedné vrstvy stejné, nicmén každý jednotlivý neuron m že mít individuální typ p enosové funkce. Pr b h p enosové funkce je jedna ze základních záležitostí nastavení sít a zásadn ur uje chování UNS. Obr. 14.7. Typy základních p enosových funkcí Aktivace p íslušných výstupních neuron p edstavuje míru p íslušnosti ke t íd . Podle hodnoty aktivity (pokud nejde o binární nebo bipolární hodnoty) lze navíc usuzovat na míru správnosti. 14.2.2 U ení Jedná se o proces samo inné optimalizace systému klasifikátoru p i postupném p edkládání u ících vzor . Obr. 14.8. Princip u ení znalostí klasifikátoru Trénovací množinu p i u ení tvo í skupina p íznak , u nichž apriorn známe p íslušnost ke t íd – objektu v obraze. B hem trénování nelze p edložit síti k nau ení všechny možné existující obrazy – p i procesu klasifikace se projeví schopnost generalizace sít – základní schopnost UNS. Metoda pro nastavení (trénování) klasifikátoru musí být induktivní, tzn., že informace obsažené v obrazech trénovací množiny budou inferen ním mechanismem klasifikátoru zobecn ny na celý obrazový prostor. Po íta ové vid ní 107 Fáze klasifikace: ur ení typu a topologie sít , stanovení p enosových funkcí neuronu, stanovení trénovacích a testovacích dat, u ení, verifikace, klasifika ní proces. Cílem u ení je minimalizovat celkovou chybu sít , k emuž je zapot ebí p edem stanovit tzv. optimaliza ní kritérium. U ící algoritmus pak minimalizuje chybovou funkci EC, tzn. hledá extrém funkce podle p edpisu: wik 1 wik 1 2wik : min EC P 1 2 S =Y (i, s) B ( i, s ) > 2 i 1 s 1 kde symboly mají následující význam: wik-1 váha i-tého neuronu v k-1 kroku EC chybová funkce výstupu sít S po et výstupních neuron , které se podílí na chyb P po et p edkládaných vzor v jedné epoše u ení 14.2.3 Aproximátory – aproxima ní klasifikátory Vytvá í vlastní model vzor – t ídící informaci nelze jednoduše dohledat, je rozprost ena ve všech vahách sít . P íkladem je nap . jednoduchý nebo vícevrstvý perceptron. Obr. 14.9. Topologie p íkladu aproxima ního klasifikátoru 14.2.4 Asociativní pam ti – Hopfieldova sí Ve vahách sít jsou „zapamatovány“ obrazy p edložených vzor . Klasifikátor na bázi asociativní pam ti aktivuje pouze jeden výstup odpovídající dané t íd , ostatní jsou v nule. Klasické lineární pam ti: klí em k vyhledání položky v pam ti je adresa. Asociativní pam ti: dochází k vybavení informace (pam ) na základ její áste né znalosti, ili na základ lineárních kombinací vstup (ne afinních kombinací). Auto-asociativní pam ti: vstupní i výstupní vzor je podobný, ili jde o up esn ní vstupní informace. Lze využít k rozpoznávání poškozených vzor (mimo klasifikaci také k reparaci). 108 FEKT Vysokého u ení technického v Brn Hetero-asociativní pam ti: vstup i výstup jsou r zné. Na vstupní vzor (podn t) sí reaguje odlišným výstupním vzorem – tzv. sdruženou informací. Tato souvisí se vstupem n kterou lineární kombinací vstup , ne obecn afinních. Obr. 14.10. Topologie Hopfieldovy sít Mechanismus vybavování si informace na výstupu z pam ti Hopfieldovy sít se ídí následující relací: bi F 1 F 1 N =a i wi ci i 1 > i jinak Vlastnosti sít : - bez u ení – jednorázové nastavení sít - klasifikátor asociativní pam tí - binární (0,1) nebo bipolární (-1, +1) vstupy a výstupy - kapacita pam ti mén , než 15 % po tu neuron 14.2.5 Realizovatelnost klasifikátoru Pokud je konkrétní proces klasifikace realizovatelný kone nou posloupností symbolických klasifika ních postup , pak je tento problém matematicky popsatelný po ástech spojitou funkcí s kone ným po tem prom nných. D kaz Kolmogorova ukazuje, že lze takovou spojitou funkci kone ného po tu prom nných rozložit na n funkcí jedné prom nné. Transforma ní funkci klasifikace lze pak aproximovat pomocí neuronové sít , bude-li tato mít alespo t i vrstvy a p íslušný kone ný po et neuron . Po íta ové vid ní 109 14.3 Klasifika ní úlohy 14.3.1 Klasifikace obrazu íslice Tvar íslice je popsán binárním obrazem, jehož každý jeden pixel odpovídá jednomu vstupu neuronové sít . Vstupní vrstva má tedy dimenzi rovnou rozlišení snímku. Obr. 14.11. Reprezentace obrazové informace v síti P i použití asociativní pam ti samoz ejm není zaru ena invariantnost v i zm n m ítka, oto ení, zm n fontu, šumu apod. Takové nezávislosti lze docílit použitím aproxima ních klasifikátor UNS s vhodn vybranou trénovací množinou. Obr. 14.12. Trénovací množina ru n psaných znak Z možných typ sítí (Hammingova, Hopfieldova, LVQ, Perceptron, ML Perceptron, Kohonenova samo-organizující se atd.) se jako možná vhodná rýsuje sí Kohonenova s kompetitivním u ením nebo obecná ML perceptron sí typu Feed-forward, sí dop edná. Tento typ sít (ML) se s výhodou používá mimo jiné pro rozpoznávání znak v abeced , což je velmi d ležitý aspekt pro ur ení míry vhodnosti tohoto typu sít pro rozpoznávání vad na transparentním materiálu. Znak nebo p esn ji jeho p esný vzor (p edpis) je reprezentován maticí pro jednoduchost nul a jedni ek (tedy pouze binárn , úpln vlevo). Každý takový binární p edpis znaku je ideálním p ípadem skute ného obrazu znaku (uprost ed), který je už ale konkrétním p ípadem libovolného obecného obrazu (vpravo). 110 FEKT Vysokého u ení technického v Brn Obr. 14.13. Zobecn ní obrazového vzoru P izp sobením vstupního obrazu parametr m sít zpravidla dojde ke snížení po tu kvantiza ních úrovní (nej ast ji na dv p edstavující binární obraz) a rozlišení, což ur uje pro použití takové sít p i zpracování obrazu s nepom rn vyšším rozlišením pot ebné výpo etní nároky, ale nezamítá její použitelnost. V úloze rozpoznání znak jsou jednotlivé ádky vzoru znaku se azeny za sebou a p edstavují jeden ádkový vzor. Obdobn lze takto sestavit vzor libovoln velkého obrazu, samoz ejm s úm rn vyšší dobou výpo tu. Pro každý takový vzor je ur en v rámci u ení jediný výstupní parametr a to 0 nebo 1 podle toho, zda je na snímku vada nebo ne. 14.3.2 Klasifikace obrazu vady Na homogenním snímku materiálu se v p ípad jeho poškození objeví nehomogenní oblast, která je nejd íve segmentována a následn popsána pro jednoduchost dv ma p íznaky ur ujícími rozm r nehomogenity – vady. Klasifika ní prostor je tedy dvou dimenzionální, jednotlivé dimenze jsou totožné s dimenzemi obrazu segmentované vady – ší ka a výška. Klasifika ní t ídy jsou indexovány a jejich verbální popis je následující: 1. velká vada 2. malá vada 3. šum 4. vertikální tenká vada 5. horizontální tenká vada Trénovací množinu tvo í N vzor , u nichž jsou segmentací a popisem známy parametry ší ka a výška a expertem ur ená správná klasifika ní t ída. Tabulka 14.1. Trénovací množina systému rozpoznávání vad íslo vzoru Ší ka nehomogenity [mm] Výška nehomogenity [mm] Klasifika ní t ída 1 30 40 2 2 80 50 1 3 90 20 5 4 15 20 3 5 60 70 2 … … … … … … … … N 20 80 4 Po íta ové vid ní 111 Obsazení t íd ve dvourozm rném klasifika ním prostoru s ostrými hranicemi t íd ur enými nastavením vah neuron sít lze vizualizovat pomocí postupného dosazení všech p ípustných hodnot na vstup sít a stanovením aktivovaného výstupu. Stejným zp sobem lze obdržet podobu klasifika ního prostoru s pravd podobnostními p echody mezi jednotlivými t ídami (pravd podobnost správnosti klasifikace na pomezí). Obr. 14.14. Rozd lení klasifika ních t íd s ostrými a pravd podobnostními p echody 14.3.3 Klasifikace obraz znak Úloha rozpoznávání obrazc a symbol nap . na bankovních poukázkách, kde je požadována obecn vyšší rychlost zpracování a nižší náklady. Úloha je definována tak, že rozpoznávací systém má rozeznávat navzájem 26 písmen latinské abecedy. Vstupní data lze realizovat dostupným systémem pro digitalizaci vzor (písmen) vyst ed ného ve snímacím poli, kde každý znak je reprezentován binární maticí o rozm rech 5x7 bod . Systém pro p evod znak do íslicové podoby ale není ideální, obrazy znak jsou tedy zašum né. Diference velikosti polí ka od st ední velikosti ur uje míru p ítomného šumu. Obr. 14.15. Reprezentace ideáln (vlevo) a reáln (vpravo) snímaného znaku A Na rozpoznávací systém jsou kladeny dva proporcionální požadavky: zcela bezchybné t íd ní (klasifikace) p esn snímaných vzor a relativn p esné t íd ní i vzor se šumem. Etalony znak jsou definovány ve 26 maticích nazvaných abeceda, každá o rozm ru 5x7, ili 35 obrazových bod . Matice jsou pro práci se sítí p evedeny na vektorový formát o délce 35 len . 112 FEKT Vysokého u ení technického v Brn Cílové vektory – vektory s ur enými správnými t ídami klasifikace (znaky) jsou nazvány cíl. Každý vektor cíl má 26 prvk s hodnotou 1 na míst znaku, který reprezentuje a hodnotou 0 na ostatních pozicích (nap . vektor znaku “A” má hodnotu 1 na prvním míst a na zbylých 25 pozicích hodnotu 0). Systém je realizován sítí s BP (back-propagation) algoritmem – zp tné ší ení chyby. Neuronová sí : - vstupy sít jsou tvo eny vektory s 35 prvky - úkolem je najít korespondující hodnoty a vrátit 26 prvkový vektor cíl - sí by m la správn vyhodnocovat i zašum ná data Architektura sít : - 35 vstupních neuron pro matici 5x7 vstupních vzor - 26 neuron ve výstupní vrstv pro vektor cíl ur ující znak abecedy - sí má jednu skrytou vrstvu - p enosové funkce neuron logaritmické sigmoidy jak ve skryté tak i výstupní vrstv mají tvar P enosová funkce logaritmická sigmoida (log-sig) byla zvolena, protože je z hlediska binárních výstup (0,1) vhodná pro reprezentaci vektoru výstupu cíl. Obr. 14.16. Architektura sít Skrytá vrstva má 10 neuron – po et zjišt n experimentáln , v p ípad špatného u ení sít lze do skryté vrstvy p idávat další neurony. Inicializace: Dvouvrstvá sí (vstupní vrstva se nepo ítá) je vytvo ena v Matlabu funkcí newff. S1 = 10; [R,Q] = size(abeceda); [S2,Q] = size(cíl); P = abeceda; net = newff(minmax(P),[S1 S2],{'logsig' 'logsig'},'traingdx'); Trénování: Trénovací množina je tvo ena ideálními i zašum nými daty. Sí je nejprve u ena na ideální vzory, dokud chyba u ení neklesne pod stanovenou hladinu. Poté jsou síti p edkládány ideální i zašum né vzory, tím je podpo ena schopnost sít generalizovat získané znalosti i na Po íta ové vid ní 113 reálných datech, které nutn obsahují šum. Trénování sít vzory bez šumu je omezeno 5000 epochami nebo poklesem chyby pod hodnotu 0.1. P = abeceda; T = cíl; net.performFcn = 'sse'; net.trainParam.goal = 0.1; net.trainParam.show = 20; net.trainParam.epochs = 5000; net.trainParam.mc = 0.95; [net,tr] = train(net,P,T); Trénování sít vzory se šumem je omezeno 300 epochami nebo poklesem chyby pod hodnotu 0.6. Vzory obsahují 10 % a 20 % šumu. netn = net; P = abeceda T = cíl; netn.trainParam.goal = 0.6; netn.trainParam.epochs = 300; [netn,tr] = train(netn,P,T); Obr. 14.17. Rozpoznávání znak bez a se šumem P íklad vstupního obrazu znaku se šumem (vlevo) do rozpoznávacího systému a výsledného klasifikovaného znaku NS-klasifikátorem (vpravo) je ukázán na následujícím obrázku. Znak napravo byl získán vyhledáním shody vektoru cíl v poli etalon . Obr. 14.18. Rekonstrukce zašum ného obrazu znaku 114 FEKT Vysokého u ení technického v Brn 15 Analýza dynamických obraz (Horák) 15.1 Pohyb v obraze Prostorový pohyb bod objekt v reálném sv t je p i zpracování reprezentován 2D obrazem – rychlostním polem. Každý bod obrazu rychlostního pole má p i azen dvousložkový vektor rychlosti v = (sm r; amplituda). obrazová rovina (rychlostní pole) pohyb bodu v prostoru zobrazovací soustava ohnisková vzdálenost P r r P i1 P i2 r 1 dr = r - r = v . dt i i2 i1 i Wy 1 z z0 i2 dr = r - r = v . dt 2 1 P 2 r i1 2 Wz Wx Obr. 15.1. Zobrazení prostoru na pohybové pole Bod na povrchu objektu se p emístí z bodu P1 popsaného polohovým vektorem r1 do bodu P2 s polohovým vektorem r2. Jeho zm nu polohy dr=r2-r1 v prostoru lze vyjád it jako pohyb rychlostí GvG ve sm ru v za as dt. Z podobnosti trojúhelník lze odvodit obdobný vztah pro zm nu hodnoty sm ru a amplitudy vektoru rychlosti v rychlostním poli dri=ri2-ri1=vi dt. Aperturní problém = z hlediska obrazu nejednozna ný pohyb zp sobený kone nými rozm ry snímacího ipu a objektivu (apertury). Prostorov omezená projekce nenese informace o sm ru skute ného pohybu. Projek ní problém = nejednozna ný pohyb – objekt se p ibližuje, resp. oddaluje od obrazové roviny, tj. kone ný úsek objektu ve scén se postupn zv tšuje, resp. zmenšuje. Obr. 15.2. Jednozna né zobrazení pohybu – segment nem ní vzdálenost od objektivu Po íta ové vid ní 115 Obr. 15.3. Nejednozna né zobrazení pohybu – segment se p ibližuje k objektivu Zjednodušující p edpoklady o pohybu tuhých t les: & Omezení maximální rychlosti (a) – na následujícím obraze se pixel m že zobrazit jen do omezeného okolí jeho p edchozí polohy – do kruhu o polom ru v dt se st edem v p vodní poloze. & Omezení akcelerace (b) – velikost zm ny polohy mezi okamžiky t1 a t2 je omezeno velikostí zm ny polohy mezi okamžiky t0 a t1 – nenulová hmotnost objektu ur uje malé (kone né) zrychlení. & Pohybová korespondence (c) – topologické vlastnosti se nem ní – nezávislost na homeomorfní transformaci – tuhá t lesa mají stabilní konfiguraci bod pohybujících se stejným sm rem. Obr. 15.4.: Zjednodušující p edpoklady analýzy pohybu 15.2 Obrazová sekvence Zpracování statických obraz je odkázáno pouze na informace obsažené v jednom obrazu bez vazby na p edchozí nebo/a následující d ní ve scén . ada úloh ale vyžaduje pro kvalitní analýzu a porozum ní obsahu dynamické scény obrazové informace nejen v prostorových dimenzích x a y, ale navíc i v dimenzi asové, ili vyžaduje sekvenci obraz . Na tuto sekvenci snímk jsou pak aplikovány algoritmy odlišující pop edí (pohyblivé objekty) a pozadí (nem nnou scénu). Mezi takové motiva ní úlohy lze za adit: - Analýza pohybu o í pro automobilové koncerny vyvíjející systémy zabra ující usnutí idi e za jízdy, pro dálkové ovládání po íta e nevidomými apod. 116 FEKT Vysokého u ení technického v Brn - Analýza pohybu lov ka pro bezpe nostní služby, rehabilita ní programy zdravotnických za ízení nebo pro identifikaci osoby v uzav ených prostorech. - Lokalizace pohybu vozidel pro automatickou kontrolu dodržování dopravních p edpis (p ekro ení maximální povolené rychlosti, jízda v k ižovatce na ervenou). - Rekonstrukce tvaru z pohybu pro identifikaci p edm t . Z technického hlediska je analýza dynamických obraz (sekvencí) zpracování série snímk , p i emž pro zpracování mají nemalý význam vzájemné vazby mezi nimi. Oproti statickému obrazu g(x,y) ur enému dvourozm rnou jasovou funkcí je dynamický obraz ur en funkcí f(x,y,t) závislou na asové složce. Obr. 15.5.: Obrazová sekvence jako trojrozm rný signál Obrazy sekvence jsou obvykle snímány v ekvidistantních krocích 2 t dostate n krátkých tak, aby byly zaznamenány i nejrychlejší pohyby v obraze. Sou adnice x a y reprezentují polohu bodu v jednom obraze, sou adnice t ur uje po adí obrazu v sekvenci. V reálném sv t mohou nastat obecn ty i následující situace podle relativního pohybu snímací soustavy a snímané scény, p i emž o pohybu v obraze mluvíme v posledních t ech p ípadech: kamera v klidu, objekty v klidu 1. 2. kamera v pohybu, objekty v klidu 3. kamera v klidu, objekty v pohybu 4. kamera v pohybu, objekty v pohybu Každá kombinace relativního pohybu kamery a objektu je vhodná pro ur itou t ídu systém zpracování dynamických obraz nap . dozor í systémy mají zpravidla pevn umíst nou kameru a detekují pohyb lidí nebo vozidel v obraze (p estože m že být kamera umíst na na rotujícím kloubu, pak je horizontální pohyb kloubu algoritmicky eliminován). Po íta ové vid ní 117 Obr. 15.6.: Sekvence snímk s ekvidistantním asováním a kamerou v klidu 15.3 Analýza pohybu V praxi je analýza pohybu provád na na t ech základních typech úloh: 1. Detekce pohybu. 2. Lokalizace a popis pohybujících se objekt – predikce trajektorie. 3. Stanovení vlastností objekt v prostoru. Nejjednodušší úlohou zpracování dynamických obraz je prostá detekce pohybu (ad 1). Jde o zaznamenání libovolného pohybu v obraze bez nutnosti hledání popisných informací objekt v n m obsažených. S výhodou lze využít metodu rozdílových snímk . Složit jší úloha (ad 2) eší rozpoznávání pohybujících se objekt a nalezení jejich polohy. Vysokým stupn m v pomyslné škále porozum ní dynamickým obraz m je hledání trajektorie pohybujících se objekt , na jejímž základ lze predikovat nap . dráhu objektu v obraze. K takové predikci se zpravidla používají metody hledání významných bod a jejich korespondence. Poslední skupinu úloh (ad 3) p edstavuje stanovení fyzických vlastností objekt v reálném prostoru, ili stanovení geometrických vlastností t lesa v t ídimenzionálním prostoru ze série snímk – dvourozm rných projekcí. Obvykle jsou tyto metody aplikovány jen na n kolik málo obraz sekvence, z nichž jsou klasickými postupy zpracování statického obrazu získány p íznaky, ve kterých pak vyšší vrstva nalezne korespondenci nebo jinou metriku podobnosti v obraze. Analýzu pohybu v obraze lze provést také pomocí výpo tu tzv. optického toku. D ležitou podmínkou pro použití metody výpo tu optického toku je absence výrazných zm n v bezprost edn po sob jdoucích snímcích. Podmínku lze zajistit krátkou dobou vzorkování mezi snímky. P i výpo tu optického toku se stanoví pro každý bod obrazu vektor rychlosti ur ující sm r a rychlost pohybu daného bodu. Pokud nejsou intervaly mezi jednotlivými obrazy zanedbatelné z hlediska zm n v obraze, jde o výpo et tzv. rychlostního 118 FEKT Vysokého u ení technického v Brn pole, což je kompromisní metoda mezi koresponden ními technikami a metodou výpo tu optického toku. Analýza pohybu m že být bu závislá, nebo nezávislá. & Nezávislá analýza pohybu je provád na bez ohledu na polohu pohybujících se objekt v obraze a m že být: o Bodov (pixelov ) orientovaná. o Blokov orientovaná. & - Závislá analýza pohybu je provád na za pomoci detekce objekt a lze využít p edpoklad o pohybu tuhých t les (viz zjednodušující p edpoklady pohybu): rychlostní pole rozdílové metody Analýza dynamických obraz má dva komplementárn spojené cíle: a) Detekovat smysluplný (významný) pohyb. b) Vyhnout se falešné detekci pohybu (šum, stíny, zm na osv tlení scény apod.). Základní problémy – výzvy analýzy pohybu v obraze: a) Nerelevantní pohyb v obraze – rozpoznání od významných pohyb . b) Zm na vzhledu objektu nap . oto ením na jednom míst . c) Stíny – rozpoznání objektu a jeho stínu. d) Lokalizace do asn stojících objekt . e) P ekrývající se objekty. f) Dynamické snímání dynamické scény – pohybující se kamera. 15.4 Rozdílové metody Jedná se o jednoduché metody detekce pohybu v obraze založené na zjišt ní rozdíl obraz po ízených v r zných asových okamžicích. Pokud se odpovídající obrazové body liší rozdílem jasových hodnot o více, než stanovenou mez 7, je na p íslušnou pozici binárního rozdílového obrazu zanesena hodnota 1. Pokud snímané obrazy ozna íme f1(x,y) a f2(x,y) a zavedeme hodnotu 7 ur ující práh rozdílnosti bod , lze výsledný binární rozdílový obraz d definovat: d ( x, y ) 0 f 1 ( x, y ) f 2 ( x, y ) : 7 1 f 1 ( x, y ) f 2 ( x, y ) 9 7 Jednotková hodnota (oblast pohybu) s koordináty x a y ve výstupním binárním obraze m že být zp sobená n kolika stavy: & f1(x,y) je element pohybujícího se objektu a f2(x,y) je element nepohybujícího se pozadí nebo obrácen . & f1(x, y) je element pohybujícího se objektu a f2(x,y) je element jiného pohybujícího se objektu. & f1(x, y) a f2(x,y) jsou elementy stejného pohybujícího se objektu v místech r zného jasu. & vlivem šumu a jiných nep esností p i snímání. Po íta ové vid ní 119 Jak je patrné z obrázku, lze z rozdílového obrazu relativn jednoduchým zp sobem detekovat p ítomnost pohybu v obraze, ne už však jeho sm r a velikost. Obr. 15.7.: Rozdílová metoda neur uje sm r pohybu Výpo et rozdílového snímku lze realizovat jako jednosm rný nebo obousm rný. Jednosm rný uvažuje pouze kladné zm ny jasových hodnot na prvním snímku oproti snímku následujícímu, ili z defini ního vzorce je odstran na absolutní hodnota a výsledné záporné hodnoty jsou nulovány. Obr. 15.8.: Jednosm rné rozdílové obrazy po sob jdoucích snímk Sekvence obraz s detekovaným pohybem objektu pomocí jednosm rných rozdílových snímk ukazuje nevýhodu metody: ást objektu není detekována, protože byla do zna né míry (dáno parametrem 7) spole ná dv ma po sob jdoucím obraz m a tak byla p íslušná obrazová data ode tena. Obousm rný je pak po ítán p ímo z defini ního vzorce pro výpo et rozdílového snímku v etn absolutní hodnoty. 120 FEKT Vysokého u ení technického v Brn Obr. 15.9.: Obousm rné rozdílové obrazy po sob jdoucích snímk Libovolný rozdílový snímek však nikdy neobsahuje informaci o sm ru pohybu. Tuto principiální nevýhodu metody áste n stírá použití modifikované metody výpo tu kumulovaného rozdílového obrazu. První snímaný obraz je ozna en za referen ní a na všech následujících obrazech se provede operace rozdílu s tím, že výsledný kumulativní rozdílový snímek je sou tem všech rozdílových snímk p edchozích. Pro druhý snímek v sérii se tedy jedná o prostý diferenciální obraz, jak bylo popsáno výše. Až pro t etí a další obraz je výpo et odlišný. Stejn jako v prvním p ípad se stanoví rozdílový obraz vzhledem k referen nímu snímku, výsledek je ale se ten s rozdílovým obrazem druhého snímku. Tímto se získá kumulativní rozdílový snímek pro t etí obraz. Obdobn se postupuje i pro další obrazy, jejichž p ísp vky rozdílových snímk do kumulativního rozdílového snímku mohou mít r zné váhy wi. Vztah pro výpo et kumulativního rozdílového snímku z N obraz je: d kum ( x, y ) N i 1 wi d i N i 1 wi f 1 ( x, y ) f 2 ( x, y ) Pokud jsou váhy jednotkové, pak hodnoty kumulativního rozdílového snímku ur ují, kolikrát se daný obrazový bod zm nil oproti referen nímu snímku, ímž je v obraze zanesena informace i o sm ru pohybu. Obr. 15.10. Snímky sekvence Po íta ové vid ní 121 Obr. 15.11. Kumulativní rozdílový snímek Obr. 15.12. Detekce pohybu pomocí jednosm rných rozdílových obraz Vlastnosti rozdílových metod: 1. Pohyb detekován pouze v místech, kde se objekt vyskytl nebo zmizel, nikoliv v míst kde se pohybuje, ale nedošlo v n m k výrazným jasovým zm nám (viz obrázek 8 a 9). 2. Zm na osv tlení zp sobuje zm ny v rozdílovém snímku – ešeno pomocí aktualizace referen ního snímku spolu se zapomínáním (ode ítáním nejstarších snímk v bufferu). 15.5 Estimace modelu prost edí Detekci ástí pohybujících se objekt i v místech, kde se nem ní jejich jasová úrove (nap . uvnit relativn jednobarevného objektu) nelze provést pouze pomocí rozdílových snímk . V t chto p ípadech lze použít odhad nejpravd podobn jšího modelu pozadí, ili sestavení statické ásti scény. V nejjednodušším ideálním p ípad by šlo o ernou jednolitou plochu. Každý pixel je pak porovnávám s tímto modelem a na základ tolerancí je rozhodnuto o p íslušnosti k objektu. Referen ní model pozadí je podobn jako referen ní snímek 122 FEKT Vysokého u ení technického v Brn pr b žn aktualizován. Obrazový bod o sou adnicích x a y je považován za bod objektu, spl uje-li rovnici: d ( x, y ) 0 f ( x, y ) b( x, y ) : 7 1 f ( x, y ) b( x, y ) 9 7 V uvedené rovnici je f(x,y) obrazová funkce aktuálního snímku a b(x,y) obrazová funkce modelu prost edí. Pro jeho sestavení je t eba použít jednu z možností: 1. Po ídit obraz istého prost edí. 2. Po ídit sérii obraz prost edí a vypo ítat pr m rný snímek. Pro nalezení modelu prost edí existuje tzv. naivní ešení, kdy první snímek sekvence je považován za obrazovou funkci modelu prost edí tj. platí: b( x, y ) f 1 ( x, y ) Na libovolném dalším snímku ft je obrazový bod (x,y) pokládán za bod prost edí, pokud spl uje podmínku: f t ( x, y ) b( x, y ) : 7 Hlavním problémem p i sestavení obrazové funkce modelu prost edí je šum – i stabilní obraz statické scény je ovlivn n šumem m nícím hodnoty obrazových dat: 1. Model prost edí stanovený z jednoho snímku není spolehlivý – lze použít pr m r n prvních snímk , dovoluje-li to úloha. 2. Míra šumu v obraze je závislá na použité kame e a osv tlení – je t eba otestovat významnost prahu 7 vzhledem k šumu – lokální práh 7 pro každý pixel nebo globální pro celý obraz nebo jeho ásti? Obr. 15.13. Pr m rný obraz prost edí prázdné scény (vlevo) a zm na scény (vpravo) Zm na v obraze na úrovni globálních objekt je pak snadno detekovatelná, aniž by nastávaly problémy s filtrací šumu. Po íta ové vid ní 123 Obr. 15.14. Objekty v pohybu nalezené rozdílem oproti modelu prost edí Z pochopitelných d vod stále ale z stávají problémy s filtrací stín objekt . Ty p edstavují v diferen ním obrazu jasovou zm nu obdobn jako objekt samotný a pro jejich eliminaci se používají r zné složit jší metody závislé na konkrétní aplikaci. 15.6 Optický tok Metoda výpo tu optického toku zachycuje všechny zm ny obrazu za asový interval dt. Každému bodu obrazu odpovídá dvojrozm rný vektor rychlosti, vypovídající o sm ru a velikosti rychlosti pohybu v daném míst obrazu. Optický tok lze využít v situacích, kdy je pozorovaná scéna statická a pohybující se je pozorovatel (kamera), statický pozorovatel a pohybující se scéna anebo v p ípad sou asného pohybu objekt i kamery. Nevýhodou je, že optický tok je závislý na aperturním problému, na zm n osv tlení scény a na pohybu nevýznamných objekt . Výpo et optického toku se zpravidla provádí pro následující složit jší zpracování obrazové informace. Obr. 15.15. Optický tok vypo ítaný ze dvou snímk obrazové sekvence Dynamický obraz lze popsat jako jasovou funkci polohy a asu – f(x,y,t), která ur uje hodnotu jasu v míst (x,y) a ase t. Hodnota jasu v jeho blízkém okolí je ur ena vztahem (po rozvinutí do Taylorovy ady a p i zanedbání len vyšších ád ): f ( x dx, y dy , t dt ) f ( x, y, t ) /f dx /x /f dy /y /f dt /t f ( x, y , t ) f x dx f y dy f t dt Pro nalezení polohy daného bodu na p edcházejícím snímku platí p edpoklad jeho konstantní jasové hodnoty: f ( x dx, y dy, t dt ) f ( x, y , t ) 124 FEKT Vysokého u ení technického v Brn Z p edchozích dvou rovnic pak vyplývá vztah pro složky vektoru optického toku: dx dy ft 0 f x dx f y dy f t dt 0 8 f x fy dt dt Cílem výpo tu je ur it rychlost r=(dx/dt,dy/dt)T. Všechny zm ny v dynamických obrazech lze popsat jako kombinaci ty základních typ pohybu, které lze analýzou pomocí optického toku dob e rozeznat. Obr. 15.16. Typ pohybu v dynamickém obraze (a) (b) (c) (d) Transla ní pohyb v rovin kolmé na osu pohledu. Translace do dálky (p iblížení nebo oddálení). Rotace kolem osy pohledu. Rotace kolmá na osu pohledu. Algoritmus výpo tu optického toku je výpo etn náro ný, proto se využívá rozdílových metod pro zjišt ní jen t ch míst, kde došlo k pohybu. Pro každý bod, kde došlo k pohybu je stanoveno okolí, které je postupn prohledáváno a bod, jehož jasová hodnota je nejblíže jasové hodnot aktuálního bodu je prohlášen za jeho p edchozí výskyt. Ze známých sou adnic bodu v p edchozím a aktuálním obraze je ur en vektor rychlosti optického toku. Obr. 15.17. Výpo et optického toku pro horizontální pohyb kamery 15.7 Detekce významných bod Tuto metodu lze použít v p ípadech, kdy asové intervaly mezi snímky nelze považovat za velmi malé vzhledem k asovým konstantám ur ující pohyb v obraze. Aplika ní postup Po íta ové vid ní 125 metody se skládá ze dvou krok . Prvním je samotné nalezení významných bod obrazu (nap . hrani ní body, jasov odlišné plochy apod.) a druhým je nalezení korespondence t chto bod mezi jednotlivými obrazy. Ve všech obrazech posloupnosti (sekvence) je t eba nalézt taková místa, která jsou n jakým zp sobem významná, tj. jsou co nejmén podobná svému okolí, p edstavují vrcholy i hranice objekt . Pro tento ú el lze použít hranové detektory nebo Moravc v operátor, který ur uje významnost bodu na základ co nejv tší odlišnosti malé ásti obrazu od jejího okolí a je definován takto: f (i , j ) 1k 8k i 1 j 1 g ( k , e) g ( i , j ) i 1e j 1 Vzhledem ke zpracování dynamických obraz , tedy kvalitativnímu popisu pohybu v obraze jsou podstatné a za významné ozna eny jen ty body, jejichž poloha se v ase m ní. K jejich prvotní detekci lze použít již popsané rozdílové metody. Stanovením a nalezením polohy významných bod je spln na pouze polovina úkolu. Pomocí postup srovnávání je nutné ur it korespondenci nalezených významných bod mezi jednotlivými snímky. Po ur ení korespondence je již snadné ur it rychlostní pole. Hledání korespondence je itera ní proces a za íná ur ením všech potenciálních korespondencí mezi dvojicemi bod dvou po sob jdoucích obraz . Každá dvojice bod je ohodnocena pravd podobností udávající v rohodnost korespondence, vy azeny jsou korespondence porušující p edpoklady pohybu tuhých t les nap . p edpoklad maximální rychlosti. Na základ principu spole ného pohybu bod tuhého t lesa jsou pravd podobnosti iterativn up es ovány. Existuje-li pro každý významný bod práv jeden významný bod v následujícím obraze, jejichž pravd podobnost vzájemné korespondence je výrazn v tší, než u ostatních korespondencí, itera ní proces je ukon en. 15.8 Komprese videa Metody pro zpracování dynamických obraz se používají i pro komprimaci videa. Vzhledem k tomu, že se neustále zvyšují požadavky na kvalitu zpracovávaného obrazu a zvuku sou asn p i co nejmenších nárocích na p enosovou kapacitu a úložné místo je jednou z metod snížení pot ebného datového toku i úložného místa kompenzace pohybu objektu na snímcích sekvence. Obr. 15.18. Struktura (de)kódování videa využívající metodu kompenzace pohybu objekt 126 FEKT Vysokého u ení technického v Brn Pro kompresi videa se tém výhradn používají blokov orientované metody, u nichž se obraz rozd lí do blok typicky velikosti 8x8 i 16x16 pixel . Úkolem výpo etní metody pak je nalézt odpovídající pohybové vektory pro všechny bloky mezi p edchozím a aktuálním snímkem. Nejlepší pohybový vektor je nalezen postupným porovnáváním každého bloku s bloky p edchozího snímku podle p edem dané specifické strategie za použití kritéria ur ujícího míru podobnosti blok . 15.9 Metoda RANSAC Metoda vybírající náhodnou skupinu dat ze všech m ení, která eší mimo jiné i koresponden ní problém. Její algoritmus byl poprvé publikován Fischlerem a Bollesem v roce 1981 a je ur ena pro odhad parametr matematického modelu ze sady sledovaných dat. D ležité je uv domit si, že libovolná obrazová data obsahují chyby stejn jako kterékoliv jiné m ení – snímání. Základní p edpoklad metody spo ívá v tom, že nam ená data jsou složena ze vzork odpovídající m enému modelu a ze vzork odpovídající m icím chybám. Ob skupiny vzork mohou být navíc zatíženy šumem neznámého rozložení a parametr . Chyba jednoho vzorku m že být zp sobena šumem, chybným m ením nebo špatnou interpretací dat. Metoda RANSAC automaticky p edpokládá ást chybných dat a na základ v tšinou malého souboru vybraných dat ur uje správné parametry modelu. Výhodou metody je možnost robustního ur ení parametr modelu, jelikož lze ur it parametry modelu s vysokou p esností díky úplnému vy azení chybných dat. Nevýhodou metody je, že neexistuje horní asová hranice ur ující dobu trvání výpo tu. Pokud je pevn stanovena, výsledný model nemusí být nutn ten nejlepší ze všech možností. Vlastnosti metody: 1. K dispozici je celkem M vzork m ených dat. 2. Parametry modelu mohou být odhadnuty z NHM vzork . 3. Pravd podobnost náhodného výb ru skupiny dat, která práv náleží správnému modelu je pg. 4. Pravd podobnost ukon ení výpo tu za p edpokladu existence alespo jednoho vyhovujícího modelu, aniž by byl nalezen jakýkoliv jiný dosta ující model je pfail. Formální vstupy: data – sada pozorovaných vzork model – model, který m že odpovídat vzork m N – minimální po et vzork pot ebných pro ur ení modelu L – maximální po et povolených iterací T – hodnota prahu ur ující p esnost dat s modelem D – po et vzork pot ebných ke konstatování, že model dob e odpovídá dat m Formální výstupy: – parametry modelu, který nejlépe vyhovuje dat m pop . nula, pokud není nalezen žádný vhodný model. Po íta ové vid ní 127 Postup výpo tu: 1. Náhodný výb r N vzork . 2. Výpo et parametr modelu. 3. Stanovení po tu K vzork z M, jež vyhovují vypo tenému modelu s parametry a s p edem stanovenou tolerancí T. 4. Pokud je po et vyhovujících vzork K dostate n vysoký (je spln na podmínka K>D), je p ijat aktuáln vypo teny model výpo et úsp šn ukon en. 5. Opakování krok jedna až ty i L-krát a poté ukon ení výpo tu neúsp šn . Vstupem pro algoritmus je tedy sada sledovaných dat, parametrizovaný model a známé d v ryhodné parametry. Algoritmus dosáhne svého cíle iterativním p edkládáním náhodné podskupiny z celé skupiny vstupních dat pro verifikaci modelu. Tyto vzorky mohou být hypoteticky bezchybné a tato hypotéza se testuje. Model je nastaven na hypoteticky bezchybná data, ili všechny volitelné parametry jsou rekonstruovány podle vybraných vzork . Všechny další vzorky jsou pak testovány vzhledem k novému modelu, tzn. pro každý vzorek je ur ena míra shodnosti s modelem. Pokud vzorek dob e odpovídá modelu, je za azen jako hypoteticky bezchybný (p ispívá k hodnot K). Proces je n kolikrát opakován (p edem daný maximální po et opakování L) a vždy je vyprodukován bu to model x, který je zamítnut, protože bylo p íliš málo bod vyhodnoceno jako bezchybných nebo je vytvo en vyhovující model i s odpovídajícími velikostmi chyb. Nakonec je získán nejlepší model, pro n jž je chyba minimální. Volba parametru K závisí na pom ru bezchybných dat z celkového po tu M. Pravd podobnost, že ani po L opakováních nebude nalezeno N vzork odpovídajících modelu: dostate n =1 = p > > N L p fail g Z ehož plyne maximální po et povolených opakování L: log = p fail > L N log 1 = p g > = > Rychlost výpo tu závisí: - na velikost chybové kontaminace dat, která ovliv uje nutný po et vybíraných bod N - na po tu požadovaných správných bod K pro odsouhlasení modelu - na celkovém po tu m ených dat M P íklad 1 – ur ení parametr p ímky P íkladem m že být ur ení parametr p ímky, jestliže jsou k dispozici data složená z bod náležející hledané p ímce a bod chybných. Použijeme-li metodu nejmenších tverc , získáme rovnici p ímky, která nebude p esn odpovídat hledané, protože metoda pracuje se všemi body a tedy i s t mi chybnými. Naopak použijeme-li RANSAC metodu, m žeme vytvo it model, jenž bude ur en pouze z bezchybných dat. To platí za p edpokladu, že pravd podobnost výb ru pouze bezchybných dat ze souboru všech dat je dostate n velká. Tato situace však není garantována a navíc je zde mnoho parametr , které se musí pe liv nastavit, aby pravd podobnost správného výb ru byla dostate ná. 128 FEKT Vysokého u ení technického v Brn Lineární (LMS) y Lineární (RANSAC) 3 2,5 2 1,5 y = 0,4231x + 0,3846 y = 0,5x 1 0,5 0 0 1 2 3 4 5 x 6 Obr. 15.19. Srovnání RANSAC a metody nejmenších tverc P íklad 2 – koresponden ní problém Na dvojici stereo-snímk jsou nalezeny významné body – rohy, hrany apod. pomocí lokální korelace. V okolí každého významného bodu prvního snímku je hledána poloha nejpodobn jšího segmentu ze snímku druhého. Metodou RANSAC jsou z množiny všech nalezených možných korespondencí odstran ny ty, které nevyhovují nalezenému modelu (jsou chybné). Obr. 15.20. Detekce párových významných bod na stereo-snímcích Obr. 15.21. Nalezené korespondence ( ervená) a vylou ené korespondence (zelená) Po íta ové vid ní 129 16 Dodatky 16.1 Vstupní test 16.1.1 Vstupní test – zadání 1. Jak lze charakterizovat diskrétní obraz z hlediska teorie signálu? 2. Co o diskrétním signálu vypovídá charakteristika nazývaná histogram? 3. Co se rozumí filtrací obrazového signálu v prostorové a co ve frekven ní oblasti? 4. K emu se používá Fouriérova transformace? 5. Co je to topologie objektu? 16.1.2 Vstupní test – ešení 1. Obraz je p eveden z analogové podoby do íslicové vždy p i po ízení/snímání obrazu. Samotné vzorkování reálného kontinuálního obrazu probíhá mimod k p ímo na ploše snímacího ipu (nap . CCD nebo CMOS), kvantování pak v A/D p evodníku digitaliza ní karty nebo fotoaparátu. Prostorová frekvence vzorkování, ili po et bun k ipu v prvním resp. druhém rozm ru analogového obrazu udává po et ádk resp. sloupc výstupního diskrétního obrazu. Rozsah A/D p evodníku pak ur uje po et kvantiza ních úrovní a tím výslednou barevnou hloubku obrazu, nej ast ji 8 bit pro šedo-tónové snímky a 24 bit pro barevné. 2. etnost jasové hodnoty v diskrétním obrazovém signálu udává celkový po et výskyt této konkrétní hodnoty. Pokud se hodnoty se adí vedle sebe vzestupn podle jaspové hodnoty, vytvo í charakteristiku zvanou histogram. 3. Filtrací obrazového signálu v prostorové oblasti se rozumí potla ení i jiné ovlivn ní obrazových bod p ímo v nativní domén obrazových dat nap . operace prahování i filtrace binární maskou. Naopak filtrací ve frekven ní oblasti se chápe odstran ní, zvýrazn ní nebo jiná zm na n kterých frekven ních složek obrazu. Rozmazání hran resp. ost ení obrazu lze nap . provést potla ením resp. zvýrazn ním vysokých frekvencí ve spektru obrazového signálu. 4. Fouriérova transformace p i zpracování obrazu se využívá stejným zp sobem jako p i zpracování jednorozm rného signálu, jen je formáln uzp sobena dvourozm rnému signálu. Lze tedy pomocí ní analyzovat a modifikovat signál ve spektrální oblasti. 5. Topologie objektu p edstavuje takové jeho vlastnosti, které se netýkají metrických vzdáleností, ale jsou naopak ur eny vzájemným uspo ádáním jednotlivých bod tvo ících objekt. Pokud je na obraz aplikována libovolná homeomorfní transformace nap . oto ení nebo zm na m ítka, topologické vlastnosti objektu z stávají zachovány. 130 FEKT Vysokého u ení technického v Brn 16.2 Obrazová galerie Kapitola bude dopln na v akademickém roce 2008/2009. Po íta ové vid ní 131 17 Seznam použité literatury [ 1 ] Computer Vision online – http://homepages.inf.ed.ac.uk/rbf/CVonline. soubor odkaz a lánk : [ 2 ] CROWLEY, J.L., CHRISTENSEN, H.I. Vision as Process. Springer-Verlag. 1995. ISNB 3-540-58143. [ 3 ] DAVIES, E.R. Machine Vision : Theory, Algorithms, Practicalities. Morgan Kaufmann. 2005. ISBN 0-12-206093-8. [ 4 ] DUDA, R.O., HART, P.E. Pattern Classification and Scene Analysis. John Willey & Sons New York, 1982. 482 pages. ISBN 978-0471223610. [ 5 ] FLUSSER, J., SUK, T. Construction of Complete and Independent System of Rotation Moment Invariants. Petrov & Westenberg Editors, Springer-Verlag Berlin Heidelberg. 2003. [ 6 ] FORSYTH, A.D., PONCE, J. Computer Vision, A Modern Approach. Prentice Hall International Ltd.. 2003. ISBN 0-12-379777-2. [ 7 ] GALBIATI, L.J. Machine Vision and Digital Image Processing Fundamentals. Prentice Hall International Ltd., 1997. ISBN 978-0135420447. [ 8 ] GERLA, V., HOZMAN, J., POP, M. MIPS 2.0 - Microscopy Image Processing Software http://mips.ic.cz/Pages/01.htm [ 9 ] GONZALES, R.C., WINTZ, P. Digital Image Processing. Addison-Wesley, Massachusetts. 1987. ISBN 0-201-11026-1. [ 10 ] HIPR2 – jednoduchý a názorný materiál pro demonstraci základních operací nad obrazem: http://homepages.inf.ed.ac.uk/rbf/HIPR2. [ 11 ] HLAVÁ , V., SEDLÁ EK, M.: Zpracování signál a obraz . Skriptum VUT, 2000. ISBN 80–01-02114-9. [ 12 ] HLAVÁ , V., ŠONKA, M.: Po íta ové vid ní, Grada 1992, ISBN 80–85424-67–3 [ 13 ] HU, M.K. Visual pattern recognition by moment invariants. IRE Trans. Information. 1962, 179-187. [ 14 ] JAN, J.: Poznámky ke kurzu Digitální zpracování a analýza obrazového signálu, FEKT 1999. [ 15 ] JAN, J. Dub P.: Poznámky ke kurzu: Vyšší metody íslicového zpracování obrazu, FEKT 2001. [ 16 ] JAN, J. íslicová filtrace, analýza a restaurace signál . VUTIUM. 2002. ISBN 80-2142911-9. [ 17 ] JÄHNE, B.: Digital Image Processing. Springer. 2002. ISBN 3-540-67754-2. [ 18 ] JÄHNE, B.: Handbook of Computer Vision and Applications I, II, III. Academic Press, San Diego, 1999. ISBN 0-12-379770-5. [ 19 ] KOTEK, Z. Metody rozpoznávání a jejich aplikace. Academia Praha, 1993. [ 20 ] LIŠKA, A., VOLF, P., KOŠEK, M. Zpracování obrazu a jeho statistická analýza. 132 FEKT Vysokého u ení technického v Brn [ 21 ] MARR, D. Vision. W. H. Freeman and Company. 1982. ISBN 0-7167-1284-9. [ 22 ] MUHARREM, M., KAYHAN, G., TARIK, V.M. Real object recognition using moment invariants. Sahana, vol. 30. 2005. [ 23 ] PRATT, W.K. Digital Image Processing. John Wiley & Sons, New York. 1991. 720 pages. ISBN 987-0471857662. [ 24 ] ROSENFELD, A., KAK, A.C. Digital Picture Processing. Academic Press, New York. 1982. ISBN 0-12-597301-2. [ 25 ] RUSS, C. The Image Processing Handbook. CRC Press, 1994. 674 pages. ISBN 08493-2516-1. [ 26 ] SHAPIRO, L.G., STOCKMAN, G.C. Computer Vision. Prentice Hall International Ltd.. 2001. ISBN 0-13-030796-3. [ 27 ] SCHLESINGER, M.I., HLAVÁ , V. Deset p ednášek z teorie statistického a strukturního rozpoznávání. Vydavatelství VUT Praha, 1999. [ 28 ] SKALA V.: Sv tlo, barvy a barevné systémy v po íta ové grafice; Academia 1993; ISBN 80-200-0463-7. [ 29 ] SLOWINSKI, R. Intelligent Decision Support – Handbook of Applicationsand Advances of the Rough Sets Theory. KLUWER ACADEMIC PUBLISHERS. 1992. ISBN 0-7923-1923-0. [ 30 ] ŠONKA, M., HLAVÁ , V., BOYLE, R. Image Processing, Analysis, and Machine Vision. PWS Publishing. 1999. ISBN 0-534-95393-X. [ 31 ] TEAGUE, M.R. Image analysis via the general theory of moments. Optical Society of America, JOSA Communications. 1980. 920-930. [ 32 ] TEKALP, M. Digital Video Processing. Prentice Hall International Ltd., 1995. 526 pages. ISBN 01-13-190075-7. [ 33 ] TRUCCO, E., VERRI, A. Introductory Techniques for 3-D Computer Vision. Prentice Hall International Ltd.. 1998. ISBN 0132611082. [ 34 ] VERNON, D. Machine Vision, Automated Visual Inspection and Robot Vision. Prentice Hall International Ltd., 1991. 259 pages. ISBN 0-13-543398-3. [ 35 ] Wikipedia, The free encyklopedia: HLS color space, http://en.wikipedia.org/wiki/HLS. [ 36 ] WILEY InterScience: Encyclopedia http://www3.interscience.wiley.com. of Imaging Science and Technology, [ 37 ] WONG, W.H., SIU, W.C., LAM, K.M. Generation of moment invariants and their uses for character recognition. Pattern Recognition Letters 16. 1995. 115-123. [ 38 ] ŽÁRA, J. a kol.: Moderní po íta ová grafika, Computer Press 1998, ISBN 80–7226049–9 [ 39 ] ŽÁRA, J. a kol.: Po íta ová grafika - Principy a algoritmy, Grada 1992, ISBN 8085623-00-5.
Podobné dokumenty
ZPRACOVÁNÍ DLOUHODOBÝCH EEG ZÁZNAMŮ
Abstrakt Cílem p ísp vku je seznámit s vývojem systému pro zpracování dlouhodobých EEG záznam a jeho praktickou
aplikací na signály komatické. Vzhledem ke srovnatelnému charakteru signálu jsou však...
Nephele: Databáze restaurátorských zpráv s možností vyhledávání
stará o správu dat v databázi, vyhledávání (v našem případě i obrazové vyhledávání),
správu uživatelů apod. Úkolem druhé části, kterou budeme nazývat klient, je komunikace s uživatelem. Poskytuje g...
Komprese digitálního videa
MPEG
Historie MPEG (čte se jako em-peg) je zkratkou pro Moving Picture Coding Experts Group, což je označení
dané rodiny mezinárodních standardů používaných pro kódování audio-vizuální informace v ...
Sborník anotací Studentská tvůrčí a odborná činnost STOČ `2006
Studentská tvůrčí a odborná činnost ‘2006
GRAFICKÁ PODPORA NÁVRHU WEB STRÁNEK V ASP.NET
průmyslové pece - FMMI
čtvrté mocnině termodynamické teploty“. Intenzita vyzařování černého tělesa
E0 T 4