Co je to aliasing
Transkript
Zvuk včetně komprese Digitálně = lépe! Je to ale pravda? X36PZA Periferní zařízení M. Šnorek Obsah přednášky • Digitalizace spojitého signálu. – Aliasing, – kvantizační chyba. • Praktická realizace digitálního zvukového řetězce. • Komprese zvuku. – Aplikace psychoakustické komprese MPEG Audio. – Digitální telefonie pro „IT people“. X36PZA Periferní zařízení M. Šnorek Digitalizace spojitého signálu X36PZA Periferní zařízení M. Šnorek Fáze digitalizace spojitých signálů: Spojitý v čase i amplitudě Diskrétní v čase i amplitudě Diskrétní v čase, spojitý v amplitudě Otázka: může být i spojitý v čase a diskrétní v amplitudě? Nakreslete! X36PZA Periferní zařízení M. Šnorek Navzorkovaný spojitý signál X36PZA Periferní zařízení M. Šnorek Digitálně znamená s chybou! • Diskretizace/digitalizace způsobí – změny ve frekvenční oblasti, tzv. aliasing, – změny v amplitudě, tzv. kvantizační chybu. X36PZA Periferní zařízení M. Šnorek Co je to aliasing (změny ve frekvencích) I? D iskretizace Frekvenční spektrum analogového signálu Správné vzorkování X36PZA Periferní zařízení M. Šnorek Co je to aliasing (změny ve frekvencích) II? D iskretizace Frekvenční spektrum analogového signálu Nesprávné vzorkování X36PZA Periferní zařízení M. Šnorek Aliasing se projeví takto X36PZA Periferní zařízení M. Šnorek Shannonův vzorkovací teorém • Signál, jehož spektrum je soustředěno pouze v pásmu kmitočtů <0, fmax> , lze aproximovat řadou funkcí (Fourier). • Koeficienty řady jsou vzorky signálu rovnoměrně odebírané s kmitočtem vzorkování, který je větší než dvojnásobek maximálního kmitočtu v signálu obsaženém. • Viz též Nyquist (1928) a Kotelnikov. X36PZA Periferní zařízení M. Šnorek Digitálně znamená s chybou! • Vzorkování způsobí – změny ve frekvenční oblasti, tzv. aliasing, – změny v amplitudě, tzv. kvantizační chybu. X36PZA Periferní zařízení M. Šnorek Změny v amplitudě X36PZA Periferní zařízení M. Šnorek Kvantizační chyba X36PZA Periferní zařízení M. Šnorek Kvantizační chyba X36PZA Periferní zařízení M. Šnorek Praktická realizace digitálního zvukového řetězce X36PZA Periferní zařízení M. Šnorek Co je to zvuk? • Periodické vlnění prostředí, kterým se šíří. • Představují ho spojité změny akustického tlaku, které přijímáme • uchem a zpracováváme • sluchovým ústrojím. X36PZA Periferní zařízení M. Šnorek Blokové schéma zvukového řetězce Uvidíte později, že většina technologie je digitální! X36PZA Periferní zařízení M. Šnorek A/D převodníky - srovnání X36PZA Periferní zařízení M. Šnorek A/D převodník delta) (sigma- X36PZA Periferní zařízení M. Šnorek Sigma-delta koncepce • Ideální technologie pro VLSI obvody zpracovávající spojité i diskrétní signály (Mixed signals). • Posouvají kvantizační šum pomocí modulátoru do vyššího frekvenčního pásma, • realizují převzorkování, • digitálně filtrují signál decimátorem. • Umožňují realizaci převodníků s velkým rozlišením. X36PZA Periferní zařízení M. Šnorek Jak funguje modulátor? X36PZA Periferní zařízení M. Šnorek 1-bitový výstup modulátoru X36PZA Periferní zařízení M. Šnorek Decimátor • Zpracovává (oslabuje) příliš kategorické jednobitové reakce sigma-delta modulátoru na vstupní signál tím, že je „průměruje“, • čítá po delší časový interval. • Slouží tedy jako zádrž pro vysoké frekvence změn výstupu (je tedy vlastně digitálním dolnopropustným filtrem). X36PZA Periferní zařízení M. Šnorek Zaujalo vás to? • Podrobněji se tomuto tématu věnujeme v předmětu • Analogové a číslicové systémy. X36PZA Periferní zařízení M. Šnorek Komprese zvuku X36PZA Periferní zařízení M. Šnorek Komprese dat • Objasňovat proč komprimovat by bylo mlácením prázdné slámy. Každý přece ví, že … – 1 s zvuku v CD kvalitě představuje – 44,1k vzorků po 2x 16 bitech (stereo), tedy – 176 400 B, tedy více než 172 kB. • Typy komprese – ztrátová, – bezeztrátová. X36PZA Periferní zařízení M. Šnorek Psychoakustický (PA) princip • Psychoakustický princip se – opírá o studium vlastností lidského ucha, – snaží se vytvořit nejdokonalejší model sluchu a – s tímto poznáním určuje, co bude vlastně neslyšitelné. • Pak nevadí, když se příslušná data kompresí ztratí. • Autorství: Fraunhoferův Institut, SRN. X36PZA Periferní zařízení M. Šnorek Průměrné lidské ucho Frekvenční rozsah 20 Hz - 20 kHz, • dynamický rozsah (ticho - hluk) cca 96 dB. • Důležitá poznámka: • víte, že slyšíme frekvenčně? X36PZA Periferní zařízení M. Šnorek Zásady PA komprese • Frekvenční závislost sluchu, neboli frekvenční maskování (frequency masking) a • časové maskování (temporal masking). X36PZA Periferní zařízení M. Šnorek Frekvenční závislost sluchu X36PZA Periferní zařízení M. Šnorek Obrázek ukazuje ještě něco důležitějšího! • Práh slyšitelnosti není frekvenčně nezávislý, – absolutně nejnižší hodnotu akustického tlaku ucho rozpozná na frekvenci cca 4 kHz, • schopnost slyšet závisí na úrovni hlasitosti – a to dokonce nejen globálně, – ale i lokálně (viz dále). • Slyšitelnost se měří v jednotkách sone (hlasitost 40-ti dB tónu o frekvenci 1 kHz). X36PZA Periferní zařízení M. Šnorek Frekvenční maskování X36PZA Periferní zařízení M. Šnorek Důsledky frekvenčního maskování • Maskování - jeden zvuk je přehlušen jiným, silnějším. • Maskování je silnější, jsou-li zvuky na blízkých frekvencích. • Práh slyšitelnosti se mění podle toho, co je právě slyšet. • Mluvíme o aktuální maskovací šabloně. X36PZA Periferní zařízení M. Šnorek Časové maskování X36PZA Periferní zařízení M. Šnorek Důsledky časového maskování • Ucho má jistou setrvačnost. Důsledkem je, že po hlasitém zvuku chvíli neslyšíme. • Zprvu poněkud překvapivý je jev opačný ... • „Přehlušené“ je ucho déle, než „zahlušené“. X36PZA Periferní zařízení M. Šnorek Aplikace psychoakustické komprese MPEG Audio X36PZA Periferní zařízení M. Šnorek Rozdíly podrobněji • Layer 1 – pouze frekvenční maskování. • Layer 2 – pracuje se se třemi framy vzorků najednou (předch., souč., násled.) - 1152 vzorků. Použito i časové maskování. Koncovka .mp2. • Layer 3 – nejlepší, redukce vazeb mezi stereokanály, kompresní poměr 1:6. Koncovka .mp3. X36PZA Periferní zařízení M. Šnorek Důležitá poznámka: • Kodér není standardem specifikován úplně, • zato dekodér je definován pevně. • Tato otevřená forma umožňuje budoucí vylepšení, aniž by bylo nutné měnit standard. • Obměňovat je tak možné – psychoakustický model, popř. – algoritmus bitové alokace. X36PZA Periferní zařízení M. Šnorek Layer 1/2 - princip kódování X36PZA Periferní zařízení M. Šnorek Postup při kódování (Layer 1/2) X36PZA Periferní zařízení M. Šnorek Layer 1 - dekodér X36PZA Periferní zařízení M. Šnorek Kodér Layer 3 (MP3) Viz dále X36PZA Periferní zařízení M. Šnorek Zjemnění frekvenční filtrace 32 >576 subpásem X36PZA Periferní zařízení M. Šnorek Layer 3 - dekodér X36PZA Periferní zařízení M. Šnorek Princip a funkce oken Hanningovo okno X36PZA Periferní zařízení M. Šnorek Digitální telefonie pro „IT people“ X36PZA Periferní zařízení M. Šnorek Vývoj standardu GSM • 1982 sdružení CEPT,výzkumná skupina Groupe Special M obile, • Realizace panevropského komunikačního systému na celulární (buňkové) bázi v pásmu 900 MHz. • Požadavek: – nízká cena, masivní výroba, miniaturní zařízení, – kvalitní přenos řeči, – otevřenost budoucím standardům ISDN, – podpora rozšířených služeb (SMS). X36PZA Periferní zařízení M. Šnorek Celulární (buňková) síť Frekvence používané v jedné buňce nepoužívá žádná ze sousedních buněk. BS neboli Base Station základnová stanice X36PZA Periferní zařízení M. Šnorek Časový multiplex v GSM kanál 0 1 2 3 4 5 6 7 0 1 2 3 ... sloty Poznámka: Jeden hovor se přenáší kanálem stále ve stejném slotu. X36PZA Periferní zařízení M. Šnorek Multirámec, rámec, slot 120 ms trvá multirámec (24 datových rámců) 0 ... 12 ... 25 4,615 ms řídicí rámec nevyužito 0 1 2 3 4 5 6 7 TDMA rámec (8 slotů) 0,577 ms 3 57 datových bitů 1 26 režijních bitů 1 57 datových bitů 3 8,25 slot X36PZA Periferní zařízení M. Šnorek Kolik bitů představuje jeden hovor? • V rámci slotu 2 x 57 užitečných bitů, • v jednom multirámci je tomuto hovoru přidělen čas 24x, tedy 2 x 57 x 24 = 2736 b. • Multirámec trvá 120 ms, tedy 2 736 b/120 ms, což je 22 800 b/s neboli 22,8 kbps. • Připočítáme-li k tomu ještě režii sítě, která představuje 11 kbps, představuje jeden hovor zátěž 33,8 kbps. X36PZA Periferní zařízení M. Šnorek Kolik z nich je ale „hlasových“? • • • • Začínáme s 33,8 kbps. Režie na fungování sítě GSM je cca 11 kbps, režie na vedení hovoru je cca 9,8 kbps a tedy na vlastní hovorové bity zbývá jen 13 kbps! • Jak je GSM využívá? Viz dále. X36PZA Periferní zařízení M. Šnorek Řečový signál v čase 4 3 x 10 detail 2 1 0 -1 -2 -3 0 1 2 3 4 5 6 7 8 9 X36PZA Periferní zařízení M. Šnorek Východiska realizace • Nepostupuje se, jako v digitalizaci pevných linek metodou kódování tvaru vlny. • Ta vyžaduje příliš vysoký přenosový výkon (64 kbps). • V GSM musíme vystačit s 13 kbps (RPELTP), nebo • dokonce jen s 4,8 kbps (CELP). • Jak je to vůbec možné? X36PZA Periferní zařízení M. Šnorek Vložka: digitalizace tvaru vlny • Pouze interval mezi dvěma vzorkováními (125 ms) máme k dispozici k vyslání 8-mi bitového kódu digitalizované hodnoty. • Přenosová kapacita digitální telefonní linky je tedy – 8000 vzorků/s * 8 bitů = 64 kb/s. X36PZA Periferní zařízení M. Šnorek Komprese řeči - Standardy • • • • • • • • • • • • • • • 64 kbps µ-law/A-law PCM(CCTT G.711) 64 kbps 7kHz Subband/ADPCM(CCITT G.722) 32 kbps ADPCM(CCITT G.721) 16 kbps Low Delay CELP(CCITT G.728) 13.2 kbps RPE-LTP(GSM 06.10) 13 kbps ACELP(GSM 06.60) 13 kbps QCELP(US CDMA Cellular) 8 kbps QCELP(US CDMA Cellular) 8 kbps VSELP(US TDMA Cellular) 8 kbps CS-ACELP(ITU G.729) 6.7 kbps VSELP(Japan Digital Cellular) 6.4 kbps IMBE(Immarsat Voice Coding Standard) 5.3 & 6.4 kbps True Speech Coder(ITU G.723) 4.8 kbps CELP(Fed. Standard 1016-STU-3) 2.4 kbps LPC(Fed. Standard 1015 LPC-10E) X36PZA Periferní zařízení M. Šnorek Návod na účinnější kompresi • Použijeme stejnou myšlenku, podle které pracují nejrůznější počítačové akcelerátory: • kanálem nepřenášíme „bitmapu“ hovoru, ale • jeho „vektorový“ popis. • K tomu účelu ale potřebujeme do dekodéru (i kodéru) vestavět syntezátor řeči založený na modelu generování signálu hlasovým traktem. • Tomu se říká kódování zdroje! X36PZA Periferní zařízení M. Šnorek Anatomie a funkční komponenty hlasového ústrojí Acoustic Filter X36PZA Periferní zařízení M. Šnorek Znělé a neznělé hlásky Znělé hlásky – (n, e …) kvaziperiodický průběh signálu. Neznělé hlásky – (š, č …) průběh signálu podobný šumu. X36PZA Periferní zařízení M. Šnorek Generování znělých a neznělých hlásek X36PZA Periferní zařízení M. Šnorek Model lidského hlasového ústrojí X36PZA Periferní zařízení M. Šnorek Zásady kodéru založeného na LPC • Je založen na modelu buzení + filtr (model hlasového traktu), • uspokojivě generuje pouze řeč (např. hudbu neumí), • pro znělé hlásky je buzen periodickými impulsy, • neznělé hlásky budí generátor bílého šumu. X36PZA Periferní zařízení M. Šnorek Realizace modelu • Hlasivky – dolní propusť 2. řádu s lomovou frekvencí kolem 100 Hz. • Hlasový trakt – kaskáda rezonátorů (odpovídajících jednotlivým formantům). • Vyzařování zvuku – horní propusť 1. řádu. X36PZA Periferní zařízení M. Šnorek Komprese řeči prakticky • Zpracování a předzpracování dat po 20ms blocích (160 vzorků po 13b) – odstranění stejnosměrné složky, – zvýraznění méně silných vyšších frekvenčních složek signálu (preemfáze), – rozdělení do 4 bloků po 40 vzorcích pro RPE analýzu a LTP analýzu. • LPC (koeficienty lineární predikce – krátkodobá predikce) – 8 koeficientů, model hlasového ústrojí – 36 bitů. X36PZA Periferní zařízení M. Šnorek Komprese hlasu - schéma X36PZA Periferní zařízení M. Šnorek Podrobněji? • Nová média. X36PZA Periferní zařízení M. Šnorek
Podobné dokumenty
Lingvistika mysli a těla
patří k potravě, nepřátelům, jedincům vlastního druhu, k možným partnerům. Jak, to záleží na jejich
smyslovém aparátu, resp. na tom, co umožňuje jejich nervová soustava. Každý živý tvor kategorizuj...
Časopis pro svobodný život
Chci upozornit na to, že troubení v biblické
symbolice není něco, co „troubí“ staletí před
zvláštní událostí, nýbrž stojí bezprostředně před
událostí, na kterou má upozornit. Proto také věřím,
že ...
Otáčkoměr s A/D převodníkem (1635)
začíná generování impulsu na výstupu komparátoru US4A. Dioda D4 umožňuje vybití spouštěcího
kondenzátoru C6 při sestupné hraně impulsu na kolektoru T1.
Generování impulsu na výstupe US4A trvá, poku...
JPEG2000 – Aneb nemyslete si, že vás mine!
4 JPEG (čteno “džeipeg”). Výslovnost vychází z anglické výslovnosti. Původním názvem typu
souboru je JFIF (JPEG File Interchange Format). Ustálená zkratka JPEG pro tento typ souboru
je zkratka názv...