Získat - Informační věda
Transkript
I N V E S T I C E D O R O Z V O J E V Z D Ě L Á V Á N Í Univerzita Karlova v Praze Ústav informační studií a knihovnictví Modul č. 3 Informační věda Martin Souček Určeno pro projekt: Název: Studium informační vědy a znalostního managementu v evropském kontextu Reg. číslo: CZ.1.07/2.2.00/07.0284 Operační program Vzdělávání pro konkurenceschopnost Oblast podpory. 2.2 Vysokoškolské vzdělávání Realizace: Vysoká škola báňská - TU Ostrava, Ekonomická fakulta, pracoviště Obchodní akademie a VOŠ Valašské Meziříčí OBSAH 1 ÚVODNÍ SLOVO........................................................................................................................................ 5 2 INFORMAČNÍ VĚDA ................................................................................................................................ 6 3 4 5 2.1 OBLASTI ZÁJMU INFORMAČNÍ VĚDY ..................................................................................................... 6 2.2 DŮLEŽITÉ OSOBNOSTI INFORMAČNÍ VĚDY ............................................................................................ 8 POJEM INFORMACE ............................................................................................................................... 9 3.1 CO JE TO INFORMACE ............................................................................................................................ 9 3.2 TŘI BUCKLANDOVY PŘÍSTUPY K POJMU INFORMACE .......................................................................... 10 3.3 JE INFORMACE MĚŘITELNÁ? ............................................................................................................... 11 3.4 VĚDECKÉ INFORMACE ........................................................................................................................ 12 TEORIE INFORMACE............................................................................................................................ 13 4.1 ZÁKLADNÍ KOMUNIKAČNÍ SCHÉMA: ................................................................................................... 13 4.2 KÓDOVÁNÍ .......................................................................................................................................... 14 4.3 MNOŽSTVÍ INFORMACE ....................................................................................................................... 14 4.4 SAMOOPRAVNÉ KÓDY ......................................................................................................................... 15 INFORMAČNÍ EXPLOZE ...................................................................................................................... 16 5.1 TŘI PŘELOMOVÁ OBDOBÍ .................................................................................................................... 16 5.2 PŘEDPOKLADY INFORMAČNÍ EXPLOZE ................................................................................................ 17 5.2.1 Nárůst objemu informací v elektronické podobě .......................................................................... 18 5.2.2 Dostupnost informací .................................................................................................................... 19 5.2.3 Moorův zákon – podmínka informační exploze............................................................................ 20 5.3 6 DŮSLEDKY, PROBLÉMY....................................................................................................................... 20 5.3.1 Information Overload Research Group ......................................................................................... 21 5.3.2 Řešení důsledků informační exploze, efektivní vyhledávání informací........................................ 22 INFORMACE V PROSTŘEDÍ WEBU................................................................................................... 23 6.1 POVRCHOVÝ WEB ............................................................................................................................... 24 6.1.1 Definice povrchového webu a základní principy fungování ......................................................... 24 6.1.2 Roboti, indexování povrchového webu......................................................................................... 24 6.2 6.2.1 Definice hlubokého webu a základní principy .............................................................................. 25 6.2.2 Proč je hluboký web skrytý........................................................................................................... 26 6.2.3 Vyhledávání v prostředí hlubokého webu..................................................................................... 26 6.3 7 9 FENOMÉN GOOGLE ............................................................................................................................. 28 6.3.1 Cíle společnosti ............................................................................................................................. 28 6.3.2 PageRank ...................................................................................................................................... 33 INFORMETRIE, SCIENTOMETRIE A BIBLIOMETRIE ................................................................. 35 7.1 INFORMETRIE ...................................................................................................................................... 35 7.2 SCIENTOMETRIE .................................................................................................................................. 36 7.3 BIBLIOMETRIE .................................................................................................................................... 37 7.3.1 8 HLUBOKÝ WEB ................................................................................................................................... 25 Bibliometrické zákony .................................................................................................................. 38 7.4 WEBOMETRIE ..................................................................................................................................... 39 7.5 CITAČNÍ ANALÝZY .............................................................................................................................. 40 7.6 SCIENTOMETRICKÉ A BIBLIOMETRICKÉ INDIKÁTORY A JINÉ METRIKY ................................................ 44 7.6.1 Impakt faktor................................................................................................................................. 46 7.6.2 Další klasické bibliometrické indikátory ISI................................................................................. 48 7.6.3 H-index.......................................................................................................................................... 49 7.6.4 Eigenfactor .................................................................................................................................... 52 7.6.5 Omezení indikátorů ....................................................................................................................... 52 CITAČNÍ DATABÁZE A EVALUACE VĚDY ..................................................................................... 55 8.1 DATABÁZE PRO HODNOCENÍ VĚDY ..................................................................................................... 57 8.2 CITAČNÍ DATABÁZE ............................................................................................................................ 59 8.2.1 ISI Web of Science a citační rejstříky ........................................................................................... 60 8.2.2 Scopus ........................................................................................................................................... 65 8.2.3 Google Scholar.............................................................................................................................. 70 8.3 DALŠÍ ANALYTICKÉ NÁSTROJE A NÁSTROJE MAPOVÁNÍ VĚDY ............................................................ 71 8.4 POUŽITÁ LITERATURA......................................................................................................................... 75 SPOLEČENSKÉ DOPADY MODERNÍCH INFORMAČNÍCH TECHNOLOGIÍ ........................... 77 Vliv na člověka a jeho sebepojetí.................................................................................................. 78 9.1.1 9.1.1.1 10 11 Příklady k zamyšlení: problémy s identitou ........................................................................................ 79 9.2 VLIV NA PRACOVNÍ A VOLNOČASOVÝ REŽIM ...................................................................................... 79 9.3 VLIV NA DISTRIBUCI MOCI VE SPOLEČNOSTI ....................................................................................... 80 9.4 VLIV NA ŽIVOTNÍ PROSTŘEDÍ .............................................................................................................. 80 9.5 MCLUHANOVA TEORIE MÉDIÍ ............................................................................................................. 81 9.5.1 Vliv médií na společnost ............................................................................................................... 82 9.5.2 McLuhanova tetráda na zkoumání médií ...................................................................................... 83 9.6 ÚKOLY ................................................................................................................................................ 84 9.7 LITERATURA ....................................................................................................................................... 84 INFORMAČNÍ ETIKA ............................................................................................................................ 85 10.1 VYMEZENÍ INFORMAČNÍ ETIKY ........................................................................................................... 85 10.2 KONFLIKTNÍ OBLASTI MIMOETICKÉ DIMENZE NAKLÁDÁNÍ S INFORMACEMI ....................................... 86 10.2.1 Zpřístupňování informací vs. omezování přístupnosti informací ............................................. 86 10.2.2 Odpovědnost za publikované informace či informační produkt............................................... 87 10.2.3 Korektní nakládání s vlastnickými právy původce informací či informačního produktu......... 87 10.2.4 Analýza informačních konfliktů............................................................................................... 87 10.2.5 K zamyšlení: eticky složité situace........................................................................................... 88 10.2.6 Úkol.......................................................................................................................................... 90 10.2.7 Použitá literatura....................................................................................................................... 90 HUMAN-COMPUTER INTERACTION................................................................................................ 90 11.1 VAZBA NA JINÉ OBLASTI A SOUVISEJÍCÍ OBORY .................................................................................. 91 11.1.1 Iniciativy a organizace HCI...................................................................................................... 91 11.1.2 Metodologie HCI...................................................................................................................... 92 11.2 INFORMAČNÍ ARCHITEKTURA ............................................................................................................. 93 11.2.1 Iniciativy a organizace IA ........................................................................................................ 94 11.2.2 Základní pilíře IA ..................................................................................................................... 94 11.3 PŘÍSTUPNOST ...................................................................................................................................... 95 11.3.1 Iniciativy v oblasti přístupnosti webu....................................................................................... 96 11.3.2 Metodiky a legislativní předpisy přístupnosti webu ................................................................. 96 11.4 12 POUŽITELNOST WEBU ......................................................................................................................... 98 11.4.1 Iniciativy v oblasti použitelnosti webu ..................................................................................... 98 11.4.2 Metody použitelnosti webu ...................................................................................................... 99 11.5 SHRNUTÍ ............................................................................................................................................. 99 11.6 SEZNAM POUŽITÉ LITERATURY ......................................................................................................... 101 PRÁVO A INTERNET ........................................................................................................................... 102 12.1 INTERNET Z HLEDISKA PRÁVA........................................................................................................... 102 12.2 VYMAHATELNOST A PŮSOBNOST PRÁVA NA INTERNETU .................................................................. 102 12.3 POJEM DUŠEVNÍHO VLASTNICTVÍ ...................................................................................................... 104 12.4 AUTORSKÉ DÍLO ............................................................................................................................... 104 12.5 ZPŘÍSTUPNĚNÍ DÍLA PROSTŘEDNICTVÍM INTERNETU ......................................................................... 106 12.6 STAHOVÁNÍ DÍLA Z INTERNETU ........................................................................................................ 107 12.7 P2P SÍTĚ A AUTORSKÉ PRÁVO ........................................................................................................... 107 12.8 OCHRANA AUTORSKÝCH PRÁV ......................................................................................................... 108 1 ÚVODNÍ SLOVO Nebývá jednoduché stručně vysvětlit, co je obsahem informační vědy. I když lze snadno sdělit, že je to věda, která se zabývá komunikací informací ve společnosti, její obrovský význam a přínos se ujasní až po určitém studiu. Informační věda je poměrně mladý, ale dynamický obor, který se vhledem k neustále rostoucí nutnosti systemizace informací rychle rozvíjí. Zkoumá pohyb informací v lidské společnosti, odhlíží od toho jakým způsobem se technicky informace přenášejí (to přenechává informatice), ale zabývá se informacemi z hlediska obsahového. Zkoumá způsob jejich symbolického vyjádření (reprezentaci), jejich medializaci (prezentaci) i proces jejich přijímání (recepci). Má dva základní aspekty společenskovědní s výrazným filozofickým akcentem a technický, který poskytuje velmi účinné nástroje pro uspořádání informací a jejich vyhledávání. V tomto materiálu se budeme nejprve věnovat filosofickým a sociologickým východiskům a následně se pokusíme popsat technické nástroje, které má informační věda k dispozici. O tom jak významný je předmět zájmu informační vědy uveďme za všechny příklad její geniální aplikace, fenomenální růst firmy Google. Ten je výbornou ukázkou a dokladem, že v oblasti systemizace informací leží obrovský vědecký potenciál, budoucnost a úspěch. Ukazuje to výraznou společenskou potřebu tohoto výzkumu, význam mezioborové součinnosti i možnost synergické spolupráce vědy a komerční sféry. V případě Google je výsledkem takové spolupráce úspěch v hodnotě 25 mld USD ročního obratu, což stojí za pozornost. Nicméně informační věda potřebuje velmi širokou základnu a velký mezioborový záběr aby na takovéto úspěchy mohla pomýšlet. Nesmí ztratit ze zřetele filozofické, sociologické, společenské, právní, matematické ani technické aspekty a přitom si udržet své směřování a svébytnost. Pokud se jí to podaří, bude v blízké budoucnosti představovat jeden s nejvýznamnějších vědních oborů vůbec. 2 INFORMAČNÍ VĚDA Informační věda reflektuje změny které probíhají důsledkem vlivu moderních komunikačních technologií a sleduje jejich dopad ve všech oblastech lidského konání. Manuel Castells tvrdí, že žijeme v nové době, kterou nazývá informační, kdy životy jedinců i společenských skupin je tvarován novými technologickými prostředky. Je to právě rozvoj těchto prostředků, který propojuje stále hustší a kapacitnější informační sítí celý svět, nabízí nové způsoby komunikace a zásadně tak mění informační toky a informační chování v celé společnosti. Obecně řečeno zkoumá informační věda několik základních oblastí, které rychle proměňují v kontextu rozvoje informační společnosti – vytváření a vznik informačních pramenů; přenos, oběh, a šíření informací; zpracování, ukládání a vyhledávání informací; informační fondy (kolekce, knihovny); jazykové nástroje komunikace informací a roli člověka jako příjemce a zprostředkovatele informací. Stručně řečeno je to tedy teoreticko-praktický obor, jehož ústředním tématem je zkoumání vztahů mezi člověkem, informacemi a technologiemi v jejich společenském kontextu. Tyto tři složky v jejichž průniku se nachází jádro informační vědy se navzájem ovlivňují, doplňují a prolínají (Grešková, 2007). Informační věda je poměrně mladým oborem, její základy byly položeny v polovině 20. století. Jako samostatná vědecká disciplína byla informační věda deklarována v roce 1958, kdy byl ve Velké Británii vytvořen Institute of Information Scientists (IIS). V této době byl hlavní důraz kladen na aplikovanou úroveň informační vědy v oblasti bibliometrie a teorie informace. Později se prosazují kognitivní aspekty informační vědy a do popředí zájmu vstupuje člověk a výzkum jeho interakce s informačním prostředím, což přináší důležitý obrat ve vývoji tohoto oboru (Ingwersen, 1992). 2.1 Oblasti zájmu informační vědy Informační věda je typicky multioborová vědní disciplína. Níže uvádím výběrový přehled, který ilustruje oborovou rozmanitost této platformy a připojuji stručný popis rozhraní ve kterém se daný obor dotýká informační vědy: Strana 6 Sociologie – vývoj a dopady komunikačních změn ve společnosti s ohledem na prudký rozvoj informačních technologií a rozvoj nových medií, problém rozdělení společnosti podle přístupu k novým technologiím a médiím (digital divide), vývojové komunikační tendence ve společnosti; problematika sociologických průzkumů Filozofie – filozofické aspekty informační/znalostní společnosti; etické aspekty nakládání s informacemi Informatika – problematika technické realizace komunikace, koordinace rozvoje elektronické komunikace s růstem výpočetního výkonu a se zvyšováním kapacity datových úložišť, standardizace komunikačních protokolů v informačních systémech Psychologie – psychologické aspekty vyhledávání informací, chování uživatelů informací (information seeking behaviour); psychologické aspekty komunikace člověk–počítač (human-computer interaction); pojetí informace jako psychofyziologického jevu Pedagogika – teorie výchovy a vzdělávání; pedagogické a didaktické metody; vzdělávací programy jednotlivých typů a stupňů vzdělávacích institucí Politologie – vliv schopnosti pracovat s informacemi na rozhodování občanů v oblasti politického života; princip rovného přístupu k informacím a jeho vliv na rozvoj demokracie Právo – legislativní aspekty přístupu k informacím a jejich využívání Lingvistika – obecné principy fungování přirozeného lidského jazyka jako základního komunikačního nástroje, zkoumání komunikace a jazyka pomocí matematických a statistických metod, počítačové modelování jazykových systémů a strojový překlad Ekonomie – ekonomické aspekty rostoucí úrovně informační gramotnosti (vliv na produktivitu práce, míru nezaměstnanosti apod.) Teorie komunikace - problematika přenosu, kódování a měření informace z matematického pohledu, definuje technicky a matematicky komunikační prostředí v rámci teorie přenosu informace Statistika – rozvoj a zpracování empirických dat pomocí matematických metod, modelování náhodnosti a neurčitosti pomocí teorie pravděpodobnosti, plánování, sumarizace a analýza konkrétních pozorování Strana 7 2.2 Důležité osobnosti informační vědy Paul Otlet (1868 - 1944) - belgický právník a bibliograf, jeden ze zakladatelů informační vědy, autor spisu o teorii dokumentace. Spolu s Henri La Fontainem založili Mezinárodní bibliografický institut v Bruselu s cílem zachytit celosvětovou literární produkci. Pro obsahové zatřídění záznamů vytvořili MDT. Shyali Ramamrita Ranganathan (1892 - 1972) - je považován za otce knihovnictví v Indii a celosvětově patří k významným postavám na poli knihovnictví a informační vědy. Za jeho největší přínos knihovnické vědě jsou považovány jeho teorie klasifikace a teorie indexace. George Kingsley Zipf (1902 - 1950) - americký psycholog a lingvista, profesor lingvistiky na Harvardově univerzitě. Věnoval se kvantitativní analýze jazyka (Zipfův zákon). Samuel Clemens Bradford (1878 - 1948) - americký knihovník, jeden ze zakladatelů bibliometrie. Výsledky studia rozložení článků v odborných časopisech z oboru geofyziky zobecnil v tzv. Bradfordův zákon, platný pro všechny obory. Derek J. De Solla Price (1922 - 1983) - americký historik vědy, zakladatel scientometrie. V dílech Little Science, Big Science (1963) a Science Since Babylon (1961) mj. empiricky prokázal exponenciální vzrůst počtu dokumentů. Vannevar Bush (1890 - 1974) - ředitel MIT ( Massachusetts Institute of Technology) a amerického úřadu pro vědu a výzkum (US Office for Scientific Research and Development), poradce prezidenta Roosevelta. Autor návrhu hypertextového systému (memex), který by organizoval informace a umožňoval přístup k nim na principu podobném asociativnosti lidského myšlení. Eugen Garfield (1925) - zakladatel a čestný ředitel Institute of Scientific Information, od r. 1955 vydává Science Citation Index, vydavatel časopisu Scientist. Jiří Cejpek (1928 - 2005) - profesor Univerzity Karlovy. V letech 1956 - 1970 působil na Filozofické fakultě Univerzity Karlovy nejprve jako odborný asistent a od roku 1968 jako docent katedry knihovnictví a vědeckých informací. V letech 1990 - 1994 stál v čele Ústavu informačních studií a knihovnictví. Strana 8 3 POJEM INFORMACE 3.1 Co je to informace Začněme s nelehkou otázkou - co je to vlastně informace. Termín který je tak často používán se při bližším zkoumání ukazuje jako těžko uchopitelný. Termín informace prostupuje všemi oblastmi lidské činnosti, v této všeobecnosti spočívá je jeho síla i jeho problematičnost. Na jedné straně všichni tomuto pojmu nějak rozumí, nějak jej interpretují a připouští jeho důležitost, na straně druhé jsou způsoby této interpretace velmi rozdílné a obtížně slučitelné. Etymologicky pojem informace pochází z latinského podstatného jména „informatio“, které bylo odvozeno ze slovesa „informare“ – informovat. Tento termín se začal používat ve středověké filozofii ve smyslu „dát formu myšlence“, zformulovat myšlenku. Je tedy zřejmé že už od samého vzniku toto slovo popisovalo určité zhmotnění myšlenky do komunikovatelné podoby s cílem sdělovat, přenášet myšlenky, komunikovat. Uvedu pro ilustraci tři různé způsoby chápání pojmu informace: • informace jako sdělení - komunikovatelný poznatek, který má význam pro příjemce ( údaj usnadňující volbu mezi alternativními rozhodovacími možnostmi) • informace jako psychofyziologický jev, tedy jako součásti lidského vědomí • Norbert Wiener definuje informaci jako "obsah toho, co se vymění s vnějším světem, když se mu přizpůsobujeme a působíme na něj svým přizpůsobováním„ Je zřejmé, že v případě informace se tedy jedná o nematematickou veličinou, kterou lze jen obtížně definovat a měřit. Existují i intuitivní přístupy k chápání tohoto pojmu, cítíme že informace je to, co přijímáme například formou textů, řečí, pomocí obrazů a že tato informace zřejmě souvisí se získanou kvalitou. Například Ingwersen chápe informaci jako jev, který přichází určitá změna, na jedné straně odráží znalostní změnu tvůrce který ji formuloval a na straně druhé ovlivňuje příjemce informace a mění stav jeho znalostí. V případě že dochází ke změně pouze u znalostních Strana 9 struktur tvůrce informace, je možné mluvit o potencionální informaci, nebo li o datech které mají pro příjemce hodnotu jenom latentní a skrytou (Ingwersen, 1992). Pojem informace úzce souvisí s příbuznými pojmy data a znalost. Data jsou v této souvislosti chápány jenom jako řetězce znaků, které představují formalizované vyjádření (zatím potenciální) informace, připravené pro přijetí lidmi nebo ke strojovému zpracování. Data je zapotřebí zpracovat, komunikovat a vnímat, pak se teprve stávají informací. Další úrovní je pak znalost (či poznatek), která předpokládá zařazení, uchování a iterpretaci informace v rámci hiearchicky uspořádaných znalostních struktur, ať už v hlavě příjemce nebo v rámci informačního systému. Znalost je tedy to, co bylo uvedeno do souvislostí, co jedinec ví poté co informace interpretoval v určitém kontextu. Obrázek 1- Jak souvisí informace, data a znalosti 3.2 Tři Bucklandovy přístupy k pojmu informace M. Buckland vychází ze vztahů mezi znalostmi, objekty a procesy a rozlišuje 3 pohledy: informace jako znalost je objektem informace jako procesu. Jde o entitu, nikoliv proces. Znalosti, názory, víra .. nelze se jich přímo dotknout. • informace jako proces Strana 10 • někdo někoho informuje, sděluje mu zprávu. Závisí na kontextu. informace jako věc hmatatelná entita, dokument. Jde o fixovanou informaci, informaci v určité materiální reprezentaci. Jako stěžejní v rámci systematizace pohledu na pojem informace pokládá dělící čáru mezi nehmotnou a hmotnou informací. Pokud se jí lze dotknout, změřit jí, není to znalost, ale nějaká fyzická entita, může to být například papírový dokument. V době elektronického zpracování informací to ale může také představovat nějaký informační systém, který je fyzicky reprezentován servery a datovými úložišti, kde se informace zpracovávají a často i neustále proměňují, jsou v neustálém procesu změny. Tím do tohoto rozdělení zavání klidový stav, kdy informace je sama o sobě beze změny a proces vývoje, ve kterém se informace proměňuje. Tím se termín informace rozpadá na čtyři aspekty, dané rozdělením informace hmotná nebo nehmotná a informace věc nebo proces. NEHMOTNÁ VĚC PROCES HMOTNÁ Znalost Dokument Sdělení Zpracování dat Obrázek 2- Čtyři aspekty informace podle Bucklanda 3.3 Je informace měřitelná? Někdy se uvádí, že informace má v rámci sociální komunikace podobnou roli jako energie v termodynamice. Proto se dává do souvislosti s pojmem entropie, který v tomto oboru vznikl. Klíčový je v této souvislosti druhý termodynamický zákon, podle kterého mají uzavřené systémy tendenci neustále zvyšovat svoji entropii – svojí míru neuspořádanosti, míru rozmanitosti. Nejvyšší entropii má takový systém, který není organizován žádnými vnitřními pravidly, takový systém je homogenní, všechny prvky jsou rozloženy, bez odlišností, heterogenity v něm vznikají přidáním energie zvenčí. Strana 11 Přenesením tohoto modelu do oblasti informační vědy dává prostor určování velikosti informace která vstupuje do systému pomocí sledovaní změn v uspořádanosti tohoto systému. Znamená to tedy, že čím více roste informace, tím více klesá entropie a naopak. Množství informace je tedy dáno rozdílem mezi stavem neurčitosti systému (entropie), kterou měl systém před přijetím informace a stavem neurčitosti, která se přijetím informace odstranila. Informace tak snižuje nebo odstraňuje neurčitost systému, protože je kvantitativní mírou vnitřních zákonitostí. V tomto smyslu může být informace považována jak za vlastnost organizované hmoty vyjadřující její vnitřní strukturu. 3.4 Vědecké informace V rámci vědy a výzkumu je velmi důležitý způsob výměny vědeckých informací, protože ten předurčuje a determinuje schopnost vědy rozvíjet se na základě vzájemné spolupráce a sdílení poznatků. Forma této komunikace je ustálena na standardní procesy jejich nejběžnější podobou je článek v odborném časopise. Mezi další běžné výsledky vědy a výzkumu patří konferenční příspěvek (c konferenčním sborníku), review (shrnutí nějakého tématu v přehledovém článku), nebo postery (velkoplošné panely používané na konferencích k popisu problematiky a diskuzi nad příslušným tématem). Na analýze vědeckých výstupů je založena scientometrie, obor který zkoumá vědeckou komunikaci a pokouší se je její kvantitativní měření a evaluaci. Výstupem vědecké činnosti je tedy publikace výsledků v některé s uvedených forem, která má ve odborném světě určitý dopad, vliv. Jediným nesubjektivním způsobem jak tento vliv můžeme měřit je citační ohlas, to jakou odezvu a zájem daný výstup vyvolal mezi odborníky v daném oboru. Tyto citační ohlasy se snažíme systematicky mapovat a získávat z nich síť kde jsou jednotlivé vědecké výstupy vzájemně propojeny a ze které pak vyvstávají důležité vztahy a souvislosti. Na tomto místě je nutné zdůraznit základní vlastnosti vědeckých informací, kterými se odlišují od ostatních druhů sociální komunikace (Königová, 2002). • přesnost, objektivnost, pravdivost, platnost, jednoznačnost, účelnost, společenská hodnota atd • stárnutí informace - snižování hodnoty v závislosti na čase • sémantická povaha – informace je zachycena smysluplným souborem znaků • nezávislost na jazyku a nosiči - tentýž obsah může mít různé formy Strana 12 • neaditivnost, nekomutativnost, neasociativnost • rozptyl informací v časopisech • nezávislost na tvůrcích 4 TEORIE INFORMACE 4.1 ZI Základní komunikační schéma: Kodér Přenos Dekodér PI Šum ZI: zdroj informace – člověk nebo stroj nebo příroda Kodér: informace je zakódována (= zpráva) Přenos: zakódovaná zpráva je poškozena Šumem Dekodér: odkódováné zprávy (převedené do řeči, písma apod.) PI: příjemce informace Zde je vidět, že informace není to co máme v hlavě, ale to co dokážeme komunikovat někomu jinému. Přitom je jasné, že neexistuje způsob, kdy dekódovaná informace je úplně shodná s původní informací – sémantický obsah přenesený k příjemci není úplně shodný se sémantickém obsahem na straně zdroje informace. Strana 13 Odtud je jasné, že pojem informace má mnoho rovin a že je těžké definovat pojem informace v plném rozsahu. Zároveň je jasné, že základním prvkem zpracování informace (tak aby vůbec mohla být přenesena od původce k příjemci) je kódování, tj. převedení informace do nějakého řetězce znaků (znaky mohou být např. také fonémy). Proto se napřed seznámíme velmi letmo se základními principy kódování. 4.2 Kódování Abeceda je (konečná) množina znaků používaných v daném kódu. Slovo = konečná posloupnost znaků z dané abecedy Délka slova = počet znaků ve slově Kódovaní je převedení informace do zadaného kódu, případně převedení informace z jednoho kódu do druhého kódu. Binární kódování: abeceda obsahuje pouze dva znaky 0 a 1 tj. A = {0,1}. Kód: kód je zadán, pokud je zadána množina kódových slov, tj. podmnožina množiny všech možných slov. Obvykle je množina kódových slov zadána nějakou soustavou podmínek. Blokový kód: zpráva je rozdělena do částí (bloků) o stejné délce, každý blok je zakódován samostatně a zakódované bloky jsou spojeny do zakódované zprávy. 4.3 Množství informace 1 bit = jednotka informace = množství informace obsažené v binárním slově o délce jedna. Množství informace obsažené v binárním slově o délce n (tj. slovo = a1…an , kde ai {0,1}, i = 1, … , n) je rovno n bitů, Inf (slovo o délce n) = n bitů. Strana 14 Funkce Inf je definována jako informace obsažené v daném řetězci vyjádřené pomocí jednotky bit. Množství informace lze vyjádřit obecně pomocí počtu všech možných slov. Máme-li binární slova o délce n, potom jejich počet je roven 2n. Pro binární slova tedy platí Inf (binární slovo délky n) = log 2 (počet binárních slov délky n) Definice obecná: množství informace obsažené ve slově dané délky je rovno dvojkovému logaritmu počtu všech možných slov dané délky. Toto platí např. pro libovolnou abecedu • A = abeceda = {z1, …, zS} kde z1, …, zS jsou znaky abecedy A. • Počet možných slov o délce n v této abecedě je zřejmě Sn a tedy • h I (slovo délky n) = log 2 S = h ⋅ log 2 S ( ) Např. informace obsažené v 1 znaku abecedy A je rovna log 2 S Pozn. log2x je to číslo, kterým musíme umocnit 2, abychom dostali x, tj. 2 log 2 x = x 4.4 Samoopravné kódy Samoopravné kódy jsou nezbytné pro fungování počítačů – dokáží kompletně eliminovat možné chyby pamětí a disků. Budeme uvažovat binární kódy tj. s = 2, A = {0,1}. Hammingova vzdálenost dvou bitových slov (o stejné délce) je rovna počtu míst ve kterých se tyto dva bitové řetězce liší. Základní opakovací kód: Slovo a1…an (kde a1,…,an {0,1}) je kódováno jako a 1 a 1 a 1 a 2 a 2 a 2 a n a n a n . Je jasné, že 1 chybu lze vždy opravit. Strana 15 Opakovací kód je definován jako množina kódových slov (délky 3n). OpKod = { a 1 a 1 a 1 …a n a n a n : a1,…,an {0,1}}. Lze snadno vidět, že dvě kódová slova z Op Kod mají Hammigovu vzdálenost ≥ 3. Obecný argument: Pokud sestrojíme kód, kde každá dvě slova budou mít Hammingovu vzdálenost alespoň 3, bude možné vždy opravit chybu, pokud řetězec obsahuje nejvýše jednu chybu. Konkrétní konstrukce samoopravných kódů je předmětem algebry a je systematicky vypracována. Základní samoopravný Hammingův kód umožňuje zakódovat do bloku 7 binárních znaků informaci obsahující 4 bity tak, že kód automaticky opraví jednu chybu. (pomocí opakovacího kódu bychom k přenesení 4 bitů potřebovali 12 bitů.) Metody pro samoopravné kódy umožňují pomocí vhodně zavedené redundance snížit pravděpodobnost neopravené chyby na prakticky nulu. Podrobně popisovat je nebudeme, protože tyto metody tvoří část aplikované informatiky, což není obsaženo v Informační vě dě . ytvoření a použití efektivních samoopravných kódů je absolutně nezbytné pro praktickou realizaci počítače. Kdyby nebyly k dispozici, počítače by vůbec nebylo možné používat. Poznamenejme také, že základní myšlenka teorie samoopravných kódů, tj. myšlenka využití redundance je výchozím prvkem divadelní hry Václava Havla Vyrozumění. Zajímavé je také to, že myšlenka kvantových počítačů začaly být brána vážně až poté, co byla vytvořena efektivní teorie kvantových samoopravných kódů. 5 INFORMAČNÍ EXPLOZE „V poslední třetině 20. století technologická revoluce soustředěná okolo informací změnila způsob, jakým myslíme, žijeme, umíráme, vedeme válku i milujeme." Manuel Castells 5.1 Tři přelomová období Při historické analýze informačního vývoje se uvádí několik přelomových období, kdy se výrazně změnil způsob komunikace informací ve společnosti, vytvářeli se nové informační a komunikační kanály a proměnil se i způsob sdílení informací v celospolečenském kontextu. V historii představuje takový první zásadní mezník vznik písma a na něj navázané období zakládání knihoven (uvádí se 4. tisíciletí před K. po vzniku písma v údolích Eufratu a Tigridu a následně také v údolí Nilu). Končí tím období předávání informací, znalostí a Strana 16 náboženských nauk „od úst k uchu“ a začíná první fáze zpracování, ukládání informací a jejich systemizace. Dalším zásadním historickým přelomem je vynález knihtisku na přelomu středověku a novověku, který znamenal zásadní revoluci ve způsobu šíření informací. Hlavní dokumentem, který knihtisk pomohl rozšířit byla kniha, která již přestala být nedostupnou a drahou záležitostí ale nacházela si postupně cestu i do nižších vrstev společnosti. Byly položeny základy pro všeobecné rozšiřování vzdělanosti, širokou dostupnost informací. Tato skutečnost se stala i zásadním podnětem pro změnu čtení, čtení již neznamenalo předčítání a naslouchání, lidé si začali číst pro sebe, díky čitelnějšímu písmu bylo čtení snazší, mnoho lidí bylo motivováno aby se naučili číst. Začali se objevovat konkrétní autoři jednotlivých knih, skončila doba anonymního vydávání. Šestnácté století pak bylo stoletím komunikační revoluce, na jeho počátku již v Evropě existovalo téměř tisíc tiskáren, vyráběly se stovky exemplářů jednotlivých titulů, docházelo k jejich obrovskému zlevnění a zpřístupnění. Třetím přelomovým obdobím je vývoj informačních technologií přinášející zásadní změnu komunikace ve společnosti. Tento proces začal již v druhé polovině 19-tého století rozvojem telegrafie a pokračoval v poválečném období vývojem elektronkových počítačů (elektronika), které nahradily jejich elektromechanické předchůdce. Zásadní společenská změna však nastala až s příchodem a rozšířením internetu koncem 90-tých let, kdy se díky rozvoji prostředků záznamu a šíření informací spolu s rychlým vývojem infrastruktury zásadním způsobem začíná měnit způsob práce s informacemi. Takto začíná informační exploze moderního věku, která má výrazně jiné charakteristiky než uvedená přelomová období ve starověku a na počátku novověku. Dotýkáme se zde podstaty celé společensko kulturní změny která charakterizována termínem „information overload“ – informační přetížení. Tento termín a jeho společenské pojetí předchází době internetu. Poprvé jej zmínil a popularizoval v 70-tých letech Alvin Toffler, který poukazoval na obtíže člověka, který se má rozhodovat v situaci, kdy má příliš mnoho informací. 5.2 Předpoklady informační exploze Jak svět vstupuje do nové éry globalizace, je stále více lidí připojeno k internetu (od roku 1995 se počet uživatelů navýšil 40 krát – na dnešní cca 2 miliardy uživatelů) a tito Strana 17 uživatelé mají v úhrnu obrovskou schopnost vytvářet a zpracovávat data z internetových stránek, jejichž počet roste geometrickou řadou. Růst počtu uživatelů sítě internet Počet uživatelů (tis.) 2 000 000 1 800 000 1 600 000 1 400 000 1 200 000 1 000 000 800 000 600 000 400 000 200 000 0 1987 1996 2000 2003 2005 2010 Rok Zároveň je společnost na informacích a moderních informačních kanálech čím dál více závislá, hlavním předpokladem společenského a hospodářského růstu již nejsou suroviny a ekonomické zdroje, ale kvalitní informace a znalosti. Zvyšuje se tedy závislost na všech formách informací (kupodivu si ani neklademe otázku, zda je tato závislost prospěšná a zda nemohou mít informace v jistých situacích i negativní účinek na náš život). Předpoklady informační exploze se dají charakterizovat třemi hlavními faktory, jimiž jsou: • obrovský nárůst objemu dokumentů a informací v elektronické podobě, • dostupnost těchto informací díky stále lepšímu síťovému propojení • platnost Moorova zákova o exponenciálním růstu výpočetního výkonu počítačů 5.2.1 Nárůst objemu informací v elektronické podobě Rychle roste objem vytvářených informací, které vznikají buď přímo v elektronické podobě (born digital), nebo jsou nějakým způsobem digitalizovány (scanování, OCR, digitalizace analogových zdrojů). Do procesu zpřístupňování starších a historických dokumentů se nyní v rámci digitalizačních projektů vkládá velké množství prostředků, přičemž se často jedná o velmi zajímavé a hodnotné dokumenty, které tvoří webový Strana 18 prostor stále atraktivnějším. Míra v jaké objem dostupných informací narůstá je skutečně spíše explozí, k čemž pochopitelně výrazně přispívá snadnost kopírování, publikování a sdílení dat. Zároveň výrazně narůstá počet kanálů pro příjímání informací, jako jsou například např. emailová komunikace, instant messaging, RSS, mobilní telefony, PDA, čtečky elektronických knih (Kindle, Sony PRS, iPAD) a další. 5.2.2 Dostupnost informací Webový prostor (cyberspace) se obrovským tempem rozšiřuje, propojuje a zpřístupňuje obrovské objemy informací, takže pro své uživatele nabízí stále více. Počet webových serverů na internetu leden 2000 - cca 10 miliónů webových serverů červen 2005 - přes 70 miliónů webových serverů září 2007 - přibližně 135 million webových serverů duben 2009 - více než 232 miliónů webových serverů Obrázek 3- Počet webových serverů na internetu Strana 19 5.2.3 Moorův zákon – podmínka informační exploze • Už řadu let se potvrzují předpoklady systematického technického a technologického rozvoje, tak jak je vyslovil roku 1965 chemik a spoluzakladatel firmy Intel Gordon Moore. Jeho původní znění bylo: „složitost součástek (výkon) se každý rok zdvojnásobí při zachování stejné ceny.“ Mluví se tedy o exponenciálním růstu výpočetního výkonu, který je běžně dostupný na trhu. Tento zákon je dodnes, tedy už bezmála půl století, považován za velmi dobrý odhad technologického a ekonomického vývoje. V současné době by jej stačilo mírně upřesnit a prohlásit že každých cca 18 měsíců se výpočetní výkon a kapacita disků zdvojnásobí. V praxi to tedy znamená, že za posledních cca 40 let tedy vzrostl výpočetní výkon přibližně 100 milionkrát. Mnozí vědci předpokládají, že tento zákon zůstane v platnosti i následujících 20 let a možná i déle. • Jeho význam pro informační vědu je obrovský, protože ve onom trojúhelníku člověk - technologie - informace představuje motor který roztáčí spirálu bouřlivých změn v informačních procesech celé společnosti a v jejím informačním chování. Důsledkem těchto změn je obrovský nárůst elektronických informací všeho druhu, nejrůznější kvality a důležitosti, tedy proces, který nazýváme informační explozí. Moorův zákon charakterizuje technický a ekonomický vývoj, který je v dlouhodobém kontextu přímou příčinou a předpokladem této exploze. 5.3 Důsledky, problémy Důsledky informační exploze jsou patrné evidentní v každém oboru lidské činnosti. Jenom objem vědeckých informací se zdvojnásobí během tří let a tento interval se postupně zkracuje. Informační exploze přináší pochopitelně dokumenty různé kvality a spolehlivosti, přináší také řadu rozporných a nepřesností dostupných informacích, kdy části dokumentů jsou zavádějící, zkreslené informačními šumy a nemají jasnou strukturu. Uživatelova situace je navíc zkomplikovaná tím, že většinou nejsou dostupné metody pro porovnání a zpracování různých druhů informací. Al Gore pojmenovává problém „informačního odpadu“ tedy informací které nikomu neslouží, jsou nadbytečné (jenom komplikují informační procesy), nebo dokonce škodlivé a nebezpečné a nazývá je „exformace“. Příkladem mohou být gigabajty logů operačních Strana 20 systémů a aplikací které nikdo nidky nekůže zpracovat a přečíst, případně vyloženě negativní ,toxických' informací (např. xenofóobní, komunistické a fašistické materiály, návody na výrobu otravných látek, drog apod.) Data a informací tedy evidentně vytváříme v daleko větších kvantech než kdykoliv předtím, ale neptáme se jestli jsou pro nás prospěšná, či nikoliv. Začínáme narušovat proces, v němž se informace postupně přeměňují ve znalosti a pak (někdy) ve spojení s vnímavým a inteligentním člověkem se mění na moudrost. Pro dokončení tohoto procesu nezbývá dostatek času, protože přirozený pomalý proces konverze informací na znalosti, je přerušen záplavou nových údajů, které se derou do pozornosti člověka a vyžadují zpracování. Tento proces přináší v odborném životě nezbytnou nutnost specializace každého kvalifikovaného pracovníka, zaměření se na konkrétní úzce definovaný problém. Výsledkem pak bývá v extrémních případech člověk který ví „skoro všechno o skoro ničem“ (někdy nezíván nehezkým pejorativním termínem fachidiot). Pokud takovýto pracovník nemá v hlavě informace z souvisejících disciplín, nemá nadhled v rámci svého oboru, nemůže pochopit širší souvislosti a správně se rozhodovat v složitějších situacích. Člověk s polyglotickým vzděláním, který by obsáhnul vševědění lidstva nemůže být z tohoto světa a zůstává jen nedostupnou výzvou z antických časů. Hodnota informace klesá s jejím rozšířením, má velký a význam důležitost jen když je vzácná, pokud se stane všeobecně známou, snižuje se její informační hodnota (to že Země obíhá kolem Slunce, je dnes triviální a v podstatě bezcenná informace). Na druhou stranu lze sledovat proces, kdy v záplavě nových informací část z těch starších přestává být validní. Jsou již překonané a ztrácí význam, původní znalost je překryta a zapomenuta (staré technologické postupy, řemesla). Máme tedy v současné době přístup k obrovskému množství informací ze široké škály odvětví a oborů, je jen na nás, jak tohoto využijeme. Nicméně schopnost člověka "vstřebávat" informace je značně omezena našimi intelektuálními schopnostmi a zvětšuje se buď vůbec, nebo jen velmi pomalu. 5.3.1 Information Overload Research Group Řada akademických pracovníků, firemních ředitelů a politiků pochopilo rostoucí důležitost tohoto fenoménu. V červnu 2008 skupina výzkumníků z rozličných pracovišť zakládá Information Overload Research Group (IORG) - neziskovou organizaci určenou pro Strana 21 podporu výzkumu této problematiky a pro hledání nových řešení v oblasti Information overload. Obrázek 4- IORG, www: iorgforum.org 5.3.2 Řešení důsledků informační exploze, efektivní vyhledávání informací Řešení nebo alespoň zmírnění problému informační exploze je komplikované a netriviální. V každém případě přijít na pomoc informační specialisté, lidé kteří těží ze zkušeností knihovníků, kteří jsou zvyklí systemizovat informace již po tisíce let a kteří s využitím znalostí v oblasti ICT vytvoří informační procesy které zafungují jako určité "prodloužení" a "zesílení" lidských schopností. Výsledkem jsou pak informační systémy které jsou schopné kategorizovat tematicky a kvalitativně informace, opatřit je metadaty a nabídnout je uživateli v jednoduchém a uživatelsky přívětivém prostředí. Pro pořízení metadat, což je klíčový proces pro systemizaci informací, jsou v principu možné dva přístupy – manuální a strojový: manuální přístup – znamená systemizaci informací v rámci knihovnické kategorizace, věcný a identifikační popis, zařazení dokumentů do thesaurů a číselníků, využití selekčních jazyků, hraje nezastupitelnou roli v knihovnách, u kvalitních sbírek a v profesionálních databázových centrech Strana 22 strojové zpracování – typicky to bývá indexování dokumentů pro fulltextové vyhledávání, automatické generování anotací, search engine, zpracování dat s využitím umělé inteligence, bez zásahu člověka, využívá se především v prostředí webu Začíná být zřejmé, že kromě těch nejkvalitnějších databází a digitálních knihoven ve světovém informačním prostoru jednoznačně vítězí strojové indexování a fulltextové vyhledávání, protože neexistuje jiný efektivní způsob jak zpracovat neustále narůstající obrovský objem informací. Strojové zpracování umožňuje docílit velkou rychlost zpracování a je tak možno zpracovávat obrovské datové objemy. Je pochopitelné, že takto nelze dosáhnout kvality, přesnosti zpracování a úrovně přidané hodnoty, kterou přináší manuální zpracování, ale nutnost velkých výkonů a průběžné aktualizace metadat je v konečném důsledku rozhodující. Nejdále ve strojovém zpracování informací pokročila společnost Google, které ukazuje směry kterým se tyto technologie budou v budoucnosti rozvíjet, což je především aplikace algoritmů pro posouvání relevance a rozvoj paralelizace vyhledávacích procesů, kterým lze docílit obrovský výpočetní výkon (jeden dotaz v Google Search je zpracován cca na 5 tisíci počítačích) V rámci obrovských datových objemů se do budoucna ukazují jako nejprogresivnější strojové metody zpracování informací, přičemž se technologie tohoto zpracování neustále intenzivně rozvíjí. Manuální zpracování a kategorizace je čím dál více vyhrazeno klasickým knihovnickým sbírkám a databázovým systémům s těmi nejhodnotnějšími a nejkvalitnějšími daty. 6 INFORMACE V PROSTŘEDÍ WEBU Informace ve webovém prostředí jsou dostupné v různých úrovních zpřístupnění. Některá data jsou zcela otevřeně vystavena na webovém serveru, jiná jsou uložena takovým způsobem, že se přímému přístupu brání, ať je to již záměr či chyba jejich administrátorů. Z tohoto pohledu rozeznáváme tzv. povrchový (volný) web, který je veřejně přístupný, běžně indexovaný vyhledávači a obsahuje cca trilion (1,000,000,000,000) indexovaných webových stránek a tzv. hluboký (skrytý) web, který vyhledávací stroje nejsou schopny indexovat. Strana 23 Lze zjednodušeně říci, že pokud za povrchový web považujeme všechny výsledky dosažitelné dotazem v obecném vyhledávači typu Google, je pak hluboký web všechno ostatní, vše co existuje v elektronické a sdílené podobě, nicméně to nemůžeme objevit pomocí vyhledávačů v rámci dostupných výsledků. 6.1 Povrchový web Povrchovým webem rozumíme tu část internetového prostoru, která je běžným vyhledávačem typu Google Search indexována a zpřístupněna. Tento webový podprostor je nám všem dobře známý a záleží jen na naší schopnosti dobře formulovat dotaz a nacházíme okamžité odpovědi na naše otázky. Na druhou stranu je to prostor, který principielně obsahuje informace které jsou často neověřené, mohou být neúplné, neaktuální, nespolehlivé informace, zkrátka data která pomyslně řadíme do pejorativní oblasti informačního „smogu“. 6.1.1 Definice povrchového webu a základní principy fungování Povrchový web, stručně řečeno, je webový prostor, který je indexovaný vyhledávači a který je tedy prohledatelný v rámci používání těchto vyhledávačů. Lapidárně a zjednodušeně řečeno - povrchový web je to co najde vyhledávač Google. Tím je zároveň naznačeno, že existují oblasti webu do kterých Google vstoupit nemůže... Pro pochopení termínu povrchový web je rozhodující porozumět mechanismu, kterým jednotlivé internetové vyhledávače (search engine) v prostředí webu zpracovávají informace. Tyto internetové vyhledávače se skládají se ze tří modulů – webového robota, indexátoru a vyhledávacího modulu. Takovýchto internetových vyhledávačů je celá řada, Googlre mezi nimi sice výrazně dominuje, ale desítky ostatních můžete na jít třeba v katalogu Yahoo. • 6.1.2 Roboti, indexování povrchového webu Přestavme si, že robot (crawler) stáhne určitou webovou stránku do databáze. Na této stránce projde postupně všechny odkazy a příslušné stránky také stáhne. Takto postupuje pořád dál (ze zadané množiny výchozích bodů) až postupně projde velkou část všech webových serverů a uloží si obsah jejich stránek do databáze. Stažené stránky jsou pak Strana 24 zařazeny do indexu používaného pro fulltextové vyhledávání (indexátor). Jsou vyřazena stop slova, lemmatizace, jsou provedeny indexace. Když chce uživatel najít stránku, která obsahuje určitá slova, pracuje s vyhledávacím modulem, který prohledá index a seřadí nalezené stránky podle relevance a několik prvních pošle uživateli. Parametr relevance podle kterého jsou stránky seřazeny je klíčový, Google má svůj pagerank, Seznam používá S-Rank, vyhledávač Jyxo má Jyxo Rank. Dobře navržený algoritmus pro výpočet ranku stránky je klíčem k úspěchu celého vyhledávače. Jak bylo již uvedeno každý vyhledavač používá pro indexování stránek svého robota, každý z těchto robotů má svoje specifické vlastnosti. Příkladem těchto vyhledávacích robotů jsou GoogleBot, SeznamBot, JyxoBot, Morfeo Holmes, MsnBot, Slurp a další. 6.2 Hluboký web Hluboký web (deep web) je tvořen běžně nedostupnými dokumenty a daty v profesionálních databázích. Uvádí se že je cca 500x obsáhlejší než povrchový, nicméně přesná čísla nejsou dostupná, protože neexistuje dobrý způsob jak hluboký web komplexně zmapovat a změřit. V každém případě je rozsáhlost hlubokého webu oproti povrchovému impozantní. 6.2.1 Definice hlubokého webu a základní principy Termínem hluboký web, nebo také neviditelný web, se označuje ta část webu, která je pro běžné uživatele vyhledávacích strojů typu Google skrytá. Zmíněný termín „neviditelný“ není úplně přesný, protože tyto informace samozřejmě k nalezení jsou, avšak ne běžným fulltextovým vyhledáváním, které používá drtivá většina uživatelů. Pro ně zůstávají tyto informace neviditelné. Hluboký web je taková oblast internetu, která není strojově prohledavatelná a která má své specifické vlastnosti. Na rozdíl od neuspořádaných a neúplných informací, které známe z běžného (tzv. povrchového) webu, poskytuje informace systemizované v databázích, nebo v databázových centrech, které bývají relevantní a poměrně spolehlivé. Termín hluboký web se používá zhruba od roku 2000, kdy jej zavedla společnost BrightPlanet. Definovala jej jako neindexovatelnou část webu a tvrdí, že hluboký web je Strana 25 asi řádově větší než povrchový web. Hluboký web obsahuje stovky miliard dokumentů vysoké kvality, které jsou přístupné prostřednictvím databázových center (MAKULOVÁ 2002). 6.2.2 Proč je hluboký web skrytý Pro pochopení, proč je hluboký web pro vyhledávače neviditelný, je třeba vyjít ze způsobu práce těchto vyhledávačů. Výše jsme uvedli že robot prochází web po jednotlivých odkazech, nicméně toto jeho chování je limitováno na přímé linky v html kódu. Pokud se mu postaví do cesty přihlášení, dotazovací okno, flash a podobné překážky je pro něj tato cesta uzavřená. Řekněme si tedy, co roboti prohledávat neumí: • stránky, kde je potřeba přihlášení • stránky s restrikcí přístupu na určitý rozsah IP adres; • databáze, kde musí uživatel klást dotaz; • stránky zabezpečené technologií CAPTCHA; • stránky používající nevhodným způsobem JavaScript, FLASH či AJAX; Jakmile tedy vyhledávací stroj narazí na stránky, které mají výše popsané vlastnosti, není schopen je zaindexovat. Důležité jsou pro nás první dva body, protože ty jsou v případě hlubokého webu majoritní. Proto jsou z indexace vyloučena všechna databázová centra, všechny dynamické portály s databázemi, databáze skryté v internetu atd. k těmto zdrojům musí tedy uživatelé přistupovat jiným způsobem a použít například vstupních bodů, které budou popsány v dalších kapitolách. Jedná se o sofistikované portálové aplikace, které pracují v heterogenním databázovém prostředí a jsou nazývány profesionální databázová centra, databázoví agregátoři, poskytovatelé profesionálních informačních zdrojů pro vědu a výzkum. 6.2.3 Vyhledávání v prostředí hlubokého webu Hlavním datovým zdrojem, který tvoří největší část hlubokého webu jsou profesionální databáze a tudíž znalost hlubokého webu může být chápána jako orientace v těchto databázích a databázových centrech. Strana 26 Takovýmto prostorem jsou databázová centra, která ve většině případů stojí na komerčních základech a která obsahují velké množství ověřených informačních pramenů seskupených v jednotlivých tématicky zaměřených databázích. v těchto případech bývá podmínkou, aby organizace, jejichž služeb využíváme, navázala smluvní vztahy s příslušnými databázovými centry a domluvila se s nimi na platebních podmínkách. Na rozdíl od portálů probíraných v předchozí kapitole nejsou totiž tato databázová centra volně přístupná. Příkladem může být největší databázové cetrum Dialog, který bývá někdy označován za nejrozsáhlejší databázový systém vůbec (VLASÁK 1999). V současné době nabízí v rámci svých produktů přístup do databází o celkovém datovém objemu více než 15 terabytů. Tvoří bezpochyby světovou špičku v poskytování online informačních služeb na poli obchodu, vědy, techniky, financí a práva, s více než 670 zaměstnanci a přímým působením v 27 zemích celého světa. Brány do hlubokého webu - příklady • Turbo10: Turbo10 umožňuje klást dotazy více než 800 vyhledávačům, které jsou zaměřeny na hluboký web. • BusinessResearch: Tento vyhledávací nástroj je zaměřený na aplikovaný výzkum. • Science Research Portal – tento vyhledávací portál umožňuje prohledávat hluboký web v oblasti vědeckých informací. • Lycos Invisible Web Catalog – jde o jednu z nejlepších služeb pro orientaci v prostředí hlubokého webu. Mapuje více než 10 000 databází. • Infomine Multiple Database Search – rozcestník k více než 15 000 databázím, určeným především pro akademickou komunitu. Jeho součástí jsou i odkazy na elektronické časopisy, knihy, knihovní katalogy apod. • AlphaSearch – služba, která nabízí jedny z nejkvalitnějších odkazů, ačkoli jejich počet není z nejvyšších. Při mapování neviditelného webu se tato služba zaměřuje na zdroje značované jako „vstupní brány“. • WebData – databázový portál nabízející k jednotlivým databázím anotace, recenze a hodnocení kvality. Strana 27 Všechny živé systémy (živé v nejširším možném smyslu slova – např. živočichové, rostliny, houby apod.) nějakým způsobem pracují s informací. Základní činnosti při práci s informacemi jsou: uchovávání a předávání (přitom vědomě poněkud přehlížíme tvorbu nových informací). 6.3 Fenomén Google Způsob práce s informací se v čase mění – probíhá nejen evoluční vývoj, ale také revoluce. Revoluční vývoj může být ukázán na novém pojetí přístupu k informacím, tak jak jej prezentuje firma Google již od roku 1999. Jde o ambice, které si dříve nikdo nepoložil, ani si je reálně neuměl nikdo představit. Tyto aktivity překračují kategorizaci na hluboký a povrchový webu, proto o nich budeme pojednávat ve zvláštní kapitole. 6.3.1 Cíle společnosti Firma Google si již na počátku stanovil zjednodušeně řečeno následující cíle: • Uspořádat dosažitelné informace na webu (a kdekoliv jinde) • Zpřístupnit dosažitelné informace Uspořádání informací na internetu znamená především indexování celého obsahu webu. • Tento cíl si zakladatelé Googlu stanovili explicitně přesto, že v té době byl takovýto cíl zřejmě nedosažitelný. Nenechali se touto skutečností odradit a pustili se do práce. • Aby bylo možné indexovat celý existující bylo nutné vytvořit nové postupy jak v oblasti SW, tak i v oblasti HW. Cíl vyžadující tak ohromný výpočetní a paměťový výkon vyžadoval nové postupy jak v oblasti SW (ohromná paralelizace výpočtů) tak v oblasti HW (vytvoření ohromné kapacity). Zakladatelé řešili tento úkol tím, že vytvořili nové postupy síťových kooperací (vesměs patentované) a tím, že vytvořili ohromné farmy PC-serverů, které jim poskytly ohromný výpočetní a paměťový výkon. Strana 28 • Právem je Google nazýván novým typem firmy – hardwarově-softwarová firma – díky tomu nemá fakticky konkurenci – je na špici jak v oblasti HW tak v oblasti SW • Kvantitativní data – Google využívá více než 450:000 PC serverů, každý dotaz do vyhledávače je zpracováván v průměru v 7.000 počítačích. • Dnes má Google indexovaný a (mnohonásobně uložený) celý obsah internetu, k tomu digitalizovaný a indexovaný obsah desítek velkých knihoven, produkci desítek tisíc nakladatelů, dostupná digitální data o zemském povrchu (mapy i fotografie), a nikdo neví co ještě • Je možné uzavřít, že první cíl Googlu – uspořádat dostupné informace firma plní Druhý cíl zpřístupnění informací je nejméně tak ambiciózní jako první cíl uspořádání informací – spíše je daleko ambicióznější, ale to posoudí budoucnost. Cíl zpřístupnit informace si Google představuje takto • Uživatel zadá svůj požadavek na informace tím, že specifikuje pomocí pojmů vyjádřených slovy jaké informace chce najít • Google dokáže upravit (interpretovat) zadaná data v dotazu tak, aby „pochopil“ o co uživateli jde • Cílem Goolgovského vyhledávače je nastavit pořadí webových stránek tak, aby byly seřazeny v pořadí klesající relevance – relevancí se rozumí relevance vzhledem k zadanému dotazu – nástrojem k tomu je vytvoření tzv. „page rank“ což znamená ohodnocení relevance dané stránky vůči zadanému dotazu (přesný postup tvoří obchodní tajemství fy Google) Cílem stanovit relevanci stránek vzhledem k zadanému dotazu si Google dal prakticky naprosto nesplnitelný cíl. Znamená to totiž • Interpretovat zadaný vyhledávací řetězec ve smyslu „co měl uživatel na mysli, když zadal právě tento řetězec“ ? Takto pojatý úkol je konečným cílem oboru Sémantika a je v pohledu teoretické sémantiky nedosažitelný. Firma Google si opět (již podruhé po zadání úlohy indexace celého internetu) položila cíl, který podle zdravého rozumu je nesplnitelný – strojově pochopit ze zadaného dotazu o co uživateli fakticky jde. Vývojáři Googlu si s tím určitým způsobem poradili Strana 29 o Vytvořili si pojem relevance stránky vzhledem k zadanému dotazu – znamená to, že stránka má určitý „page rank“daný tím jak často je odkazována z jiných stránek a dalšími hledisky, které vystihují relevanci určité stránky vůči zadanému dotazu o Formulovali ideu, že sémantický obsah jakéhokoliv jazykového výrazu lze reprezentovat pomocí obsahů stránek na internetu a pomocí vztahů mezi stránkami na internetu. Tato značně troufalá myšlenka znamená v praxi to, že internet v nějaké formě obsahuje věrnou reprezentaci sémantických obsahů. Pokud by tato „hypotéza“byla pravdivá, znamenalo by to historický pokrok v oblasti sémantiky. Znamenalo by to, že veškeré sémantické obsahy lze nalézt na internetu, stačí je jen najít. To by byla naprostá revoluce v oblasti informační vědy, protože by to znamenalo, že konečný cíl sémantiky tj. reprezentovat sémantické obsahy by byl efektivně dosažen. Toto je spíše utopie, ale pokroky jsou nesmírné. o Tvorba indexu relevance, který umožňuje seřadit odpovědi na dotaz dle relevance je úctyhodná (přitom faktické algoritmy nejsou známy). • Musíme si uvědomit, že bez HW-SW schopností fy Google by vyhledávání na internetu bylo utopií. Vyhledávač firmy Google je vlajkovou lodí firmy, ale Google nabízí nejméně sto dalších velice sofistikovaných aplikací. Některé z nich zmíníme • Gmail je nový typ poštovního internetového klienta, který má značné výhody o Je nejrychlejší o Umožňuje řazení mailů do komunikací ve skupinách o Umožňuje naprosto bezprecedentně rychlé prohledávání v poště o Umožňuje současné prohledávání internetu • Dodává jednoduchý ale funkční systém pro práci s dokumentem (Google docs) současně zpracovávaným více uživateli o Aplikace Google docs je plně funkční a velmi jednoduchá a rychlá o Je zdarma • Google Maps a Google Earth – aplikace mapující zemský povrch – nesmírně populární a užitečná umožňující efektivní prohlížení map a fotografií zemského povrchu Strana 30 • Google Books – aplikace umožňující vyhledávání v digitalizovaných knihách (obecně bez možnosti prohlížení obsahu) pomocí indexování obsahu knih. Google zastává stanovisko, že pouhé indexování obsahu knihy není porušením autorského zákona: umožňuje vyhledávané místo najít, ale neumožní zpřístupnění obsahu knihy (pouze krátký citát). o Problém uživatele zda knihu koupit nebo ne spočívá většinou v tom, zda kniha je relevantní nebo není – Google mu pomáhá najít správný odhad relevance. Potom může uživatel buď knihu koupit nebo si ji vypůjčit v knihovně. o Domníváme se, že jednak je Google v právu, pokud se domnívá, že indexace sama není porušením autorských práv a jednak, že autorská práva se vztahují na sémantický obsah a ten není indexováním nijak odhalen. Dále se domníváme, že aplikace Google Books umožní mnoha uživatelům najít knihu, kterou by si i koupili, kdyby o ní věděli. o Tato snaha Googlu o zpřístupnění digitálního obsahu je ku prospěchu celého lidského společenství Firma Google navíc rozřešila i (pro jiné nerozřešitelný problém) problém financování. Vytvořila takové formy reklamy na internetu, které mají kladný výnos pro podnikatele a zároveň nejsou dehonestující pro zaměstnance. Jimi vytvořená pravidla financování prostřednictvím diskuse s partnery vedou na spravedlivější přerozdělování v rámci státu (a pouze státu – po provedení hlasování se na návrh zapomene). Rozhodnutí fy Google nabízet aplikace běžnému uživateli zdarma je klíčové – a to jak pro uživatele, tak i pro firmu. Tím Google získal rozhodující objem uživatelů, protože v řadě směrů nabízí nejlepší produkt a zdarma. Google si uvědomil, že získání uživatele je cennější než jeho platba. Plně globální věk vzniká až s firmou Google. Její cíle jsou plně globální • Indexovat celý internet • Zpřístupnit všechny dostupné informace na celém světě • Získat pro sebe všechny uživatele tím, že jejich produkt je nejlepší a je zdarma Strana 31 • Nezbytné finanční výnosy získat od firem prostřednictvím reklamy (neboť oslovují všechny uživatele) a tím potřebné náklady na provoz a rozvoj rozdělit na ty, kteří přebytečné zdroje mají • Měřítkem je pro ně objem všech dostupných informací Aktivity firmy Google naráží ovšem na přirozené limity • Autorská práva – Google má za cíl indexovat všechny informace a zpřístupnit pouze ty, které jsou z hlediska autorských práv volné o Existence neúměrně dlouho trvajících autorských práv je zřejmou brzdou jakéhokoliv pokroku lidstva – cestou praktického omezení práv Google pomáhá lidstvu překonat tuto hlubokou překážku pokroku o Vlastnické vztahy k poznatkům jsou zásadním omezením lidstva – dovedete si představit svět, ve kterém by Pythagorova věta byla soukromým vlastnictvím ? (zobecnění Pythagorovy věty jsou základem moderní vědy např. kvantové mechaniky a teorie relativity – obě teorie jsou bez Pythagorovy věty nemyslitelné) o Problém autorských práv ke svým produktům Google rozřešil – většina jich je dostupná zdarma. Google žije z reklamy a to není otázka využívání produktů. • Hlavní veřejně známé rysy o nejpoužívanější vyhledávač, založený v roce 1997 Pagem a Brinnem o více než sto dalších produktů – valná většina služeb zdarma o obrat 21 miliard USD o proklamované zásady o „Don't be evil “ o „A healthy disregard for the impossible“ Další aplikace o Google Video + YouTube o Google Docs & Spreadsheets o Google Maps + Google Earth o Google Reader Strana 32 o Google Calendar o Google Books o Blogger o Picasa + Picasa Web Albums 6.3.2 PageRank Parametr PageRank funguje jako dnes již slavná obchodní značka Googlu. Je to výsledek algoritmu, který vytvořili zakladatelé firmy a který je pravidelně vylepšován a upravován. Tento koncept odráží důležitost jednotlivých stránek a lze jej slovy tvůrců popsat takto: "To calculate the uniquely democratic nature of the web by using its vast link structure as an indicator of an individual page's value." [PAGE L. 1998]. Celý systém se opírá o analýzu odkazů miliard webových stránek tvořících internet. Princip je následující: odkazuje-li jedna stránka na druhou, dává jí tak vlastně hlas a zvyšuje její důležitost. Neznamená to samozřejmě, že stránky se při vyhledávání zobrazují výhradně podle PageRanku, konečné pořadí je určeno až kombinací s obsahem stránky a konkrétními on-page faktory. [SEO konzultace 2008]. Současný algoritmus PageRank není přesně znám (tvoří součást obchodního tajemství), k dispozici je pouze algoritmus tak, jak byl původně zveřejněn [PAGE 1998]: (1 − d ) + PR( A) = m n PR(Bi ) ∑ d × C (Bi ) i =1 • PR (A) je PageRank stránky A • PR (Bi) je PageRank stránky Bi, která na stránky a odkazuje • C(Bi) je počet odchozích odkazů na stránce Bi • m je celkový počet indexovaných stránek Strana 33 • d je faktor útlumu (tzv. damping faktor), který nabývá hodnot od nuly do jedné. Další kroky algoritmu • jako vstupní hodnoty PR(Bi) se berou hodnoty PageRanku stránek z minulé iterace výpočtu • odkazuje-li jedna stránka na druhou, dává jí tak vlastně hlas a zvyšuje její důležitost. • stránky se při vyhledávání nezobrazují výhradně podle PageRanku, konečné pořadí je určeno až kombinací s obsahem stránky a konkrétními on-page faktory • PageRank je v podstatě počítání odkazů – zhruba řečeno Strana 34 7 INFORMETRIE, SCIENTOMETRIE A BIBLIOMETRIE Lucie Vavříková Informetrie, scientometrie a bibliometrie jsou si velmi blízké, bývají možná i právem někdy zaměňovány, to však může být způsobeno právě tím, že se navzájem prolínají, spolupracují spolu, používají stejné metody, jednu si dnes bez druhé nelze představit. V pramenech se také objevuje několik různých pojetí jejich vzájemného vztahu, vymezení každé z nich není zcela jednoznačné. Jejich vztah je naznačen na obr. č. 2: INFORMETRIE Scientometrie Bibliometrie Obr. 1 – Vzájemný vztah informetrie, scientometrie a bibliometrie Zastřešující je informetrie, jak naznačuje její název, zabývá se informacemi, respektive informačním procesem a měřením informačních toků. Bibliometrie a scientomterie se navzájem velmi překrývají, mají totožné vědecké metody, dělají obdobné analýzy, nicméně bibliometrie je omezena na zaznamenané informace a jejich bibliografie (řekněme publikace obecně), zatímco scientometrie je vymezena sociálním aspektem vědu, zkoumá pouze publikace, resp. vědecké výstupy ve vědecké komunitě. Bibliometrie je „starší“, v podstatě je scientometrie jen její nadstavbou a doplňkem; scientometrie obecně ke svému zkoumání využívá zejména bibliometrických metod. Pojmy bibliometrie a scientometrie uvedl Pritchard a Nalimov s Mulčenkem takřka ve stejný čas (1969), informetrie si na svou definici počkala dalších 10 let. 7.1 Informetrie Informetrie je ze zmiňovaných třech dílčích disciplín nejširší, její povaha je nejvíce teoretická a zajišťuje takto metodologický základ zbývajícím dvěma. Informetrie se zabývá měřením toku informací, hodnocením informačního procesu. Jedná se o vědní obor, který Strana 35 používá matematicko-statistických metod k popisu a analýze informačních jevů za účelem hledání jejich zákonitostí [KTD, 2003]. Jako součást informační vědy se zabývá především kvantifikací informace, kvantitativní analýzou informačních toků a dokumentů apod.; její výsledky slouží např. pro analýzu kvantitativního růstu literatury, účinnosti informačních systémů či role informací ve vědecké komunikaci. Informetrie je metoda zkoumající a kvantitativně měřící vznik, oběh a působení informací v jakékoli oblasti společenského života jednotlivce nebo společnosti. Usiluje o vyjádření hodnoty informačního sdělení. [KÖNIGOVÁ, 2001]. 7.2 Scientometrie Existuje řada způsobů jak ve vědě měřit ve kvalitu a kvantitu. Scientometrie je věda, která se tímto měřením zabývá, snaží se nalézat metody a metriky pro určení jednoho či druhého aspektu, obecněji se také vžil pojem měření výkonnosti vědy. Ve své samotné podstatě sleduje a hodnotí komunikaci ve vědě, neboť všechna měření jsou odvozena od interakcí mezi jednotlivými elementy scientometrie, touto základní interakcí je citace. Její název je odvozen z metrein – měřit (řec., lat.), scientia – znalost, vědění. Scientometrie přímo navazuje a vychází z informační vědy a používá mj. její metody, pro správné pochopení je ji třeba vsadit do kontextu jednotlivých metod bibliometrie a informetrie. Prakticky je scientometrie dnes nejvíce využívána pro hodnocení vědy pro rozdělování finančních zdrojů ve vědě. Scientometrie, v angličtině „Scientometrics“, se obecně řečeno zabývá měřením vstupů a výstupů ve vědě a měřícími procedurami ve vědě [KÖNIGOVÁ, 2001]. Z pohledu sociologického se jedná o studium kvantitativních aspektů vědecké komunikace (publikace, citace). Jejím cílem je vyvinout indikátory intelektuální a sociální organizace vědeckých disciplín za pomoci vzájemných vztahů mezi autory a texty [LEYDESDORFF, 2001]. Scientometrie provádí matematické a statistické analýzy vědeckého výzkumu (častěji v tzv. tvrdých vědách) [KTD, 2003]. Pomocí scientometrie lze určit vzory a identifikovat charakteristiky jak autorů, tak dokumentů. Metodami scientometrie lze propojit informace o institucích na úrovni výzkumných skupin s vývojem na úrovni jednotlivých disciplín a oborů. Jeden z nejdůležitějších cílů scientometrie je zkoumat kvantitativní vztahy produkce, diseminace a impaktu/vlivu vědeckých informací [VINKLER, 2008]. Strana 36 Pokud uvážíme dnešní ekonomické aspekty hodnocení vědy, lze definici scientometrie ještě o kousek posunout, scientometrie zkoumá vědeckou produktivitu a její výslednou prospěšnost, současný výzkum využívá jak bibliometrické tak ekonomické analýzy [DIODATO, 1994], věda je uvažována jako ekonomická aktivita [TAGUE-SUTCLIFFE, 1992]. D. J. de Solla Price, zakladatel scientometrie, se výrazně zabýval oblastí historie vědy a vědy o vědě, z kvantitativních analýz odvozoval tvrzení o exponenciálním charakteru vývoje či rozložení zkoumaných jevů. Mezi nejznámější patří zákon o exponenciálním růstu počtu dokumentů a tvrzení, že polovina vědeckých článků je publikována druhou odmocninou počtu všech autorů [KTD, 2003]. V dnešní době využívá scientometrie zejména data dvou komerčních produktů, databáze citačních rejstříků dnes sjednocená do platformy ISI Web of Science (Thomson Reuters) s více jak čtyřicetiletou historií a konkurenční citační databáze Scopus od nizozemského vydavatele Elsevier spuštěná před 5 lety. S rozvojem technologií je však stále snazší pro ostatní producenty zabudovávat do svých databází a dalších informačních a znalostních produktů prvky scientometrických analýz, zejména sledovat vzájemné citace. Velmi diskutován je např. nástroj Google Scholar. Z dalších produktů zahrnující tyto nástroje je databáze PubMed, CSA Illumina aj. 7.3 Bibliometrie Výraz bibliometrie bývá velmi často používán jako souhrnný pojem, autoři často informetrii nebo scientometrii od ní nerozlišují. Pravděpodobně je to tím, že převážná část metodologického aparátu je definována jako bibliometrická. Bibliometrie se zabývá studiem kvantitativních aspektů produkce, rozšiřování a užití zaznamenaných informací. Vytváří si matematický model a teorie procesů a poté je aplikuje pro odhadování vývoje a pro rozhodování [TAGUE-SUTCLIFFE, 1992]. Bibliometrie pomocí kvantitativních analýz, statistik a datových vizualizací zjišťuje charakteristiky referencí, citací, autorů, časopisů, institucí, slov, klíčových slov, klasifikačních kódů atd. Typickou a jednou z nejstarších je bibliometrická analýza kvantitativního růstu literatury. Do bibliometrie dnes bývá velmi často také zařazována Strana 37 oblast výzkumu informačních potřeb (uspokojení nebo neuspokojení požadavků uživatelů), neboť bibliometrie tvoří jeho valnou část, jako např. hodnocení intenzity využívání knihovních a informačních fondů. 7.3.1 Bibliometrické zákony Jak bylo již výše zmíněno, máme tři bibliometrické zákony Lotkův, Bradfordův a Zipfův, mezi nejpoužívanější bibliometrické metody řadíme publikační a citační analýzy. Lotkův zákon, známý jako zákon měření vědecké produktivity [KÖNIGOVÁ, 2001], který byl definován při srovnávání publikační činnosti autorů v oblasti chemie a fyziky, říká, že se stoupajícím počtem publikovaných článků klesá počet autorů píšící největší poměr množství článků [Scientometrics, 2007]. Pokud a1 autorů publikuje jeden článek, pak an bude počet autorů, kteří publikují n článků: an = a1 / n 2 Zipfův zákon neboli frekvenční analýza respektive „rozptyl slov v textu“ [KÖNIGOVÁ, 2001] byl definován Georgem Kingsley Zipfem, americkým psychologem a lingvistou. Zipfův zákon vyjadřuje skutečnost, že základ lexiky vytváří relativně malý počet silně frekventovaných slov. Zipf slova uspořádal podle frekvence ( f ) výskytu, slovo s nejvyšší hodnotou výskytu získalo r =1, následující r = 2 atd. Jsou-li slova dlouhého textu seřazena podle pořadí klesající četnosti jejich výskytu, potom součin pořadí ( r ) a četnosti ( f ) pro každé slovo textu bude přibližně táž konstanta ( C ), která závisí na délce textu. r*f=c Na základě Zipfova zákona se konstruovaly také slovníky nevýznamových (stop) slov, které jsou základem pro automatické vyhledávání. Bradfordův zákon, je zákon rozptylu informací, nebo rozptylu relevantních článků v časopisech [KÖNIGOVÁ, 2001]. Definoval jej Samuel Clemens Bradford, americký knihovník, jeden ze zakladatelů bibliometrie. Tento zákon se prakticky může použít např. Strana 38 pro tvorbu a vyváženost knihovních fondů. Obdobně jako Lotkův zákon definuje nepřímou úměru mezi časopisy a relevantními články v nich - maximální počet relevantních článků je soustředěn v minimálním počtu časopisů tvořících tzv. jádro. Jádro oboru pak tvoří nejužší skupina časopisů, ve kterých vyšlo nejvíce relevantních článků. 7.4 Webometrie S nástupem počítačů, nejen že se díky obrovskému výpočetnímu, propojovacímu a úložnému potenciálu scientometrie velmi rozvíjí, dochází také k transformování bibliometrických metod do tohoto prostředí a formuje se kybermetrie, nebo také webometrie. Lze je chápat jako totožné, pokud bychom je chtěli od sebe alespoň nějak odlišit, kybermetrie je určena obecně aplikací do kyberprostoru, navíc první časopis zabývající se touto oblastí nese název Cybermetrics, webometrie se pak spíše aplikuje v rámci World Wide Web, jinak zjednodušeně označované jako internet nebo web. O obou se začíná hovořit v roce 1997. Vzhledem k dnešnímu vymezení většiny služeb právě v rámci internetu, respektive využívání zdrojů skrze webové rozhraní, na kterém jsou analýzy založeny, bude zde souhrnně použit termín webometrie. Webometrie se zabývá kvantitativními aspekty vytváření a užití informačních zdrojů, struktur a technologií celého internetu, přičemž využívá bibliometrického a informetrického přístupu. Web může být v jistých aspektech nahlížen stejně jako klasická „papírová“ komunikace, kde tradiční informační entity a citace jsou nahrazeny webovými stránkami a odkazy. Výrazným rozdílem proti klasickému prostředí je možnost oboustranného propojení a samozřejmě to, že ve webovém prostředí neexistuje kontrola kvality [BJÖRNEBORN, INGWERSEN, 2004]. Webometrie je stále ještě v experimentálním stádiu, je zkoumáno, zda bibliometrické metody mohou v tomto prostředí být aplikovány [NORUZI, 2006]. Zkoumat lze ve všech složkách digitálního prostředí, tj. v sítích jednotlivých domén, intranetu; webometrie provádí hodnocení sítí podle objemu informačních kolekcí, počtu www stránek, podle četností vstupu, času odezvy. Provádí klasifikaci stránek podle způsobu prezentace, vytváří statistiky užívání, hodnotí produktivitu autorů [SOUČEK, 2006]. Strana 39 7.5 Citační analýzy Tato kapitola se pokusí přiblížit základní metodu zkoumání v bibliometrii a scientometrii: citační analýzy, jejich účel, využití a omezení. Ačkoliv je kapitola pojmenována ve stručnosti „Citační analýzy“, seznámíme se nejprve s analýzami publikačními, které jsou vlastním základem analýz citačních. Citační a publikační analýzy jsou základní bibliometrické metody, které umožňují měření a tím vzájemné srovnávání v oblasti vědy a výzkumu. Uvést publikační analýzy je nezbytné proto, že pokud chceme získat kompletní obraz vědy např. v daném státě, je nezbytné se zaměřit již na základní úroveň, tj. přímo na samotné publikování, ještě než budeme zkoumat další komunikaci díla v rámci vědy. Pro důslednou interpretaci výsledků citačních analýz je nutné přihlédnout k výsledkům publikační analýzy. Např. pokud bychom z citační analýzy usoudili, že v určitém oboru nejsou v daném regionu kvalitní vědci, neboť nejsou citováni, je důležité nejprve zjistit, zda-li se v daném regionu v daném oboru vůbec publikuje. Citační a publikační analýzy nejsou vždy vymezeny zvlášť, často jsou v rámci analýzy citační provedeny analýzy publikační. Publikační analýza je matematicko-statistická bibliometrická metoda, která se zabývá kvantitativním měřením produkce publikací. Publikační analýzou nejčastěji vyhodnocujeme [INGWERSEN, LARSEN, 2007]: • geografickou oblast • vědní oblast • časovou periodu • typ vědecké literatury • autora v oboru nebo zemi • časopisy v oboru • instituce Publikační analýzou stanovujeme např. jaké typy publikací jsou typické pro danou oblast [INGWERSEN, LARSEN, 2007]: • přírodní vědy a medicína • recenzované články Strana 40 • článek typu review • dopisy a poznámky (typické zejména pro fyziku a obdobné oblasti) • technické a počítačové vědy • recenzované články • příspěvky ve sborníku (recenzované) • patenty • společenské a humanitní vědy • knihy (antologie a monografie; recenzované a vydané) • recenzované články Citační analýza je matematicko-statistická bibliometrická metoda, která kvantifikuje vztahy mezi autory, dokumenty a vědními obory na základě bibliografických citací a bibliografických referencí. Konkrétně citační analýzy zkoumají citovanost dokumentů, četnosti citací v dalších pracích apod. [KTD, 2003]. Analýzy se zabývají výzkumem citačních vazeb a citací. Jedná se o zkoumání témat, směrů, množství a vazeb, jsou vytvářeny např. citační sítě a grafy [JANSSENS, 2006]. Výsledkem citační analýzy může také být určení hodnoty scientometrického indikátoru [SMELSER, BALTES, 2004]. Analýzou citačních rejstříků je možné určit a popsat směr budoucího vývoje vědních disciplín a mapovat vědu [JANSSENS, 2006]. Pomocí citačních analýz se měří tzv. viditelnost v oblasti vědy. Citace je znak vědecké komunikace, je znakem užití informace. Citace navzájem propojuje dokumenty, pomocí nich lze vymodelovat odbornou literaturu jako velkou síť dokumentů, které jsou spojeny citacemi. Citace jsou dvojího druhu: citace a reference. Formálně reference ve vědecké komunikaci označuje použití informace, citace vyjadřuje příjem tohoto použití ve vědecké komunikaci. Citační analýzy měří a indikují zejména: • počet citací dokumentu • vztahy dokumentů • vzájemnou obsahovou souvislost • nepřímou obsahová souvislost (více dokumentů citovaných jedním dokumentem, jeden dokument citovaný více dokumenty) Strana 41 • jádro oboru • kvantifikované profily oboru a prognostické odhady Výsledky citačních analýz lze interpretovat v několika směrech, lze z nich usuzovat na [MOED, c2005]: • výkonnost vědy • odbornou kvalitu • vliv • dopad Jako aplikovaná metoda má citační analýza význam pro optimalizaci informačních toků a pro profilování knihovních fondů; je také základem citačního mapování vědy pomocí konstrukce citační sítě [KTD, 2003]. Citační analýzy jsou dnes využívány zejména v oblasti hodnocení vědy. Výsledky citačních analýz jsou přímo závislé na zdroji dat, na jeho excerpci, kvalitě záznamů a jejich metadat. Při interpretaci výsledků citačních analýz je nutno vždy přihlížet k možnostem a mezím použitých metod a zdrojů. Rizika a omezení citačních analýz Citační analýzy jsou omezovány mnoha aspekty, které mohou výsledky zkreslovat. Zásadní je identifikace elementů, je velmi těžké určit, zda se jedná o téhož autora, instituci, velmi složité je identifikovat úroveň elementu (výzkumný tým) a vzájemnou spolupráci, obdobné problémy jsou s identifikací publikace. Identifikaci z pohledu textu pak znesnadňují homonyma, synonyma, zkratky a různé variantní názvy. Velmi složité je určit typologii dokumentů. Mezi technická omezení řadíme zejména otázku vzájemného propojování citací (vychází z nedokonalé identifikace). Citační analýzy předpokládají citační morálku, třetím omezením je morální aspekt. Na etické rovině hovoříme zejména o nadměrném citování sebe sama (autocitace), vzájemné bezdůvodné citování a zneužívání spoluautorství (uvedení autorů, kteří na publikaci nemají žádný či jen minimální podíl). V jednotlivých oborech se výrazně liší citační zvyklosti; v molekulární biologii a biomedicíně je snazší dosáhnout citovanosti než v teoretické fyzice (totéž se do určité míry Strana 42 projevuje i uvnitř oborů). Vyšší citovanost přináší bádání na pomezí oborů, v interdisciplinárních oblastech. Na obecnější úrovni si pak musíme uvědomit, že často mnoho pramenů (neformálních) citováno není vůbec (konzultace s kolegy aj.), že stále jsme omezeni daným zdrojem dat a nikdy se nemůžeme vyvarovat lidské potažmo úřední chybě. Mimořádně vysokou citovanost také mívají přehledové články a některé metodické práce. Ačkoli vysoká citovanost pravděpodobně indikuje, že daná práce či její autor přináší pro odbornou komunitu něco důležitého a objevného, je třeba mít stále na paměti, že pro vědu mají velký význam i lidé, jejichž originální badatelský přínos není velký, ale jsou skvělými popularizátory, mají organizační schopnosti nebo umějí dobře přednášet. Podrobněji jsou omezení a rizika rozebrána v kapitole Scientometrické a bibliometrické indikátory. Citační rejstříky V dnešní době se nástroje citačních analýz díky výpočetní technice rychle rozvíjejí. Klasickým nástrojem je citační resjtřík (též citační index), který má za cíl mapování vědy, prestiže autorů, časopisů, oborů, pracovišť atd. Otcem citačních rejstříků je Eugene Garfield, který definoval citační rejstřík, pro jejich vývoj založil Institute of Scientific Information ve Philadelphii r. 1958. Citační rejstřík je ve své minimální podobě seznam publikovaných článků opatřený výčtem jejich citací v daném časovém období. Základní metodou je tedy sledování a zaznamenávání citací a jejich počtu a slouží tak k průzkumu citovanosti, respektive jsou zdrojem pro vytváření citačních analýz. V dnešním kontextu můžeme chápat citační rejstřík šířeji, v podstatě lze jakýkoliv informační zdroj, který disponuje údaji o vzájemném propojení dokumentů pomocí citací či referencí, označit za citační rejstřík. Nebo můžeme koncept uchopit obráceně a říci, že citační rejstříky jsou dnes již automatickou součástí tzv. citačních databází, které nabízí další nástroje k citačním analýzám. Citační rejstříky lze rozdělit na několik druhů polytematické - zahrnují více oblastí vědy, nejznámější Science Citation Index (v rámci databáze ISI Web od Science na platformě ISI Web of Knowledge), novější databáze Scopus (http://www.scopus.com), Google Scholar (http://scholar.google.com). Strana 43 oborové v rámci databáze Medline (http://www.medline.com) astronomie, fyzika - NASA ADS (http://adsabs.harvard.edu) medicínský citační index Národní lékařské knihovny (http://www.nlk.cz) preprintová digitální knihovna pro fyziku v Los Alamos (http://www.lanl.gov) a další... specializované – jsou orientovány na specifickou formu vědecké komunikace, např. patentový citační rejstřík Derwent Innovation Index, STN International aj. Nejznámější (a původní) citační rejstříky jsou: SCI = Science Citation Index (od r. 1961) – ukazatel citací v přírodních. lékařských a technických vědách SSCI = Social Science Citation Index – zaměřený na společenské vědy (od r. 1969) AHCI = Arts and Humanities Citation Index (od r. 1978) – obsahuje data z oblasti humanitních věd a umění Jsou dostupné v rámci databáze ISI Web of Science, analytické výsledky z těchto dat jsou podrobně vypracovávány v databázi Journal Citation Reports. Podrobnější informace k citačním rejstříkům, databázím, které substituují citační rejstříky a dalším zdrojům pro citační analýzy jsou uvedeny v kapitole Citační databáze a scientometrické zdroje. 7.6 Scientometrické a bibliometrické indikátory a jiné metriky „Každý indikátor má své přednosti a svá omezení. Nesmí se na ně hledět jako na „absolutní“ ukazatele; mají komplementární roli. Různé bibliometrické postupy a Strana 44 metody musí být používány v kombinaci, přestože mohou někdy vést k protichůdným výsledkům, zvláště pokud poskytují užitečné informace a odpovídají vědeckým a odborným standardům. Přes svá omezení, bibliometrické ukazatele poskytují zásadní kvantitativní měřítka vědeckého výkonu.“ [OKUBO, 1997] Scientometrie je věda, která se snaží vstupy a výstupy ve vědě uchopit, zejména kvantitativně. K tomu potřebujeme definované metriky, na základě nichž můžeme právě kvantitu určit; určujeme ji indikátory, v kontextu evaluativní scientometrie hovoříme o scientometrických prvcích. V průběhu vývoje scientometrie bylo navrženo velké množství indikátorů, které charakterizují scientometrické elementy, neboli určují jejich status [BOLLEN, RODRIGUEZ, SOMPEL, 2008]; a dnes jsou velkým tempem navrhovány a vyvíjeny indikátory další. Nejtradičnějším indikátorem je impakt faktor, navržený Eugenem Garfieldem a další z kolekce Institute for Scientific Information (Citing Half-life aj.), dnes mu adekvátní konkurenci tvoří H-Index. Jelikož všechny indikátory mají svá omezení, nevýhody a zkreslují svým způsobem výsledky, vždy jsou navrhovány indikátory komplementární, které se snaží tato omezení zmenšit a redukovat zavádějící výpovědní hodnoty. Pokud hovoříme o indikátorech a jejich definicích, velmi jasně vstupujeme do sporu tvrdých věd a věd společenských (sociální, humanitní). Na společenské vědy lze indikátory aplikovat jen v omezeném měřítku, neboť společenské vědy mají velmi odlišné charakteristiky vědní komunikace, ať už se jedná o typ publikací, poločas rozpadu nebo regionální vymezenost. Proto zejména ve společenských vědách je význam indikátorů velmi relativizován a je stále zdůrazňován význam recenzního řízení. Rozdíly mezi hodnotami indikátorů jsou samozřejmě i mezi jednotlivými vědeckými disciplínami, nelze jednotlivé obory, potažmo tak ani vědce, či instituce, srovnávat na základě absolutní hodnoty indikátoru. Obecně jsou však indikátory určeny pro hodnocení na všech úrovních, na mikro- (autor, článek), střední (výzkumný tým, projekt, instituce) i makroúrovni (velké instituce, stát, region). Jak je zmíněno na začátku, indikátory hovoří o kvantitativních aspektech. V dnešní době mnoho systémů hodnocení vědy jej přebírají jako náhradní evaluační nástroj. Právě vzhledem k mnoha omezením, které jednotlivé indikátory mají, nelze nahradit kvalitativní posuzování, stejně jako nelze brát výstupní hodnoty jednotlivých metrik jako absolutní bernou minci. K rozhodnutí o zapojení indikátoru jako hodnotícího prvku je nejprve nutné Strana 45 se důsledně seznámit s jeho vlastnostmi, definicemi a užitými metodami tak, aby alespoň co nejlépe odpovídal záměru hodnocení. 7.6.1 Impakt faktor „Dobrý sluha, ale zlý pán“ Špála O impakt faktoru bylo napsáno mnohé, jeho dlouholetá historie ho podrobila řadě kritiky, která byla impulzem pro vznik nových indikátorů, nicméně impakt faktor je dodnes velmi uznávaným indikátorem, mnoho systémů hodnocení vědy využívá tuto metriku jako součást evaluace výstupů z vědy. impakt faktor = počet citací / počet publikací Impakt faktor vyjadřuje impakt individuálních časopisů, podle toho, jak byly průměrně citovány ve 2 předchozích letech (v roce 2004 je IF určen za r. 2002-03). Impakt faktor je uváděn na tři desetinná místa. Celý název tohoto indikátoru je Journal Impact Factor, který avizuje, že je primárně určen pro aplikaci na časopisy, nikoliv na jiné scientometrické elementy, nelze jím hodnotit autory nebo články samotné. Při takovéto aplikaci se dopouštíme chyby, kdy uvažujeme, že úspěšný článek mnohokrát citovaný je totožný s tím, který takřka nebyl citován, pouze byl uveřejněn ve stejném časopise, potažmo autoři jsou v tuto chvíli posuzování jako stejně úspěšní, mají stejný impakt faktor [EGGHE, 2007]. Impakt faktor je přidělován časopisům, které jsou excerpovány do tzv. citačních rejstříků, v současné době tedy do databáze ISI Web of Science, jejímž producentem je korporace Thomson Reuters. Databáze zahrnuje citační rejstříky Science Citation Index, Social Science Citation Index a Arts & Humanities Citation Index. Databáze ISI Web of Science je zpřístupněna mj. v integrovaném rozhraní ISI Web of Knowledge, které zahrnuje také databázi Journal Citation Reports, v níž jsou publikovány právě hodnoty impakt faktorů a další indikátory derivované z citačních rejstříků. Strana 46 Z impakt faktoru lze vyvozovat, s jakou pravděpodobností lze očekávat, že články v časopise uveřejněné by mohly být citovány [ŠPÁLA, 2006]. Neboť právě časopis, ve kterém byl vydán, má přidělen takový impakt faktor, kolik v průměru jeho články získávají citací, lze pak předpokládat, že článek by tento počet citací mohl získat taktéž. Historie Impakt faktor byl definován v r. 1955 v rámci projektu citačních rejstříků Eugenem Garfieldem, který pro zavedení tohoto indikátoru založil Institute for Scientific Information ve Philadelphii (USA). V r. 1960 vzniká první obecný citační rejstřík, o rok později byl zpracován první Science Citation Index. Následovalo vydání Journal Citation Reports, dnes je vše dostupné v rámci integrovaného rozhraní producenta Thomson Reuters ISI Web of Knowledge. Kontroverzní impakt faktor: Sám Eugene Garfield se ve svých posledních článcích věnuje fenoménu impakt faktoru a jeho kritice, respektive jeho použití. Vyskytují se pochyby o uvádění impakt faktoru na 3 desetinná místa. Pomocí impakt faktoru nelze srovnávat časopisy z různých vědeckých disciplín nebo hodnotit autory, impakt faktor se liší podle časové periody, ne ve všech případech při delší časové periodě impakt faktor stoupá [ŠPÁLA, 2006]. Nejrozsáhlejší kritiku konceptu impakt faktoru patrně provedl v r. 1997 Per O. Seglen [SEGLEN, 1997] [HJØRLAND,2007]. Zásadními body jsou: • není statisticky reprezentativní pro individuální články v časopise • nekoreluje s aktuálními citacemi jednotlivých článků • autoři i vybírají podle mnoha jiných kritérií, když nabízejí článek do časopisu • citace necitovatelných jednotek jsou v databázi započítávány • nereflektuje nadměrnou citovanost publikací typu review • rozsáhlé články získávají více citací, hodnota impakt faktoru se zvyšuje • navyšování citací pomocí autocitací u časopisů s kratší periodou vydávání, jinak též selektivní autocitace, články mají tendenci přednostně citovat jiné články ve stejném časopise • autory časopisu jsou preferovány citace v národním jazyce časopisu Strana 47 • omezené pokrytí databáze • v databázi nejsou zahrnuty knihy, i když jsou významným zdrojem citací • orientace databáze zejména na anglický jazyk, dominance amerických publikací • kolekce časopisů v databázi se může rok od roku lišit • vyšší hodnoty mají výzkumné oblasti s rychle zastarávajícími informacemi • závislost na dynamice oboru v daném čase • menší vědecké disciplíny většinou nemají časopisy s vysokým impaktem • je silně ovlivněn vztahy mezi jednotlivými disciplínami (např. klinický vs. základní výzkum) • je určen mírou citovanosti, což neplatí vice versa • ignoruje kvalitu přijatých citací, rozpor mezi prestiží a popularitou 7.6.2 Další klasické bibliometrické indikátory ISI Spolu se zavedením impakt faktoru byly zavedeny další indikátory, jejichž hodnoty jsou určovány z datové kolekce citačních rejstříků. Indexy jsou určován buď pro jednotlivé časopisy, nebo v rámci předmětné oblasti, tzv. agregované indexy. Immediacy Index Immediacy Index, v češtině nazýván jako index bezprostředního vlivu nebo odezvy, někdy označován také jako Garfieldův index, vyjadřuje průměrný počet citací, který článek získal v roce jeho publikování. immediacy index = počet citací článku v daném roce / počet článků v daném roce Vzhledem k tomu, že je uvažován průměr citací na článek, immediacy index redukuje vliv velkých časopisů. Časopisy s velkou periodicitou jsou zvýhodněny, neboť mají více času v průběhu roku nasbírat citace. Časopisy, které vycházejí nepravidelně nebo ke konci roku Strana 48 tak mají nižší immediacy index. Tento index je vhodný zejména pro srovnávání časopisů zabývající se velmi aktuálními otázkami a dynamickými vědními disciplínami. Cited Half-life Poločas citovanosti, jak je do češtiny tento ukazatel překládán, udává po kolika letech (ve vztahu k určitému roku) se objeví 50% všech citací na články daného časopisu v citačních rejstřících. Například časopis, který v roce 2001 má cited half-life 5, což znamená, že články publikované mezi 1997-2001 (včetně) odpovídají polovině všech citací článků z tohoto časopisu v roce 2001. Cited half-life je vypočítáván pouze pro ty časopisy, které byly citovány více než stokrát v daném roce. Cited half-life má výpovědní hodnotu zejména pro akvizici a archivování, změny mohou naznačovat změnu ve formátu časopisu a dá se z nich vyvozovat historie časopisu. Citing Half-life Poločas citování vyjadřuje průměrné stáří článků, které jsou citovány v daném časopise v jednom roce. Např. pokud má časopis v r. 2008 hodnotu citing half-life 9, značí to, že polovina článků, které byly články v průběhu roku v daném časopise citovány, byly publikovány mezi lety 2000-2008 (včetně). Obdobně jako cited half-life je tento index vypočten jen u časopisů s více jak 100 referencemi. 7.6.3 H-index H-index je poměrně nový indikátor, byl definován v roce 2005 fyzikem Jorge Hirschem. tento indikátor byl vědeckou komunitou velmi rychle akceptován, dnes je již plně respektovaným ukazatelem. Název H-index byl původně odvozen právě od příjmení autora Hirsch, dnes se však již využívá spíše jeho charakteristiky a h je interpretováno jako highly cited index. H-index je číslo h, které udává počet publikací, které byly alespoň h-krát citovány. Pokud tedy vědec má h-index roven 5, značí to, že nehledě na to, kolik publikací celkově napsal, 5 jeho publikací bylo nejméně 5krát citováno. Strana 49 H-index lze jednoduše odečíst i ze seznamu publikací seřazených podle počtu citací, kdy hindex je průsečíkem pořadí dokumentu a udaného počtu citací. Př.: pořadí název počet citací 1 Dokument A 20 2 Dokument B 8 3 Dokument C 5 4 Dokument D 4 5 Dokument E 1 h = 4: pořadí = počet citací H-index může být aplikován na jakýkoliv scientometrický element na mikroúrovni (pro hodnocení autorů byl tento indikátor původně vytvořen, jinak např. časopis) a na střední úrovni (výzkumný tým, instituce aj.). Pomocí H-indexu lze odvozovat také vývoj vědecké disciplíny, pokud provedeme rešerši na tuto oblast a seřadíme dle citací, definovat aktuální témata a naopak eliminovat témata zastarávající [BORNMANN, 2007]. Výhody H-indexu Fakt, že byl H-index odbornou komunitou velmi rychle přijat, svědčí o tom, že má mnoho výhod. Je především určen pro efektivní hodnocení na mikroúrovni, pokrývá jak množství tak „viditelnost“ [BORNMANN, 2007], tedy neuvažuje málo citované publikace nehledě na jejich množství [EGGHE, 2007] a minimalizuje vliv vědců s jednou citovanou publikací, kteří však jiný přínos nemají (typicky autor publikace typu review). Hlavní předností je též jeho jednoduchost a odvoditelnost z jednoduchého seznamu [BORNMANN, 2007]. Nevýhody H-indexu To, co je na jedné straně interpretováno jako výhoda, se může z obráceného úhlu pohledu jevit též jako nevýhoda. Konkrétně h-index nebere v potaz, je-li článek dále citován a jestli dále obdrží 100, 1000 nebo více citací [EGGHE, 2007], tj. nerozlišuje již dále kvalitní Strana 50 vědce, kterých je v populárních disciplínách mnoho. Indexu je taktéž někdy označován za index průměrnosti, neboť výrazně zvýhodňuje vědce dlouhodobě působící v oboru, nicméně v takovém případě lze velmi jednoduše aplikovat časové omezení a naopak umožňuje srovnání vědců různého věku [ŠPÁLA, 2006]. Právě možností určení časové periody pomocí indexu lze sestavit jakousi klasifikační stupnici. Např. pokud vědecký pracovník po 20 letech práce dosáhne h rovné 20, je ho možno označit za úspěšného. Pokud h bude rovné 40 je vynikající a při hodnotě 60 (nebo 90 po 30 letech) je skutečně výjimečným jedincem. [ŠPÁLA, 2006]. Taktéž přílišná jednoduchost se stává terčem kritiky, otázkou zůstává, zda lze měřit vše jen jedním indexem a redukovat tak vícestranný pohled [GLÄNZEL, 2006]. H-index dodnes taktéž není ověřen ve všech vědních oblastech [BORNMANN, 2007], jeho funkčnost je dokázána zejména v některých tvrdých vědách (fyzika, biologie, ekologie, evoluční biologie). Opět se vracíme k obecnému omezení většiny indikátorů, kdy h-indexem taktéž lze porovnávat pouze vědce působící v jedné vědní oblasti, neřeší problém rozlišných charakteristik vědních oborů. Sám Hirsch konstatuje, že index neodstraňuje problém review, které vždy získává více citací než článek s původním výzkumem [ŠPÁLA, 2006]. Revize h-indexu a nové indikátory z něj odvozené Všechna omezení h-indexu vedla k zamyšlení a pokusu limitování daného parametru, který do této metriky vstupuje, a dalšímu zdokonalení tohoto indikátoru. Jak již bylo zmíněno, ihned vešlo v používání omezení na danou časovou periodu. Problematika autocitací lze taktéž poměrně jednoduše řešit tak, že publikace budou do výpočtu započteny jen v tom případě, kdy po odečtení autocitací převyšuje výsledný počet citací hodnotu h-indexu. Bornmann [2007] a Hirsch se shodli taktéž na řešení problému rozdílu mezi jednotlivými disciplínami na základě jejich charakteristiky spoluautorství; pokud sečteme všechny hautory (multiplicitně) a podělíme h-indexem, dostaneme se k hodnotám, které rozdíly mezi jednotlivými disciplínami redukují a můžeme je tak srovnávat [BATISTA, 2006]. K h-indexu byly definovány další komplementární indikátory, které vychází z jeho podstaty, jako např. a-index nebo g-index (viz následující podkapitola o dalších indikátorech). Strana 51 7.6.4 Eigenfactor Jednu z nových metod určených k hodnocení vědy nabízí portál Eigenfactor.org s podtitulem „Ranking and Mapping Scientific Knowledge“. Pro hodnocení portál používá dva indikátory Eigenfactor Score a Article Influence. Eigenfactor Score vyjadřuje míru důležitosti časopisu pro vědeckou komunitu. Podle definice a matematického modelu sítě dokumentů navzájem propojené citacemi, ve které se vědec pohybuje, je to odhad procenta času, který stráví uživatelé s daným časopisem. Také proto se toto skóre zvětšuje s velikostí časopisu, je přímo závislé na počtu článků, větší časopisy mají také větší Eigenfactor Score. Skóre je uváděno jako percentil, tj. součet skóre všech časopisů je roven 100. V r. 2006 měl nejvyšší Eigenfactor Score časopis Nature, a to 2.138; v první tisícovce časopisů skóre neklesá pod 0.01. Druhý indikátor, Article Influence, je určen k odhadnutí důležitosti časopisu nehledě na jeho velikost (počet publikovaných článků). Article Influence vyjadřuje míru průměrného vlivu každého článku v časopise za pět let po jeho publikování. Pokud je jeho hodnota u časopisu např. 20, znamená to, že průměrný článek v tomto časopise je dvacetkrát vlivnější než průměrný článek v celé kolekci dat. Tento indikátor je srovnatelný s impakt faktorem. 7.6.5 Omezení indikátorů Identifikace měřených elementů Zásadní problematikou při hodnocení elementů je jejich identifikace, určení, jejich vymezení. Omezení lze rozdělit na technická, obsahová a etická, vždy narážíme na zásadní problém kategorizace a klasifikace na všech úrovních či právě nedodržení vědecké morálky. V případě omezení v kombinaci obsahové i technické úrovně jmenujme například identifikaci autora samotného. Pro vymezení autora nepostačuje jméno, je nutné ho určit dalšími metainformacemi, jako např. obor, instituce. Bohužel však při trendu dnešní vědy k akademické mobilitě a spolupráci je instituce naopak jako určující prvek velmi problematický. Z obsahového hlediska se jako problémové jeví vymezení disciplíny, důvody jsou tendence k interdisciplinaritě, nejasné vymezení dokumentů, zahlušení polovědeckými typy dokumentů, mnohočetné publikování, nemožnost nalézt všechny citace aj. Z technického hlediska je největším problémem propojování záznamů (citace na citovaný dokument a vice versa). Strana 52 Datová základna a excerpce Indikátory jsou vždy aplikovány na určitou datovou základnu, na kolekci dat, která je ovlivněna jejím výběrem. Ačkoliv pravidla excerpce se snaží držet jistou kvalitativně kvantitativní linii, nikdy není možné zajistit naprosto vyváženou sbírku. Pokud bychom uvažovali všechny výsledky, nemusí být zaručena kvalita zvažovaných výstupů a do výsledků by tak mohli zasáhnout např. chronicky píšící autoři; nehledě na to, že obsáhnutí veškeré vědecké produkce je s velkou pravděpodobností utopie. Charakteristiky vědních disciplín Jak již bylo zmíněno, každá vědecká disciplína má jiné charakteristiky, lze říci, že každou vědní disciplínu vykazuje jisté charakteristiky vědní komunikace; liší se z hlediska času, četnosti, typu publikací aj. Přehledové výstupy Zde se dostáváme k problému jakési užitečnosti či užitnosti. Review neboli přehled je obvykle sepsán vědcem, který se v oboru již dobře orientuje a je schopen uchopit problematiku a systematicky ji popsat, zároveň jméno autora často přináší jistou garanci obsahu. Takový článek je pro ostatní velmi cenný z hlediska užitku, neboť „zkracuje“ pro ostatní cestu ad fontes, tedy k původním pramenům, které by jinak museli složitě objevovat v původních vědeckých výstupech. Z toho plyne, že článek dosahuje vysoké citovanosti, aniž by však měl samotný vědecký přínos, aby předkládal vědecké komunitě cokoliv nového. Navíc se v tomto případě nejedná jen o články, ale samozřejmě knihy, skripta aj. Stejný problém lze definovat i mezi klinickým a základním výzkumem, kdy jeden nutně používá definice druhého, zpětně však tato vazba neexistuje. Autocitace Autocitace je velmi známý a diskutovaný etický problém, neboť vědec by v seznamu použité literatury neměl nadbytečně odkazovat sám na sebe. Uvádí se, že maximální únosná míra autocitace je 20% [JANOŠ, 2001]. V současné době, kdy je mnohem jednodušší a efektivnější kontrola autocitací, se odborná veřejnost na základě rozsáhlých Strana 53 analýz začíná klonit k názoru, že autocitace nejsou zásadním problémem ve výsledcích, že je ovlivňují jen málo a spíše kolem této problematiky panuje „dlouhodobá hysterie“. Některé nástroje dnes již umožňují v předdefinovaných analytických nástrojích autocitace vyloučit. Při vylučování takových citací však musí být zvážen fakt, že autor se zpravidla systematicky věnuje jedné oblasti, jeho odkazování na starší díla je pak zcela logické a adekvátní. Časová perioda Pokud indikátor není sám definován v rámci času (Impact Factor), podstatně do jeho výsledku právě volba časové periody zasahuje. U zkoumaných dat v dané disciplíně musíme vždy uvážit potřebný výsledek a podle toho volit, v případě multioborových analýz se opět potýkáme s problematikou rozdílů v charakteristice vědní komunikace. Každý indikátor je časem zkreslován jiným způsobem. Spoluautorství Spoluautorství prvořadě nelze označit za pouze etické omezení. Chápáno v kontextu etiky se jedná pouze o praxi uplatňovanou zejména v některých oborech, např. v medicíně, kdy se autorská odpovědnost přisuzuje nejen opravdovému autoru, nýbrž i jeho spolupracovníkům, nadřízeným a osobám jinak spjatým s výzkumným prostředím. Druhou stránkou spoluautorství, které limituje výpovědní hodnoty indikátorů, je jeho kvantitativní uchopení. Těžko lze srovnávat velké množství výstupů vědce, který se na mnoha citovaných článcích podílel, než menší množství článků jednoho autora; nelze objektivně jasně definovat, který má větší přínos pro vědu. Počet spoluautorů je jedním ze znaků komunikace jednotlivých vědních disciplín. Nesrovnatelnost napříč vědními disciplínami K této problematice již bylo dost zmíněno – v anglickém pojmosloví se často označuje jako citation pattern. Jedná se o rozdílnost vědní komunikace v jednotlivých disciplínách a některých dalších charakteristik, jako je zastarávání informací, i když pokud chápeme komunikaci v tom nejširším kontextu, je možné i zastarávání informací sem zařadit. Mezi Strana 54 typické komunikační charakteristiky patří počet časopisů, počet vydávaných článků, průměrný počet citací na článek. Negativní citace Byť velmi omezeným jevem, ale přeci jen zkreslujícím jsou takzvané negativní citace. Jedná se o situaci, kdy vědec publikuje dílo, které je nekvalitní nebo má jiné závažné nedostatky, ve vědecké komunitě to vyvolá patřičnou reakci a článek pak vykazuje velkou citovanost, neboť na něj každý poukazuje. Tento jev nelze žádnou automatickou metodou vyloučit, zde si je nutné uvědomit, že právě v tuto chvíli velmi závisí na povědomí a znalostech hodnotitele. Nicméně je prokázáno, že negativní citace výsledky zásadním způsobem nezkreslují. Navíc negativní citovanost často se projevuje jen v krátkém časovém intervalu. Open Access Aspektem, který se do hodnot indikátorů může projevovat, je míra přístupu k informaci. Jestliže je publikace volně dostupná, hodnota indikátoru může stoupat [OpCit, 2008], neboť publikace má větší možnosti získat své publikum a následně citace. 8 CITAČNÍ DATABÁZE A EVALUACE VĚDY Lucie Vavříková Jednou z kvalifikací informační profese je znalost, kde najít patřičné informace, jaké zdroje pro získání relevantních a pertinentních informací využít. Pokud informační profesionál nedisponuje těmito znalostmi, musí znát alespoň metody, jak nejrelevantnější zdroje nalézt. Jednou z možných metod je užití citačních databází, které uživatele pomocí citační a publikační analýzy nasměrují k takovým zdrojům, které již prošly jakýmsi hodnocením. Podle míry citovanosti článku (časopisu, autora) lze usuzovat na kvalitu zdroje. Toto Strana 55 hledisko výběru zdrojů však není vždy relevantní, je třeba si uvědomit, že kritérium míry citovanosti nemusí být vždy adekvátní, často mohou být lepším zdrojem oborové databáze. Oborové databáze mají výhodu v tom, že zachází se specifickými informacemi. Mívají kvalitnější relevantní popisný aparát, neboť mohou zohledňovat typickou strukturu dokumentů. Mají vlastní oborové tezaury, předmětová hesla či klíčová slova. Vynikají hloubkou obsahu, jsou schopné dát odpověď na velmi specifické a přesně definované dotazy. Vzhledem k jejich orientaci na obsah však nedisponují pokročilými funkcemi jako je práce s autory či institucemi, málokdy nabízejí specifické funkce, které usnadňují práci uživatelům. Oproti tomu citační databáze nabízí rychlou identifikaci významných zdrojů, publikací a autorů pro daný okruh. Jsou obsahově méně hluboké než oborové databáze, svým polytematickým zaměřením však doplňují oborové databáze o aspekt interdisciplinarity. Pro uživatele jsou k dispozici další analytické nástroje, databáze se snaží autoritně zpracovávat autory a instituce. Díky těmto nástrojům pak můžeme porovnávat časopisy, autory, zkoumat jejich vzájemnou spolupráci atd. Pokud se zabýváme scientometrií, narazíme na několik typů zdrojů informací. Klasickým jsou již zmíněné citační databáze, do kterých řadíme ISI Web of Science s jejich citačními rejstříky, databázi Scopus, Google Scholar a některé oborové databáze, které propojují jednotlivé dokumenty na základě citací a referencí (PubMed). Tyto zdroje užíváme k analýzám výstupů ve vědě a jednomu z hodnocení vědeckých výstupů. Především společnost Thomson Reuters rozvinula zdroje pro scientometrii v oblasti vědy o vědě a jejího hodnocení. Nabízí několik databází, které slouží k hodnocení vědy na úrovni časopisů, institucí či států. Scopus postupně dohání tyto databáze implementací funkcí přímo do databáze, které umožňují srovnatelné analýzy. Ve scientometrii lze využít dalších syntetických nástrojů, jako jsou portály informací o nejvíce citovaných vědcích či časopisech, nebo portály, které na základě propojení dokumentů citacemi se snaží mapovat vědu a vytvářet další analýzy. Rozdělení na různé typy není kategorické, mnoho zdrojů se překrývá a lze je zařadit do více kategorií. Strana 56 8.1 Databáze pro hodnocení vědy Databáze pro hodnocení vědy můžeme rozlišit na dva základní druhy. První, z provenience společnosti Thomson Reuters [Thomson Reuters, 2008] (sekce Scientific, oblast Research and Development), které poskytují analytická a syntetická data vycházející z ISI Web of Science a citačních rejstříků a jejich využívání. Tyto databáze jsou bohužel v rámci ČR takřka nedostupné. Druhou kategorií jsou databáze na národní úrovni, které zabezpečují proces hodnocení vědy v daném státě. Za ČR je to databáze RIV, rejstřík informací o výsledcích, který je součástí informačního systému výzkumu, vývoje a inovací v ČR. Dostupný je na http://aplikace.isvav.cvut.cz/prepareResultForm.do. Těmto databázím se zde věnovat nebudeme. Essential Science Indicators [Thomson Reuters, 2008] Souhrnná databáze statistik vědecké výkonnosti a vědeckých trendů založená na počtech publikovaných článků a citačních dat z databází Thomson Reuters. Je to analytický zdroj informací, který umožňuje analyzovat výkonnost vědy na různých úrovních, identifikovat vědecké trendy, určovat nejvýkonnější státy, časopisy, instituce aj., hodnotit vědecké výstupy a jejich impakt, hodnotit autory. Institutional Citation Report [Thomson Reuters, 2008] Tato databáze je určena k analýzám vědeckých výstupů a impaktu na institucionální úrovni. Umožňuje srovnávat, řadit a hodnotit instituce. National Citation Report [Thomson Reuters, 2008] Je obdobou výše uvedené databáze Institutional Citation Reports, je zaměřena na státní úroveň. National Science Indicators [Thomson Reuters, 2008] Strana 57 Statistická databáze vědecké výkonnosti v rámci státu. Obsahuje statistiky z více jak 180 států, jsou k dispozici data 25 let zpětně. Nabízí vizualizaci dat. Journal Performance Indicators [Thomson Reuters, 2008] Nabízí data z více než 10000 vědeckých vysoce citovaných časopisů za více jak 25 let, poskytují za různá období pro různé časopisy a články různé citační a impaktfaktorové údaje. V porovnání s Journal Citation Reports poskytují přesnější údaje [ŠPÁLA, 2006]. Journal Citation Reports [Thomson Reuters, 2008] Tradiční databáze je přímým výstupem z dat citačních rejstříků Science Citation Index a Social Science Citation Index. Obr. 2 – Vstupní obrazovka do databáze Journal Citation Reports Journal Citation Reports poskytuje statistické informace a analytická data o časopisech, výsledky citačních analýz, určuje pro každý časopis bibliometrické indikátory impakt faktor, Immediacy Index, Cited Half-life. Po kliknutí na název časopisu jsou k dispozici další údaje o časopisu včetně výpočtů daných indikátorů. Databáze je vhodně propojena s databází Ulrich´s Periodical, která zpřístupňuje detailní data o časopisech. Dostupná v ČR, samostatně nebo v rámci platformy ISI Web of Knowledge (http://www.isiknowledge.com/). Strana 58 Obr. 3 – Analytický přehled časopisů v oblasti Information Science and Librarianship podle impakt faktoru 8.2 Citační databáze Jako citační databáze dnes bývají uváděny „dvě plus jedna“ základní platforma: ISI Web of Science, Scopus a opatrně je přidáván Google Scholar. Samozřejmě by bylo možné při dnešních technologických možnostech uvádět i další databáze, jako je např. PubMed, rozhraní databáze Medline, které sbírají informace citacích. Citační databáze však tyto záznamy propojují v obou směrech a nabízejí další funkce pro citační a jiné analýzy. Právě proto se Google Scholar ke dvojici přiřazuje opatrně, neboť v současné chvíli spíše slouží jako vyhledávač než jako citační databáze. Strana 59 8.2.1 ISI Web of Science a citační rejstříky Databáze ISI Web of Science již byla zmíněna mnohokrát. Její historické kořeny, respektive předchůdci, sahají až do 60. let 20. století, kdy Eugene Garfield začal vytvářet citační rejstříky a založil Institute of Scientific Information (zkratka ISI - před jménem databáze). S příchodem informačních a komunikačních technologií vznikla počítačová verze, v dnešní podobě je to typicky zelené rozhraní ISI Web of Science. Dnes je producentem mediální a informační magnát Thomson Reuters, ještě nedávno spadala pod sekci Thomson Scientific, než došlo k fúzi s Reuters. ISI Web of Science je databáze, která sdružuje několik dílčích informačních zdrojů, v závislosti na subskripci instituce. Pro ČR jsou v rámci ISI Web of Science dostupné všechny tři citační rejstříky, Science Citation Index, Social Science Citation Index, Arts and Humanitites Citation Index a některé dílčí databáze. V rámci integrace svých zdrojů společnost Thomson Reuters provozuje platformu ISI Web of Knowledge (http://www.isiknowledge.com/), ve které jsou sdruženy všechny předplacené zdroje. Je možné pracovat jak zároveň ve všech tak pouze v jedné z databází. V ČR jsou typicky v rámci ISI Web of Knowledge dostupné databáze ISI Web of Science, Current Contents Connect a Journal Citation Reports. Current Contents Connect je databáze obsahů a bibliografických informací odborných časopisů a knih. V rámci této databáze jsou zveřejňovány články dříve, než vyjdou v časopise. Science Citation Index je nejstarším citačním rejstříkem, byl definován v r. 1961 a poprvé vydán r. 1963. Je to databáze převážně bibliografických informací (bez plných textů). Do tohoto rejstříku je excerpováno přibližně 3700 odborných časopisů, ve své rozšířené verzi Science Citation Index Expanded přes 6500, z oblasti zemědělství, biologie, ekologie, z oblasti inženýrství a technických věd, aplikovaných věd, medicíny a lékařských věd, fyziky a chemie. Informace jsou aktualizovány týdně. Social Science Citation Index vznikl v r. 1973, obsahuje data z přibližně 2000 časopisů z 50 společenskovědních disciplín. Některé časopisy mohou být zařazeny v obou dvou rejstřících. Tradičně nejsilnějšími disciplínami jsou právě ty, které mají časopisy v obou Strana 60 rejstřících. Patří mezi ně psychologie, psychiatrie a pečovatelství. Dalšími výraznými disciplínami jsou ekonomie, management, politologie a sociologie. Arts and Humanitites Index je nejmladší, je datován do r. 1979. Tato databáze není zpracována jako dvě předchozí do Journal Citation Reports. Obsahuje přes 1000 časopisů z oblasti umění a humanitních věd, mezi ně patří např. disciplíny jako archeologie, umění a architektura, historie, jazykověda a lingvistika, literatura, filozofie, herectví, náboženství a religionistika; nechybí ani kategorie všeobecností. Tento rejstřík má vlastní specifický popisný aparát. Obr. 4 – Úvodní obrazovka databáze ISI Web of Science s rozhraním jednoduchého vyhledávání Strana 61 Databáze ISI Web of Science disponuje uživatelsky přívětivým jednoduchým vyhledávacím rozhraním. Nabízí specifické možnosti vyhledávání jako je „Cited References Search“, hledání v citacích určeného autora a zdroje, a pokročilé vyhledávání. Lze si ukládat historii vyhledávání. Jakoukoliv sadu výsledků lze analyzovat ve smyslu počtu záznamů podle autora, země, typu dokumentu, instituce, časopisů atd. Tato data je možné si uložit. Obr. 5 – Analýza sady vyhledaných záznamů podle zastoupení autorů Portál nabízí personalizované funkce jako je sestavení vlastního seznamu časopisů, upozornění na citace nebo právě uložení hledání. Je efektivně propojen s dalšími službami s dílny Thomson Reuters jako je citační manažer EndNote Web (https://www.myendnoteweb.com/), do kterého lze přímo ukládat záznamy, jako i do Strana 62 dalších referenčních manažerů. Nabízí odkaz na portál MyResearcher’s ID, který se snaží za pomoci uživatelů vytvořit standardizovaný seznam autorit. Je možné zadaný dotaz použít pro vyhledávání na webu pomocí služby Scientific WebPlus (http://scientific.thomsonwebplus.com/) zaměřené na vyhledávání odborných informací. V poslední době se databáze hojně zaměřila na vylepšení identifikace autorů a institucí, pokud autora vyhledávání rozpozná jako autoritu, nabídne k němu tzv. Distinct Author Set, tj. souhrn všech údajů, které jsou mu v rámci databáze přiřazeny. Obr. 6 – Sada informací k danému autoru (Distinct Author Set) Databáze umožňuje vytvořit tzv. Citation Report, který analyzuje výsledky. Zobrazuje graf publikací za rok a citací přijatých každý rok. Informuje o celkové citovanosti, průměrné citovanosti a h-indexu. Z výsledků analýzy je možné vyloučit autocitace. Obsahuje tabulku citací podle jednotlivých článků a roku. Strana 63 Obr. 7 – Citační analýza článků daného autora – graf vydaných publikací v určitém roce, graf citací přijatých každý rok. Napravo další statistické údaje. Obr. 8 – Analýza citací každého článku podle jednotlivých let Databáze ISI Web of Science obsahuje snadno ovladatelné nástroje umožňující základní scientometrické analýzy. Je dnes respektovaným zdrojem informací, i když při tom, jak stabilní a dlouholetou pozici na trhu má, se samozřejmě vyskytuje řada kritických ohlasů. Co se týče uživatelského rozhraní, trochu zaostává za svou konkurencí, databází Scopus, která je podstatně intuitivnější a více zaměřená na uživatele. Velmi těžké je v databázi zjistit, jak prohlížet obsažené zdroje. Obsahově se o databázi ISI Web of Science hovoří jako o úzké a hluboké, kdežto Scopus je považován za mělký a široký. Obojí dvojí může Strana 64 být i výhodou i nevýhodou. Velkým přínosem je to, že existují dva silně konkurenční produkty, což tlačí vývoj jejich možností velkou rychlostí dopředu a snaží se dohánět vzájemné nevýhody. 8.2.2 Scopus Scopus (www.scopus.com) je citační a abstraktová databáze produkovaná tradičním vydavatelem odborné literatury společností Elsevier (založena r. 1880). Byla spuštěna v r. 2004. Excerpuje přes 15 000 vědeckých časopisů ze všech oblastí vědy. Zahrnuje informační zdroje z největších patentových databází, z webu a dalších zdrojů. Retrospektiva databáze je do r. 1966, je aktualizována denně. Citační a jiné analýzy lze provádět s daty od r. 1996, starší záznamy nejsou plně zpracovány. V ČR není vyjma některých ústavů Akademie věd ČR a České geologické služby k dispozici. Strana 65 Obr. 9 - Úvodní obrazovka databáze Scopus s rozhraním jednoduchého vyhledávání Úvodní obrazovka nabízí tradičně jednoduché vyhledávání obohacené o možnosti omezení na časovou periodu, typ dokumentu a předmětnou oblast. V dalších záložkách jsou k dispozici specifická vyhledávání, a to autorů, pracovišť a vyhledávání pokročilé. Po provedení vyhledávání jsou k dispozici výsledky podle kategorie zdroje – přímo z databáze Scopus, potom z databáze referencí, které nemají primární záznam v databázi, výsledky z webu, které jsou získány pomocí vyhledávače odborné literatury Scirus (www.scirus.com), z patentových databází a z tzv. vybraných zdrojů, tj. z institucionálních repositářů, preprintových archivů, open access archivů aj. Databáze taktéž obsahuje tzv. Articles in Press, tj. články, které jsou před oficiálním publikováním, ale již jsou přijaty do časopisu. U každého záznamu je uveden počet citací, jakákoliv sada výsledků se dá obdobně jako v ISI Web of Science analyzovat podle let a přijatých citací. U článku je k dispozici seznam Strana 66 referencí přímo opatřený počty citací a dalším aparátem, který umožňuje s tímto seznamem či jednotlivou referencí rovnou pracovat. Co se týče autorů a pracovišť, v databázi Scopus se nachází jejich autoritní seznamy; pro každého autora či instituci jsou tak zvlášť zpracovávány analytické údaje. V profilu autora jsou pak k dispozici poměrně detailní informace, jako variantní názvy jména, afiliace aktuální i historické, publikační historie, odkazy na všechny články, předmětná oblast autora, či seznam spoluautorů. Z analytických dat je k dispozici počet článků, referencí a citací, h-index autora a přehled článků a citací za celou publikační historii podle jednotlivých let. Data autora lze jednoduše analyzovat na tzv. h-grafu, který graficky znázorňuje přehled citací podle článků. K dispozici jsou také grafy publikovaných článků v jednotlivých letech a totéž pro citace. H-graf se dá aplikovat na jakoukoliv sadu výsledků, tedy i na sadu článků, časopis aj. Strana 67 Obr. 10 – Analytický nástroj H-graf, který zobrazuje vztah článků a počtu citací, na průniku křivky grafu s diagonálou lze odečíst H-index Vraťme se k pracovištím, jejich identifikaci a dostupným analytickým nástrojům. Mimo popisných informací zde nalezneme údaje jako výčet článků, autorů, počtu patentů, zdrojů, ve kterých autoři tohoto pracoviště publikují, je zpracována analýza spolupracujících institucí. Na koláčovém grafu je zobrazeno rozvržení činnosti v jednotlivých vědeckých disciplínách, které lze přepnout na tabulkové zobrazení. Pro analytické zpracování časopisů je k dispozici Journal Analyzer v části Analytics, pomocí něhož lze časopisy na základě citačních analýz porovnávat. Strana 68 Obr. 11 – Analyzátor časopisů, umožňuje vzájemně porovnávat citace a publikované články v jednotlivých časopisech U profilů jednotlivých časopisů je pak k dispozici přehled všech čísel a k tomu analytický nástroj pro zobrazení citačních analýz dle jednotlivých let. Databáze nabízí také možnosti personalizace, umožňuje uložit si vlastní seznam autorů, časopisů a článků. K dispozici je možnost zřídit si upozornění na nová čísla časopisů, změnu výsledků vyhledávání a na citace dokumentů nebo autora. Je možné si ukládat historii vyhledávání. Obdobně jako ISI Web of Science je k dispozici propojení s referenčními manažery (RefWorks), dalšími vyhledávači, katalogy místní knihovny a dalších zdrojů (také Ulrich’s Periodical). Scopus má v sobě zabudováno mnoho nástrojů, které jsou v případě produktů Thomson Reuters rozdrobeny do jednotlivých databází, je velmi přehledný a intuitivní. Omezením je zmíněné zpracování citačních dat pouze po r. 1996, otázkou je, zda-li při současném rychlém vývoji vědy tato retrospektiva není dostatečná. Pravděpodobně v příštím roce by měla být tato databáze k dispozici i v ČR, výsledky z ní jsou již letos zahrnuty do hodnocení vědy v ČR. Strana 69 8.2.3 Google Scholar Obr. 12 – Výsledky vyhledávání v Google Scholar Google Scholar Beta (http://scholar.google.cz/ nebo http://scholar.google.com/) byl spuštěn na konci roku 2004 a zpočátku zejména odborná veřejnost na něj pohlížela skrze prsty. Google Scholar prohledává databáze vydavatelů odborné literatury, odborných časopisů, odborných repositářů, preprintových a open access archivů (mezi přispěvatele patří Elsevier, American Chemical Society, PubMed, OCLC, Blackwell, the Institute of Physics, the Nature Publishing Group, Wiley Interscience a Springer atd.). Obsahem pokrývá taktéž projekt Google Books. U větších zdrojů se však často vyskytuje problém, že je zaindexována jen jejich malá část (Elsevier, PubMed). Doposud se Google Scholar nepodařilo doplnit zásadní mezery v obsahu o nejlépe hodnocené časopisy [JACSÓ, 2008]. V oblasti citačních analýz poskytuje Google Scholar pouze počet citujících dokumentů s patřičným odkazem na ně. Vyhodnocuje ještě klíčové autory (cca 5) – nejčastěji se vyskytující autory v rámci vyhledaných výsledků. Vzhledem k obrovskému obsahu počty citací nemusí být vypovídající, neboť Google Scholar obsahuje velké množství duplicit, triplicit a vyšších řádů četnosti. To plyne především z nedokonalé práce se strukturovaným textem, stále se objevují neexistující jména autorů, informace v polích, které tam zjevně Strana 70 nepatří, a to často i pokud jsou ve zdrojovém dokumentu uvedena správně. Google Scholar navíc nedisponuje možností seřadit jakkoliv jinak výsledky vyhledávání, jsou seřazeny podle počtu citací [JACSÓ, 2008]. Výhodou Google Scholar je především velmi rychlé jednoduché vyhledávání v obrovském množství zdrojů nehledě na vědeckou disciplínu. Dokáže najít plný text článku, který z klasických databází není dostupný, neboť nemáte zdroj předplacen, na internetu však je. Nabízí také spojení s českými SFX službami a dalšími knihovními katalogy. Velkou výhodou je šíře geografického a jazykového pokrytí. Do Google Scholar se může zapojit takřka kdokoliv. Google Scholar je zdarma, nabízí velmi rychlé vyhledání napříč obory, v současné době ale stále není vhodný pro jakékoliv bibliometrické či scientometrické hodnocení [JACSÓ, 2008]. 8.3 Další analytické nástroje a nástroje mapování vědy V dnešní době rozvinutých webových služeb máme k dispozici portály, které nám předkládají automaticky výsledky citačních analýz. Většinou jsou spojené s producentem citační databáze. Mezi takové právě patří portál Scopus TopCited a ISI HighlyCited.com. Scopus TopCited (http://www.topcited.com/) Portál TopCited nabízí přesně to, co evokuje jeho název. Na základě dat z databáze Scopus zveřejňuje přehledně 20 nejcitovanějších článků pro každou vědeckou disciplínu mezi lety 2004 a 2008 ve zvolené časové periodě. Pomocí tohoto nástroje se velmi snadno získají charakteristiky vědecké disciplíny podle počtu citací. V současné době jsou nejcitovanější články z oblasti genetiky, částicové fyziky a medicíny. ISI HighlyCited (http://isihighlycited.com/) Tento portál poskytuje profily nejcitovanějších autorů a nejprestižnějších pracovišť, vychází z dat Thomson Reuters a databáze ISI Web of Science. Na tomto portálu se Strana 71 výrazněji projevuje původní proamerické zaměření databáze ISI Web of Science, nenalezneme na něm např. ani jednoho českého vědce. SciMago (http://www.scimagojr.com/) SCImago Journal & Country Rank je portál, který obsahuje a zpřístupňuje scientometrické indikátory časopisů a zemí vytvořených z dat, která pochází z databáze Scopus. Tato platforma získala název podle indikátoru SCImago Journal Rank (SJR), který byl vyvinut na stejném principu jako je algoritmus Google PageRank [HANUŠOVÁ, 2008].. Tento indikátor poskytuje představu o „viditelnosti“ či „známosti“ vědeckých periodik. Data mají retrospektivu do roku 1996. U časopisů a států jsou přehledově k dispozici údaje SCImago Journal Rank, H-index, celkové počty dokumentů, referencí, citací, citovatelných dokumentů, porovnání dokumentů a citací, referencí a dokumentů. Časopisy lze filtrovat dle země nebo oboru periodika. Pominout nelze zajímavou stránku World Report, kde jsou sumarizovány údaje o celé světové vědecké produkci. Můžeme se tak například dozvědět, že poměr všech a citovatelných dokumentů je 10:9 či že nejvíce se publikuje v medicíně (cca 20 % dokumentů). Jednou z hlavních funkcí webu SCImago je možnost porovnání dvou až čtyřech periodik či zemí. Samozřejmostí je možnost omezit porovnání na určitý obor nebo srovnat region (např. pozici České republiky v rámci vědecké výkonnosti ve východní Evropě). K tomu jsou k dispozici i pokročilé vizualizační funkce. Eigenfactor.org (http://www.eigenfactor.org/index.php) [VAVŘÍKOVÁ, 2008] Portál Eigenfactor.org s podtitulem „Ranking and Mapping Scientific Knowledge“ poskytuje hodnocení odborných časopisů, zajímavé vizualizační, statistické a srovnávací výstupy v mapování vědy a velmi srozumitelně ukazuje provázanost vědeckých disciplín. Portál taktéž poskytuje informace o ceně časopisu (v rámci subskripcí) a porovnávání cen časopisů (ve spolupráci s portálem Journalprices.com). Na portálu jsou k dispozici statistiky nejlepších časopisů. Tento portál analyzuje data poskytnutá Thomson Reuters Journal Citation Reports Dataset, přebírá data z rejstříků Science Citation Index a Social Science Citation Index. K Strana 72 hodnocení užívá pětileté citační okno, tj. hodnocení v r. 2006 je vypočítáno z dat za léta 2001-2005. Portál přisuzuje časopisům dva indikátory – Eigenfactor Score a Article Influence. Eigenfactor Score (dále ES) je míra důležitosti časopisu pro vědeckou komunitu. Podle definice a matematického modelu je to odhad procenta času, který stráví uživatelé s daným časopisem. Také proto se toto skóre zvětšuje s velikostí časopisu, je přímo závislé na počtu článků, větší časopisy mají také větší ES. Součet všech ES všech časopisů je roven 100, každému časopisu je přisouzena poměrná část ze 100. V r. 2006 měl nejvyšší ES časopis Nature, a to 2.138; v první tisícovce časopisů ES neklesá pod 0.01. Abychom mohli odhadnout důležitost časopisu nehledě na jeho velikost (počet publikovaných článků), je zaveden druhý indikátor, Article Influence (dále AI). AI je míra průměrného vlivu každého článku v časopise za pět let po jeho publikování. Pokud je AI u časopisu např. 20, znamená to, že průměrný článek v tomto časopise je dvacetkrát vlivnější než průměrný článek v celé kolekci dat. Tento indikátor je srovnatelný s impakt faktorem. Pro každý časopis jsou k dispozici informace o něm, hodnoty indikátorů portálu a jejich srovnání s impakt faktorem. Grafy názorně zobrazují vývoj časopisu, z čehož v případě porovnání nejlepších časopisů lze usuzovat na vývoj disciplíny jako takové v rámci celé vědy, případně obráceně zjišťovat trendy ve vědě. Statistiky jsou dostupné pro několik let. Velmi zajímavé jsou vizualizační funkce portálu. Na základě propojení dokumentů citacemi je k dispozici interaktivní mapa vědy, která vždy zobrazuje vazby na příbuzné disciplíny, včetně typu vazby. Druhá vizualizace slouží názornému porovnávání časopisů a analytických údajů. Strana 73 Obr. 13 – Mapa společenských věd podle portálu Eigenfactor.org Strana 74 8.4 Použitá literatura • BATISTA, P.D., CAMPITELI, M.G., KINOUCHI, O. Is it possible to compare researchers with different scientific interests? Scientometrics. 2006, vol. 68, no. 1, s. 179–189. • BJÖRNEBORN, Lennart, INGWERSEN, Peter. Perspectives of webometrics. Scientometrics. 2001, vol. 50, no. 1, s. 65-82. • BJÖRNEBORN, Lennart, INGWERSEN, Peter. Toward a basic framework for webometrics. Journal of American Society of Information Science and Technology. 2004, vol. 55, is. 14, s. 1216-1227. • BOLLEN, Johan, RODRIGUEZ, Marko. A., SOMPEL, Herbert Van de. Journal Status. Scientometrics. 2006, vol. 69, no. 3, s. 669-687. • BORNMANN, Lutz, DANIEL, Hans-Dieter. What Do We Know About the h Index?. Journal of the American Society for Information Science and Technology. 2007, vol. 58, is. 9, s. 1381-1385. • Cybermetrics : international journal of scientometrics, informetrics, and bibliometrics [online]. Consejo Superior de Investigaciones Cientificas, Centro de Informacion y Documentacion Cientifica. 1997- , vol. 1, is. 1- . Spain : 1x ročně. Dostupný z WWW: < http://www.cindoc.csic.es/cybermetrics/cybermetrics.html>. ISSN 1137-5019. • DIODATO, Virgil Pasquale. Dictionary of Bibliometrics. New York : Haworth Press, 1994. 185 s. Dostupný z WWW: <http://books.google.cz/books?id=XBg1SNzNTD0C&printsec=frontcover>. ISBN 1560248521. • EGGHE, Leo. From h to g: the evolution of citation indices. Research Trends [online]. 2007, is. 1 [cit. 2008-08-24]. Dostupný z WWW: <http://info.scopus.com/researchtrends/archive/RT1/exp_op_1.htm>. • GLÄNZEL, Wolfgang. On the h-index : A mathematical approach to a new measure of publication activity and citation impact. Scientometrics. 2006, vol. 67, no. 2, s. 315-321. • GLÄNZEL, Wolfgang, DEBACKERE, Koenradd. Measuring communication in science : Opportunities and limitations of bibliometric methods [online]. Leuven : Steunpunt O&O Indicatoren, [2004] [cit. 2008-09-06]. Ppt prezentace. Dostupný z WWW: <http://www.google.cz/url?sa=t&source=web&ct=res&cd=1&url=http%3A%2F% 2Fwww.ulb.ac.be%2Funica%2Fdocs%2FSch-com-2004-presGlanzel.ppt&ei=9qfDSPCBJZSa1wbM74ToBw&usg=AFQjCNH15XCttR2zAwIF -Q2ZCXcS5vz1EQ&sig2=d_awnWCYJSv0eeZ_Pl3bng>. • GODIN, B. On the origins of bibliometrics. Scientometrics. 2001, vol. 68, no. 1, s. 109-133. Strana 75 • GRANOVSKY, Y. V. Is it possible to measure science? V. V. Nalimov's research in scientometrics. Scientometrics. 2001, vol. 52, no. 2, s. 127-150. • HANUŠOVÁ, Soňa. SCImago Journal & Country Rank. Ikaros [online]. 2008, roč. 12, č. 6 [cit. 2008-10-17]. Dostupný z WWW: <http://www.ikaros.cz/node/4829>. URN-NBN:cz-ik4829. ISSN 1212-5075. • HJøRLAND, Birger. Impact Factor [online]. 2007 , 21-4-2007 [cit. 2008-08-24]. Dostupný z WWW: <http://www.db.dk/bh/core%20concepts%20in%20lis/articles%20az/impact_factor.htm>. • INGWERSEN, Peter, LARSEN, Birger. Advanced publication and citation analysis [ppt prezentace]. Danmarks Biblioteksskole. 2007, [cit. 2008-09-20]. Studijní materiál ke kurzu Information Seeking and Information Retrieval Theories. • JACSÓ, Péter. Google Scholar Revisited. Online Information Review [online]. 2008, vol. 32, is. 1 [cit. 2008-10-10]. ISSN 1468-4527. • JANOŠ, Karel. 2001. Informační etika. In PAPÍK, Richard; SOUČEK, Martin; STÖCKLOVÁ, Anna. Informační studia a knihovnictví v elektronických textech I [CD-ROM]. Praha : Ústav informačních studií a knihovnictví FF UK, c2001. • JANSSENS, Frizo, et al. Towards mapping library and information science. Information Processing and Management. 2006, vol. 42, is. 6, s. 1614-1642. • KÖNIGOVÁ, Marie. 2001. Vybrané kapitoly z informační vědy. In PAPÍK, Richard; SOUČEK, Martin; STÖCKLOVÁ, Anna. Informační studia a knihovnictví v elektronických textech I [CD-ROM]. Praha : Ústav informačních studií a knihovnictví FF UK, c2001. • KTD : Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna České republiky, 2003. Dostupný z WWW: <http://sigma.nkp.cz/cze/ktd>. • MOED, Henk F. Citation Analysis in Research Evaluation. [s.l.] : Springer, c2005. 346 s. Information Science and Knowledge Management; sv. 9. ISBN 1-40203713-9. • NORUZI, A. The web impact factor : A critical review. Electronic Library. 2006, vol. 24, is. 4, s. 490-500. • OKUBO, Y. Bibliometric indicators and analysis of research systems: Methods and examples. OECD, Paris, 1997, STI Working Papers 1997/1 – OCDE/GD(97)41. • SEGLEN, Per O. Citations and Journal Impact Factors : Questionable Indicators of Research Quality. Allergy : European Journal of Allergy and Clinical Immunology. 1997, Vol. 52, no. 11, s. 1050-1056. • SHAPIRO, F.R. Origins of bibliometrics, citation indexing and citation analysis: the neglected legal literature. Journal of the American Society for Information Science and Technology. 1999, vol. 43, is. 5, s. 337-339. • SCHWARZ, Josef. Před 40 lety začala zlatá éra citačních rejstříků vědecké literatury. Ikaros [online]. 2003, roč. 7, č. 11 [cit. 2008-02-23]. Dostupný z WWW: <http://www.ikaros.cz/node/1520>. URN-NBN:cz-ik1520. ISSN 1212-5075. Strana 76 9 • Scientometrics from past to present. Research Trends [online]. 2007, is. 1 [cit. 2008-09-06]. Dostupný z WWW: <http://info.scopus.com/researchtrends/archive/RT1/bib_mes_1.htm>. • SCImago: Journal & Country Rank [online]. c2007-2008 [cit. 2008-10-10]. Dostupný z WWW: <http://www.scimagojr.com/> • Scopus [online]. c2008 [cit. 2008-10-10]. Dostupný z WWW: <http://www.scopus.com/>. • SMELSER, N. J., BALTES, P. B. International Encyclopedia of the Social & Behavioral Sciences. Loet Leydesdorff. Amsterdam : Elsevier, c2004. Scientometrics, s. 13752-13755. ISBN 0-08-043076-7. • SOUČEK, Martin. Informační věda : studijní materiály k předmětu \"Úvod do informační vědy\" [online]. 2006 , 17.10.2006 [cit. 2008-09-06]. Dostupný z WWW: <http://uisk.ff.cuni.cz/detail.do?articleId=1959>. • ŠPÁLA, Milan. Impakt faktor – Dobrý sluha, ale špatný pán. Ikaros [online]. 2006, roč. 10, č. 4 [cit. 2008-08-24]. Dostupný z WWW: <http://www.ikaros.cz/node/3293>. URN-NBN:cz-ik3293. ISSN 1212-5075. • TAGUE-SUTCLIFFE, Jean. An introduction to informetrics. Information Processing & Management. 1992, vol. 28, is. 1, s. 1-3. • The effect of open access and downloads ('hits') on citation impact: a bibliography of studies [online]. 4 August 2008 [cit. 2008-08-23]. Dostupný z WWW: <http://opcit.eprints.org/oacitation-biblio.html>. • Thomson Reuters [online]. c2008 [cit. 2008-10-10]. Dostupný z WWW: <http://www.thomsonreuters.com/>. • VAVŘÍKOVÁ, Lucie. Hodnocení a mapování vědy pomocí portálu Eigenfactor.org. Ikaros [online]. 2008, roč. 12, č. 8 [cit. 2008-10-17]. Dostupný z WWW: <http://www.ikaros.cz/node/4935>. URN-NBN:cz-ik4935. ISSN 12125075. • VINKLER, Peter. An attempt for defining some basic categories of scientometrics and classifying the indicators of evaluative scientometrics. Scientometrics. 2001, vol. 50, no. 3, s. 539-544. • XING, Wenpu, GHORBANI, Ali. Weighted PageRank Algorithm. In Second annual conference on communication networks and services research CNSR’04 . Fredericton : [s.n.], 2004. s. 305-314. Dostupný z WWW: <http://ias.cs.unb.ca/papers/xingw_weighted.pdf>. SPOLEČENSKÉ DOPADY MODERNÍCH INFORMAČNÍCH TECHNOLOGIÍ Jan Činčera Strana 77 Předmětem informační etiky je podle některých autorů i oblast tzv. makroetiky, zkoumající společenské dopady informačních technologií a služeb. Je zřejmé, že vývojem, distribucí či používáním určitých aplikací vstupujeme do sítě komplikovaných environmentálněsociálních vztahů, ze kterých následně plynou eticky konfliktní situace. Dopady informačních služeb a technologií na moderní společnosti jsou zkoumány řadou disciplín a vzhledem k jejich komplexnosti o nich nelze vypovídat jednoznačné soudy. V rámci informační etiky nás budou zajímat následující oblasti: • vliv na člověka a jeho sebepojetí. • vliv na pracovní a volnočasový režim. • vliv na distribuci moci ve společnosti. • vliv na životní prostředí. 9.1.1 Vliv na člověka a jeho sebepojetí. V rámci sebepojetí člověka bychom chtěli otevřít několik klíčových témat, na kterých budeme ilustrovat problémy s pojené s informační etikou. Jedním z nich je závislost na internetu, která se projevuje neschopností ukončit práci na internetu, rostoucím počtem hodin online, lhaním o délce času stráveném v síti či jinými projevy psychologické závislosti. Za nejadiktivnější aplikace jsou považovány zejména ty, které umožňují komunikaci v reálném čase. Specifickou oblastí jsou také nové formy sexuality umožněné internetovými aplikacemi (tzv. kybersex). Opět lze říct, že zatímco někteří autoři se obávají odcizení způsobené touto formou sexuality či rizik spojených s oboustrannou anonymitou, jiní mluví o legitimní formě sexuálního projevu dospělých lidí. Další oblastí je experimentování s vlastní identitou. Anonymita internetových aplikací umožňuje svobodně si volit a experimentovat s různými identitami, např. měnit si pohlaví či věk oproti skutečnosti. Diskutován je dopad těchto experimentů na psychiku a sebepojetí – zatímco někteří autoři oceňují pozitivní stránky nových zkušeností, jiní se obávají rozštěpení mezi internetovou a neinternetovou identitu a neschopnost je v reálném životě sjednotit. Strana 78 9.1.1.1 Příklady k zamyšlení: problémy s identitou V tomto případě platí, že vhodným příkladem lze docílit lepšího pochopení, než dalekosáhlým obecným popisem a vysvětlováním. Zde jsou tedy tři případy, které ilustrují problémy s identitou, které se v rámci anonymního světa internetových aplikací často vyskytují: 1. Stewart má v reálném světě nízké sebevědomí a problémy s navazováním vztahů. V GargoyleMOO vystupuje pod jménem Achilles. Zatímco jeho studentský pokojík v RL je skromný a jednoduchý, Achilles bydlí v přepychovém a elegantně zařízeném bytě, vyzdobeném obrazy Achillových přátel z celého světa. Jako Achilles se Stewart seznámil s jednou ze tří ženských obyvatel GargoyleMOO, Winterlight. Pozval ji na virtuální schůzku do italské restaurace a strávil s ní romantický večer. Po nějaké době známosti ji požádal o ruku a ona přijala. Ona mu poslala růži, kterou nosila ve vlasech, on jí tisíc papírových hvězd. Ačkoliv Stewart se svatební oslavy účastnil před monitorem svého bytu, jeho přátelé z Německa se sjeli na svatební party k serveru, na kterém je MOO provozováno. Stewart se nyní cítí na MOO závislý: jeho alter ego Achilles je sice populární, ale jen ve své roli, Stewartovi se nepodařilo jeho prostřednictvím zbavit se vlastních mindráků (Turkle, 2000). 2. Šťastně ženatý čtyřiatřicetiletý designer Case hraje v MedievalMUD studentku práva, která dostala nabídku k sňatku od jednoho ze šlechticů, kteří provozují její školu a který jí platí studium. Case alias studentka Mairead obtížně prožívá pocit nerovného vztahu (Turkle, 2000). 3. Doug vystupuje v několika různých MOO a MUD pod čtyřmi různými postavami. První je svůdná žena, druhou chlapský kovboj. Třetí nenápadný králík nespecifikovaného pohlaví, kterého Doug využívá pro uspokojení svých voyeuristkých sklonů. Poslední postavou je ”sexuální turista”, pod kterým Doug žije v sexuálně orientované FurryMUDs. ”RL je jen další z oken a zpravidla ne moje nejlepší.” (Turkle, 2000). 9.2 Vliv na pracovní a volnočasový režim V této oblasti nás může zajímat několik okruhů otázek. Jaký má například dopad teleworkingu na pracovní efektivitu i sociální vztahy. Současné výzkumy zkoumají zejména dopady práce na dálku na sociální aktivity zaměstnance, které jsou zásadním samozřejmě vyhodnocovány jako výrazně negativní, na druhé straně ale jsou oceňovány úspory na pracovišti, omezení výdajů za jízdy i možnost zaměstnat pracovníky ze vzdálených chudších zemí. Strana 79 Vliv moderních technologií má vliv také na rychlost života a množství i chápání volného času. Zejména sociální sítě představují nový fenomén v oblasti sociálních kontaktů s osobami, které známe i které neznáme z reálného života. Vnikají také například nové formy online spirituality, na internetu se objevují nové náboženské skupiny, provozuje se online magie, diskutují se náboženské otázky. Věřící mohou konzultovat otázky víry s duchovními, se kterými se nikdy fyzicky nepotkali a kteří žijí ve vzdálených zemích. To může ovlivňovat i jejich soužití s většinovou společností a umocňovat fundamentalistické protesty. 9.3 Vliv na distribuci moci ve společnosti Distribuce moci ve společnosti je primárně vymezena právním prostředím ve kterém se pohybujeme. Právní normy podchycující také „život“ na internetu a staví se poněkud do protikladu s původním chápáním internetu jako svobodného média. V rámci webových komunit byly například řešeny otázky cenzurování internetu, oprávněnost boje hackerů proti eticky závadným dokumentům či jiné aktivity zabíhající za obvyklý právní rámec. Vliv internetu na moderní pojetí demokracie se projevuje na mnoha úrovních, internet ovlivňuje výsledky tradičních voleb, zvyšuje kontrolu veřejnosti nad politiky, nabízí ale i vizi online demokracie využívající průběžná elektronická referenda k diskutovaným tématům. Internet na druhé straně také umožňuje kontrolu státu a firem nad občanem a fakticky omezuje jeho právo na ochranu soukromí. Informační propast – digital divide, je problematika o které se nyní mluví velmi často a na mnoha úrovních, bývá chápána jako negativní projev vlivu internetu a informačních technologií na sdílení vlivu a moci mezi chudší a bohatší společenskou vrstvou, případně chudými a bohatými zeměmi. Na druhé straně sebou tento proces může nést i určité pozitivní aspekty, zatímco se dříve se upozorňovalo na rozšiřování vzdálenosti mezi oběma světy, je dnes možné najít řadu pozitivních příkladů o přínosech mobilních telefonů pro chudé obyvatele Afriky či o přínosu internetu anglicky mluvícím indickým programátorům a konzultantům. 9.4 Vliv na životní prostředí Jak dopadá informační společnost na životní prostředí je téma kontroverzní, nabízející více problémů než jejich řešení. Můžeme se ptát jestli moderní média umožňují bezpapírovou Strana 80 společnost nebo naopak povzbuzují k vyšší produkci papíru? Zatímco v posledních dvaceti letech pravděpodobně platilo druhé tvrzení, v současné době se rozšiřující zařízení na čtení elektronických dokumentů možná povede k náhradě části „papírové komunikace“ za elektronickou, ale je to bohužel zatím jenom jeden z trendů. Vyvstává tu dále problematika obrovského nárůstu elektronického odpadu (důsledek Moorova zákona) a tento odpad stále ještě nenachází vhodnou formu zpracování či recyklace. S výrobou elektroniky navíc souvisí řada negativních environmentálních i sociálních dopadů v zemích, odkud se dováží příslušné suroviny či kde se likviduje stará elektronika. Zde je ale na druhé straně také potřeba zmínit, že existuje i výrazně pozitivní vliv internetu na environmentální uvědomění, např. možnost koordinovat mezinárodní výchovné projekty, sdílet podklady a informace, zapojovat žáky do jejich samostatného vyhledávání atp. Celkově lze shrnout, že vliv moderních informačních technologií a služeb na společnost je nejednoznačný a zároveň velmi silný. To je pro nás významnou motivací zkoumat tuto problematiku hlouběji a provádět systematické sociologické analýzy, které nám umožní problému výše zmíněným problémům rychle a dobře porozumět. Obecně platí, že některé dopady jsou jednoznačně negativní a je naším úkolem hledat dílčí řešení vzniklých situací u jiných se hodnocení zdá být věcí názoru a společenské diskuse a u dalších není vůbec predikovat jejich budoucí vývoj a zaujmout relevantní stanovisko. 9.5 McLuhanova teorie médií „Když generál Sarnoff, prezident společnosti RCA, před několika lety přijímal čestný doktorát univerzity Notre Dame, prohlásil: ”Máme příliš silný sklon dělat z technologických nástrojů obětní beránky za hříchy těch, kdo je mají v rukou. Produkty moderní vědy nejsou samy o sobě dobré, nebo špatné; jejich hodnotu určuje způsob, jakým jsou použity.” Tak mluví soudobý náměsíčník. Dejme tomu, že bychom řekli: ”Jablečný koláč není sám o sobě ani dobrý, ani špatný; jeho hodnotu určuje způsob, jakým ho použijeme.” Nebo: ”Virus neštovic není sám o sobě ani dobrý, ani špatný; jeho hodnotu určuje způsob, jakým je použit.” A ještě: ”Střelné zbraně nejsou samy o sobě ani dobré, ani špatné; jejich hodnotu určuje způsob, jakým jsou použity.” Jako by byly střelné zbraně dobré, kdyby kulky zasáhly správné cíle. Pokud televizní obrazovka vypálí správnou munici na správné cíle, je dobrá. To neříkám ze zlomyslnosti. Na Sarnoffově tvrzení neobstojí nic, neboť ignoruje podstatu všech médií vpravdě narcisovským způsobem člověka, který je hypnotizován amputací a extenzí svého bytí v nové technické podobě.” (Marshal McLuhan) Strana 81 Marshall McLuhan (1911-1980) radikálně proměnil pohled sociálních věd na média. Média, která chápal jako všechny technologie rozšiřující lidské tělo a smysly, podle jeho názoru nejsou eticky neutrálními zprostředkovateli informací. Naopak, samotné médium je poselstvím („the medium is the message“). Je aktivním činitelem, které přináší vlastní informace a mění nás svojí podstatou. 9.5.1 Vliv médií na společnost Podle McLuhana nejsou média pouhými nástroji přenosu informací, ale jsou rozšířením člověka – extenzí určitého smyslu. Písmo a zařízení na přenos písma (knihtisk) je například extenzí oka. Rozhlas extenzí ucha. Rozšířením smyslového orgánu se ale lidé mění. Mění se způsob vnímání a komunikování světa, náš způsob uvažování o něm a následně i společenské instituce, které jsou na tomto vnímání závislé. McLuhan popisuje tři fáze vývoje lidské společnosti podle převládajícího média. V preliterárních kulturách převládala přímá komunikace, pro kterou bylo typické zapojení více smyslů: zraku, sluchu, hmatu, čichu. Společnost té doby měla podobu venkovských komunit. Moc drželi silní vůdci, schopni svým projevem ovlivnit ostatní. Soukromí neexistovalo, současně byla společnost provázána řadou silných vazeb. Knihtisk přinesl zásadní zvrat a dominanci oka nad ostatními smysly. Člověk mohl komunikovat nepřímo, o samotě, prostřednictvím knih. To vedlo k zániku původních venkovských struktur a k individualizaci. Individualizace přinesla pojem soukromí a koncept lidských práv. Elektronická média pak přinesla další změnu, protože opět začala zapojovat další smysly. V důsledku se podle McLuhana ve dnešní době opět vrací určité vesnické hodnoty, svět se stává „globální vesnicí“. Spojujeme se s dalšími lidmi bez ohledu na geografické vzdálenosti do elektronických komunit, ve kterých se vytvářejí nepsaná zvyková pravidla. Soukromí se stává diskutovaným a ohroženým konceptem. Podle McLuhana je současně každé přechodové období charakteristické velkou mírou společenské nejistoty a výbuchy násilí. Média předešlé epochy (rukopisná kniha, tištěná kniha) bývají považována za hodnotnější, než média nová (tištěná kniha, elektronická kniha). Dalším pozoruhodným aspektem je otázka dobrovolnosti využívání nových médií. McLuhan upozorňuje, že nová média jsou nejprve svobodnou volbou, ale od jistého Strana 82 rozšíření se stávají vyžadovanou nutností. Ve dnešní době je možné zamyslet se například nad reálností volby nepoužívat mobilní telefon či internet… 9.5.2 McLuhanova tetráda na zkoumání médií McLuhan proto navrhuje zkoumat média jako fenomény, které do určité míry žijí vlastním životem a ovlivňují společnost nezávisle na přání svých vynálezců a uživatelů. Pro analýzu médií navrhnul čtyři navazující okruhy otázek, tzv. tetrádu: 1. Co médium intenzifikuje neboli umocňuje, rozmnožuje a posiluje? 2. Co médium archaizuje neboli co činí zastaralým, překonaným? 3. Co médium aktualizuje neboli co probouzí k novému životu? 4. Co je nevyhnutelnou inverzí média, tedy v co se nakonec zvrhne? Pro porozumění se formou krátkého zamyšlení pokusíme aplikovat na příkladě mobilních telefonů: Mobilní telefony intenzifikují sociální komunikaci a to ústní i písemnou. Zvyšují počet příležitostí, kdy jsme v kontaktu s blízkými osobami a můžeme se s nimi domlouvat a koordinovat. Pravděpodobně také zvyšují naše pracovní tempo, protože nám umožňují zvládat a řešit problémy rychleji a proto si jich také více brát. Na druhé straně archaizují tradiční poštovní služby. Do určité míry archaizují pevné plánování a spolehlivost – díky mobilním telefonům je možné termíny kdykoliv změnit a aktualizovat. Lze uvažovat o archaizaci pevného rozdělení času mezi pracovní dobu a volný čas – díky mobilním telefonům jsme kdekoliv a kdykoliv dostupní a tato dostupnost je po nás často vyžadována. Mobilní telefony aktualizují písemnou komunikaci, ovšem formou upraveného a trochu komprimovaného jazyka. Aktualizují také možnosti kontroly – například rodičů nad dětmi. Mobilní telefony se možná z komunikačního prostředku zvrhnou v čistou zábavu – komunikaci pro komunikaci. McLuhanova teorie médií zůstává dodnes teorii inspirující a provokativní. Současně v době, která je médii utvářena v mnohem větší míře, než kdykoliv dříve, stojí jeho názory za připomenutí a analýzu. McLuhan svým způsobem stál na počátku bádání v oblasti informační vědy, zkoumající například dopady internetu na sociální vztahy, sexualitu či trávení volného času. Analýza společenských dopadů médií otevírá široký vějíř etických Strana 83 konsekvencí, jejichž porozumění je zásadní pro každého, kdo v této oblasti profesně působí. 9.6 Úkoly Který z dopadů společenských moderních informačních technologií považujete za nejsilnější / nejvíce pozitivní / nejvíce negativní? Proč? Vyberte si libovolnou otázku, která Vás zaujala. Najděte k ní na internetu další informace a relevantní odborné studie. Připravte na dané téma prezentaci, kterou promítnete ostatním. Prodiskutujte s přáteli případ Stewarta, Case a Douga. Posuďte, do jaké míry je pro ně zkušenost experimentování s vlastní identitou přínosem pro vlastní osobnostní rozvoj, případně co by se mělo změnit, aby se tato zkušenost stala reálným přínosem. Aplikujte McLuhanovu tetrádu na Facebook či sociální sítě obecně. Dohledejte k jednotlivým bodům potřebné informace z relevantních výzkumů publikovaných v dostupných zdrojích. 9.7 Literatura • Anderson, Craig A., Dill, Karen E. Video Games and Agressive Thoughts, Feelings, and Behavior in the Laboratory and in Life. Journal of Personality and Social Psychology, Vol. 78, 2000, no 4, p. 772-790. • Činčera, Jan. Internet a trvale udržitelný život. Environmentální a společenské dopady rozšiřování globálních počítačových sítí. [Disertace] Praha: Ústav informačních studií a knihovnictví FF UK v Praze, 2001. 168 s. • Johnson, Deborah G. Is the Global Information Infrastructure a Democratic Technology? In Baird, R. M., Reagan, R., Rosenbaum, S. E. Cyberethics: social and moral issues in the computer age. New York: Prometheus Books, 2000. S. 304318. • Spinello, Richard A. Case Studies in Information and Computer Ethics. Upper Sadle River: Prentice Hall, 1997. • Turkle, Sherry. Who Am We? In Baird, R. M., Reagan, R., Rosenbaum, S. E. Cyberethics: social and moral issues in the computer age. New York: Prometheus Books, 2000. S. 129-141. Young, Kimberly S. University of Pittsburgh at Bradford. Internet addiction: The Emergence of a New Clinical Disorder. CyberPsychology and Behavior, Vol. 1, 1998. No. 3., pages 237-244. [WWW dokument] http://www.netaddiction.com/articles/newdisorder.htm • • MCLUHAN, M. Člověk, média a elektronická kultura. Výbor z díla. Brno: Jota, 2000. Strana 84 • MCLUHAN, M . Jak rozumět médiím. Extenze člověka. Praha: Odeon, 1991. 10 INFORMAČNÍ ETIKA Jan Činčera 10.1 Vymezení informační etiky Praxe nakládání s informacemi přináší kromě praktických problémů také etická dilemata, které se řeší na úrovni státní, institucionální či individuální. Teoretickým podchycením těchto dilemat se zabývá etika, která se v závislosti na svém zaměření označuje jako informační, počítačová, kyberetika, novinářská etika či jinak. Karel Janoš (1993) definoval informační etiku jako “oblast morálky uplatňované při vzniku, šíření, transformaci, ukládání, vyhledávání, využívání a organizaci informací.” (s. 47) Etická dilemata, která s informační praxí mohou být spojována, přitom mohou mít dvě roviny. Na první, mikroetické, jde především o správnost či nesprávnost určitého způsobu nakládání s informacemi. Mikroetické problémy jsou problémy, související s vlastní informační prací a individuálním chováním aktérů informačního procesu (tedy například ochrana soukromí, ochrana duševního vlastnictví, atd.). Oproti tomu makroetické problémy souvisejí s dopady informačních technologií na společnost, tedy například s problémem nerovného přístupu k informacím (tzv. digital divide), zranitelností informační společnosti, atd. Podle Ladda (2000) je předmětem makroetiky morální posuzování norem, praktik, institucí a zákonů, které jsou budovány na bázi mikroetiky. Zejména hledisko společenských dopadů internetu se stává v posledních letech součástí každé práce o informační etice. Strana 85 10.2 Konfliktní oblasti mimoetické dimenze nakládání s informacemi V rámci této kapitoly se budeme soustředit na mikroetiku. Typická problémová a konfliktní situace může být například otázka do jaké míry je správné zpřístupňovat některé informace a do jaké míry v určitých případech omezit přístupnost informací. Dalším typickým problémem může být odpovědnost za publikované informace nebo informační produkt. Třetí skupinou problémů je korektní nakládání s vlastnickými právy původce informací či informačního produktu. 10.2.1 Zpřístupňování informací vs. omezování přístupnosti informací V mnoha případech narážíme na těžko řešitelné rozpory, které v některých případech nemají jednoznačnou odpověď a musí se k přistupovat citlivě, nepředpojatě, případ od případu se snažit nalézt eticky přiměřené rozhodnutí. Příkladem může být požadavek a ochranu soukromí versus snaha státu o zajištění bezpečnosti občanů, zejména v souvislosti s bojem proti terorismu (informace o výrobě výbušnin, výroba jaderných zbraní, politicky citlivé údaje, silná kryptografie apod.). Dalším takovým typickým rozporem je otázka, jakým způsobem najít hranici mezi právem člověka na informace a legitimní snahou ochránit soukromí? S tímto rozporem se běžně setkáváme na mnoha úrovních. Do jaké míry má zaměstnavatel právo vstupovat do soukromí svých zaměstnanců (např. monitoring zaměstnanecké korespondence). Kde končí obchodní tajemství a začíná právo na informace například oblasti vlivu firem na životní prostředí? Do jaké míry může být legální obchodování s osobními údaji získanými z počítačových sítí či jiných zdrojů? Kde je hranice soukromí například u veřejně činných osob, nebo do jaké míry máme znát informace o osobách, které byly odsouzené, nebo jsou jako narušení jedinci jsou považováni za nebezpečné pro své okolí? Strana 86 10.2.2 Odpovědnost za publikované informace či informační produkt V této oblasti se nejčastěji diskutuje problematika provozování informačních aplikací, u kterých existuje riziko, že v důsledku jejich používání vznikne jedinci či společnosti újma. Příkladem může být provozování potenciálně adiktivních aplikací (např. online casina), publikace rasistických či jinak násilí podněcujících dokumentů, xenofobních dokumentů, publikace agresivních interaktivních aplikací, např. počítačových her, virtuálních světů (MUDs), publikace nepravdivých či záměrně zkreslených informací (například záměrné politické dezinformace). 10.2.3 Korektní nakládání s vlastnickými právy původce informací či informačního produktu. V tomto případě se jedná o takové zacházení s informačními produkty, které nerespektuje přání jejich původce. Jedná se v nejčastějších případech o porušení citačních zásad, hacking a cracking, nelegální stahování softwaru a jiných produktů. 10.2.4 Analýza informačních konfliktů Jak k takovým konfliktům přistupovat? Můžeme využít následující postup: Porovnat situaci se stávajícími normami, tj. právním řádem, firemním etickým kodexem či společenským územ. Identifikovat zainteresované strany konflikty a vyhodnotit jejich stanoviska, postoje a důvody, proč je zaujímají. Pokusit se konflikt posoudit z hlediska obecných etických zásad, tj. např. podle kategorického imperativu či podle utilitaristického přístupu. Přihlédnout v hodnocení k vlastnímu svědomí a pocitům. Příklad: V létě 2000 zveřejnil britský bulvární deník jména a fotografie všech osob, kteří byli v posledních letech propuštěni z vězení po odpykání trestu za pohlavní zneužívání dětí. List argumentoval tím, že občané mají právo vědět o nebezpečí, Strana 87 které hrozí jejich dětem. Policie se ale obávala, že zveřejnění jmen povede k rozvrácení snahy těchto osob o normální život a k jejich útěku do anonymity, kde nebudou pod státní kontrolou. Rozbor: V našich podmínkách by zveřejnění jmen propuštěných delikventů znamenalo porušení zákona na ochranu osobních údajů. V konfliktu figurují tři zainteresované strany: Propuštění delikventi – požadují ochranu svého soukromí z důvodu obavy o svůj život; Noviny – požadují zveřejnění informace, důvodem je naděje ve zvýšení prodejnosti; Veřejnost – požaduje zveřejnění informace, důvodem je obava o bezpečnost dětí. Podle Kantova kategorického imperativu bychom se museli ptát, zda by fungovala společnost, ve které by každý měl přístup k trestnímu rejstříku všech ostatních. To by pravděpodobně vedlo k ostrakizaci osob s popsaným rejstříkem a ztížení jejich možné resocializace. Podle utilitaristické zásady nejvyššího dobra největšímu počtu osob bychom měli vážit, zda více dobra více lidem přinese zveřejnění (=vyšší pocit bezpečnosti a vyšší prodejnost) nebo utajení (=ochrana delikventů). Krátkodobě patrně převažuje užitek ze zveřejnění, dlouhodobě ale může vést ke zvýšení nebezpečnosti propuštěných trestanců. Intuitivně cítíme určitou nekorektnost tohoto zveřejnění a lze se domnívat, že tu jde do značné míry o zisk vydavatele. 10.2.5 K zamyšlení: eticky složité situace Odpůrci internetové cenzury jsou přesvědčeni, že online komunita je schopna své problémy řešit i bez rušivého vpádu státní moci. Na internetu například existují organizované skupiny hackerů soustředěně útočících proti pornografickým či spammerským serverům, proti kterým používají legální i nelegální prostředky. Je ovšem sporné, zda tyto skupiny dosáhnou stejné efektivity, jako policejní zásah. Jejich činnost je jednak trestná, jednak neúčinná - vymazané pornografické servery jsou schopny obnovit svoji činnost po několika minutách. Proto mnoho protipornografických hackerských skupin - Condemned, Cyber Angels, antichildporn.org opouští hackerské metody a přechází na legální formy boje. I ty se ovšem míjejí s účinkem. Ač je dětská pornografie všude ve světě zakázána (v roce 1982 rozhodnul americký Nejvyšší soud, že se na ní nevztahuje svoboda projevu, daná Prvním dodatkem, trestné je nejen její šíření, ale i pouhé vlastnění), není zatím FBI schopna proti virtuální dětské pornografii zasahovat (Burke, 2000). Strana 88 Scientologická církev je mnohými považována za jednu nejnebezpečnějších sekt, využívajících rafinované psychologické postupy k získání dalších platících příznivců. Přestože v USA může volně fungovat, je v některých evropských státech zakázána či nepovolena, bývalý německý kancléř Kohl ji dokonce prohlásil za hrozbu německé demokracii. V roce 1991 vznikla na internetu diskusní skupina, spojující odpůrce scientologické církve, alt.religion.scientology. V této konferenci se jednoho dne objevily dlouhé texty, získané nelegálním (hackerským) průnikem na weby Scientologické církve. Texty obsahovaly interní informace, známé jaké Pokročilé technologie, určené pouze pro zasvěcené. Texty obsahovaly bizarní popisy mimozemských bytostí, prehistorických jaderných válek a další kapitoly, které “nezasvěceným” musely připadat dost komické. Zástupci Církve se obrátili na soud s žalobou o porušení svých autorských práv. Soud jim dal za pravdu, ale poté co právníci Církve požadovali zrušení konference, ukázalo se, že to technicky není možné: net news konference jsou zrcadleny na stovkách news serverů a nemají žádného odpovědného provozovatele. Příspěvky byly navíc odeslány prostřednictvím finského anonymního remaileru a nebylo tedy možné zjistit, kdo je jejich skutečným původcem. Scientologům se ale podařilo získat soudní příkaz k tlaku na finského provozovatele remailovací služby a přinutili ho, aby odhalil jména odesílatelů. To vyvolalo veliké pobouření mezi internetovou komunitou a kritický text se začal objevovat na diskusních konferencích odeslaný prostřednictvím sítě anonymních remailerů a s tedy nezjistitelnými odesílateli. Protože scientologové začali v této fázi války uvažovat o spamovém útoku a zasypávání nepřátelských konferencí maily oslavujícími Scientologickou církev, byly připraveny nástroje, které se od té doby začaly používat proti spammerům: cancelbot, umožňující smazat spam z konference a cancelfile, umožňující automaticky mazat maily od jednoho adresáta. Tyto nástroje ale dokázala využít i Církev a tak od roku 1994 začaly z alt.religion.scientology mizet texty. Pod informací o smazání stál podpis “Cancelbunny” , anonymní osobnosti, která nepřiznala svoji vazbu na Církev a ani Církev nikdy nepřiznala svůj vztah k ní. Válka ovšem neskončila: internetová komunita vytvořila nástroj zvaný Lazarus, pomocí kterého je možné smazané příspěvky opět křísit (Post, 1996). Strana 89 10.2.6 Úkol Přečtěte si v libovolné učebnici etiky informace o vybrané etické teorii (Aristoteles, Kant, utilitarismus, kontraktariánská etika, atd.). Vyhodnoťte, do jaké míry s teorií souhlasíte a jak byste ji mohli využít při řešení konfliktů v informační praxi. Analyzujte příklady uvedené v kapitole „K zamyšlení“ a vyhodnoťte je podle výše uvedené metodiky. Svoje řešení prodiskutujte s přáteli. Najděte v novinách libovolnou zprávu o konfliktu, týkajícím se informací. Rozeberte jej podle výše uvedených bodů a rozhodněte, jaké řešení považujete za správné. 10.2.7 Použitá literatura • Burke, Lynn. Wired News Report. Hackers' New Tack on Kid Porn. [WWW dokument]. http://www.wired.com/news/politics/0,1283,33869,00.html. 3:00 a.m. 3.Feb.2000 PST • Capurro, Raffael. Moral Issues in Information Science. [WWW dokument]. 1985. Dostupné z <http://www.capurro.de> • Capurro, Raffael. Ethical Challenges of the Information Society in the 21st Century. [WWW dokument]. 2000. Dostupné z <http://www.capurro.de> • Janoš, Karel. Informační etika. Praha: Univerzita Karlova, 1993. • Ladd, John. Ethics and the Computer World: A New Challenge For Philosphers. In Baird, R. M., Reagan, R., Rosenbaum, S. E. Cyberethics: social and moral issues in the computer age. New York: Prometheus Books, 2000. • Moor, James H. What Is Computer Ethics. In Baird, R. M., Reagan, R., Rosenbaum, S. E. Cyberethics: social and moral issues in the computer age. New York: Prometheus Books, 2000. • Post, David G. The First Internet War. [WWW dokument] http://www.cli.org/DPost/X0003_ARTICLE4.html . 1996. 11 HUMAN-COMPUTER INTERACTION Vznik HCI se datuje od 70.-80. let 20. stol. s nástupem osobních počítačů. Tehdy si mnozí uvědomili, jak je obrácení pozornosti na interakci člověk-počítač velmi důležité, protože Strana 90 nedostatečně navržená rozhraní mezi člověkem a počítačem mohou vést k nenadálým problémům. V současné době neexistuje jednoznačně výstižná, všeobecně použitelná definicie HCI. Je ale možné skonstatovat, že je společensko-technologickou vědou, která zkoumá problematiku interakce komunikace mezi člověkem (jednotlivcem či skupinami) a počítačem (počítačovými systémy), lidské vnímání a poznávání a schopnost využívat počítač. Studuje chování a informační potřeby konečného uživatele při využívání informačních a komunikačních technologií (ICT - Information and Communication Technologies) s cílem zlepšit použitelnost a intuitivnost využívání ICT i u méně odborných uživatelů. Zahrnuje procesy relevantního vyhledávání informací, uživatelských rozhraní a dalších atributů informačních systémů či informačních technologií (Pilecká, 2009; Součková, 2003). Proto je HCI orientován i na design, tvorbu a testování použitelnosti a přístupnosti informačních systémů a jejich rozhraní tak, aby byly co nejjednodušší a nejintuitivnější pro konkrétně definovanou skupinu uživatelů. Existuje nejméně 7 klíčových principů designu uživatelského rozhraní (UID - User Interface Design), které by neměly být v žádném případě opomíjeny, a sice tolerance, jednoduchost, viditelnost, dostupnost, konzistentnost, struktura a zpětná vazba (Tidwell, 1999). 11.1 Vazba na jiné oblasti a související obory HCI představuje spleť vzájemně propojených oborů - počítačové grafiky, kognitivní psychologie (včetně lidských faktorů), ergonomiky, inženýrských oborů a systémů, jenž jsou součástí počítačové vědy, operačních systémů nevyjímaje. Můžeme zde zařadit i další přidružené obory, jakými jsou umění, design, psychologie, kognitivní psychologie, lingvistika, sociologie, filosofie, antropologie, fyziologie, umělá inteligence, kognitivní věda, etika a estetika. 11.1.1 Iniciativy a organizace HCI Nejznámější organizací zabývající se problematikou interakce člověka s počítačem je ACM SIGCHI. Tato speciální zájmová skupina expertů, profesionálů, akademiků a studentů (Special Interest Group on Computer–Human Interaction), vydává časopisy, publikace, tutoriály, provozuje online diskusní fóra. Pravidelně také pořádá workshopy a Strana 91 konference. Jejich každoroční konference ACM's Conference on Human Factors in Computing Systems patří mezi nejprestižnější konference HCI. Česká odnož ACM - Prague ACM SIGCHI je občanské sdružení, které si klade za cíl budovat komunitu lidí zajímajících se o návrh uživatelských rozhraní (user interface design), použitelnost (usability) a přístupnost (accessibility). Další, neméně známou organizací je i The American Center for Design (ACD), která patří mezi primární zdroje informací o designu. Na rozdíl od ACM SIGCHI, sdružuje výhradně profesionály a experty z nejrůznějších oblastí teoretického i praktického designu. 11.1.2 Metodologie HCI Mnohé metodologie designu pochází z modelu, ve kterém uživatelé, designéři a technické systémy vzájemně interagují. Přesto je metodologie HCI závislá na její konkrétní aplikaci. Společnou je zřejmě jen evaluace. Například rané metodologie považovali uživatele a jeho kognitivní procesy za předvídatelné a tím pádem i plně kvantifikovatelné, čemuž ve výsledku odpovídaly i první protypy rozhraní. Moderní modelování uživatelů se zaměřuje spíše na stálou zpětnou vazbu a komunikaci mezi uživateli, designéry a inženýry. Uživatelsky orientovaný design (UCD - User-centred design), design zaměřen na uživatele, představuje moderní, rychle se rozvíjející filosofii designu, která má za to, že dobrý design musí sloužit především zájmu uživatelů. Uživatelské požadavky jsou od začátku (životního cyklu tvorby uživatelského rozhraní) zaznamenávány a následně dolaďovány prostřednictvím různorodých metod, např. etnografických studií, testování prototypů, testování použitelnosti apod. K metodám obecnějšího charakteru řadíme např. participační design. Ten zdůrazňuje aktivní participaci koncových uživatelů na designu rozhraní prostřednictvím různých workshopů a sezení. Nabízí vhodné společné komunikační prostředí pro technické i netechnické účastníky (vývojáře, designéry i uživatele). Mezi další nejpoužívanější metody HCI (zejména při tvorbě uživatelských rozhraní) patří design zaměřen na aktivity (activity-centered design), ‘Affordance Analysis’, ‘bodystorming’, kontextuální design (contextual design), ‘focus group’, ‘iterative design’, ‘pictive user interface workshop method’, design založený na scénářích (Scenario Based Design - SBD), analýza/modelování úkolů (task analysis, task modeling), Experiment Strana 92 Čaroděje ze země Oz (Wizard of Oz experiment) či design zaměřen na používání (usagecentered design). 12.1.3 Uživatel jako klíčový element Jak je již vidět z výše uvedeného, současný trend je zcela zaměřen na uživatele a jeho potřeby. Uživatel je centrálním a určujícím činitelem celého informačního systému. Bez respektování potřeb uživatelů pracuje systém víceméně naprázdno. Kvalitu uživatelsky přívětivého rozhraní určuje: • interaktivita - rozhraní komunikuje s uživatelem, informuje jej o tom, co se děje • průhlednost - ovládání je jednoduché a reakce systému předvídatelné • přehlednost - orientace je snadná nejen na první obrazovce, ale v celém systému • empatie - rozhraní je “šito” na míru uživateli • standardizace - klasické a navyklé pracovní postupy uživatele jsou zachovány i s ohledem na zvyklosti a standardy operačního systému, pro který je program navržen • srozumitelnost - pojmy, které rozhraní používá jsou obecně známy, popřípadě známy alespoň skupině uživatelů, pro které je program určen • návodnost - rozhraní provází uživatele celým systémem bez učení se navigace v systému • ochrana - před nebezpečnými operacemi, které mohou připravit uživatele o data • pomoc - vybavení přehlednými návody a pomůckami. 11.2 Informační architektura Pojem informační architektura (Information Architecture - IA) byl poprvé použit Richardem Saul Wurmanem v roce 1976 na konferenci The Architecture of Information. Trvalo více než 20 let než se IA ujala jako vědní disciplína. IA můžeme definovat jako vědeckou disciplínu zabývající se organizací a rozvržením (layout) obsahu systému / rozhraní/ webu. Ale také jako umění i vědu organizace a Strana 93 modelování informací způsobem, který úspěšně naplňuje potřeby uživatelů obzvláště v komplexních systémech. Jedná se ku příkladu o knihovní systémy, systémy pro správu obsahu, kde je nevyhnutné vhodně podchytit vývoj databází a webu, programování či technické psaní. Institut informační architektury (podrobněji o instituci viz níže) definuje informační architekturu pomocí tří obecných prohlášení (Our, 2007): Strukturální design sdílených informačních prostředí. Umění a věda organizace a popisu webových sídel, intranetů, online komunit a softwaru za účelem následného vyhledání a využití. Vznikající zájmová skupina přenášející principy designu a architektury do digitální sféry. Informační architekt je pak osoba, která organizuje vzory v datech, transformuje je z komplexní do přehledné podoby, vytváří strukturu nebo mapu informací umožňující snadnou orientaci a cestu k poznatkům. Jde o profesi 21. století s úkolem řešit problémy organizování informací tak, aby byly snadno pochopitelné a srozumitelné (Makulová, 2005). 11.2.1 Iniciativy a organizace IA Institut informační architektury (The Information Architecture Institute - IAI) byl zřízen v roce 2002 jako nezisková organizace pro experty a technicky zdatné odborníky. Poskytuje informační zdroje, informační nástroje, školení, konference, workshopy, semináře apod. Snahou je nabídnout mezinárodní členství, které propojí různé jazyky, kultury a perspektivy. 11.2.2 Základní pilíře IA Informační architekturu tvoří několik základních “pilířů” - organizační systém, systém popisu (labeling system), navigační systém a vyhledávací systém. IA se tedy zaměřuje na informační, nikoli grafický design. Strana 94 Organizačný systém - informace jsou organizovány za účelem jejich lepšího řízení, vysvětlení, pochopení a v neposlední řadě i využití. Proto základem by měla být náležitá klasifikace. Cílem je podpora navigace, vyhledávání a popis, který bude vyhovovat právě uživatelům systému/ rozhraní/ webového sídla. Systém popisu - popisný systém slouží jako reprezentace informací. Úkolem je popis informací sémanticky jednoznačným (a tím pádem i efektivním) způsobem pro daného koncového uživatele či uživatelské komunity. Navigační systém - jedná se o prvky, které usnadňují navigaci v systému/ rozhraní/ sídle/ podle předem stanovených kroků. Typickými nástroji jsou organizační systémy, globální navigační systémy, lokální navigační systémy, mapy a indexy systému/rozhraní/sídel, průvodci či doplňkové navigační schémata. Vyhledávací systém - patří zde nástroje umožňující formulaci uživatelského požadavku – vyhledávací rozhraní, vyhledávací algoritmus, dotazovací jazyk se svou syntaxí a sémantikou, zobrazené výsledky vyhledávání atd. (Morville, 2006; Makulová, 2005). 11.3 Přístupnost Přístupnost (web accesibility) ve všeobecnosti znamená takový stav, kdy daná věc (webová stránka, sídlo, systém, uživatelské rozhraní) neklade svým uživatelům při jejim užívání žádné překážky (Špinar, 2004). Termín přístupnost bývá někdy nesprávně významově zaměňován za dostupnost (availability) či použitelnost (usability). I když je v běžné řeči považujeme za synonyma, v oblasti HCI máme na mysli především logický přístup (vhodné podmínky pro zpracování informací v mysli), na rozdíl od fyzického přístupu (dostupnosti), např. připojení na internet. Přístupnost webu je neoddělitelnou součástí použitelnosti webu. Neexistují mezi nimi pevné hranice, nicméně neplatí, že každá přístupná stránka je i bezprostředně použitelná a naopak. Strana 95 11.3.1 Iniciativy v oblasti přístupnosti webu Zřejmě nejznámější iniciativou v oblasti přístupnosti webu je Web Accessibility Initiative WAI fungující v rámci konsorcia World Wide Web. Její činnost je možné rozdělit do pěti základních okruhů: vývoj nových technologií, výzkum, výchova a vzdělávání, poskytování nástrojů, vydávání odborných návodů. V posledně zmíněné oblasti se realizovaly vydáním dvou směrnic - Směrnice přístupnosti webu 1.0 a Směrnice přístupnosti webu 2.0 (Web Accessibility Guidelines - WCAG). Neméně známým sdružením je WebAIM - Web Accessibility in Mind, které již od roku 1999 poskytuje řešení problematiky přístupnosti webu. Jde o neziskovou organizaci v rámci Centra pro znevýhodněné na americké univerzitě státu Utah (Center for Persons with Disabilities at Utah State University). Cílem WebAIM je šířit povědomí o přístupnosti a použitelnosti webu pro všechny skupiny znevýhodněných uživatelů - publikační činností, podporou výměny informací a zkušeností v online komunitách, aktivní účástí ve výzkumu a na legislativním procesu, poskytováním služeb a vytvářením sofwarových nástrojů, stejně tak instruktážních videí. 11.3.2 Metodiky a legislativní předpisy přístupnosti webu Některé země chtěly přístupnost webu řešit legislativní cestou. Průkopníky se staly USA. Začátkem 90.-tych let se ve Státech odehrálo několik soudních sporů, ve kterých žalující strana (znevýhodnění uživatelé a organizace bojující za práva menšin) požadovala rovnocenný přístup ve společnosti a k informacím. Na tyto spory reagoval v roce 1998 prezident Clinton podepsáním dodatku k novelizovanému zákonu Rehabilitation Act z roku 1973, ve kterém byl vznesen požadavek na vypracování konkrétních regulí přístupnosti webových sídel. Vznikl tak dokument Section 508. Podkladem tohoto prováděcího předpisu byly právě Směrnice přístupného webu 1.0 (WCAG 1.0). V roce 1998 si kanadská vláda stanovila vyšší cíl, a to přijetím Směrnic s druhým stupněm jejich priority - na rozdíl od USA, kde Section 508 vychází pouze z prvního stupně priority. První zemí na evropském kontinentu, která přijala v roce 1999 rezoluci vztahující se na přístupnost webu se stalo Portugalsko (Slatin, 2003). V květnu v roku 2002 zavedlo Strana 96 Spojené království pravidla Code of Practice, která dala základ zákonu Disability Discrimination Act (DDA). Pro pravidla přístupnosti webu není vždy nutné chodit daleko. V České republice existují dvě velice zdařilé metodiky Blind Friendly Web (dále jen BFW) a Pravidla pro tvorbu přístupného webu, které tvoří přílohu zákonu č. 365/2000 Sb. o informačních systémech veřejné správy. BFW podrobně popisuje pravidla pro přístupné webové stránky pro zrakově znevýhodněné uživatele. Jejich autorem je Radek Pavlíček ze Sjednocené organizace nevidomých a slabozrakých České republiky. V Best Practice - Pravidla pro tvorbu přístupného webu, na rozdíl od BFW, jsou kontrolní body poměrně konkrétně definovány (lepší sémantika), což usnadňuje jejich srozumitelnou interpretaci i bez podrobnějšího výkladu. Příručka přístupnosti obsahuje 37 kontrolních bodů, které jsou dostupné jak v základní, tak i rozšířené formě s detailním popisem. 12.3.3 Kategorie znevýhodněných uživatelů I když pod “hlavičkou” znevýhodněných najdeme velice různorodou skupinu lidí, i zde je možná alespoň částečná kategorizace, přičemž je nutné si uvědomit, že tyto skupiny se mohou překrývat. To znamená, že uživatel z hlediska této kategorizace může spadat do několika skupin, respektive trpět i několika znevýhodněními. Jde o kategorie: Zdravotně znevýhodnění uživatelé (tělesně, smyslově, kognitivně) - např. imobilní či částečně mobilní občané, zrakově, sluchově, rečově znevýhodnění a také lidé s poruchami kognice. Uživatelé se zobrazovacími problémy - uživatelé s nejrůznějším hardwarových a softwarovým vybavením (monochromatický či žádný monitor, řečový syntentizátor apod.) Dočasně znevýhodnění uživatelé - nejen dočasně zdravotně znevýhodnění lidé (např. po úrazech, zlomeninách končetin apod.), ale i uživatelé s nevyhovujícím pracovním prostředím (např. příliš nebo málo osvětlený monitor). Špinar (2004), s trochou nadsázky, označuje roboty vyhledávacích nástrojů (web crawlers) za samostanou znevýhodněnou skupinu “uživatelů”. Jelikož jsou také “nevidomí”, jejich činnost závisí na kvalitním, čistém zdrojovém kódu. Strana 97 11.4 Použitelnost webu Dodržování nejdůležitějších zásad použitelnosti systému/ rozhraní/ webu zvyšuje srozumitelnost a přehlednost. Interakce s rozhraním by tedy měla probíhat bez nutnosti složitého přemýšlení. K dispozici dáváme i několik dalších definic použitelnosti, např.: • Použitelnost je stupeň do jakého se software, hardware anebo výrobek lehce používá a vyhovuje lidem, kteří to využívají • Použitelnost je o tom, zda-li je výrobek efektivní, výkonný a uspokojuje ty, kteří jej používají • Použitelnost označuje skupinu technik, které profesionálové z oblasti použitelnosti používají ke tvorbě použitelných výrobků • Použitelnost můžeme definovat jako lehké využívání systému ke konkrétním účelům. Mezinárodní norma ISO 9241, v části 11 definuje použitelnost jako využívání produktu uživateli za účelem dosažení specifických cílů, a to efektivně, s vysokým stupněm výkonnosti a míry uspokojení. Použitelnost můžeme v obecnějším chápání brát jako takový přístup k vývoji výrobku, který předpokládá přímou zpětnou vazbu uživatele během výrobního cyklu, s cílem snížení nákladů a naplnění potřeb uživatelů (Makulová, 2009). 11.4.1 Iniciativy v oblasti použitelnosti webu Cílem nejvýznamnější iniciativy použitelnosti webu - Asociace profesionálů použitelnosti (The Usability Professionals’ Association - UPA) je být především autoritativní organizací pro použitelnost, uživatelsky orientovaný design a ‘user experience’ (UX). Dále je zde snaha podporovat výzkum, vzdělávání a profesní růst, propagovat obchodní hodnoty v uživatelsky orientovaném designu a stejně tak usnadňovat komunikaci expertů sdílením a výměnou informací. I proto UPA každoročně organizuje jednodenní konferenci World Usability Day, která probíhá ve stejný den ve více než 43 zemích světa pro nejširší spektrum publika. U nás ji převzala záštitu Prague ACM SIGCHI. Strana 98 11.4.2 Metody použitelnosti webu Mezi nejčastější metody použitelnosti patří např. uživatelské testování, ‘eye-tracking’, testování prototypů (na papíře, nebo ve formě elektronické prezentace). Důležité tak je zjistit a zajistit čitelnost obsahu při všech rozlišeních, jasný účel webu, členění textu, informace o smyslu webu, sdělení informací o organizaci, firmě či instituci vlastnící/ spravující daný systém. Dále také způsob vytváření obsahu, navigaci, vyhledávání, včetně grafiky a animace, grafického designu a prvků uživatelského rozhraní. Opomenout bychom neměli ani záhlaví oken, URL adresy, přivítání a poděkování, informace o případných technických problémech, zprávy a tisková prohlášení, informační okna a úvodní stránky, reklamu, podporu komunit a shromažďování informací o zákaznících. Nejdůležitější informace by se vždy měly nacházet v první polovině “obrazovky”. Pokud totiž většinu výše uvedených kritérií systémy/ rozhraní/ webová sídla splňují, mají podle Nielsena (2005) tyto čtyři charakteristické znaky: • Snadná naučitelnost a zapamatovatelnost • Vysoká výkonnost uživatelů při provádění a dokončování stanovených úkolů • Nízká chybovost • Spokojenost. 11.5 Shrnutí S nástupem osobních počítačů si mnozí uvědomili, jak je obrácení pozornosti na interakci člověk-počítač velmi důležité, jelikož nedostatečně navržená rozhraní mezi člověkem a počítačem mohou vést k nepředvídatelným problémům. HCI představuje spleť vzájemně propojených oborů - počítačové grafiky, kognitivní psychologie (včetně lidských faktorů), ergonomiky, inženýrských oborů a systémů, jenž jsou součástí počítačové vědy, operační systémy nevyjímaje. HCI je orientována i na design, tvorbu a testování přístupnosti a použitelnosti informačních systémů a jejich rozhraní tak, aby byly co nejjednodušší a nejintuitivnější pro konkrétně definovanou skupinu uživatelů. Přístupnost je neoddělitelnou součástí použitelnosti. Neexistují mezi nimi pevné hranice, nicméně neplatí, že každý přístupný systém, rozhraní či web je i bezprostředně použitelný a naopak. Strana 99 Nesmí se však opomínat ani informační architektura, která navrhuje vhodné rozvržení (layout) obsahu systému /rozhraní/ webu, organizaci a modelování informací tak, aby potřeby uživatelů, obzvláště v komplexních systémech, byly úspěšně naplňovány. Strana 100 11.6 Seznam použité literatury • Best practice - Pravidlá pro tvorbu přístupného webu. Verze 1.0. 2004 [online]. Praha : Ministerstvo informatiky (Odbor metodické podpory ISVS), 2004 [cit. 2010-08-21]. Dostupný z WWW: <http://aplikace.mvcr.cz/archiv2008/micr/files/1510/mi_final_bp_web_pristupnost _20040722.pdf>. • FOJTU, A. Analýza súčasného stavu a perspektívy riešenia v oblasti iniciatívy prístupnosti webových sídiel [Diplomová práce]. Univerzita Komenského v Bratislave; Filozofická fakulta; Katedra knižničnej a informačnej vedy. Bratislava: FFUK, 2005. 70 s. • MAKULOVÁ, S. 2005. Informačná architektúra. In Ikaros [online]. 2005, roč. 9, č. 9 [cit. 29.08.2010]. Dostupný z WWW: <http://www.ikaros.cz/node/2007>. URNNBN:cz-ik2007. ISSN 1212-5075. • MAKULOVÁ, S. 2009. Ako sa vyvíjalo chápanie použiteľnosti webových sídiel. In ELET Newsletter. [online] 1. január 2009 [cit. 2009-11-29]. Dostupný z WWW: <http://www.elet.sk/?pouzitelnost-pristupnost&sprava=ako-sa-vyvijalo-chapaniepouzitelnosti-webovych-sidiel>. • MORVILLE, P., ROSENFELD, L. 2006. Information Architecture for the World Wide Web. 3rd ed. Cambridge: O’Reilly, 2006. 504 p. ISBN 0-596-52734-9. • NIELSEN, J. 2002. Web Design. 1. vyd. Praha : SoftPress s.r.o., 2002. 382 s. ISBN 80-86497-27-5. • Our mission - The Information Architecture Institute. 2007 [online]. Last modified January 16, 2007 [cit. 2010-08-29]. Dostupný z WWW: <http://iainstitute.org/en/about/our_mission.php>. • PAVLÍČEK, R. 2005. Blind Friednly Web : Dokumentace zásad přístupnosti webových stránek pro těžce zrakově postižené uživatele [online]. Praha : Sjednocená organizace nevidomých a slabozrakých ČR, 2005 [cit. 2004-08-17]. Dostupný z WWW: <http://www.blindfriendly.cz/doc/bfw.php>. • PILECKÁ, V. 2009. Vzájemné inspirace informační a kognitivní vědy. In ProInflow [online]. 31.12.2009 [cit. 2010-08-29]. Dostupný z WWW: <http://pro.inflow.cz/vzajemne-inspirace-informacni-kognitivni-vedy>. ISSN 1804–2406. • SLATIN, J.M., RUSH, S. 2003. Maximum Accessibility : Making Your Web Site More Usable for Everyone. 1st ed. Boston : Addison-Wesley, 2003. 588 p. ISBN 0201-77422-4. • SOUČKOVÁ, M. 2003. Aspekty vztahu člověk-počítač s důrazem na uživatelské rozhraní. Praha, 2003. iv, 89 s. Diplomová práce. Univerzita Karlova v Praze, Filozofická fakulta, Ústav informačních studií 2003. Vedoucí diplomové práce Richard Papík. • ŠPINAR, D. 2004. Tvoříme přístupné webové stránky. 1. vyd. Brno: Zoner Press, 2004. 360 s. ISBN 80-86815-11-0. Strana 101 • TIDWELL, J. 1999. Common Ground : A Pattern Language for Human-Computer Interface Design [online]. Last modified May 17, 1999 [cit. 2010-08-29]. Dostupný z WWW: <http://www.mit.edu/~jtidwell/common_ground_onefile.html>. 12 PRÁVO A INTERNET 12.1 Internet z hlediska práva Je třeba pochopit co vlastně znamená internet z hlediska práva. Rozlišujeme konkrétní subjekty práva – ISOC, IAB, provozovatelé jednotlivých sítí, poskytovatelé služeb, uživatelé, atd., dále pak věci – hardware, tedy optická vlákna, kabely, telefonní linky, servery, satelity, routery, atd. a práva a jiné majetkové hodnoty – práva užívání, databáze, ochranné známky, autorská díla, osobní údaje, atd. Klíčové aspekty internetu z hlediska práva - 12.2 Trans-teritorialita Dobrovolná normativita Anonymita a nízké právní vědomí Neexistence jednotné mezinárodní právní úpravy Vymahatelnost a působnost práva na internetu Právo chápeme jako normativní systém, tedy systém norem regulujících lidské chování, jehož dodržování je vynucováno státem. Otázka rozhodného práva a jurisdikce Trestní právo zákon č. 40/2009 Sb., trestní zákoník (již neúčinný zákon č. 140/1961 Sb., trestní zákon) § 4 Zásada teritoriality Strana 102 (1) Podle zákona České republiky se posuzuje trestnost činu, který byl spáchán na jejím území. (2) Trestný čin se považuje za spáchaný na území České republiky, a) dopustil-li se tu pachatel zcela nebo zčásti jednání, i když porušení nebo ohrožení zájmu chráněného trestním zákonem nastalo nebo mělo nastat zcela nebo zčásti v cizině, nebo b) porušil-li nebo ohrozil-li tu pachatel zájem chráněný trestním zákonem nebo mělli tu alespoň zčásti takový následek nastat, i když se jednání dopustil v cizině. Civilní právo mezinárodní právo soukromé – kolizní norma říká, podle práva jakého státu se bude právní stav posuzovat, rozhodným prvkem může být: - patria – stát, jehož příslušníkem je subjekt locus delicti – místo, kde došlo ke škodní události locus solutionis – místo, kde byl nebo měl být splněn závazek dohoda stran Nařízení Rady (ES) č. 44/2001, článek 5 Osoba, která má bydliště na území některého členského státu, může být v jiném členském státě žalována, 1. a) pokud předmět sporu tvoří smlouva nebo nároky ze smlouvy, u soudu místa, kde závazek, o nějž se jedná, byl nebo měl být splněn; b) pro účely tohoto ustanovení a pokud nebylo dohodnuto jinak, je místem plnění zmíněného závazku: - v případě prodeje zboží místo na území členského státu, kam podle smlouvy zboží bylo nebo mělo být dodáno, - v případě poskytování služeb místo na území členského státu, kde služby podle smlouvy byly nebo měly být poskytovány, c) nepoužije-li se písmeno b), použije se písmeno a); 3. ve věcech týkajících se protiprávního jednání či jednání, které je postaveno na roveň protiprávnímu jednání, u soudu místa, kde došlo nebo může dojít ke škodní události; Nařízení Rady (ES) č. 44/2001, článek 23 1. Dohodnou-li se strany, z nichž alespoň jedna má bydliště na území členského státu, že v již vzniklém nebo budoucím sporu z určitého právního vztahu má příslušnost soud nebo soudy tohoto členského státu, je příslušný soud nebo soudy tohoto státu. Pokud se strany nedohodnou jinak, je tato příslušnost výlučná. Taková dohoda o příslušnosti musí být uzavřena a) písemně nebo ústně s písemným potvrzením nebo Strana 103 b) ve formě, která odpovídá zvyklostem zavedeným mezi těmito stranami, nebo c) v mezinárodním obchodě ve formě, která odpovídá obchodním zvyklostem, které strany znaly nebo musely znát a které strany smluv tohoto druhu v daném odvětví obchodu obecně znají a pravidelně se jimi řídí. 2. Písemné formě jsou rovnocenná veškerá sdělení elektronickými prostředky, která umožňují trvalý záznam dohody. 3. Uzavřou-li takovou dohodu strany, z nichž žádná nemá bydliště na území členského státu, nemohou soudy ostatních členských států rozhodovat, ledaže by zvolený soud nebo soudy příslušnost odmítly. Správní právo - 12.3 kritérium místa zdanitelného plnění finanční právo loterijní právo Pojem duševního vlastnictví Pojem autorských práv a duševního vlastnictví se vztahuje v rámci autorské práva na dílo literární, umělecké a vědecké, databáze, počítačový program. Z hlediska průmyslového práva se jedná o patenty, užitné a průmyslové vzory, vynálezy a zlepšovací návrhy, ochranné známky… 12.4 Autorské dílo Co je autorské dílo? (§ 2 autorského zákona) Autorské dílo je - dílo literární a jiné dílo umělecké a dílo vědecké, které je jedinečným výsledkem tvůrčí činnosti autora a je vyjádřeno v jakékoli objektivně vnímatelné podobě (vysloveno nahlas, napsáno, nakresleno, vymodelováno, pantomimicky naznačeno…), bez ohledu na jeho rozsah, účel nebo význam Autorským dílem je zejména Strana 104 dílo slovesné vyjádřené řečí (proslov) nebo písmem (kniha, báseň, článek), dílo hudební, dílo dramatické a dílo hudebně dramatické (balet), dílo choreografické (choreografie baletu) a dílo pantomimické, dílo fotografické a dílo vyjádřené postupem podobným fotografii, dílo audiovizuální, jako je dílo kinematografické, dílo výtvarné, jako je dílo malířské, grafické a sochařské, dílo architektonické včetně díla urbanistického (soubor budov), dílo užitého umění dílo kartografické (mapa) počítačový program databáze, která je autorovým duševním výtvorem ve smyslu způsobu řazení či výběru dat Autorským dílem není - - námět díla sám o sobě, denní zpráva nebo jiný údaj sám o sobě, myšlenka, postup, princip, metoda, objev, vědecká teorie, matematický a obdobný vzorec, statistický graf a podobný předmět sám o sobě Vedle práva autorů chrání autorský zákon i práva výkonných umělců (herců, zpěváků, hudebníků, tanečníků, dirigentů, sbormistrů, režisérů, artistů). Vyloučení z ochrany autorského zákona (§ 3 autorského zákona) Ochrana se nevztahuje na úřední dílo, jímž je právní předpis, rozhodnutí, opatření obecné povahy, veřejná listina, veřejně přístupný rejstřík a sbírka jeho listin, jakož i úřední návrh úředního díla a jiná přípravná úřední dokumentace, včetně úředního překladu takového díla, sněmovní a senátní publikace, pamětní knihy obecní (obecní kroniky), státní symbol a symbol jednotky územní samosprávy a jiná taková díla, u nichž je veřejný zájem na vyloučení z ochrany, - výtvory tradiční lidové kultury, není-li pravé jméno autora obecně známo a nejde-li o dílo anonymní nebo o dílo pseudonymní (§ 7) Užít takové dílo lze jen způsobem nesnižujícím jeho hodnotu. - Trvání majetkových práv (§ 27 autorského zákona) Majetková práva trvají po dobu autorova života a 70 let po jeho smrti. Bylo-li dílo vytvořeno jako dílo spoluautorů, počítá se doba 70 let od smrti spoluautora, který ostatní přežil. Strana 105 12.5 Zpřístupnění díla prostřednictvím internetu Právo dílo užít (§ 12 autorského zákona) Autor má neomezené právo své dílo užít nebo smlouvou dovolit jinému, aby jeho dílo užil (tzv. licence). Takovou smlouvou ale nezaniká autorovo právo dílo užít, autor jen musí strpět užití díla tím, komu to dovolil. Další osoby smí dílo užít, jen pokud jim to dovoluje souhlas autora nebo autorský zákon. Rozmnožování díla (§ 13 autorského zákona) Rozmnožováním díla se rozumí zhotovování jakýchkoli rozmnoženin (kopií) díla: dočasných nebo trvalých, přímých nebo nepřímých, celého díla nebo jeho části, jakýmikoli prostředky a v jakékoli formě. Forma rozmnoženiny může být zejména tisková, fotografická, zvuková, obrazová nebo zvukově-obrazová, stavba architektonického díla nebo jiná trojrozměrná rozmnoženina anebo forma elektronická včetně vyjádření analogového i digitálního. Sdělování veřejnosti (§ 18 autorského zákona) Sdělováním díla veřejnosti se rozumí zpřístupňování díla v nehmotné podobě, živě nebo ze záznamu, po drátě nebo bezdrátově. Sdělováním díla veřejnosti je také zpřístupňování díla veřejnosti způsobem, že kdokoli může mít k němu přístup na místě a v čase podle své vlastní volby, zejména počítačovou nebo obdobnou sítí. Citace (§ 31 autorského zákona) Je dovoleno užít cizí, již dříve zveřejněné dílo v omezeném a odůvodněném rozsahu, který odpovídá sledovanému účelu, v těchto případech: výňatky děl jiných autorů ve svém díle, výňatky z díla nebo drobná celá díla pro účely kritiky nebo recenze vztahující se k tomuto dílu, vědecké či odborné tvorby za podmínky, že takové užití bude v souladu s poctivými zvyklostmi, Strana 106 při vyučování pro ilustrační účel nebo při vědeckém výzkumu, jejichž účelem není dosažení hospodářského prospěchu. Vždy je však nutno uvést, je-li to možné, jméno autora, název díla a pramen. 12.6 Stahování díla z internetu tzv. volná užití (§ 30 autorského zákona) Užití díla pro osobní potřebu fyzické osoby, jehož účelem není dosažení hospodářského prospěchu, je možno činit zcela volně, protože není „užitím“ díla podle autorského zákona (které je možné činit jedině se souhlasem autora díla). Stejně tak není porušením autorského práva, pokud kdokoli pro svou osobní potřebu zhotoví záznam (např. nahrávka živého koncertu), rozmnoženinu (např. kopie CD) nebo napodobeninu (např. reprodukce obrazu) díla. Jakékoli šíření těchto záznamů, rozmnoženin a napodobenin už ale autorské právo porušuje. Výše uvedené se ale netýká: užití počítačových programů a elektronických databází pro osobní potřebu a zhotovení jejich rozmnoženiny pro osobní potřebu = počítačový program nebo hru nemohu nainstalovat na více počítačích, než pro kolik je určena, ani CD/DVD s ní zkopírovat zhotovení rozmnoženiny či napodobeniny architektonického díla stavbou = nemohu si postavit kopii stavby navržené architektem bez jeho souhlasu pořízení záznamu audiovizuálního díla při jeho provozování ze záznamu (typicky promítání v kině) = zákaz pořizování tzv. kinoripů 12.7 P2P sítě a autorské právo Technologie p2p A&M Records, Inc. v. Napster, Inc., 239 F.3d 1004 (9th Cir. 2001) The Pirate Bay trial, 2009 (Fredrik Neij, Gottfrid Svartholm, Peter Sunde, Carl Lundström) Strana 107 12.8 Ochrana autorských práv 1. Civilní právo = právo autora obrátit se na soud a žádat zákaz porušování autorského práva a zaplacení peněžitých nároků Práva autora jsou vypočtena v § 40 autorského zákona, jde o: - právo na náhradu škody včetně ušlého zisku právo na vydání bezdůvodného obohacení 2. Správní právo (Přestupkové řízení) = vede se u obecního úřadu, který věc vyšetří, uloží pokutu a případně i povinnost nahradit škodu autorovi § 105a autorského zákona (1) Fyzická osoba se dopustí přestupku tím, že a) neoprávněně užije autorské dílo, umělecký výkon, zvukový či zvukově obrazový záznam, rozhlasové nebo televizní vysílání nebo databázi, b) neoprávněně zasahuje do práva autorského způsobem uvedeným v § 43 odst. 1 (obchází účinné technické prostředky ochrany práv) nebo 2 (drží, distribuuje nebo propaguje zařízení a služby sloužící k obcházení účinných technických prostředků) anebo v § 44 odst. 1 (odstraňuje nebo mění jakoukoli elektronickou informaci o správě práv k dílu nebo takto upravené dílo distribuuje), nebo c) jako obchodník, který se účastní prodeje originálu díla uměleckého, nesplní oznamovací povinnost podle § 24 odst. 6 (oznámit kolektivnímu správci prodej uměleckého díla za více než 1.500 eur). (2) Za přestupek podle odstavce 1 písm. a) lze uložit pokutu do 150.000 Kč, za přestupek podle odstavce 1 písm. b) pokutu do 100.000 Kč a za přestupek podle odstavce 1 písm. c) pokutu do 50.000 Kč. 3. Trestní právo = ochrana společnosti před závažným a systematickým porušováním autorských práv, pachatele stíhá a vyšetřuje policie a před soudem stojí proti státnímu zástupci; autor je v řízení v postavení poškozeného s právem na náhradu škody - trestné činy proti průmyslovým právům a proti autorskému právu, obsažené v zákoně č. 40/2009 Sb., trestní zákoník, v platném znění, mezi trestnými činy hospodářskými Strana 108 - trestní právo stíhá pouze rozsáhlé a závažné porušování autorských práv, protože podle obecného ustanovení trestního zákoníku lze pachatele odsoudit a potrestat jen v případech společensky škodlivých, ve kterých nepostačuje uplatnění odpovědnosti podle jiného právního předpisu (například podle autorského zákona v občanskoprávním řízení) § 270 Porušení autorského práva, práv souvisejících s právem autorským a práv k databázi (1) Kdo neoprávněně zasáhne nikoli nepatrně do zákonem chráněných práv k autorskému dílu, uměleckému výkonu, zvukovému či zvukově obrazovému záznamu, rozhlasovému nebo televiznímu vysílání nebo databázi, bude potrestán odnětím svobody až na dvě léta, zákazem činnosti nebo propadnutím věci nebo jiné majetkové hodnoty. (2) Odnětím svobody na šest měsíců až pět let, peněžitým trestem nebo propadnutím věci nebo jiné majetkové hodnoty bude pachatel potrestán, a) vykazuje-li čin uvedený v odstavci 1 znaky obchodní činnosti nebo jiného podnikání, b) získá-li takovým činem pro sebe nebo pro jiného značný prospěch (500.000 Kč nebo více) nebo způsobí-li tím jinému značnou škodu (500.000 Kč nebo více), nebo c) dopustí-li se takového činu ve značném rozsahu. (3) Odnětím svobody na tři léta až osm let bude pachatel potrestán, a) získá-li činem uvedeným v odstavci 1 pro sebe nebo pro jiného prospěch velkého rozsahu (5.000.000 Kč nebo více) nebo způsobí-li tím jinému škodu velkého rozsahu (5.000.000 Kč nebo více), nebo b) dopustí-li se takového činu ve velkém rozsahu. 12.9 Literatura • Telec, I., Tůma, B.: Autorský zákon. Komentář. 1. vydání, Praha: C.H.Beck. 2007 • Holcová, I., Křesťanová V., Voborník, M.: Ochrana autorského práva, 1. vydání, Olomouc: Univerzita Palackého v Olomouci, 2005 • Čermák, J.: Internet a autorské právo, 2. vydání, Praha: Linde Praha a.s., 2003 • Kříž, J., Holcová,I., Křesťanová, V., Kordač, J.: Autorský zákon. Komentář a předpisy související, 2. vydání Praha: Linde Praha a.s., 2005 • MacQueen, H., Waelde, Ch., Laurie, G.: Contemporary Intellectual Property, Law and Policy, Oxford University Press, 2007 • St. Laurent, Andrew: Understanding Open Source and Free Software Licensing, O'Reilly Media, Inc., 2004 • Rosen, Lawrence: Open Source Licensing, Prentice Hall Professional Technical Reference, 2005 Strana 109 Strana 110
Podobné dokumenty
čeština - Web we want
vzít tuto skutečnost na vědomí a snažit se mladým lidem pomoci naplno využívat možnosti online
technologií pro rozvoj jejich klíčových kompetencí. Možná ještě podstatnější je, aby učitelé mladým
li...
SANFRANCISKÁ DEKLARACE – HODNOCENÍ VÝZKUMU
Zavádění vědeckého přístupu do hodnocení výzkumu
Metody hodnocení výstupů vědeckého výzkumu financujícími organizacemi,
akademickými institucemi a dalšími hodnotiteli je nezbytně nutné vylepšit.
To...
Úvod do informačních zdrojů - Od rozvoje znalostí k inovacím
Předložený materiál sumarizuje informační kurzy, které proběhly v rámci projektu Od rozvoje znalostí k inovacím.
Jejich účastníci si tak mohou připomenout znalosti, které během jejich absolvování n...
Rešeršní!strategie!a!informační!systémy!
Z hlediska na uživatele orientovaných návrhů (user-centered, resp. human-centered)
uživatelských rozhraní a informačních systémů je termín information seeking výstižnější než
termín information ret...
Celý sborník - Nejmenší z nás
Sborník je uveden příspěvkem Květoslava Šipra, který se zabývá vztahem moderních přírodovědeckých poznatků na stanovení počátku lidského života. Ukazuje, že
na základě současného poznání můžeme jed...