Digitální knihovny: principy a problémy
Transkript
Digitální knihovny: principy a problémy Jaroslav Pokorný MFF UK Katedra softwarového inženýrství Praha email: [email protected] J. Pokorný, Knihovny 01 1 Úvod • digitální knihovna - od r. 1994 (elektronická knihovna, virtuální knihovna) • vize: J.C.R. Licklider, 1965 • rozvoj: – knihy (Fox, Arms, …) – časopisy (D-Lib Magazine, Int. J. on DL) – konference (ACM Int. Conf. on DL) – předmět výuky J. Pokorný, Knihovny 01 2 Úvod ? • digitální knihovna jako disciplína knihovníci: další krok v automatizaci knihoven databázisti: architektura federativních databází propagátoři hypertextu: aplikace hypertextové technologie informatici: aplikace workflow systémů propagátoři Webu: Web je digitální knihovna J. Pokorný, Knihovny 01 3 Obsah • • • • • vymezení pojmu digitální knihovny komponenty digitální knihovny architektura digitální knihovny budování digitální knihovny od digitální knihovny k automatizované digitální knihovně • závěr J. Pokorný, Knihovny 01 4 Vymezení pojmu DK Co je společné mnoha definicím: • DK není jednotlivá entita • DK vyžaduje technologii umožňující propojit několik informačních zdrojů • propojení mezi více DK a informačními službami má být pro uživatele transparentní • cílem budování DK je univerzální přístup k informačním zdrojům a službám J. Pokorný, Knihovny 01 5 Vymezení pojmu DK Zde: DK je řízená kolekce informací spolu s jistými službami, přičemž tyto informace jsou uloženy v digitální formě a jsou přístupné po síti Lépe: systém DK J. Pokorný, Knihovny 01 6 komunikace (průchodnost, konektivita) Umístění digitální knihovny ve výpočetním a komunikačním prostoru trajektorie v technologii digitálních knihoven: intelektuální přístup ke globálně distribuovaným informacím počítačové zpracování (flops) digitální obsah méně J. Pokorný, Knihovny 01 více (původ: S. Griffin, NSF) 7 Komponenty digitální knihovny • elementy – data – metadata – procesy • doména ⇒ fyzické, digitální, hybridní knihovny • přístup: onl-line přes knihovnu, přímo, na CDROM (např. ACM a IEEE Digital libraries) J. Pokorný, Knihovny 01 8 Komponenty digitální knihovny data objekty převedené kniha, časopis, z fyzických zdrojů video nové digitální objekty J. Pokorný, Knihovny 01 hypertextová kniha, počítačový program, vizualizace vědeckých dat, elektronický časopis metadata procesy statický index, tezaurus, klasifikace, prostorové umístění akvizice dat, dynamický index, profily uživatelů, anotace zdrojů, tématické portály, ontologie fulltextové vyhledávání, perzonalizace nabídek přírůstků, výběr pomocí agentů katalogizace, vyhledávací služby, výpůjční služby 9 Architektura digitální knihovny klasické konceptuální schéma uživatel uživatel knihovník knihovník tvůrce tvůrce informací/ informací/ vydavatel vydavatel J. Pokorný, Knihovny 01 server server digitální digitální knihovny knihovny klient klient digitální digitální knihovny knihovny 10 Architektura digitální knihovny brány uživatelská rozhraní procesor pro MM/ HT manažer pracovních toků vyhledávací stroje, klasifikátory, … SŘBD data, MM Info J. Pokorný, Knihovny 01 manažer práv přístupu repozitář 11 Architektura digitální knihovny konceptuální schéma s distribuovanými informačními zdroji uživatel uživatel knihovník knihovník tvůrce tvůrce informací/ informací/ vydavatel vydavatel tvůrce tvůrce informací/ informací/ vydavatel vydavatel tvůrce tvůrce informací/ informací/ vydavatel vydavatel J. Pokorný, Knihovny 01 server server digitální digitální knihovny knihovny klient klient digitální digitální knihovny knihovny Internet 12 Architektura digitální knihovny kooperace na různých úrovních Úroveň Způsob kooperace Příklad federace striktní standardy MARC, Z39.50 sklízení dat shromažďování dat vyhledávací middelware J. Pokorný, Knihovny 01 DK nabízí základní metadata, protokol, otevřené archivy registraci DK nekooperují; vyhledávání vyhledávací pomocí služeb stroje zdroje s metadaty jsou volně Z93.50, XML, zapojovány do sítě RDF, SDLIP 13 Federace autonomní DK založené na standardech a dohodách standardy a dohody: • technické: formáty, protokoly, systémy ochrany, apod. • obsahové: data a metadata (včetně sémantiky) • organizační : přístup, služby, placení, autentizace, apod. Př.: Z39.50 a MARC federace jsou potřebné, ale velmi náročné a dost řídké J. Pokorný, Knihovny 01 14 Sklízení dat DK: • poskytují stručná metadata pro každý prvek dat (např. Dublin Core) • podporují jednoduchý protokol pro přístup k metadatům automatičtí ženci: • sklízejí metadata automaticky • budují se automatické služby Př.: Open Archives Initiative J. Pokorný, Knihovny 01 15 Shromažďování dat služby pro otevřený přístup k informacím dokonce i když jejich poskytovatelé se nedohodnou na standardech • vyhledávací robot shromažďuje informace, které jsou otevřené k přístupu a indexuje je • možné jsou automatizované služby (např. ResearchIndex) Př.: Internet Archive, Google J. Pokorný, Knihovny 01 16 Vyhledávací middleware uživatel uživatel ontologie dotaz odpověď mediátor 1 mediátor 3 ontologie 3 mediátor 2 ontologie 1 repozitář 1 informační zdroj 1 J. Pokorný, Knihovny 01 ontologie 2 Z 39.50, repozitář 2 XML, RDF informační zdroj 2 SDLIP 17 Model 5S Societies Scenarios Spaces Structures Streams J. Pokorný, Knihovny 01 18 Model 5S • Společenství: interakce lidí (, počítačů) • Scénáře: služby, funkce, operace, metody • Prostory: domény + omezení (např. vzdálenost, sousedství): 2D, vektory, pravděpodobnost • Struktury: relace, stromy, uzly a hrany • Proudy: posloupnosti prvků (text, audio, video, síťový provoz) J. Pokorný, Knihovny 01 19 5S: kombinace • Společenství + Scénáře = uživatelský model • Společenství + Scénáře + Prostory = uživatelské rozhraní • Proudy + Struktury = značkování • Proudy + Struktury + Scénáře = objekt • Struktury + Scénáře = SŘBD J. Pokorný, Knihovny 01 20 DK zkracuje řetěz mezi autorem a čtenářem autor editor Recenzent vydavatel A&I akvizice knihovna čtenář J. Pokorný, Knihovny 01 21 Přechod od klasické knihovny k digitální • vybudování technické infrastruktury (sítě, technika) • konstrukce digitálních kolekcí (skenování, tvorba metadat, popis zdrojů a jeho kódování, ontologie), • přehodnocení některých klasických knihovnických služeb, případně zavedení zcela nových, které vyžaduje nový způsob zpracování. ⇒ s technologickými problémy se spojují i problémy metodologické a ryze informatické Nové standardy: DC, XML, RDF Další problémy: jména digitálních objektů J. Pokorný, Knihovny 01 22 Absorbování nových forem reprezentace informací do DK objevování informací pomocí Webu: • konkurence knihovně nebo její nový element? anonymní uživatel (knihovny): „Dříve jsem používal Inspec. Nyní místo toho používám Google.“ proč? – širší záběr (šedá literatura, multimediální informace) – lepší řazení – bezprostřední přístup k informacím (např. otevřený přístup k publikaci) J. Pokorný, Knihovny 01 23 Absorbování nových forem reprezentace informací do DK webové vyhledávací služby mají mnoho slabin ------ výběr je velmi libovolný indexování je nahrubo žádné řízení autorit detekce duplicit slabá nízká přesnost (ale vysoká úplnost!) mnoha uživatelům to vyhovuje ... J. Pokorný, Knihovny 01 24 Absorbování nových forem reprezentace informací do DK webové vyhledávání: • výběr každé webové stránky • indexování každého slova • opakuje se každý měsíc rysy: hrubá síla jednoduché algoritmy + škálovatelná výpočetní kapacita J. Pokorný, Knihovny 01 25 Absorbování nových forem reprezentace informací do DK archivace a konzervace Př.: Internet Archive • měsíčně, webový robot sbírá každou otevřenou webovou stránku včetně obrázků • webové stránky jsou konzervovány pro příští generace • soubory jsou dostupné akademickým institucím Problémy: dynamika Webu (poločas rozpadu webové stránky je 2 roky) J. Pokorný, Knihovny 01 26 Absorbování nových forem reprezentace informací do DK vazby pomocí odkazů Př.: ResearchIndex (CiteSeer, ScienceIndex) • tvorba: plně automatická • otevřený přístup ke všemu z informatiky • služba zdarma kontrast k Web of Science • tvorba: kombinace automatických prostředků a odborníků • omezený počet časopisů • velmi drahé J. Pokorný, Knihovny 01 27 Od DK k automatizované digitální knihovně Změny: • v kvalitě knihovnických služeb • v kvantitě knihovnických služeb • nové ekonomické modely • pojem automatizované digitální knihovny J. Pokorný, Knihovny 01 28 Vědecké knihovny jsou drahé Každá z těchto knihoven stojí více než skenování všech jejich knih J. Pokorný, Knihovny 01 29 Vědecké knihovny jsou drahé materiál knihovny J. Pokorný, Knihovny 01 budovy a zařízení personál 30 Potenciál digitálních knihoven otevřený přístup materiál J. Pokorný, Knihovny 01 budovy a zařízení personál 31 4 ekonomické modely Příklad: televizní vysílání Otevřený přístup reklama externí financování komerční televize veřejno-právní televize Omezený přístup předplatné zaplať za použití J. Pokorný, Knihovny 01 kabelová televize zaplať za pořad 32 Příklady staré nové knihy v tisku (předplatné) Amazon.com (reklama) Medline (zaplať za použití) Grateful Med (externí) časopisy (předplatné) archivy ePrint (externí) Westlaw (zaplať za použití) Legal Information Institute (externí) Inspec (předplatné) Google (reklama) J. Pokorný, Knihovny 01 33 Náklady na automatizované digitální knihovny společnost Google • 5.5 milionů vyhledávání denně • 85 lidí (polovina technický personál, 14 má PhD v informatice) • 2,500 PC pod Linuxem, s 80 terabytes na discích Internet Archive • 7 lidí + podpora od Alexa J. Pokorný, Knihovny 01 34 O budoucnosti otevřeného přístupu Dominantní silou bude tlak autorů, který zdůrazňuje spíše otevřený přístup než uzavřený. • bude působit více ekonomických modelů současně • otevřený přístup bude možná ke všem vědeckým či odborným informacím • nejčastější ekonomický model: informace budou publikovány organizací, která je produkuje Organizace, které budou produkovat informace budou univerzity, konference, laboratoře, společnosti atd. J. Pokorný, Knihovny 01 35 Potenciál automatizovaných digitálních knihoven otevřený přístup ? materiál J. Pokorný, Knihovny 01 buildings počítače && facilities sítě personál 36 Nové role vědeckých knihoven Akademické knihovny a asociace by měly poskytovat podporu pro otevřený přístup k informacím: -- zakládat standardy pro kvalitu výstupů výzkumu -- udržovat lokální archivy -- dlouhodobě pečovat o digitální informace a chránit je Důsledek: obnovení primární funkce - být vzdělávací institucí J. Pokorný, Knihovny 01 37 6 trendů místo závěrů Z konference Asociace amerických knihoven, 2000: • Jak zajistit věrohodnost a prestiž digitálních informačních zdrojů? • Jak prohledávat digitální kolekce, které jsou ve více jazycích? • Jak integrovat digitální kolekce, aby samy poskytovaly uživateli další nabídku možností vztažených k jeho problému? • Jak perzonalizovat služby podle profilu a zájmu uživatele? • Jak organizovat, aby informace samy hledaly svého uživatele? J. Pokorný, Knihovny 01 38
Podobné dokumenty
Citace odborné literatury jako nástroj rozvoje služeb a integrace
(SCI) je v podstatě jediným kandidátem, který přichází do úvahy, pokud systém, který směřuje k budování integrovaného informačního celku, míří také k aplikaci citačních vazeb,
které, jak známo, jso...
Úkoly a řešení 2015
soutěžícím naznačit, že úkoly které je letos čekají mají nějakou spojitost se vzduchem, nebo
děním ve vzduchu.
Digitální knihovny: principy a problémy
dokumentů: rozšiřují svůj dosah na artefakty, které nemohou být reprezentovány nebo distribuovány v tištěné formě, např. videa přednášek, hlasové záznamy apod.
V této práci budeme pod pojmem digitá...
Úvod - Robotika.cz
Základní robotické algoritmy pro plánování, lokalizaci
a řízení. Vývojové postupy (simulátor, logy, XPlight)
(cca 5 přednášek)
Grand Challenge — 3D World
Náročnější druhy algoritmů, pravděpodobnost...
zde - Mediální studia / Media Studies
Snad každá komunikační inovace se ve Spojených státech stala v prvních fázích svého rozšíření obětním beránkem, jemuž byl připisován nárůst odcizení mezi lidmi, podíl na pokračujícím rozpadu pospol...
Digitální knihovny: více problémů než očekávání?
Mění se také role digitálních knihoven. Nejde již pouze o tradiční služby podporující informační potřeby jednotlivých uživatelů. Digitální knihovny se stávají součástí např. systémů pro
řízení obsa...
Celý text - Česká společnost pro právo životního prostředí
pokud taková řízení neexistují, do jiných řízení nebo do řízení, která mají být
zavedena pro dosažení souladu s cíli Směrnice EIA. K významné změně Směrnice
EIA došlo přijetím Směrnice Rady 2003/...