|obsah

|index autorů |  | index názvů |  | index témat | | archiv |

 


 

Knihovna

2009, ročník 20, číslo 1,  s.  30-37


 

Národní úložiště šedé literatury jako součást Digitální polytematické knihovny vědy, výzkumu a vývoje

Petra Pejšová / Národní technická knihovna /
e-mail: p.pejsova@stk.cz, nusl@stk.cz

 

Historie a zkušenosti Národní technické knihovny1

Národní technická knihovna (dále NTK) má dlouholeté zkušenosti se zpřístupňováním elektronických zdrojů, ať již se jedná o databáze, časopisy či knihy. Hlavními projekty

v této oblasti jsou Virtuální polytechnická knihovna2, v současné době se NTK zapojuje do projektu eBooks on Demand3 a je jedním z hlavních organizátorů konsorcií pro přístup ke klíčovým elektronickým informačním zdrojům pro výzkum a vývoj. Zároveň NTK zajišťuje národní vyhledávací portál pro výzkum a vývoj oborovou bránu Technika (dále TECH)4 pro technické a přírodní vědy a stále aktualizuje Polytematický strukturovaný heslář5, který je volně k dispozici pod licencí Creative Commons6. Dalšími aktivitami

v oblasti elektronických zdrojů je digitalizace fondů NTK. V rámci digitalizace se NTK zaměřila na svoji historickou sbírku, časopisy ohrožené "kyselostí papíru" a učební texty, které všechny zpřístupňuje v systému Kramerius7.

NTK na sebe vzala též roli garanta šedé literatury v České republice. Této role se zhostila již v roce 1994, kdy vytvořila Kooperační systém šedé literatury (KSŠL), který byl navázán na evropský systém SIGLE. Po zániku SIGLE v roce 2005 se v NTK zrodila idea Národního úložiště šedé literatury, které se nyní nachází ve fázi pilotní realizace.

Hlavním cílem NTK je všechny tyto elektronické zdroje zastřešit systémem Digitální Národní technické knihovny, který umožní jednotné vyhledávání a zpřístupnění informací ze všech poskytovaných zdrojů.

Strategický projektový záměr v rámci Smart Administration8

V rámci strategických záměrů Smart Administration strukturálních fondů Evropské unie byly sloučeny projekty Digitální Národní technická knihovna a Národní úložiště šedé literatury (dále NUŠL) pod jeden projekt s názvem Digitální polytematická knihovna vědy, výzkumu a vývoje (dále DPK VVV).

Účelem DPK VVV je zajišťovat jednotný přístup k různým druhům digitálních objektů se zaměřením na technické a přírodní vědy. Podstatná komponenta DPK VVV – Národní úložiště šedé literatury – bude v maximálním možném záběru sledovat informace o dokumentech šedé literatury (technické zprávy, výzkumné zprávy, vysokoškolské kvalifikační práce, selektivně i další typy šedé literatury) v celém spektru vědních oborů včetně technických, přírodních a společenskovědních tak, aby nadále nedocházelo ke ztrátám odborných a vědeckých informací v kontextu vědy a výzkumu v České republice.

Projekt se bude zabývat jak digitalizací stávajících tištěných fondů NTK, tak získáváním nových titulů již v digitální formě a zajišťovat archivaci digitálních dokumentů v digitálním repozitáři NTK. Tento článek je zaměřen především na realizaci pilotního projektu NUŠL.

Pilotní projekt Národní úložiště šedé literatury

NTK chce shromažďovat šedou literaturu a doplnit tak funkce NK ČR, jejímž hlavním úkolem je evidovat literaturu publikovanou v ČR (tzv. bílou literaturu) a nepodchycuje a neplánuje podchycovat literaturu polopublikovanou a nepublikovanou (tzv. šedou literaturu). NTK se tohoto úkolu ujala vzhledem k svým předchozím zkušenostem se spoluprací s Evropskou asociací pro využívání šedé literatury – EAGLE (European Association for Grey Literature Exploitation), které byla NTK zástupcem za Českou republiku. EAGLE provozovala Evropský systém informací pro šedou literaturu – SIGLE (System for Information on Grey Literature in Europe), na jehož podporu NTK vytvořila již v roce 1994 Kooperační systém šedé literatury (KSŠL). Tento systém byl založen na smluvním základě a přebíral bibliografické záznamy o šedé literatuře (zejména o disertacích) od kooperujících českých vysokých škol a dalších institucí, převzatá metadata konvertoval do specifického datového formátu SIGLE. Po zániku SIGLE začala NTK vyvíjet iniciativu s cílem zajistit centrální přístup k šedé literatuře na národní úrovni. Tato iniciativa se začala realizovat v roce 2008 díky podpoře Ministerstva kultury České republiky v rámci programových projektů výzkumu a vývoje.

Výzkumný záměr Digitální knihovna šedé literatury – funkční model a pilotní realizace je naplánován na čtyři roky (2008 – 2011). Řešiteli projektu jsou NTK a Vysoká škola ekonomická v Praze (dále VŠE). Jeho cílem je vytvořit funkční model a pilotní aplikaci, která bude sloužit k budování národního repositáře šedé literatury. Na základě ověřené technologie a metod definovaných v rámci projektu budou vytvořeny doporučení a standardy pro další instituce, které se rozhodnou vytvářet digitální repositáře šedé literatury. Doporučení a standardy budou obsahovat zejména doporučený metadatový formát, výměnné formáty a šablony; vzory licenčních modelů a řešené právní problematiky; metodiku ochrany, archivace a zpřístupňování digitálních dat; a webové rozhraní pro spolupráci s producenty šedé literatury. Doporučení a standardy budou publikovány v českém a anglickém jazyce v tištěné formě a na webových stránkách projektu.

NUŠL bude obsahovat záznamy o šedé literatuře z oblasti výzkumu a vývoje, státní správy, školství, komerčního sektoru a "open access". V rámci projektu je jednáno se zástupci systémů zastřešujícími tyto věcné oblasti.

Klíčové postavení Národního úložiště šedé literatury

Cílem NUŠL je doplňovat a navazovat na další projekty, které řeší dlouhodobou archivaci a zpřístupňování digitálních dokumentů v České republice a v zahraničí.

Jedním z těchto projektů je Národní digitální knihovna. Národní knihovna České republiky (NK ČR) vytvořila koncepci České digitální knihovny9 (ČDK) – viz obrázek. Jádrem České digitální knihovny je Národní digitální knihovna (dále jako NDK), která je uprostřed obrázku zobrazena červenou barvou. NDK se orientuje pouze na publikované dokumenty v rámci ochrany kulturního dědictví České republiky. NUŠL bude naopak podchycovat dokumenty oficiálně nepublikované.V základním funkčním schématu koncepce ČDK se NUŠL nachází v tzv. standardní zóně, která předpokládá zastřešení prostřednictvím portálů a souborných katalogů digitálních dokumentů. NUŠL bude jedním z nich. Samotný NUŠL bude přitom sklízet metadata a plné texty z lokálních úložišť oborových, institucionálních a dalších zdrojů v šedé zóně. Zodpovědnost za tyto úložiště i finanční ponesou jednotlivé instituce a jejich zřizovatelé jako jsou resortně příslušná ministerstva.

Obr. č. 1: Schéma České digitální knihovny

Obr. č. 1: Schéma České digitální knihovny

Dalším projektem je Národní registr vysokoškolských kvalifikačníchprací10, o kterém jako zdroji uvažujeme od počátku řešení projektu NUŠL.

Významnou oblastí produkce šedé literatury jsou také ústavy Akademie věd České republiky (AV ČR). V AV ČR není šedá literatura sledována samostatně, je vymezena spolu s ostatními výsledky vědecké činnosti, které jsou vykazovány jednotlivými ústavy v rámci hodnocení vědy (souvisí s dalším financováním těchto vědecko–výzkumných institucí). Tyto výsledky vědecké činnosti jsou sledovány prostřednictvím Automatizovaného systému evidence publikací (dále ASEP)11, který vytváří knihovna AV ČR. NTK již navázala s knihovnou AV ČR spolupráci. Metadata šedé literatury bude možné sklízet přes protokol OAI-PMH12 ze systému ASEP. Získávání plných textů z jednotlivých ústavů AV je nutné zajistit na základě licenčních smluv.

NTK navázala spolupráci s organizací GreyNet13 (Grey Literature Network Service) se sídlem v Amsterodamu. GreyNet byl založen v roce 1992 za účelem pořádání série Mezinárodní konference o šedé literatuře. Po zaniknutí EAGLE se GreyNet snaží o obnovení jejích funkcí, především o znovuobnovení kooperující sítě organizací zabývajících se šedou literaturou. Cílem GreyNetu je usnadnit dialog, výzkum a komunikaci mezi lidmi a organizacemi v oblasti šedé literatury.

GreyNet díky spolupráci s INIST-CNRS14 (Institute for Scientific and Technical Information of the French National Center for Scientific Research) z Francie inicializoval obnovení systému SIGLE, který je nyní znám pod názvem OpenSIGLE15. Nejprve v roce 2006 vznikl prototyp nového systému v open source software DSpace16. V této fázi byly převedeny záznamy z německého FIZ Karlsruhe do DSpace ve francouzském INISTu. Cílem bylo zajistit pokračování přístupu k již vloženým datům. V průběhu roku 2007 a 2008 obdržely GreyNet i INIST žádosti od bývalých členů EAGLE, ale i nových zájemců, o obnovení vkládání dat do systému OpenSIGLE. Prvním krokem bylo v závěru roku 2008 vložení kolekce sborníků z International Conference of Grey Literature za posledních 5 let (GL5 až GL9) do OpenSIGLE včetně plných textů a prezentací. V dalších krocích se GreyNet zaměřuje na vytvoření kooperující sítě institucionálních a obsahově zaměřených repozitářů šedé literatury. INIST zajišťuje vytvoření technologických podmínek a vypracovává metodiky a standardy pro přijímání dat a zajištění linků na fulltexty a externí zdroje. NTK je společně s OSTI-DOE z USA a CABI z Velké Británie prvními kooperujícími organizacemi.

Po fyzickém vytvoření repositáře NUŠL plánujeme též jeho zapojení do projektu DRIVER17 (Digital Repository Infrastructure Vision for European Research), který je nadstavbou nad zapojenými evropskými institucionálními repositáři typu "open access". Jedná se o vyhledávací portál, který vyhledává v článcích, disertacích, knihách, zprávách apod. z více než 200 institucionálních a obsahově zaměřených repositářů z 23 zemí Evropy a v 25 jazycích.

Harmonogram pilotního projektu NUŠL

Projekt NUŠL je naplánován na čtyři roky 2008 – 2011. Celý projekt je rozdělen do tří hlavních etap. První etapa (duben 2008 – červen 2009), která právě probíhá, se zabývá přípravou zadávací dokumentace pro modelovou aplikaci. Tato příprava obsahuje specifikaci metadat, výběr vhodných persistentních identifikátorů,analýzutypologie dokumentů, specifikaci software pro modelovou aplikaci, přípravul icenčních smluv pro spolupráci s producenty šedé literatury, dále vytvoření webových stránek projektu.

V rámci druhé etapy (červenec 2009 – září 2010) proběhne realizace modelové aplikace a její ověření. Třetí etapa (červenec 2010 – prosinec 2011) se zaměří na testovací provoz a na sestavení standardů, doporučení a metod ověřených na provozu modelové aplikace, které budou zpřístupněny jak na webových stránkách projektu, tak vydány formou odborné publikace. V průběhu všech tří etap bude probíhat doplňování informací na webových stránkách projektu, každoročně bude pořádán "Seminář ke zpřístupňování šedé literatury" s cílem informovat a podporovat odbornou diskusi.

Metadatový formát NUŠL

Pro metadatový formát NUŠL jsou stanoveny základní požadavky, kterými jsou jednoduchost, minimum povinných polí a respektování metadatových standardů. V prvním roce řešení projektu proběhla analýza metadatových formátů, ze kterých bude největší množství zdrojových záznamů do NUŠL. Mezi tyto metadatové formáty patří metadatový soubor pro elektronické vysokoškolské kvalifikačnípráce18 (EVSKP-MS), Automatizovaný systém evidence publikací AV ČR (ASEP) a Rejstřík informací o výsledcích19 (RIV) Informačního systému vědy a vývoje. Na základě této analýzy vznikla podkladová analýza pro definici metadatového formátu NUŠL a betaverze 0.2 metadatového formátu NUŠL, která je dostupná na webu projektu a je k ní otevřena odborná diskuse. Díky analýze českých a zahraničních metadatových formátů jsme objevili jejich velkou rozmanitost. Tato rozmanitost nás vede k poznání, že v této oblasti je tolik možností a variant, že metadatový formát pro NUŠL musí být flexibilní formát se schopností absorbovat nové prvky, které se v průběhu let objeví.

Nyní probíhá testování metadatového formátu OpenSigle, jehož první verze nám byla poskytnuta v polovině prosince 2008 Institutem de l'Information Scientifique et Technique (INIST) z Francie, který systém OpenSigle spravuje. Současně jsou připravovány konverzní mechanismy pro převod záznamů z báze NUŠL do báze OpenSIGLE a zvažujeme, jak využít standardy OpenSIGLE pro NUŠL.

Typologie NUŠL

Při tvorbě typologie dokumentů pro NUŠL jsme vycházeli z typologií systémů GreyNet, ASEP a RIV. Při analýze seznamu typů dokumentů bylo zjištěno, že se do těchto typologií promítají různá hlediska jako jsou události (projev, uspořádání, organizace), forma (podání – oznámení, zpracování – překlad, výstupu – výstup), obsah (politické dokumenty), místa (tuzemské, zahraniční), typ formátu (e-text) apod. Proto jsme se rozhodli, že vytvoříme typologii, která bude strukturovaná do více úrovní, aby mohla být lépe vyjádřena jednotlivá hlediska. Předpokládáme, že v NUŠL budou pouze dokumenty "digital born" (tj. vzniklé již přímo v digitální podobě), případně výběrově digitalizované tištěné dokumenty. Základní typologie znázorněná myšlenkovou mapou popisuje veškerá kritéria pro dokumenty, které budou přijímané do NUŠL. Ze základní typologie je dále rozpracována charakteristika druhu dokumentu v samostatné myšlenkové mapě.

 

Obr. č. 2: Základní typologie NUŠL

Obr. č. 2: Základní typologie NUŠL

 

Obr. č. 3: Typologie dle druhu dokumentu

Obr. č. 3: Typologie dle druhu dokumentu

Softwarové řešení

V roce 2008 byly specifikovány požadavky na funkcionalitu software(dáleSW)prodigitální knihovnu šedé literatury a návazné služby, které nyní slouží jako podklady pro výběr softwarového řešení. Požadavky byly specifikovány s ohledem narozvoj pilotního projektu směrem k vytvoření DPK VVV.

Požadavky na software pro NUŠL jsou rozděleny do pěti oblastí:

V souvislosti s přípravou pro výběr SW pro digitální knihovnu šedé literatury byly porovnány požadavky na SW s vybranými systémy pro digitální knihovny z oblasti "open source". Do této analýzy byla zahrnuta následující softwarová řešení: DSpace, Fedora, CDS Invenio, Eprint a Greenstone. Když jsme hodnotili uvedené systémy jen podle jejich vlastností bez ohledu na vhodnost nasazení v našich podmínkách, nejlépe vycházely systémy Greenstone a CDS Invenio, těsně následovány systémem DSpace. Fedora byla v rámci pilotního řešení vyloučena z důvodu nutnosti vysoké náročnosti konfigurace.Systém Eprints je z našeho pohledu jednoúčelový pro menší denní přírůstky důkladně popisovaných vědeckých dokumentů. Pro nasazení v České republice je dostupností služeb a jazykové lokalizace vhodný systém CDS Invenio, který je zároveň velice funkčně bohatý a flexibilní,za což se ovšem platí jeho relativní implementační a provozní složitostí.

Výběr konkrétního SW řešení pro digitální knihovnu šedé literatury bude znám do konce roku 2009.

Identifikátory

V první fázi projektu byla řešena také problematika persistentních identifikátorů.V dostupných českých a zahraničních zdrojích nebyla nalezena srozumitelně a přehledně specifikovaná kritéria pro výběr persistentního identifikátoru.Z tohoto důvodu vznikl jako součást řešení na základě studia dokumentů zabývajících se problematikou identifikátorů dokument s rozhodovacími kritérii a rozhodovací tabulka. Při sestavování rozhodovacích kritérií bylo bráno v úvahu nejen hledisko pro centrální repositář, ale také hlediska lokálních repositářů. V dalším kroku probíhá výběr u každého z kritérií vhodnou variantou pro NUŠL. Definované požadavky pak budou porovnány s existujícími schématy persistentních identifikátorů.

Webové stránky

Na počátku řešení projektu byly vytvořeny webové stránky, které naleznete na adrese http://nusl.stk.cz/. Webové stránky jsou vytvořeny v aplikaci Media wiki a grafického stylu WordPress modifikovaného podle grafického manuálu NTK.AplikaceMediawikipodporuje sdílenou tvorbu obsahu v rámci pracovní skupiny a otevírání diskusních skupin

k jednotlivým tématům směrem k veřejnosti. Na webových stránkách jsou průběžně aktualizovány informace o projektu a zveřejňovány jeho výstupy. Dále zde jsou informace o šedé literatuře z ČR i ze světa, k legislativě spojené s šedou literaturou v ČR, odkazy na portály podporující výzkum a vývoj ve vědě v ČR, on-line sborník ze "Semináře ke zpřístupňování šedé literatury" a informační zdroje šedé literatury. V roce 2009 plánujeme vytvoření anglické verze webových stránek projektu.

Obr. č. 4: Náhled úvodní stránky webu projektu

Obr. č. 4: Náhled úvodní stránky webu projektu

V rámci řešení projektu byla zahájena spolupráce s oborovou bránou TECH20, do které jsou předávány informační zdroje šedé literatury. Oborová brána TECH zajišťuje tam, kde to licence a technické parametry povolují, jejich prohledávání. V této spolupráci se průběžně pokračuje.

E-PRINT - obrázek

Obr. č. 5: Označení informačních zdrojů prohledávaných oborovou bránou TECH

Semináře

V souvislosti s řešením projektu je pořádán Seminář ke zpřístupňování šedé literatury. První ročník semináře se konal 8. října 2008 a navázal na seminář Systémy pro zpřístupňování eVŠKP 2008, který se konal 7. října 2008. Na semináři byl prezentován projekt samotný, stav systémů pro šedou literaturu ve světě, formát PDF a ISO standardy pro dlouhodobé archivování, standardizace otevřených archivů se zaměřením na popis a výměnu agregovaných webových zdrojů prostřednictvím OAI-ORE, autorská práva prostřednictvím licencí Creative Commons a stav implementace persistentních identifikátorů v NK ČR.Všechny prezentace a plné texty přednášek naleznete v on-line sborníku semináře.21

Aktuální stav a plánovaný postup

NTK aktuálně intenzivně pracuje na pilotní realizaci NUŠL, která je jedním z prvků DPK VVV a funkčním základem jejího řešení. Stav řešení je možné sledovat na webových stránkách projektu http://nusl.stk.cz, kde je též možné se zapojit do odborné diskuse. NTK plánuje, že na tuto pilotní realizaci naváže projektem DPK VVV, který zahrne všechny elektronické zdroje poskytované NTK.

NTK sbírá zkušenosti s digitalizací jak starých, tak novodobých textů. Hlavním cílem digitalizace NTK je ochrana původních textů. V současné době NTK zajišťuje digitalizaci a následné zpracování vlastními silami, přičemž se celý tento proces snaží co nejvíce automatizovat. Tímto řešením je však NTK schopná digitalizovat pouze několik procent potřebného fondu a v budoucnu se neobejde bez cílené dotace na tuto činnost.

Zastřešující projekt DPK VVV je evidován v monitoringu Integračního operačního programu EU v rámci Smart Administration. Pro jeho další úspěšný postup plánuje NTK vypracovat studii proveditelnosti a další podpůrné dokumenty.

 

 

Poznámky

1 Do 30. 4. 2009 Státní technická knihovna (STK) viz www.stk.cz

2 http://www.stk.cz/cs/sluzby/vpk/

3 http://books2ebooks.eu/

4 http://tech.jib.cz/

5 http://as.stk.cz:7777/psh/dynamic.jsp

6 http://creativecommons.org/license/?lang=cs

7 http://kramerius.stk.cz/kramerius/Welcome.do

8 http://www.mvcr.cz/docDetail.aspx?docid=20914&doctype=ART&

9 http://www.ndk.cz/koncepce/koncepcetext.pdf

10 http://www.theses.cz/

11 http://www.lib.cas.cz/cs/asep

12 http://www.openarchives.org/

13 http://www.greynet.org/

14 http://international.inist.fr/

15 http://opensigle.inist.fr/

16 http://www.dspace.org/

17 http://www.driver-community.eu/

18 http://www.evskp.cz/standardy/metadata/

19 http://www.vyzkum.cz/FrontClanek.aspx?idsekce=956

20 http://tech.jib.cz/informacni-zdroje/profesionalni-zdroje/seda-literatura

21 http://nusl.stk.cz/sbornik/2008/

 

CITACE:

Pejšová, Petra. Národní úložiště šedé literatury jako součást Digitální polytematické knihovny vědy, výzkumu a vývoje. Knihovna [online]. 2009, roč. 20, č. 1, s. 30-37 . Dostupný z WWW: <http://knihovna.nkp.cz/knihovna91/pejs.htm>. ISSN 1802-8772.

 

Valid HTML 4.01 Transitional

 

 


 

| nahoru | |obsah| | archiv | | domů |

 | index autorů | | index názvů | | index témat |