Nacházíte se v sekci: SDRUK » Odborné sekce » Sekce pro informační technologie
Zápis z jednání sekce SDRUK pro IT, 13.-14.2.2007, Vědecká knihovna Olomouc
(jednání řídil předseda sekce RNDr. Tomáš Řehák, program jednání sekce vytvořen ve spolupráci se Slezskou univerzitou v Opavě)
Jednání sekce SDRUK pro IT, 13.2.2007
Přivítání (VKOL, doc. J. Kubíček za SDRUK, T. Řehák za sekci IT).
Společná iniciativa Evropské unie založená na strategii i-2010. Původní záměr rozšířen z kulturního dědictví i na vědecké dědictví (otevřený přístup k informacím). Rozhodnutí Evropského parlamentu vedlo k vyjádření Evropské komise, která vypracovala zmíněnou iniciativu 2010. Na počátku nedorozumění, členské státy usilovaly o prostředky na digitalizaci, ale rozhodnutí Komise bylo od počátku stejné, tj. financuje pouze "evropskou přidanou hodnotu" a výsledek spojení národních iniciativ. Naopak na národní úrovni si musí jednotlivé země samy zajistit digitalizaci, zpřístupnění a archivaci.
Očekávání:
Je ale zatím nejasné, jakou podobu a roli má Evropská digitální knihovna mít. Proto byla v únoru 2006 vytvořena pracovní skupina expertů, která se podílela na zpracování doporučení Komise s cílem jasněji formulující dělbu práce na evropské a národní úrovni. (http://ec.europa.eu/information_society/activities/digital_libraries/doc/recommendation/comm_recomm/cs.pdf)
Další rozvolněná doporučení formou indikativní tabulky akcí byla přijata i na národní úrovni, obvykle se ale vytrácí důraz na budování center pro masovou digitalizaci.
Pro 7. rámcový program se připravuje podpora konkrétních institucí a jejich digitalizačních center ("network of excellence").
Základem Evropské digitální knihovny je nyní TEL (http://theeuropeanlibrary.org/), základním komunikačním standardem je OAI-PMH.
Postupně zapojovány do TEL-ME-MOR a jeho pokračování EDL (v rámci programu eContent+). Ukázalo se, že původní hypotéza (staré členské země jsou na tom dobře, nové členské země se podaří začlenit a ostatní ne) neplatí.
Zkoumaná kritéria:
Diskuse: dotaz na problematiku autorských práv.
Důraz na rozšíření mezinárodní spolupráce, jeho rozvoj bude spojen s projektem ENRICH, který byl přijat v druhé výzvě eContent+. Dvouletý projekt jaro 2007-2008. Jednotlivé etapy projektu:
Seznam technických a obsahových partnerů (členové EU i asociovaní členové) v projektu ENRICH.
Dnes už Manuscriptorium obsahuje data ze Slovenska, Turecka, Lotyšska, Polska aj.
Diskuse: zpracování a zpřístupňování mapových sbírek a listin.
přestávka
Informační systém jako celistvý homogenní systém pro komunikaci se všemi uživateli, s ohledem na knihovny byly vyvinuty zejména následující agendy:
Všeobecná spokojenost s užíváním informačního systému, veřejný archiv má řadu výhod (růst kvality prací, zveřejnění výsledků vědy…). V roce 2007 zaměření na uživatelskou studii rozhraní a chování uživatelů.
Nový projekt: digitalizace vybraných starších závěrečných prací (cca 200 tis. stran, o obsahu budou rozhodovat fakulty).
Diskuse: rozsah zveřejňování a plnotextové prohledávání celého informačního systému.
T. Gec - dotaz na možné začlenění diplomových prací do oborových bran ; odpověď - obecně možné je - do budoucna se s ohledem na registr VŠ kvalifikačních prací plánuje doplnění OAI-PMH, se kterým umí Metalib pracovat.stručná charakteristika současné verze systému :
formát METS zapouzdřením umožňuje výrazně rozšířit spolupráci s externími systémy:
Diskuse: na jaké typy dokumentů nelze Kramerius použít?
R. Michálek, J. Polišenský: Jednak musí být definované DTD (NK v roce 2003 definovala ještě muzejní objekty a zvukové dokumenty), jednak musí být podporované a implementované v Krameriovi (jsou nyní pouze monografie a periodika).Ve světě je v rámci formátu METS běžná podpora pro tato schémata popisných metadat:
Pro administrativní metadata:
Lze používat volitelně další dostupná schémata ve všech sekcích (např. EAD).
V NK se nyní rozhoduje o výběru polí, které se budou v jednotlivých sekcích vyplňovat. Výběr perzistentních identifikátorů v Krameriovi by měl proběhnout během letošního roku (hledání schématu, bude se pravděpodobně používat více typů).
Noviny a časopisy uložené v Českém registru reformátovaných dokumentů (viz http://www.nkp.cz/pages/page.php3?page=weba_seznam.htm).
P. Novák, užitečný odkaz ke hledání plagiátů http://www.docoloc.de/.
Otázka vymezení pojmu "šedé literatury", např. zdrojové kódy programů, schémata aj. Problematika zpřístupnění plného textu pak není triviální. Svým pojetím patří šedá literatura do Koncepce trvalého uchování knihovních sbírek.
Národní úložiště šedé literatury budované v STK bude přijímat dokumenty z následujících zdrojů:
Preferovaným komunikačním protokolem bude OAI-PMH nebo vlastní XML rozhraní, popisná metadata bude tvořit Dublin Core, otázkou zůstává výběr formátů dokumentů (pdf, xml, Tex, …). Přidanou službou by bylo dodání plného textu (nejlépe on-line). Pro zapouzdření objektů bude rovněž použit formát METS kontejneru. Značný důraz chce klást STK na možnosti a kontrolu zpřístupnění nejen uživatelům-lidem, ale i uživatelům- agentům. V letošním roce by měl proběhnout kvalifikovaný výběr systému.
Jako bod k podrobné analýze se ukazuje samotná volba formátu PDF. Má řadu verzí a rozšíření samotnou firmou Adobe. Obsahem pdf nemusí být jen text, ale i jiné objekty (audio, video, obrázek, JavaScript aj.). Ve formátu pdf lze zajistit bezpečnost obsahu pdf dokumentu různými způsoby, který z nich zvolit? (plug-in, heslo, …)
Diskuse: otevřena řada témat, která bude třeba v projektu prakticky realizovat.
přestávka
Lze se ztotožnit s příkladem IS MU, který slouží jako vlajková loď, jak by měly být VŠKP zpřístupňovány. Vysoké školy se staví ke zveřejňování různorodě, některé pozitivně, některé negativně (jedná se o citlivý výzkum, obchodní tajemství, postoj archivářů). Pro usnadnění budování repozitářů VŠKP vydala Asociace knihoven vysokých škol ČR několik doporučení, z nichž nejdůležitější je standard popisných metadat. O zpřístupňování byl proveden průzkum v prosinci 2006 formou dotazníkové akce, respondenty byly knihovny (26 odpovědí - 19 univerzit). Okruhy dotazů:
Plánována příprava národního registru (společný projekt 10 škol, koordinátorem VŠE), v rámci RP pro rok 2007. Každá škola bude řešit vlastní problematiku, ale s dopadem na národní registr. V prvním roce se počítá se sběrem metadat do databáze. Projekt ovšem nebyl přijat, a tak nyní školy hledají další možnosti financí.
Pohled na problematiku z hlediska zpracovatele dat, centrálního správce dat a vědce. Od roku 1994 vznik databáze ASEP (bibliografické záznamy publikací ústavů AV ČR). Vybraná data se pravidelně exportují do RIV (každým rokem úpravy podle požadavků Úřadu vlády - některé ústavy se tomu přizpůsobují velmi pružně).
Současné zpracování probíhá v systému ARL (EPCA), katalog je k dispozic na stránkách KNAV ČR. Má možnost připojení plného textu a jeho filtrování. Plný text může být umístěn lokálně, vzdáleně nebo k volně dostupným zdrojům v Internetu. V případě plných textů ze zahraničních impaktovaných titulů se zpřístupňují pouze na půdě dotyčného ústavu.
KNAV ČR má velký zájem na propojování bibliografických záznamů a digitálního obsahu, záleží ale na spolupráci a aktivitě ústavů.
Na začátku bylo odhodlání digitalizovat, podařilo se realizovat z finančních mechanismů EHP/Norska. Schvalování trvalo více než rok a půl. V listopadu 2006 byl poskytnout grant cca 400 tis. EUR na vybudování digitalizačního pracoviště. Cílem pořídit digitální kopie vzácných pragensií a zpřístupnit je.
Projekt je čtyřletý:
V roce 2005 vybavení pracoviště firmou Elsyst Engineering (planetární skener Atlas, sw Atlantis a Sirius). Digitalizace obsahu z fondu MSVK, dále z Archivu města Ostravy, plánuje se spolupráce se Slezským muzeem. Archivace na DVD nosičích, zpřístupnění sw Kramerius (cca 13000 stran - 2 tituly periodik, 18 titulů monografií) ve formátu DJVU.
Cílem vybudovat digitální knihovnu Moravskoslezského kraje, do které budou vybírány dokumenty ve vazbě na Retrospektivní regionální bibliografii.
Časté technické problémy na skeneru Atlas.
Aktuální velikosti digitalizovaných sbírek NK a KNAV.
Instalace: digitální knihovna je instalována v KKV Havlíčkův Brod, SVK Hradec Králové, MSVK Ostrava, KFB Zlín a muzejních knihovnách (UPM Praha, Židovské muzeum, Muzeum východních Čech).
Podpora grafických formátů DJVU, JPEG, PNG, PDF a připravuje se podpora dvouvrstvého PDF. Vyhledávání plného textu prostřednictvím komerčního Convera RetrievalWare (od r. 2007 implementace Lucene). V roce 2006 byla doplněna možnost generování vícestránkových pdf.
Plánovaný vývoj v roce 2007:
Výkon digitalizačního centra v roce 2006: digitalizováno 800 tis. stran, zpracováno 360 tis. stran. Kapacita skenerů je tak k dispozici za příznivé ceny (2 Kč/str. A4 400 dpi, 2,90 Kč/str. A4 600 dpi).
Debata - v rámci debaty dr. Polišenský doplnil, že v tomto roce je plánován vývoj OCR pro oblast periodik z 19. století;
Otázka V. Richtera ohledně software OCR na rozeznávání švabachu; reagoval p. Hermann z fy Elsyst - vzhledem k různorodosti použitých písem je nereálné - i SRN jenom některém typy švabachu
Digitalizace zahájena v roce 2006, spolupráce otevřena s muzejními a zámeckými knihovny. Zájem by byl ze strany muzeí o méně tradiční dokumenty (dopisy, historické hudebniny). Skenovací linku tvoří Atlas+Sirius, pro zpřístupnění chtějí použít Kramerius. Uvítali by DTD pro hudebniny.
Jednání sekce SDRUK pro IT, 14.2.2007
Příspěvek byl věnován aktuálnímu stavu a perspektivám portálu STK s následným otevřením debaty k možnostem dalšího vývoje portálu STM.
Diskuse: možné rozšíření záběru STM
Prezentace je o problematice a možných způsobech evidence statistických údajů této čím dál využívanější části služeb knihoven.
Po obecnějším úvodu byl prezentován:
Diskuse: problematika vhodné statistiky, hlavní otázkou je zadání a způsob výběru vhodných indikátorů
V Richter upřesnil, že pracovní skupina v rámci SDRUKu pro IT by řešila problematiku statistiky el. zdrojů, jinou oblast by řešila pracovní skupina v rámci Sekce SDRUKu pro RF
I. Horová doplnila, že obdobný problém řeší i VŠ knihovny; odpovědnou osobou je pí ing. Katolická, vedoucí sekce AKVŠ pro elektronické zdroje - V. Richter doplnil, že s ní je v kontaktu
K výběru nástroje pro Toplist pro měření návštěvnosti webových stránek upřesnil P. Žabička důvody (Toplist zveřejňuje údaje; Google Analytics - nezveřejňuje; Na vrcholu - od určité hranice se platí); různé hodnoty u vybraných měřených stránek z různých nástrojů - nejdůležitější je použití stejného nástroje u všech knihoven
P. Straka (KJM Brno) - upozornil, že dle zveřejněného metodického pokynu může vykazovat nereálné hodnoty (interval mezi 20.000-600.000 přístupy/měsíc, rozdíl způsobuje počítání přístupu zevnitř a z venku, , horní hranice je dosaženo nastavením domovské stránky KJM jako přednastavené na všech počítačích v knihovně); dále je zde otázka, jak řešit mnohopobočkové knihovny (jak vykázat, když jdu z pobočky na web ústřední knihovny atp.)
T. Řehák - reagoval upozorněním, že variant zkreslení statistik počtu přístupů na website může být více (dle způsobu řešení OPACu); je třeba ustavení pracovní skupiny, která se těmito problémy bude zabývat. Klíčovou otázkou je - Co vlastně chceme měřit?
P. Straka upozornil na další možné problémy s měřením návštěvnosti dle stávající metodiky (intergrace OPACu do webových stránek, způsob řešení webu obecních knihoven - záleží kdo vloží na stránky (problém s informatiky obcí; možné problémy na vnitřní webové síti za firewallem)
M. Svoboda - dle jeho názoru je cílem statistiky měřit návštěvy z venku (virtuální); fyzické osoby (včetně využití různých služeb knihovny) měříme jinou statistikou
V. Richter - u virtuální návštěvníků - jak specifikovat to, co je třeba sledovat
T. Řehák - letos lze předpokládat data nesrovnatelná; hlavní je zadání, co chceme změřit - dle jeho názoru jde o extenzi fyzických návštěv (slouží i jinak, než že do ní člověk přijde)
V. Richter doplnil, že jde o celosvětový problém - SRN vydala až loni některé parametry statistiky
B. Stoklasová doplnila, že v překladu výše zmíněné normy jsou chyby; zkoumání počitadel - zveřejnění v rámci výroční zprávy; dohoda s dodavatelem
T. Gec se zeptal na zadání toho, co sledovat - jde především o virtuální návštěvy z venku (s tím, že využití OPACu + databází typu EBSCO se bude řešit jinak)?
M. Svoboda sdělil, že dle jeho názoru jednoznačně jde o evidenci návštěv zvenku (bez využití OPACu); J. Kaňka se připojil s názorem, že OPAC by měl být sledován zvlášť od virtuálních návštěv
T. Řehák doplnil seznam problémů k řešení o to, zda evidovat i jiné formy přístupů než jenom webové (ftp; emailem)
Závěr debaty - k řešení této problematiky byla ustavena pracovní skupiny pod vedením dr. Víta Richtera ve složení - Martin Vojnar (VKOL), Petr Žabička (MZK), Pavel Straka (KJM Brno), Lukáš Gebauer, Jan Vávra (oba MKP), která bude doplněna o 3 zástupce malých knihoven.
přestávka
Následovala společná prezentace zástupců Národní knihovny (E. Bartůňková, V. Kapsa, J. Pilař, ) a Ústavu výpočetní techniky Univerzity Karlovy (M. Ledinský, J. Pokorný, J. Pavlík)
Na úvod byla stručně představena JIB a její provazba na odkazové zdroje - již realizované oborové brány a a portály (portál EDU.CZ, portál STM, Virtuální umělecká knihovna, Fyzikální portál, Portál životního prostředí, České zoologické bibliotéky, Slovenská knižnica, EconLib, Medvik, Agronavigátor, Česká literatura). Demo viz data/xinha/sdruk/den2/kiv_sdruk3.swf.
Následně zástupci NK E. Bartůňková a V. Kapsa představili parametry aktuálně spuštěných oborových bran KIV a Musica, které zástupci ÚVT UK M. Ledinský, J. Pokorný, J. Pavlík doplnili popisem mechanismu fungování nástroje Metalib, nad kterým oborové brány běží.
Technické řešení OIB
Diskuse -
T. Řehák - dotaz na možnost komunikace Metalibu i jiná než přes Z39.50; J. Pokorný - ano, i jiná rozhraní pro komunikaci (OAI-PMH, částečně zpřístupnění zdroje přes webové rozhraní - podpora open-URL, lze i proprietární rozhraní - pouze ve výjimečných případech s ohledem na množství potřebné práce na intergraci do JIBu)
T. Gec - dotaz k výběru zdrojů do brány KIV (katalogy krajských knihoven, knihovnické časopisy online); E. Bartůňková - zatím nebylo předmětem úvah, na webu je metodika výběru zdrojů, kterou je možno připomínkovat
T. Gec - dotaz na možnost on-line hradit objednávku EDD; M. Svoboda reagoval sdělením, že problematika byla již otevřena a jako problém se jeví určení částky ke složení v okamžiku objednání, kdy ještě výsledná suma není známa; P. Žabička upozornil na možnost strhnout rovnou zálohu z karty a na zavedení systému Pay-pal v ČR
Příspěvek se týkal rozšíření záběru souborného katalogu SKAT o elektronické zdroje (webové i další). V rámci prezentace postupně následovalo:
Diskuse - na téma dalších možností AKS a SK SKAT
N. Andrejčíková - informace o databázi regionálních zdrojů Rapid Library - báze (testovací) - využití některými knihovnami - integrace do JIB?
M. Svoboda - námět - bylo by vhodné otevření SKATu elektronických zdrojů pro další zájemce
V rámci prezentace byly představeny SW nástroje, na kterých funguje Webarchivu a zároveň model jeho práce
Doplňující informace - IIPC- NK členem (vývoj řídí výbor; finanční podpora individuálního vývoje X po ukončení může jednotlivá organizace vývoj uzavřít)
V rámci debaty padl tip na Workflow - smlouvy; spadne do režimu častějšího stahování
Dotaz na přijímání platebních karet (užívání a podmínky užívání karet, hlavně poplatky) - ze zúčastněných zatím nikdo nemá
T. Gec - v rámci BMI by stálo za to propagovat v médiích nějakou službu knihoven na národní úrovni typu Ask your Library, v optimálním případě umístěnou na snadno zapamatovatelné centrální webové adrese typu www.knihovny.cz ; V. Richter doplnil, že před cca 5 lety byla takto konkrétně služba Ask your library propagována
M. Svoboda - námět - stálo by za to vytvořit na webu jakýsi přehled nevyužitých nápadů; V. Richter doplnil možné vystavení zajímavých přednášek, které jejich autor nabízí k prezentaci
T. Gec - námět - v rámci Sekce SDRUK pro IT by stálo za to na webové adrese sekce vystavit přehled vlastního pomocného SW účastnických knihoven, které vznikly v rámci vlastní činnosti IT oddělení a lze ho případně využít i jinde (např. kompletní intranetové řešení čí adresář knihoven)
Příští setkání na úrovni informatiků by mělo proběhnout na podzim opět v Olomouci
Forma velkého setkání - optimální ve stávající podobě 1x za rok; T. Gec navrhl, že kromě automaticky informovaných členů sekce se může v konferenci dotázat na tipy na další vhodné účastníky a tipy na program.