logo
išči
išči tudi po celotnem besedilu
išči tudi po Europeani
Epošta:
Geslo:
Prijava
 

0 / 0

Zveza bibliotekarskih društev Slovenije

PROST DOSTOP DO DOSEŽKOV SLOVENSKIH ZNANSTVENIKOV

Zbornik prispevkov 4. skupnega posvetovanja Sekcije za specialne knjižnice in Sekcije za visokošolske knjižnice Zveze bibliotekarskih društev Slovenije

OPEN ACCESS TO THE ACHIEVEMENTS OF SLOVENIAN SCIENTISTS

Proceedings of the 4th Joint Conference of the Special Libraries Section and the Academic Libraries Section of the Slovenian Library Association

Ljubljana, 2010

Zbornik prispevkov 4. skupnega posvetovanja Sekcije za specialne knjižnice in Sekcije za visokošolske knjižnice Zveze bibliotekarskih društev Slovenije Druga popravljena elektronska izdaja

Proceedings of the 4th Joint Conference of the Special Libraries Section and the Academic Libraries Section of the Slovenian Library Association Second Revised electronic Edition

Urednika / Editors: Igor Zemljič, Maja Božič

Programski odbor / Programme Committee:

mag. Maja Božič (predsednica), Igor Zemljič (podpredsednik), Peter Čerče, dr. Alenka Kavčič-Čolic, dr. Mojca Kotar, Bojan Oštir, dr. Luka Šušteršič

Organizacijski odbor / Organizing Committee:

Igor Zemljič (predsednk), mag. Maja Božič (podpredsednica), mag. Branka Kerec, Andreja Može, mag. Špela Razpotnik, dr. Mojca Šorn

Za jezikovno pravilnost in vsebino prispevkov odgovarjajo avtorji.

Založila in izdala / Published by: Zveza bibliotekarskih društev Slovenije Zanjo odgovarja / For the publisher: dr. Melita Ambrožič

Zbornik je izšel ob podpori Ministrstva za kulturo Republike Slovenije

CIP - Kataložni zapis o publikaciji Narodna in univerzitetna knjižnica, Ljubljana

655.411:004:65(082)

SKUPNO posvetovanje Sekcije za specialne knjižnice in Sekcije za visokošolske knjižnice Zveze bibliotekarskih društev Slovenije (4 ; 2010 ; Ljubljana)

Prost dostop do dosežkov slovenskih znanstvenikov : zbornik prispevkov 4. skupnega posvetovanja Sekcije za specialne knjižnice in Sekcije za visokošolske knjižnice Zveze bibliotekarskih društev Slovenije = Open access to the achievements of Slovenian scientists : proceedings of 4th Joint Conference of Special and Academic Libraries, Ljubljana, 2010 / [urednika Igor Zemljič, Maja Božič]. -Ljubljana : Zveza bibliotekarskih društev Slovenije, 2010

ISBN 978-961-6683-15-9

1. Gl. stv. nasl. 2. Vzp. stv. nasl. 3. Zemljič, Igor

252883456

PREDGOVOR

Zveza bibliotekarskih društev Slovenije in njeni sekciji se z organizacijo posvetovanja Prost dostop do dosežkov slovenskih znanstvenikov pridružujejo že četrtemu letnemu obeleževanju prostega dostopa (Teden prostega dostopa - Open Access Week, 18. - 24. 10. 2010, www.openaccessweek.org). Organizatorji različnih aktivnosti po vsem svetu želijo v tem tednu raziskovalce, knjižničarje, upravljavce visokošolskih izobraževalnih in raziskovalnih ustanov ter financerje seznaniti s temeljnimi principi in pomenom prostega dostopa do objav in podatkov iz (javno financiranih) raziskav ter do drugih publikacij. Prost dostop je del širšega gibanja odprte znanosti (Open Science), za katero ena od definicij pravi, da se zavzema za transparentnost v metodologiji eksperimentov, opazovanju in zbiranju podatkov, javno dostopnost in ponovno uporabo podatkov, javno dostopnost in transparentnost znanstvene komunikacije (publiciranja) ter uporabo spletnih orodij za poenostavitev sodelovanja znanstvenikov (www.openscience.org).

Prosta dostopnost znanstvenih člankov in monografij je ena najpomembnejših sprememb v znanstveni komunikaciji po pojavu tiskanih znanstvenih revij v 17. stoletju in njihovih elektronskih različic konec 20. stoletja. Pobuda je bila prvič utemeljena v budimpeštanski deklaraciji iz leta 2002 (Budapest Open Access Initiative, www.soros.org/openaccess), ki jo je v znamenje podpore in namena udejanjanja podpisalo 540 organizacij (med njimi ni ustanov iz Slovenije) in preko 5.300 posameznikov (nekaj tudi iz Slovenije). V naslednjih letih so prosto dostopnost podprle še druge izjave na mednarodni, nacionalnih in na ravni ustanov, med njimi leta 2003 Bethesda Statement on Open Access Publishing (www.earlham.edu/~peters/fos/bethesda.htm) in Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities (oa.mpg.de/openaccess-berlin/berlindeclaration.html), v letih 2003 in 2005 UN World Summit on the Information Society: Declaration of Principles and Plan of Action (www.itu.int/wsis/index.html), leta 2004 Organisation for Economic Co-operation and Development (OECD): Declaration on Access to Research Data From Public Funding (www.oecd.org) in IFLA Statement on Open Access to Scholarly Literature and Research Documentation (archive.ifla.org/V/cdoc/open-access04.html).

Definicija prostodostopne publikacije

Za predstavitev značilnosti prostega dostopa do objav se najpogosteje uporabljajo definicije iz budimpeštanske in iz deklaracije iz Bethesde. Osnovni princip prostega dostopa je takojšnja prosta dostopnost rezultatov javno financiranih raziskav na svetovnem spletu brez naročniških ali avtorskopravnih omejitev.

Prostodostopna publikacija ustreza naslednjim kriterijem:

1. Avtor in nosilec materialne avtorske pravice v svetovnem merilu dopuščata vsem uporabnikom prosto, nepreklicno in stalno pravico dostopa do publikacije ter dovoljujeta razmnoževanje, uporabo, razširjanje, prenos in javni prikaz dela, izdelavo in distribucijo

izpeljanih del v katerem koli digitalnem mediju za katerikoli odgovoren namen in dopuščata, da uporabniki naredijo manjše število izpisov za lastno uporabo.

2. Celotna publikacija in vsa dodatna gradiva, vključno z dovoljenjem iz prejšnje točke, so takoj po objavi odložena v vsaj en spletni repozitorij, ki omogoča prost dostop, neomejeno distribucijo, medobratovalnost (interoperabilnost) in trajno hranjenje.

Zlata in zelena različica prostega dostopa

Za zlato različico prostega dostopa (gold open access) velja objava članka v prostodostopni reviji z ustreznim recenzentskim aparatom. V Directory of Open Access Journals (DOAJ, www.doaj.org) je trenutno evidentiranih 5.526 recenziranih prostodostopnih revij različnih področij znanosti, ki omogočajo takojšen prost dostop do člankov v celotnem besedilu (brez plačila za dostop ali embarga). Avtor v tem načinu objave obdrži materialno avtorsko pravico, na izdajatelja prostodostopne revije prenese pravico do prve tiskane in elektronske objave.

Eden od pogojev za večjo razširjenost prostodostopnih revij je razvoj ustreznih ekonomskih modelov s prehodom s plačevanja naročnin oziroma dostopa do elektronskih revij v financiranje objav v prostodostopnem okolju. Austrian Science Fund se je oktobra 2009 odločil za triletno sofinanciranje takojšnje proste dostopnosti objav, ki nastanejo v projektih, ki jih ta ustanova sofinancira, nakar bodo preučili ustreznost tovrstnega načina financiranja. Podobna priporočila sta izdala Research Information Network in Universities UK (oba Velika Britanija) v dokumentu Paying for open access publication charges (2009). V Sloveniji je sofinanciranje shranjevanja znanstvenih vsebin in objavljanja v prostodostopnih revijah že leta 2003 predlagal prof. dr. Franc Viktor Nekrep.

Zelena različica prostega dostopa (green open access) pomeni samoshranjevanje (predvsem) recenziranih člankov (avtorjeva recenzirana končna oblika - postprint), objavljenih v naročniških revijah, v prostodostopne repozitorije (samoshranjevanje/self-archiving s strani avtorjev). Če je avtor prenesel avtorsko pravico na založnika, mu mora slednji dovoliti shranitev recenziranega članka v avtorjevi končni obliki. Trenutno 80 odstotkov svetovnih založnikov to dovoljuje. Stališča posameznih založnikov znanstvene literature do proste dostopnosti člankov, objavljenih v njihovih revijah, so razvidna na strani Sherpa Romeo (www.sherpa.ac.uk/romeo). V hibridnem modelu nekateri založniki naročniških revij omogočajo takojšnjo prosto dostopnost objavljenega članka ob doplačilu avtorja za prost dostop.

V Directory of Open Access Repositories (OpenDOAR, www.opendoar.org) je evidentiranih preko 1.700 prostodostopnih repozitorijev, ki so geografsko zamejeni (evropski, nacionalni), institucionalni ali tematski.

Obvezno shranjevanje objav v prostodostopne repozitorije

Obvezno shranjevanje objav iz javno financiranih raziskav v prostodostopne repozitorije (open access mandate) za določena področja že zahtevata Evropska komisija in Evropski

raziskovalni svet, med ustanovami na primer National Institutes of Health (ZDA), The Wellcome Trust (VB) in CERN (Švica). Zahteve za obvezno shranjevanje podatkov raziskav so še manj pogoste. Za ves svet se podatki o zahtevah financerjev in ustanov zbirajo v Registry of Open Access Repository Material Archiving Policies (ROARMAP, www.eprints.org/openaccess/policysignup).

Koristi prostega dostopa

S prostim dostopom do znanstvenih objav in podatkov je napredek znanosti hitrejši, povečata se lahko obseg in razpon raziskav ter izboljša izkoristek javnega financiranja. Omejitve dostopa do in uporabe rezultatov iz javno in zasebno financiranih raziskav upočasnijo in lahko tudi zmanjšajo kakovost in učinkovitost nadaljnjih raziskav ter izrabo javnih sredstev. Prost dostop za avtorja pomeni lažjo dostopnost njegovih objav, večjo vidnost in posledično večjo citiranost objav (v razponu od 50 do 300 odstotkov večjo v primerjavi s članki, ki so bili objavljeni v naročniški reviji in avtorjeva končna recenzirana različica ni bila shranjena v prostodostopni repozitorij).

Veliki so lahko tudi finančni prihranki. V primerjalni analizi Open access - what are the economic benefits? (2009) je bilo ugotovljeno, da bi Danska pri cenah in številu objav iz leta 2007 v tem letu prihranila 70 mio evrov, če bi danski raziskovalci tega leta v celoti objavljali le v recenziranih prostodostopnih revijah. Za Nizozemsko bi v tem letu prihranek znašal 133 mio evrov in za Veliko Britanijo 480 mio evrov. Podrobnejše analize ekonomskih modelov znanstvenega publiciranja so na primer pripravili britanski JISC (Economic implications of alternative scholarly publishing models: exploring the costs and benefits, 2009), SURF (Costs and benefits of research communication: the Dutch situation, 2009) in DEFF (Costs and benefits of alternative publishing models: Denmark, 2009).

Stanje v Sloveniji

V Sloveniji različne ustanove izdajajo preko 20 prostodostopnih revij, registriranih v Directory of Open Access Journals. Na univerzah je vzpostavljenih nekaj institucionalnih repozitorijev, ki pa se večinoma polnijo z obvezno oddajo visokošolskih del in ne tudi s končnimi različicami objav raziskovalcev. Delujejo s pomočjo različne programske opreme, prav tako ni enotnega načina dostopanja do digitalnih vsebin na spletnih straneh, iskalniki in metapodatkovni modeli so različni. V Digitalni knjižnici Slovenije se v dogovoru z Javno agencijo za raziskovalno dejavnost RS zbirajo elektronske oblike revij, katerih izdajanje sofinancira agencija, in zaključna poročila projektov, glede na zakon o obveznem izvodu publikacij ter povezan pravilnik o oddaji elektronskih publikacij pa tudi doktorska dela. Shranjevanje objav iz javno financiranih raziskav v prostodostopne repozitorije ni zastavljeno kot obvezno s strani slovenskih financerjev ali raziskovalnih ustanov. V celoti je tako le zelo majhen delež objav slovenskih raziskovalcev prosto dostopen preko svetovnega spleta. Slovenija in njeni raziskovalci zato niso deležni dokazanih koristi prostega dostopa do objav in podatkov: država v smislu boljšega izkoristka javnih sredstev, hitrejšega razvoja znanosti in še večje znanstvene prepoznavnosti, raziskovalci pa večje vidnosti in odmevnosti objav.

S posvetovanjem Prost dostop do dosežkov slovenskih znanstvenikov želimo slovenske raziskovalce, vodstva ustanov, financerje raziskav, knjižničarje in informacijske specialiste seznaniti s stanjem v svetu in spodbuditi razpravo o nadaljnjih aktivnostih v Sloveniji za čim hitrejši prehod v okolje prostega dostopa.

dr. Mojca Kotar

PROGRAM

Sreda, 27. oktober 2010

08:00 Registracija

09:00 Otvoritev

Pozdravni nagovori Kulturni program

Uvodni govornik: dr. Franci Demšar, Javna agencija za raziskovalno dejavnost RS

PROST DOSTOP PO SVETU 10:00 Moderator: mag. Stojan Pečlin, Javna agencija za raziskovalno dejavnost RS, Sektor za analize

Prost dostop in razvijajoče se okolje znanstvene komunikacije Iryna Kuchma, EIFL

11:00 Odmor

Informacijski sistem o raziskovalni dejavnosti, repozitorij in nacionalni portal za prost dostop do znanstvenih objav Niamh Brennan, Trinity College Dublin

Uveljavljanje prostega dostopa do rezultatov znanstvenoraziskovalnega dela: pregled pobud in projektov

dr. Bas Savenije, National Library of the Netherlands, SPARC Europe

12:30 Predstavitev sponzorja: Proquest

13:00 Odmor za kosilo

1400 Predstavitev posterske sekcije

' Moderator: Igor Zemljič, Inštitut za novejšo zgodovino

PROST DOSTOP V SLOVENIJI 14:30 Moderatorja: doc. dr. Polona Vilar, Univerza v Ljubljani, Filozofska fakulteta, doc. dr. Jure Dimec, Univerza v Ljubljani, Medicinska fakulteta

Prost dostop in upravljanje avtorskih pravic na slovenskih univerzah dr. Maja Bogataj Jančič, LL.M., LL.M., Intellectual Property Institute, IPI

Prostodostopne znanstvene revije: Acta Chimica Slovenica (http://www.acta.chem-soc.si)

prof. dr. Aleksander Pavko, Univerza v Ljubljani, Fakulteta za kemijo in kemijsko tehnologijo; Slovensko kemijsko društvo

Prostodostopni repozitoriji za shranjevanje znanstvenih objav: Prost dostop do dosežkov slovenskih znanstvenikov prek portala dLib.si (http://www.dlib.si) mag. Zoran Krstulovic, mag. Karmen Štular Sotošek, Daša Pokorn, Narodna in univerzitetna knjižnica

Prostodostopne zbirke podatkov raziskav: Arhiv družboslovnih podatkov in storitve prostega dostopa do znanstvenih podatkov v Republiki Sloveniji (http://www.adp.fdv.uni-lj.si)

doc. dr. Janez Štebe, Univerza v Ljubljani, Fakulteta za družbene vede

Prostodostopna visokošolska dela: Zagotavljanje prostega dostopa do digitalnih virov na Univerzi v Mariboru (http://www.dkum.uni-mb.si) izr. prof. dr. Milan Ojsteršek, mag. Janez Brezovnik, Marko Ferme, Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko, mag. Dunja Legat, Univerzitetna knjižnica Maribor

16:00 Odmor

Specializirane prostodostopne zbirke: Slovenski biografski leksikon v prostem dostopu: med izdelavo in nadgradnjo (http://nl.ijs.si/fedora/sbl) mag. Petra Vide Ogrin, Slovenska akademija znanosti in umetnosti, Biblioteka, 16:30 Jan Jona Javoršek, Institut Jožef Stefan, Odsek za eksperimentalno fiziko osnovnih delcev, Mojca Mlinar Strgar, Slovenska akademija znanosti in umetnosti, Biblioteka, dr. Tomaž Erjavec, Institut Jožef Stefan, Odsek za tehnologije znanja

Specializirane prostodostopne zbirke: Spletni portal SIstory: prost dostop do dosežkov slovenskega zgodovinopisja (http://www.sistory.si) dr. Jurij Hadalin, dr. Mojca Šorn, Inštitut za novejšo zgodovino

Informacije javnega sektorja: Grafična evidenca rabe kmetijskih zemljišč (GERK/RABA, http://rkg.gov.si/GERK)

Alenka Rotter, Tine Petkovšek, Ministrstvo za kmetijstvo, gozdarstvo in prehrano, Grega Milčinski, Sinergise d.d.

Prostodostopna učna gradiva za visoko šolstvo: VideoLectures.NET Marjana Plukavec, Institut Jožef Stefan, Center za prenos znanja na področju informacijskih tehnologij

18:00 Zaključek prvega dne posvetovanja

Četrtek, 28. oktober 2010

PROST DOSTOP IN VREDNOTENJE ZNANOSTI 09:00 Moderator: zaslužni profesor dr. Franc Viktor Nekrep, Univerza v Ljubljani, Biotehniška fakulteta

Pregled politik prostega dostopa Iryna Kuchma, EIFL

Politike prostega dostopa na Irskem Niamh Brennan, Trinity College Dublin

11:00 Odmor

Pogledi, stališča, načrti financerja: Ministrstvo za visoko šolstvo, znanost in tehnologijo: dostop do raziskovalnih podatkov, financiranih z javnimi sredstvi -11:30 trenutno stanje

Petra Tramte, Ministrstvo za visoko šolstvo, znanost in tehnologijo, Direktorat za znanost

Mnenje raziskovalca kot uporabnika prostodostopnih znanstvenih vsebin in možnega avtorja slednjih - področje humanistike: Teža spletne slovenistike prof. dr. Miran Hladnik, Univerza v Ljubljani, Filozofska fakulteta

Mnenje raziskovalca kot uporabnika prostodostopnih znanstvenih vsebin in

možnega avtorja slednjih - področje biokemije

prof. dr. Gregor Anderluh, Univerza v Ljubljani, Biotehniška fakulteta

12:30 Predstavitev zlatega sponzorja: EbscoHost

13:00 Odmor za kosilo

PROST DOSTOP JUTRI

Moderator: Ivan Kanič, Univerza v Ljubljani, Ekonomska fakulteta

Kako začeti: vzpostavitev repozitorija Iryna Kuchma, EIFL

Pilot 7. okvirnega programa Evropske komisije na temo prostega dostopa in projekt OpenAIRE

dr. Mojca Kotar, Univerza v Ljubljani, Univerzitetna služba za knjižnično dejavnost Prost dostop jutri - okrogla miza 17:00 Zaključek posvetovanja

14:00

KAZALO

PREDGOVOR...............................................................................................................................4

PROGRAM ................................................................................................................................... 8

KAZALO.....................................................................................................................................11

Iryna Kuchma

OPEN ACCESS AND THE EVOLVING SCHOLARLY COMMUNICATION ENVIRONMENT.............13

Niamh Brennan

THE CRIS AND THE REPOSITORY; NATIONAL PORTAL FOR OPEN ACCESS TO RESEARCH........19

Bas Savenije

GAINING MOMENTUM FOR OPEN ACCESS: AN OVERVIEW OF INITIATIVES AND PROJECTS . 28 Maja Bogataj Jančič

PROST DOSTOP IN UPRAVLJANJE AVTORSKIH PRAVIC NA SLOVENSKIH UNIVERZAH...............40

Aleksander Pavko

ACTA CHIMICA SLOVENICA - SLOVENSKA ZNANSTVENA REVIJA Z NAJVEČJIM FAKTORJEM VPLIVA.......................................................................................................................................42

Zoran Krstulovic, Karmen Štular Sotošek, Daša Pokorn

PROST DOSTOP DO DOSEŽKOV SLOVENSKIH ZNANSTVENIKOV PREK PORTALA dLib.si.........49

Janez Štebe

ARHIV DRUŽBOSLOVNIH PODATKOV IN STORITVE PROSTEGA DOSTOPA DO ZNANSTVENIH PODATKOV V REPUBLIKI SLOVENIJI..........................................................................................64

Milan Ojsteršek, Janez Brezovnik, Marko Ferme

ZAGOTAVLJANJE PROSTEGA DOSTOPA DO DIGITALNIH VIROV NA UNIVERZI V MARIBORU .. 79

Petra Vide Ogrin, Jan Jona Javoršek, Mojca Mlinar Strgar, Tomaž Erjavec

SLOVENSKI BIOGRAFSKI LEKSIKON V PROSTEM DOSTOPU: MED IZDELAVO IN NADGRADNJO ..................................................................................................................................................94

Jurij Hadalin, Mojca Šorn

SPLETNI PORTAL ZGODOVINA SLOVENIJE - SISTORY: PROST DOSTOP DO DOSEŽKOV SLOVENSKEGA ZGODOVINOPISJA..........................................................................................106

Alenka Rotter, Tine Petkovšek, Grega Milčinski

GRAFIČNA EVIDENCA RABE KMETIJSKIH ZEMLJIŠČ (GERK/RABA, RKG.GOV.SI/GERK)..........111

Marjana Plukavec

VIDEOLECTURES.NET..............................................................................................................120

Iryna Kuchma

OPEN ACCESS POLICIES: AN OVERVIEW................................................................................122

Niamh Brenna

OPEN ACCESS POLICIES IN IRELAND: WHERE IT BEGAN........................................................129

Petra Tramte

DOSTOP DO REZULTATOV RAZISKAV, FINANCIRANIH Z JAVNIMI SREDSTVI - PREGLED STANJA ................................................................................................................................................135

Iryna Kuchma

HOW TO START: SETTING UP REPOSITORIES.........................................................................150

Mojca Kotar

PILOT 7. OKVIRNEGA PROGRAMA EVROPSKE KOMISIJE NA TEMO PROSTEGA DOSTOPA IN PROJEKT OPENAIRE................................................................................................................155

Kristina Hacin-Ludvik, Tjaša Obal

PROSTO DOSTOPNA DELOVNA GRADIVA - POT DO UČINKOVITE IZMENJAVE ZNANSTVENIH INFORMACIJ...........................................................................................................................162

Tomaž Bartol

PROST DOSTOP IN PRENOS SLOVENSKIH BIOTEHNIŠKIH ZNANSTVENIH DOKUMENTOV V SISTEME FAO AGRIS (WEBAGRIS) IN GOOGLE UČENJAK (SCHOLAR).....................................168

Jonatan Vinkler

NOVI PRISTOPI K IZDAJANJU ZNANSTVENE LITERATURE - DIGITALNA KNJIŽNICA PEDAGOŠKEGA INŠTITUTA: OBJAVLJAMO - TUDI NESUBVENCIONIRANE ZNANSTVENE KNJIGE ................................................................................................................................................ 174

Alenka Blatnik, Matija Brumen

EBOOKS ON DEMAND FROM EUROPEAN LIBRARIES.............................................................178

Mojca Mlinar Strgar

SLOVENSKI BIOGRAFSKI LEKSIKON - OZNAČEVANJE BIOGRAFSKIH PODATKOV Z OZNAKAMI TEI........................................................................................................................................................182

Milena Bojadziska

NET AS A RESOURCE OF INFORMATION................................................................................184

OPEN ACCESS AND THE EVOLVING SCHOLARLY COMMUNICATION ENVIRONMENT

Iryna Kuchma

EIFL Open Access programme manager e-mail: iryna.kuchma@eifl.net

UDK: 655.411:004.65

PROST DOSTOP IN RAZVIJAJOČE SE OKOLJE ZNANSTVENE KOMUNIKACIJE

Ključne besede: prosti dostop, znanost, univerze, projekti

Open access seeks to remove price and permission barriers that prevent knowledge from being shared. Open access literature is digital, online, free of charge, and free of most copyright and licensing restrictions. Open access is compatible with copyright, peer review, revenue (even profit), print, preservation, prestige, career-advancement, indexing, and other features and supportive services associated with conventional scholarly literature [1]. Open access benefits researchers, institutions, nations and society as a whole.

Open access journals use a funding model that does not charge readers or their institutions for access. And users can read, download, copy, distribute, print, search, or link to the full texts of the journal articles. For the journal publishers, open access brings increased readership and, with that, increased citations, and maximum visibility and impact for a journal's contents. And it means that the best possible dissemination service is being provided for research.

DK Sahu, the founder and managing director of Medknow, based in Mumbai, India, publishes journals in all areas of medicine, in his »Eight facts and myths about open access journals: an experience of eight years and eighty journals« [2] described his simple business model: The journals are sold on subscription in print form and the contents are made Open Access online as soon as each issue is published. Usage began to rise as soon as articles were available free online. Moreover, usage is from around the world, unlike previously when the journal's audience had primarily been in India and its region. Article submissions also began to rise, as the journal became better known through being Open Access. And again, submissions, which had previously been mainly from India, rapidly became international in nature (50%). Subscriptions also increased as the journal became important on the international stage, and the subscriptions, which previously had been largely confined to India, now came in from libraries across the world. The overall outcome of the Open Access venture has therefore been greater visibility, increased readership, increased submissions and subscriptions, both from international sources, and better impact.

"The Online Guide to Open Access Journals Publishing" [3] provides practical information and tools to support the efforts of scholars and other small teams producing independent

Open Access journals. Co-Action Publishing and Lund University Libraries Head Office have developed the guide with support from the National Library of Sweden and Nordbib. BOAI website lists the series of OSI "Open Access Journal Business Guides" [4] developed by Raym Crow and Howard Goldstein, SPARC Consulting Group, to assist journal developers and publishers.

Raym Crow and SPARC have also produced a report "Income models for Open Access: An overview of current practice" [5] that examines the use of supply-side revenue streams (such as article processing fees, advertising) and demand-side models (including versioning, use-triggered fees). The guide provides an overview of income models currently in use to support open-access journals, including a description of each model along with examples of journals currently employing it.

For researchers, open access brings increased visibility, usage and impact for their work. Dr. Bertalan Mesko, from the Department of Biochemistry and Molecular Biology, University of Debrecen, Hungary, shared his experience with publishing his first paper in PhD (Peripheral blood gene expression patterns discriminate among chronic inflammatory diseases and healthy controls and identify novel targets) [6]:

"^publishing in an open access journal was a real priority for us because we really wanted to get feedback from the scientific communities. So let's see where I shared that paper:

1. Scienceroll.com and also my Hungarian medical blog (MedIQ.blog.hu)

2. Twitter and Friendfeed

3. ResearchGATE

And let's see what happened after that:

• The paper now was the most viewed one in the last 30 days in BMC Medical Genomics.

• It received the "Highly accessed" badge.

• I received many e-mails with relevant questions and I had interesting discussions on Twitter (actually found some collegues who work in the same field).

• I got invitations for collaboration from several international labs.

Before you'd ask, yes, I think it's because we chose an open access journals"

Open access repositories contain research output, not only refereed journal articles, but also theses and dissertations, unpublished reports and working papers, conference and workshop papers, books, chapters and sections, multi-media and audio-visual material, learning objects, datasets, software, patents, etc. Open repositories can be institutional or thematic, they are interoperable (OAI compliant

http://www.openarchives.org/OAI/openarchivesprotocol.html), forming a global research facility, and common metadata protocol allows other web applications, such as text mining and data mining.

Visibility, access, and preservation were the most important motivations to establish a repository cited by institutions participating in a study "Open Repository Development in Developing and Transition countries" conducted by EIFL and the University of Kansas Libraries with the support from the DRIVER project and Key Perspectives Ltd [7]. Other

motivations included the need to evaluate researchers and departments, and as a response to requests from faculty. Among the most important stimulants for the development of the digital repository and its content were:

• Increased visibility and citations for the publications of the academics in our institution (57%);

• Simple and user-friendly depositing process (32%);

• Institutional policy of mandatory depositing (32%);

• Awareness-raising efforts among the academics in our institution (32%);

• Interest from the decision makers within our institution (27%);

• The requirements of research-funding organisations in our country regarding depositing research output in Open Access repositories (16%).

Open repositories publicise an institute's research strengths, providing maximum return on research investment. Institutions can mandate open repositories, speeding development. And open repositories provide an administrative tool for institutions. Open repositories increase impact and usage of institute's research, providing new contacts and research partnerships for authors. Free and open source software is used to set up the repositories and institutions benefit from free technical support for installation and use. There are low installation and maintenance costs, repositories are quick to set up and gain benefits. And repositories provide usage statistics showing global interest and value of institutional research.

Research institutions benefit from open access in the following ways: increased visibility and presence on the Web; increased impact for research; the open access collection in the repository forms a complete record of the research output of the institution in easily accessible form, provides the means for the institution to manage its research programmes more effectively and to measure and assess its research programmes.

About 1 in 5 articles published in 2009 is now available in open access [8].

A number of studies have now been carried out on the effect of open access on citations to articles, showing the increased citation impact that open access can bring [9]. Open access repositories also provide an excellent means for researchers to boost their online presence and raise their profile.

A recent JISC report authored by Alma Swan called »Modelling scholarly communication options: costs and benefits for universities« [10] shows that a single large university could contribute around £3 million each year to the research community as a whole simply by sharing knowledge through a more open route. The study applied Open Access models to a representative group of universities, and reviewed the costs and benefits of each scenario. In terms of modelling, the work does two things: it identifies the costs and benefits of different scholarly communication scenarios; and it quantifies them, that is, it attaches actual values to cost elements in the processes involved and measures what economic outcomes emerge from modelling various scenarios. The outcomes of this modelling vary (eg by university) but, in all cases, Open Access options have the potential to save universities money.

Open repository can be a useful tool in day-to-day research management activities. Once research outputs are stored in the repository departmental research managers can use them as the definitive source of information for promotion panels and appraisals. It is part of a network, both formal and informal. Repositories could be linked to the institutional research management system (IRMS): e. g. data from the finance office for research income, information on staffing from the human resources database and details of postgraduate numbers from the student records system. Using open access institutional repository in this way can lead to resource efficiencies across the institution. Without this arrangement the information about research outputs may otherwise need to be gathered from several individual departments or research groups [11].

Open access provides access to the world's research output, free of financial and other restrictions - a level playing field. It incorporates local research into interoperable network of global knowledge, increases impact of local research, providing new contacts and research partnerships for authors, and removes professional isolation. Open access strengthens economies through developing a strong and independent national science base. There is growing evidence to show that countries also benefit because open access increases the impact of the research in which they invest public money and therefore there is a better return on investment [12]. Society as a whole benefits because research is more efficient and more effective, delivering better and faster outcomes for us all.

According to Cameron Neylon (biochemist, Open Science and Open Access advocate, bringing more experimental techniques to the biosciences, working at the Science and Technology Facilities Council, the UK's major provider and supporter of large scale academic research facilities, including synchrotrons, neutron sources, and high powered lasers), the future of research communication is aggregation.

The National Centre for Text Mining (NaCTeM) is the first publicly-funded text mining centre in the world. It provides text mining services in response to the requirements of the UK academic community. NaCTeM is operated by the University of Manchester with close collaboration with the University of Tokyo. Text mining offers a solution to the challenge of 'data deluge', information overload and information overlook. Some examples:

• The Intute project, co-funded by JISC (Joint Information Systems Committee) and AHRC (Arts and Humanities Research Council), is a joint work between NaCTeM, MIMAS and the Intute Repository Search Project. The aim is to develop an intelligent semantic search service using NaCTeM's text mining tools, which will grant users the benefit of searching within an enhanced subset of the Intute repository, a collection of academic/technical reports under the domain-heading of Bio-medical Science or Social Science.

• FACTA+ is a MEDLINE search engine for finding associations between biomedical concepts.

• MEDIE uses semantic search to retrieve biomedical correlations from MEDLINE.

• Info-PubMed uses a gene/protein dictionary and deep parsing to understand protein interactions.

Apart from open access to research literature it is important to have open access to research data. In February 2010 the Panton Principles for Open Data in Science were launched:

Science is based on building on, reusing and openly criticising the published body of scientific knowledge. For science to effectively function, and for society to reap the full benefits from scientific endeavours, it is crucial that science data be made open. By open data in science we mean that it is freely available on the public internet permitting any user to download, copy, analyse, re-process, pass them to software or use them for any other purpose without financial, legal, or technical barriers other than those inseparable from gaining access to the internet itself. To this end data related to published science should be explicitly placed in the public domain [13].

The benefits of open data, says Peter Murray-Rust, a chemist, are clear: Opening up data allows others to validate or disprove experiments, leads to new scientific insights and gives individuals who created the science new recognition.

»It's commonplace that we advance by building on the work of colleagues and predecessors - standing on the shoulders of giants,« says Pollock, co-founder of the Open Knowledge Foundation and Mead Fellow in Economics, Emmanuel College, University of Cambridge. »In a digital age, to build on the work of others we need something very concrete: access to the data of others and the freedom to use and reuse it.

The authors' vision is that data needs to be used and reused for the maximum benefit, says Neylon, who also serves on the Science and Technology Facility Council. In most cases, scientists are taking public money or money from charity to conduct their research and those entities want to generate meaningful outputs.

»They want to make investments that get the biggest possible return,« says Neylon. »Funders are under pressure to make sure funding outputs are being fully exploited. The public is not impressed with hearing data is not available _ people are appalled when data is not available.« [14].

Some recommendations to researchers, research managers, research funders and libraries:

• Researchers could publish articles in open access journals, self-archive in open access repositories and spread a word about open access;

• Research managers could introduce open access policies, transform subscription based journals into open access journals, set up open access repositories, spread a word about open access;

• Research funders could mandate that publicly funded research is available in open access and develop national open access policies;

• Libraries could set up open access repositories, help researchers and students to self-archive, help to publish open access journals and create open educational resources, help in data curation and sharing, spread a word about open access.

Recommendations to the national governments and international organizations:

1. require open access to publicly funded scientific research (funders mandates),

2. commit to public domain status for publicly funded data,

3. consider a patent policy that does not hinder the process of open innovations,

4. start tracking and rewarding sharing via citations to open articles, data sets, materials, tools,

5. increase funding for library resources and new training for librarians to support data. References

[1] Suber, P. Open Access Overview: http://www.earlham.edu/~peters/fos/overview.htm

[2] Sahu, D. K. (2009) Eight facts and myths about open access journals: an experience of eight years and eighty journals. In: Open Access to Science Publications: Policy perspective, Opportunities and Challenges, 24 March 2009, New Delhi, India. Retrieved from the web site http://openmed.nic.in/3240

[3] The Online Guide to Open Access Journals Publishing. Retrieved from the web site http://www.doaj.org/bpguide

[4] Open Access Journal Business Guides. Retrieved from the web site http://www.soros.org/openaccess/oajguides/index.shtml

[5] Income models for Open Access: An overview of current practice. Retrieved from the web site http://www.arl.org/sparc/publisher/incomemodels

[6] Mesko, B.: How Science 2.0 and Open Access Really Work. Retrieved from the web site http://scienceroll.com/2010/05/25/how-science-2-0-and-open-access-really-work

[7] Open Repository Development in Developing and Transition countries. Retrieved from the web site http://www.eifl.net/cps/sections/services/eifl-oa/oa-news/2010_07_05_report-on-open

[8] Björk, B.-C., Welling, P., Laakso, M., Majlender, P., Hedlund, T., et al. (2010) Open Access to the Scientific Journal Literature: Situation 2009. PLoS ONE 5(6): e11273. doi:10.1371/journal.pone.0011273. Retrieved from the web site http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0011273

[9] Swan, A. (2010). The Open Access citation advantage: Studies and results to date. Technical Report, School of Electronics & Computer Science, University of Southampton. Retrieved from the web site:: http://eprints.ecs.soton.ac.uk/18516/

[10] Swan, A. (2010). Modelling Scholarly Communication Options: Costs and benefits for universities. Project Report. Retrieved from the web site http://ie-repository.jisc.ac.uk/442/

[11] The Briefing Paper written by Wendy White, University of Southampton Library, and edited by Alma Swan for OASIS. Retrieved from the web site

http://www.openoasis.org/images/stories/briefing_papers/IRs_for_research_management_ and_assessment.pdf

[12] John Houghton, Centre for Strategic Economic Studies, Victoria University, Melbourne (2009): Open Access - What are the economic benefits?

A comparison of the United Kingdom, Netherlands and Denmark. Retrieved from the web site http://www.knowledge-exchange.info/Default.aspx?ID=316

[13] The Panton Principles for Open Data in Science. Retrieved from the web site http://pantonprinciples.org

[14] SPARC Innovator: Authors of the Panton Principles - A Call for Open Data in Science (June 2010). Retrieved from the web site http://www.arl.org/sparc/innovator/panton.shtml

THE CRIS AND THE REPOSITORY; NATIONAL PORTAL FOR OPEN ACCESS TO RESEARCH

Niamh Brennan

Trinity College Dublin, Programme Manager, Research Informatics, Ireland e-mail: nbrennan@tcd.ie

UDK: 001.89

INFORMACIJSKI SISTEM O RAZISKOVALNI DEJAVNOSTI, REPOZITORIJ IN NACIONALNI PORTAL ZA PROST DOSTOP DO ZNANSTVENIH OBJAV

Ključne besede: prosti dostop, znanost, CRIS

What is a CRIS?

A CRIS is a Current Research Information System. It may be built in-house or use proprietary software. CRISes are often associated with university Research Offices or with funding councils as they are fundamentally used for research management purposes. As such, many of the original CRISes were »not fit for human consumption«. They wre essentially administrative systems and were not built for public display or interaction. Much of this has changed as can be seen from international developments in CRISs and their extended set of applications. And one of the most interesting developments of recent years is the integration of CRIS systems with Open Access repositories. When you think about this, it makes absolute sense: CRISs are usually treasure troves of information about research projects, their funders and their outputs, particularly publications. A CRIS is likely to be a rich source of metadata - information about information. These data are usually validated and verified institutionally and therefore tend to have a high level of credibility. It makes sense to re-use these data in as many ways as possible.

Who uses CRISs?

CRISs have been developed in countries where there has been a strong tradition of research reporting, such as Norway, The Netherlands, Germany, and Flanders. Some notable examples are FRIDA in Norway, METIS in The Netherlands and FRIS in Flanders. CRISs are receiving a new level of interest in the UK, where they are a recent arrival to institutional research information systems and examples of CRIS are starting to appear in a number of institutions in that country. And of course Slovenia's own innovations in the area of research information management (RIM) are internationally recognised, notably the publication of the Slovenian Research Agency of a calendar of funding calls for an entire year, helping researchers to plan proposals and resources.

EuroCRIS and CERIF

CRIS activities and developments in Europe are strongly associated with the Common European Research Information Format (CERIF). CERIF is considered a standard recommended by the European Union to its Member States1. While CERIF can handle all of the complex relationships involved in research information, at its heart it provides a standardised way to represent the fundamental parts of research information: People, Projects and Publications (along with Organizations, Results (in addition to publications: patents and products), Facilities, and Equipment.

)CRIS

What is CERIF ?

Common European Research Information Format

Funding Programi»e

Publication

(Semantics^

Tntotiol: CERIF 2048 Relea»«

October Sdv 200S MoMcnv, Russia

Figure 1: Brigitte Jorg's representation of CERIF, EuroCRIS CERIF Tutorial, Moscow 2008

The CERIF standard is maintained by the CERIF Task Group, a part of EuroCRIS. EuroCRIS is the European organization responsible for publicising work on CRIS systems and has a strong presence in Slovenia: the highly-successful 9th international EuroCRIS conference was held in June 2008 in Maribor, Slovenia2.

Stuart Bolton's recent report to the UK Joint Information System Council (JISC) on »The Business Case for the Adoption of a UK Standard for Research Information Interchange« summarised a number of national developments as follows:

1 Brigitte Jörg. The Common European Research Information Format Model (CERIF). CRISs for the European e-Infrastructure. Data Science Journal, Volume 9, pp. 24 - 31, Special Issue, Keith Jeffery and Anne Asserson (Eds). August, 2010 http://www.jstage.jst.go.jp/article/dsj/9/0/9_CRIS24/_article

2 http://www.cris2008.org/

FRiDA 3

FRiDA is the national CRIS system for Norway. It is an integrated research environment for the documentation and presentation of research activities, research results and scientific competence. Data from FRiDA is used to generate statistics for research activities at Norwegian universities and information provided by this system plays a major role in the annual research funding of universities. A working group was established in 2008 to look at the possibility of developing a common national research information system.

In 2009 it was decided that a restructured FRiDA named CRISTIN will be the common Research system in Norway which will include up to one hundred and fifty institutions. The main purpose of restructuring the FRiDA system is to make more of the data shared / common between the institutions while at the same time maintaining the institutional view, ownership and responsibility of their data.

FRIS 4

FRIS is a 'crossroads database' centralized at the Ministry in Flanders. The universities interact with this system using CERIF-XML. Some institutions have built CRISs which are compliant with CERIF (CERIF-CRIS) while others have wrapped legacy CRIS and associated systems to provide CERIF interfaces.

Geert van Grootel5 from the Flanders Research Information Space has reported that through FRIS the Flemish Government has found that a highly effective data environment, in which researchers spend 1.25% less time on paperwork, saves €5m per €1bn of publicly-funded R&D money. This is for a population of 22,000 researchers in the region.

The EWI return on investment model carried out in Flanders projects savings of €125 million over the first four years of FRIS and €50 million per annum thereafter.

METIS 6

The Dutch national system is rather more complex that the other examples and is currently being upgraded. The national central search facility, NARCIS, is intended as a one-stop-shop for all Dutch research outputs. Each university has its own instance of the METIS CRIS system which is CERIF based and maintains its own record of the university's research outputs. The national CRIS, DANS (also CERIF based) combines information from all the METIS instances

3 Stuart Bolton, (2010) The Business Case for the Adoption of a UK Standard for Research Information Interchange: a report to JISC. July 2010

http://www.jisc.ac.uk/media/documents/publications/reports/2010/Businesscasefinalrepor t.pdf

4 ibid

5 The Flanders Research Information Space Geert Van Grootel, Flanders Research Information Space, http://www.iua.ie/media-and-events/events-conferences/events/2007/documents/GertVanGrootelPresentation

6 Bolton (2010)

http://www.jisc.ac.uk/media/documents/publications/reports/2010/Businesscasefinalrepor t.pdf

and standardises name, institutions etc. NARCIS harvests information from these and from open access repositories to combine into the national portal.

Summary of international developments7

As noted by Pablo De Castro, across Europe CERIF is starting to see greater uptake. National systems such as METIS, FRIS and FRiDA show a significant national commitment to CERIF. The adoption of the FRiDA system as the basis for a national system which will inform funding decisions is a clear indication that in Norway the CERIF model is seen as robust and capable of developing to meet future demands.

Benefits of CRISs

• Research evaluation

• Resource allocation and rewards (eg Norwegian Model)

• Grant applications

• Research reporting (Single, authoritative source of research information)

• Cost-savings and efficiencies (elimination of duplication)

• Data on research collaboration & University Industry Collaboration (UIC)

CRISs in Ireland

In Ireland there is no national CRIS, yet institutional CRISs are in place in every university in the country and have been extending their applications since 2002. The background to these developments lies in the huge investment in research funding in Ireland, particularly since the beginning of this decade.

• Over the past 10 years expenditure on Higher Education R&D has quadrupled.

• Now reached OECD & EU-25 average HERD intensity ratio.

• between 2004 and 2006 the number of Researchers in Higher Education in Ireland increased by 13%.

Despite the current economic difficulties (or perhaps because of them), the Irish Government recently announced the single biggest investment in R&D in Ireland through the 5th cycle of the Programme for Research in Third Level Institutions with funding of almost €400 million for strategically targeted research. At the same time, a National Research Prioritisation Exercise has been announced and a task force appointed of industry leaders, university and government agency representatives and policy-makers.

All of this has meant an increased need for research information and accountability at the institutional, funder and national levels.

Research information in Ireland has never been just a 'back-room' activity undertaken by and for faceless administrators. There has always been a keen awareness of the need for public accountability and visibility of the results of public research investment. Until Spring

7 Bolton (2010)

http://www.jisc.ac.uk/media/documents/publications/reports/2010/Businesscasefinalrepor t.pdf

this year, the CRISs in Irish universities provided a nightly feed of data to Expertise Ireland8, providing a showcase of national research, with search functionality and an alerting system along with an interface between industry and universities. Expertise Ireland is currently offline while its successor, the National research Platform, is being planned. The National Research Platform is envisaged as bringing together institutional research information, funder data, bibliometric and other evaluation information, open access to research outputs and industry-university liaison. A business and funding model to support this new platform is being sought.

The CRIS at Institutional Level: Trinity College Dublin

The national developments described above, but have a strong foundation in providing services and intelligence in support of local institutional requirements. In 2002, TCD's strategic plan included the following statement:

»A coherent information policy for College to address the needs of management, the Library, e-learning, electronic publications and records management will be developed with a view to having an integrated view of information systems across the whole of College.«

A CRIS or 'Research Support System' was developed in close liaison with the university's research community, who shaped the development of the system in very specific ways. Originally conceived as a system to help manage research projects, our researchers expressed their clear requirements for a CV-driven system which would start by managing research publications first - and work towards eliminating the repeated requests for the same information and duplication of effort. The first principle of this CRIS is to save the time of our researchers and those who support them.

So from the outset the CRIS was:

• CV-driven

• Fully integrated with complementary systems

• initial population from Human Resources records

• updated & enhanced »live« by researcher

• mediated input on-demand (Library-based service)

Developed iteratively over a number of years, the CRIS started by integrating data from internal and external systems, including, by special agreement with Thomson ISI (as it was at the time), the automatic inclusion of bibliographic data from our Institutional Citation Report. Eventually the CRIS was extended to include all research staff and research students. Delivering benefits and time-savings to the individual researcher was paramount and resulted in CV-generation, a personal URL for each researcher, linking of supervisor and student CVs, report generation for multiple purposes, internal grant applications etc. A natural and inevitable development (given the institutional requirement to avoid duplication of data) was the integration of the CRIS with a newly built open access repository.

http://www.expertiseireland.com [currently offline]

8

Summary of the Benefits to the Researcher:

promotion of your research and that of your group, facility to generate and download a personal Curriculum Vitae, a personal URL to link to from your business card or website, a means of creating and maintaining up-to-date publications lists, automatic inclusion in the annual TCD Calendar's list of publications, a means of avoiding repetition in the request-for / provision-of information, an opportunity for your research profile to be exported to the Expertise Ireland portal, details from your RSS profile can be automatically used for your internal grant applications,

»live feed« of information from the RSS onto School web pages,

upload the full text of publications (subject to copyright) directly into TCD's open access digital repository and maximise its audience and impact on the world wide web, comply with funders' mandates for dissemination of research outputs, automatic inclusion in internal research evaluation exercise,

facility for alignment of People, Projects and publications to institutional strategic research themes,

public visibility through Trinity's »Research Showcase«9,

automatic integration of PubMed Feeds and alerts and Web of Science and Scopus APIs.

Joining up the CRIS and the Repository

TARA (Trinity's Access to Research Archive), a Dspace-based Open Access repository, was built in 2006 as a component of an integrated research information system and funded by the university's Research Committee. Facilitating transfer of metadata from the CRIS to the institutional repository was an obvious move. It eliminates duplication of bibliographic metadata and assists the ease of deposit of publications by the provision of a simple »Upload to Repository« button on the CRIS's publications input page.

The result is added value to both the CRIS and the repository: as well as automatically transferring standard bibliographic metadata being to the repository, other data is also passed to the repository such as funder information and the link to the researcher's CV via his/her personal URL. When an open access publication from TCD is found on Google or Google scholar, the link to its authors and their CVs (with past and present research activities and contact details) is found there too.

The integrated system automatically passes the link to the full text open access publication back to the CRIS, and this appears everywhere the CRIS feeds its publications information: webpages, CVs, reports etc.

http://www.tcd.ie/research

9

Figure 2: TCD's CRIS ('Research Support System') & OA Repository (TARA) in an integrated

environment

Where to go from here ...

Trinity College Dublin has recently implemented an Open Access Publications Policy (otherwise known as an Open Access institutional mandate), and the integrated systems will help to monitor compliance with the policy and manage its support.

Funder information feeds directly from the CRIS to the Repository and is now harvested by RIAN: Ireland's National Open Access Research Portal. Plans are underway to ensure compliance with the FP7 OpenAIRE Project's harvesting requirements which will facilitate the inclusion of our data in the forthcoming OpenAIRE Portal for European Framework and European Research Council researh outputs. Funder and research project data are fundamental to harvesting this content.

TCD's integrated CRIS/Repository system has been cloned for the use of an international project, the Irish African Partnership for Research Capacity Building. This project involves all universities on the island of Ireland (North and South) along with the University of Malawi, Makerere University (Uganda), Universidade Eduardo Mondlane (Mozambique) and the University of Dar es Salaam (Tanzania). The CRIS provides a publicly-accessible research register for the partnership, presenting research profiles of the researchers involved. The integrated repository allows for the easy deposit of publications from the CRIS. This system is a core part of the Project's portal and can be seen at http://www.irishafricanpartnership.com. It does not duplicate local systems but instead seeks to re-use data from them while providing and system for partners who currently lack

this type of infrastructure. The Irish African Partnership has worked with eIFL and with the University of Malawi to highlight the need for open access to African research.

RIAN: Ireland's Open Access Research Portal

RIAN, Ireland's new national portal for Open Access to Irish published research10 provides a single point of access to national research publications, and contains content harvested from the institutional repositories of the seven Irish Universities and Dublin Institute of Technology. RIAN is significantly increasing the visibility and impact of Irish research and will expand to harvest content from other Irish Open Access providers as the service develops. RIAN is funded by Ireland's Higher Education Authority Structural Innovation Fund (SIF) and was developed through a sectoral project coordinated by the Irish Universities Association and managed by the Irish Universities Association Librarians Group. Benefits of RIAN:

• it allows enhanced searching and browsing of aggregated content through normalised metadata,

• it provides a showcase for Irish research outputs and assists in maximising the presence of Irish research on the world stage,

• it permits analyses of content and indicators of research publications and the identification of research trends,

• it allows funders to clearly see the open access publications they have funded and to monitor compliance with their open access mandates,

• it can provide for the long-term preservation of research publications and for the establishment of standards of description and maintenance,

• it is a data provider in its own right and will be harvested by external information providers such as DART-Europe (Digital Access to Research Theses Europe)11 and Open AIRE (Open Access Infrastructure for Europe)12.

The future

Integrating CRISs and Open Access Repositories brings together research information and research outputs in new and exciting ways. In Ireland, institutional infrastructures feed into the National Open Access Portal (RIAN) and other external systems. They complement and will integrate with the National Research Data Project13, a project which aims to provide a standardised and authoritative source of hard data focusing on bibliometrics and other information about Irish research. Ultimately it is planned that these systems and resources will come together in a unified National Research Platform, which will provide a single point of access to all information about research in Ireland to the benefit of funders, researchers, universities, policy-makers, industry and the Irish public.

The National Research Platform will be the realisation of one year's intensive collaboration by people from every sector in Ireland who are engaged with research and development -

10 http://www.rian.ie

11 http://www.dart-europe.eu

12 http://www.openaire.eu/

13 http://www.iresearch.ie

representatives of industry, academia and government - brought together in an unprecedented way through the vision and dedication of Dr Celia Gallagher, Director of the National Research Platform Project, whose untimely death this year continues to be such a terrible loss to us.

Bibliography

Bolton, S. (2010) The Business Case for the Adoption of a UK Standard for Research Information Interchange: a report to JISC. July 2010. Retrieved from the web site http://www.jisc.ac.uk/media/documents/publications/reports/2010/Businesscasefinalrepor t.pdf

Castro, C. di. (2010). Sonex Working Group. Retrieved from the web site

http://sonexworkgroup.blogspot.com/2010/06/cris2010-aalborg-brief-report.html

EWI in Flanders (Website: accessed October 19th 2010) Flanders ROI Modelling. Retrieved

from the web site http://www.ewi-vlaanderen.be/en/landschap/about-ewi-flanders

CERIF 2008 (2008). Retrieved from the web site http://www.eurocris.org/fileadmin/cerif-2008/CERIF2008_1.0_FDM_forReview.pdf

Jörg, B. (2010). The Common European Research Information Format Model (CERIF). CRISs for the European e-Infrastructure. Data Science Journal, 9 (spec. iss), 24 - 31. Retrieved from the web site http://www.jstage.jst.go.jp/article/dsj/9/0/9_CRIS24/_article

Elly Dijk 'NARCIS: linking CRISs and OARs in the Netherlands: a matter of standards and identifiers Retrieved from the web site

http://www.onderzoekinformatie.nl/nl/oi/papers/position_paper/Position+paper+CNR+May +2010+Elly+Dijk.pdf

EuroCRIS (2008). Get the Good CRIS Going: Ensuring Quality of Service for the User in the ERA, 9th international Conference on Current Research Information Systems, June 5-7th, 2008 in Maribor, Slovenia. Retrieved from the web site http://www.cris2008.org/

GAINING MOMENTUM FOR OPEN ACCESS: AN OVERVIEW OF INITIATIVES AND PROJECTS

Dr. Bas Savenije

Director General of the KB, the National Library of the Netherlands e-mail: bas.savenije@kb.nl

UDK: 655.411:004.65

UVELJAVLJANJE PROSTEGA DOSTOPA DO REZULTATOV ZNANSTVENORAZISKOVALNEGA DELA

Ključne besede: prosti dostop, avtorske pravice, projekti

Introduction

The Open Access discussion is mainly concerned with academic publishing. In order to make clear the historic perspective of academic publishing, we must go back more than 330 years. In 1665 the first issue of Journal des Sgavans, the first scholarly journal, is published. A year later it is followed by a second journal, Philosophical Transactions. Both appear not in Latin but in the vernacular language, a quite unusual phenomenon during those days. The reasons to start these endeavors were the need for scientists to record research results, making known that it was their result and to communicate with their peers about these results (Guedon, 2001).

A major factor in the start of scholarly journals was the rising number of researchers. Similarly important was the influence of Francis Bacon who had been successfully advocating the use of systematic and empirical scientific inquiry and who had emphasized the significance of exploring written sources. In order to stimulate the process of building on each other's findings as well as to avoid duplication of efforts scientists needed to be informed on the results achieved and collected by their colleagues.

Of course there were books, but as a carrier for scientific information they had some disadvantages. Their main drawback — an aspect related to their volume — was their sluggishness due to precious time lost in producing them. Books also featured a definite character. Therefore, they tended to be less suitable for discourses on detailed investigations, especially if the facility of additions, comments and reply was useful.

As such, the need for communication among scholars has always been the very raison d'etre of the scholarly journal. Editors were appointed to judge the quality of the contributions. Due to differences in evaluations, a hierarchy was gradually emerging as some editors proved to be more critical since they had decided to introduce stricter selection conditions. Thus, a number of journals were acquiring a comparatively better reputation.

Consequently, scientists started deriving their stature from the reputation of the journal to which they contributed. This difference even led to the ascension of a ranking system. And finally, the ranking system resulted in playing a significant role in the evaluation of scientific papers and articles, a role that is now firmly established.

As a result, scholarly journals have become a distinct factor in evaluating academic research programs and sometimes even are the base for the funding of research groups and decisions about tenure for the researchers involved.

»Publish or perish« is an adage that we are all familiar with. It is mirrored by the growth in the number of scientific papers. As a consequence of this growth, the traditional publishing system became troubled by a number of problems. One of the main problems is that the system is sluggish: it takes at least six months, sometimes up to a year and a half, before a submitted paper actually appears.

Consequently, innovation of the system has become necessary and, in principle, that innovation is easy with the help of modern information technology.

Traditionally, the added value of the publisher has two crucial aspects: the quality assessment by the organization of peer review, and the distribution which mainly took place through intermediaries and libraries. The distribution of print publications was a hazardous undertaking which involved financial risks. But thanks to modern technology distribution has become easy and there is no longer a financial risk involved.

Scientists want to communicate with each other and nowadays distribute their publications to their colleagues themselves. The quality assessment, however, remains an important reason of being for the scholarly journals, because it is an important aspect of research evaluation: scientists feel that they depend on the existing system.

In the past decade this situation has led to a number of initiatives to innovate the traditional model of scholarly publishing. The first innovations were initiatives of the academic community itself, but gradually also the traditional publishers took part in the innovation. A number of these innovations are not only technological: also new business models are being discussed and/or implemented. The general background for these innovations is that the results of scientific research should become better accessible. Often Open Access is one of the objectives of these initiatives.

The Berlin Declaration is often seen as the start of the involvement of research organisations in the Open Access movement. Originating from 2003, it has been signed by numerous organisations and institutions. According to the Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities (http://oa.mpg.de/openaccess-berlin/berlin_declaration.pdf) a publication can be considered to be Open Access when the following conditions are met: 1. The author(s) and copyright holder(s) grant(s) to all users a free, irrevocable, worldwide, perpetual right of access to, and a license to copy, use, distribute, transmit and display the work publicly and to make and distribute derivative works, in any

digital medium for any responsible purpose, subject to proper attribution of authorship, as well as the right to make small numbers of printed copies for their personal use.

2. A complete version of the work and all supplemental materials, including a copy of the permission as stated above, in an appropriate standard electronic format is deposited (and thus published) in at least one online repository using suitable technical standards (such as the Open Archive definitions) that is supported and maintained by an academic institution, scholarly society, government agency, or other well-established organization that seeks to enable open access, unrestricted distribution, inter operability, and long-term archiving.

While Open Access is initiated within the research community to improve access to and impact from scholarly publications, it has clear advantages in order to diminish the information divide. This divide can be observed even in well developed countries, While most universities in these countries have access to the content of the most important publishers, other organisations have serious trouble in getting the relevant content for acceptable conditions; for instance health institutions, patient organizations, vocational schools or individuals in terms of lifelong learning.

There is also an information divide between countries. Many countries cannot afford the prices especially for the so called Big Deals and there are hardly any examples of national licenses for acceptable prices.

The Australian economist John Houghton has investigated for Australia, the UK and the Netherlands what would be the savings for the national economy if scholarly communication would be entirely Open Access. At the moment, research universities and polytechnics pay millions of euros every year for access to scientific and scholarly publications. Businesses, smaller polytechnics, and other organisations often cannot afford the expensive licenses needed for access. If the Open Access model were to be applied globally, there would be increased access to research results for both researchers and the public at large. For instance, Houghton's study Costs and Benefits of Research Communication: The Dutch Situation compares three publication models. The greatest advantage is offered by the Open Access model, which means that the research institution or the party financing the research pays for publication and the article is then freely accessible. Adopting this model could lead to an annual saving of € 133 million. Even if the Netherlands were the only country to adopt this publication model and continued to pay for licenses to access periodicals, there would still be a saving of € 37 million. The report concludes that the advantages would not just be in the long term; in the transitional phase too, more open access to research results would have positive effects. (Houghton, 2009)

Looking at Open Access initiatives we can distinguish two different strategies that clearly are complementary:

1. Open Access Journals: these are journals without a subscription fee, in other words journals available without any costs for the reader (often called the Golden Road to Open Access). Although the Open Access movement started with journal articles, gradually also Open Access monographs are being published.

2. Self archiving: scientists archive their publications in freely accessible digital archives (repositories, often called the Green Road to Open Access). At this moment numerous university libraries maintain a so-called institutional repository: a digital archive of the scientific publications of their parent institution, freely accessible to everyone.

Open Access journals

Today there are at least 5.190 Open Access journals with a quality assessment procedure in which peers are involved. An overview of these journals can be found in the Directory of Open Access Journals (DOAJ: http://www.doaj.org), maintained by the University Library of Lund in Sweden.

Sometimes a journal is born as an initiative of one ore more researchers who receive technical support from a library, computing centre or university press. Other journals are founded as an initiative of one or more research institutes which also provide financial support. For the start of an Open Access journal the following elements are essential: an editorial board, responsible for the content; a service provider, responsible for the infrastructure, the marketing and other services; and finally a business model which determines how income can be generated to cover the publishing costs.

A number of high quality Open Access journals are published by the Public Library of Science (PLoS: http://www.plos.org). PLoS has been started as a movement of scholars, but later received funds to start high quality journals in the field of Biology and Medicine.

There are also a number of commercial publishers of Open Access journals. A well known commercial Open Access publisher is BioMed Central (http://www.biomedcentral.com) which recently has been taken over by Springer.

In general it can be stated that the present models for impact assessment, based on the citations of a journal in the past, are an obstacle for new journals to enter the market, because the system is rather conservative. And because these models are used in research evaluations, researchers are more or less dependent on them and therefore often prefer traditional journals for their publications. There have been project to develop more sophisticated models for the usage of digital publications, but they have not resulted in a sustainable service.

A good example is the MESUR project which major objective is enriching the toolkit used for the assessment of the impact of scholarly communication items, and hence of scholars, with metrics that derive from usage data (http://www.mesur.org).

To remove this obstacle for new journals to enter the market, it is also suggested that new journals should get an impact factor on the basis of the quality of the editorial board.

An interesting aspect of Open Access journals is their business model: the way they cover their costs. They all have in common that the reader does not have to pay anything. But in essence, Open Access publishing is not cheaper than subscription based publishing. We can

distinguish a number of different financing models which also can be combined. The model is most frequently used, is that of Article processing costs: the author or his institution pays in order to get his article published. Examples are the New Journal of Physics ($ 1.100), BioMed Central ($ 1.550) and the Public Library of Science ($ 1.350 - 2.900). Other sources of income are institutional membership (an institution pays a fee in order to buy the right for his employees to publish in one or more journals) and institutional sponsorship (an organisation pays (part of) the costs of a journal because of the positive effects for the image of the organisation involved). Finally there are sources of income like grants and advertisements.

Long-term preservation of scholarly publications is of major importance for the research community. New formats of scholarly publications, new business models and new ways of dissemination are constantly being developed. To secure permanent access to scientific output for the future, cooperation between DOAJ and the e-Depot of the National Library of the Netherlands has been initiated cooperation in order to secure long-term preservation of open access journals.

Talking about Open Access, the debate mostly concentrates on journal articles. Gradually also attention is give to the Open Access publishing of books, for instance in OAPEN (www.oapen.org) Recently, the OAPEN Library is launched, which goals are to promote Open Access book publishing by building a branded collection of Open Access peer-reviewed titles, to increase the visibility and retrievability of high-quality European research and to set quality standards for Open Access books, based on transparent procedures for peer review and recommendations for Open Access licenses.

Repositories

Open Access journals are not the only way towards toll-free access to scholarly publications. Another promising scenario is formed by the phenomenon of institutional repositories: digital collections capturing and preserving the intellectual output of a single or multi-university community. Institutional repositories are a practical, cost-effective, and strategic means for institutions to build partnerships with their faculty to advance scholarly communication.

Institutional repositories build on a growing grassroots faculty practice of posting research online, most often on personal web sites, but also on departmental sites or in disciplinary repositories. This demonstrates a desire for expanded exposure of, and access to, their work.

The rationale for universities implementing institutional repositories rests on two interrelated propositions:

1. New Scholarly Publishing Paradigm.

While institutional repositories centralise, preserve, and make accessible an institution's intellectual capital, at the same time they will form part of a global system of distributed, interoperable repositories that provides the foundation for a new disaggregated model of scholarly publishing.

2. Institutional Visibility and Prestige.

Institutional repositories, by capturing, preserving, and disseminating a university's collective intellectual capital, serve as meaningful indicators of an institution's academic quality.

Setting up an institutional repository is one thing, getting the content is an other. It appears to take a lot of effort to convince scholars that they should upload their articles in a repository and the advantages for the scholars should be clear in order to convince them. Visibility and increased impact are two arguments that are used often, but it is essential that the infrastructure is set up in such a way that the repository is of use in the workflow of the scholars themselves. Several libraries implement this in the context of a so-called virtual knowledge center: a virtual working environment for a research group, fully attuned to their needs (see for instance Wesenbeeck & van Luijt, 2007).

There have been several projects in different countries to increase the number of publications in the repository. Well known examples are Cream of Science and Promise of Science in the Netherlands. After setting up DAREnet, a network of repositories of all Dutch universities, these projects were started. The purpose of the Cream of Science Project was to demonstrate that leading scholars and scientists were not averse to this new development. In fact, the opposite turned out to be true. Ten top scholars and scientists at every institution received a request to assemble their entire oeuvre and make it available via open access in their institution's repository. Their response was enthusiastic; in fact, more scientists and scholars spontaneously volunteered to participate than originally planned. Promise of Science was concerned with doctoral theses. It finally led to the situation in which all Dutch universities demand that all doctoral theses are submitted to the institutional repository (Waaijers, 2007).

There are a small but still growing number of universities and research institutes that mandate the submission of all publications by their researchers in the Open Access repository. This is in line with the Berlin Declaration which states that the results of research financed by public money should be publicly available.

Copyright may pose an obstacle for the Green Road as there may be copyright restrictions in making an e-print freely available. Although the majority of publisher and journals allow authors to archive their work under certain conditions, other publishers are more restrictive. In most cases, when an article is published, the author assigns copyright, or gives a copyright license to the publisher. Depending on the particular agreement that is signed, the author retains more or less rights to use the article. Some agreements forbid the author from photocopying the article, using it in teaching, or mounting it on-line. Other agreements are more liberal and allow the author to retain rights to use the article as they wish. SHERPA (http://www.sherpa.ac.uk/, a British partnership investigating issues in the future of scholarly communication) runs the RoMEO service (Rights MEtadata for Open archiving, http://www.lboro.ac.uk/departments/ls/disresearch/romeo/). RoMEO lists publishers and their associated copyright agreements. You can use the RoMEO service to search for a publisher, or a particular journal, to see what rights are assigned to publishers and which are retained by the author.

With the term e-print we mean a copy of the published article. Also the terms preprint and postprint are used. SHERPA gives the following explanation of the usage of these terms. One usage of the term pre-print is to describe the first draft of the article - before peer-review, even before any contact with a publisher. This use is common amongst academics. Another use of the term pre-print is for the finished article, reviewed and amended, ready and accepted for publication - but separate from the version that is type-set or formatted by the publisher. This use is more common amongst publishers, for whom the final and significant stage of modification to an article is the arrangement of the material for putting to print. A post-print is the version of the paper after peer-review, with revisions having been made.

Most publishers allow the archiving of the pre-print, albeit sometimes with an embargo period. A limited number of publishers also allow the Open Access archiving of the post-print.

SURF and JISC have created alternative license agreements for authors and publishers (http://copyrighttoolbox.surf.nl/copyrighttoolbox/). In these alternatives more rights may remain with the author, among others submitting the post-print in an Open Access repository.

Also Creative Commons licenses offer an alternative (http://creativecommons.org/).

Moreover, in license negotiation between publishers and consortia of research libraries, especially about the so-called Big Deals, Open Access can be introduced as an additional item. An example for this may be the specification of the conditions for uploading the post-prints in an institutional repository. Or an agreement can be made about an experiment on a national basis with hybrid journals, such as between Springer Open Choice and the university libaries in The Netherlands.

Most institutions maintain their own repository, but they do not take care of the long term preservation. On the longer term this is a threat to the availability of scholarly information. That is where the national library could come in. It may offer the possibility to all the institutions in the nation for the storage of the repositories in such a way that also on the longer term access is guaranteed.

When these repositories are stored it is also possible to provide integrate access to all these repositories, directly to the national library's depot. Also a printing-on-demand option can be presented.

Getting from A to B

In order to move from the present situation to a situation in which the majority of scientific communication is Open Access,there is a lot of emphasis on advocacy: explaining to all the stakeholders why such a transition is important and organising and facilitating pilots that show the possibilities and the advantages of Open Access.

SPARC (Scholarly Publishing and Academic Resources Coalition, http://www.arl.org/sparc/) was one of the first organisations to take this up. SPARC is an international alliance of academic and research libraries working to correct imbalances in the scholarly publishing system. Developed by the Association of Research Libraries, SPARC has become a catalyst for change. Its pragmatic focus is to stimulate the emergence of new scholarly communication models that expand the dissemination of scholarly research and reduce financial pressures on libraries. There is also a European branch of SPARC: SPARC Europe (http://www.sparceurope.org/).

Especially for developing and transition countries there is eIFL.net (http://www.eifl.net). eIFL is an international not-for-profit organisation with a base in Europe and a global network of partners. eIFL works with libraries around the world to enable sustainable access to high quality digital information for people in developing and transition countries. Regarding Open Access eIFL is creating awareness and building capacities to launch and sustain open access repositories in order to maximise access and to increase visibility and usage of research output. It also supports the deployment of free and open source software and provides the necessary training, enabling libraries to achieve significant cost savings. Furthermore eIFL is active in negotiations and licensing of commercial e-resources, promoting effective copyright arrangements.

OASIS (Open Access Scholarly Information Sourcebook, http://www.openoasis.org/) aims at providing an authoritative 'sourcebook' on Open Access, covering the concept, principles, advantages, approaches and means to achieving it. The site highlights developments and initiatives from around the world, with links to diverse additional resources and case studies. As such, it is a community-building as much as a resource-building exercise. Users are encouraged to share and download the resources provided, and to modify and customize them for local use. "Open Access is evolving, and we invite the growing world-wide community to take part in this exciting global movement."

An important and well known source on developments in the Open Access movement is Peter Suber's blog: http://www.earlham.edu/~peters/fos/fosblog.html. In several countries organisations of universities and/or research institutions support the Open Access movement. Well known examples are JISC in the UK and SURF in the Netherlands.

It is not difficult to imagine a situation in which all journals are paid through article processing charges. But is far from easy to construct a procedure for the transition from the present situation to this Open Access future. Several publishers, therefore, are using a construction to combine both worlds with so-called hybrid journals. In these cases authors who publish in a subscription based journal, have the option to pay a fee in order to make their article Open Access available. This has added value for the author because it is shown that Open Access publications are cited more often than articles that are only available through a license. Springer Open Choice is an example of such a program and the Open Access fee is $ 3.000. It is the policy of the publisher to reduce the subscription fee worldwide for the additional income the publisher receives out of this program.

In the Open Access movement there is critique regarding this development. One might say that this is a way to put more money in an already expensive system. Although publishers promise to reduce the subscription fee when there is an income from the Open Access program, this is hardly an incentive for an individual institution. That is why Springer started experiments with individual institutes or even countries (the Netherlands) in which all publications from the participants become Open Access without additional costs. The aim is to monitor the effect of this in terms of increase of publications and impact. When such an experiment is extended to a larger number of countries and also to other publishers, this might be a step to a broader transition. Some question, however, the sustainability of this scenario, because non-participating countries might no be willing to pay the traditional subscription fee when part of the content of the journals involved are Open Access available.

An interesting transition model has been created by SCOAP3 (Sponsoring Consortium for Open Access Publishing in Particle Physics, http://scoap3.org/). This is a consortium of High-Energy Physics funding agencies, High-Energy Physics laboratories and leading national and international libraries and library consortia. The aim of the consortium is to facilitate Open Access publishing in High Energy Physics (HEP). In this model, HEP funding agencies and libraries, which today purchase journal subscriptions, federate to explicitly cover its cost, while publishers make the electronic versions of their journals free to read. Authors are not directly charged to publish their articles OA. Each SCOAP3 partner will finance its contribution by cancelling journal subscriptions. The transition to OA will be facilitated by the fact that the large majority of HEP articles are published in just six peer-reviewed journals.

There are also parties that accept the additional costs of the transition to Open Access as a temporary, strategic investment towards a better future. For instance, there is a number of research funding organisations that demand the Open Access availability of publications (possibly with an embargo period of six months) about research that has been financed by them. The Wellcome Trust in the UK was the first to do so. Another example is NIH (National Institutes of Health) in the US. NWO in the Netherlands has no a mandate, but stimulates Open Access publication by providing a budget for the costs involved. In Europe there is EUROHORCs, a European association of the heads of research funding organisations and research performing organisations, which discusses possibilities to extend these developments to a larger scale.

Also the European Commission has created an Open Access pilot, which covers about 20 % of its 7th Framework Program budget. It commits researchers from 7 thematic areas (Health, Energy, Environment, Information & Communication Technology, Research Infrastructures, Socio-economic sciences & Humanities and Science in Society) to deposit their research publications in an institutional or disciplinary Open Access repository, to be made available worldwide in full text.

Repositories can play an important role in the transition. Through repositories the content of the publications becomes worldwide available. Thus the distribution role is taken away from the publishers, who on the longer term might be urged to concentrate on the quality assessment and thus are forged to move away from the subscription based business model.

There are several initiatives to build an international infrastructure for repositories and to create a better visibility of the publications.

OAIster (http://www.oclc.org/oaister/) is a union catalog of millions of records representing open access resources that was built by harvesting from open access collections worldwide using the Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH). Today, OAIster includes more than 25 million records representing digital resources from more than 1,100 contributors. A freely-accessible site for searching only OAIster records is available at http://oaister.worldcat.org/. Additionally, OAIster records are fully accessible through WorldCat.org, and will be included in WorldCat.org search results along with records from thousands of libraries worldwide.

OpenDOAR (Directory of Open Access Repositories, http://www.opendoar.org/) is an authoritative directory of academic open access repositories. Each OpenDOAR repository has been visited by project staff to check the information that is recorded here. This in-depth approach does not rely on automated analysis and gives a quality-controlled list of repositories. As well as providing a simple repository list, OpenDOAR lets you search for repositories or search repository contents.

There are numerous activities on a national basis. A good example is Scielo (Scientific Electronic Library Online, http://www.scielo.br/), an electronic library covering a selected collection of Brazilian scientific journals. The project envisages the development of a common methodology for the preparation, storage, dissemination and evaluation of scientific literature in electronic format. The objective of the site is to implement an electronic virtual library, providing full access to a collection of serial titles, a collection of issues from individual serial titles, as well as to the full text of articles.

COAR (Confederation of Open Access Repositories, http://coar-repositories.org/) is a membership organisation; its mission is to lobby for repositories, their networks and repository based e-infrastructures at the national and international level. Its main aims are:

• development and support of interoperable standards for national aggregation of research content in open access repositories;

• support and coordination of global collaborative efforts towards high-quality Open Access data and interoperable systems;

• Promotion of a joint global data store of Open Access repositories to enable and support the open re-use of data by service and portal providers.

OpenAIRE (Open Access Infrastructure for Research in Europe, http://www.openaire.eu/) is a three-years project funded under the 7th Framework Program of the European Commission. The main goal of OpenAIRE is to support the Open Access pilot of the FP7 budget, mentioned above. OpenAIRE will establish underlying structures for researchers to support them in complying with the pilot through among others a European Helpdesk System and an OpenAIRE portal.

PEER (Publishing and the Ecology of European Research, http://www.peerproject.eu/) is a project aiming at developing an "observatory" to monitor the effects of systematic archiving over time. Participating publishers will collectively contribute 300 journals to the project and supporting research studies will address issues such as:

• how large-scale archiving will affect journal viability;

• whether it increases access;

• how it will affect the broader ecology of European research;

• which factors influence the readiness to deposit in institutional and disciplinary repositories and what the associated costs might be;

• models to illustrate how traditional publishing systems can coexist with self-archiving.

Among the participants are the International Association of Scientific, Technical and Medical Publishers (STM), the European Science Foundation, and the Max Planck Society.

Conclusion

A lot has been accomplished by the Open Access movement in the past years. There certainly is a growing momentum. But there also are some serious barriers.

One of them is the use of Open Access publications. It appears to be necessary to improve the access to Open Access publications and especially the repositories' content. At this moment especially university libraries are concentrated on filling the repositories with research publications, more than with providing access to these publications. To stimulate the use of this content, they should be part of the information infrastructure of which libraries and their users make use. For instance, when you look for an article under license and you get the message »access denied« because you are not working in an institution that has such a license, the system should present the alternative possibility to search world wide in the repositories for the final author's version of this article.

Actually, these barriers should determine to a large part the agenda for the Open Access movement. The most important ones are listed here.

On the international and national level:

• funding agencies should create an Open Access fund to finance Open Access publication of the results;

• new impact / assessment models based on usage should be developed as a regular service;

• there should be more experiments with hybrid journal models;

• institutional repositories should be integrated in the information infrastructure;

• Open Access should be involved as a topic in licence negotiations with publishers.

On the institutional level:

• institutions should create an Open Access fund to finance Open Access publication of the results;

• institutions should introduce a mandate for the deposit of publications in institutional repositories;

• the workflow for uploading publications in institutional repositories should be as easy as possible;

• institutional repositories should have added value for the authors themselves;

• more awareness is needed for alternative copyright licences.

Finally I would like to emphasise an aspect of Open Access that is often forgotten. Mostly when talking about the Berlin Declaration, people put emphasis on recent research publications. But the following is also one of the objectives of the Declaration: »encouraging the holders of cultural heritage to support open access by providing their resources on the Internet.«

The combination of digitization technologies and internet distribution can radically transform how researchers make use of special collections materials. The most creative uses of our shared cultural heritage can only occur, however, if the public has the ability to access and use public domain source materials without onerous permissions processes or the imposition of fees. Therefore, in the spirit of the Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities, libraries should grant all non-commercial users »a free, irrevocable, worldwide, right of access to, and a license to copy, use, distribute, transmit and display the work publicly and to make and distribute derivative works, in any digital medium for any responsible purpose, subject to proper attribution of authorship.« If fees are to be assessed for the use of digitized public domain works, those fees should only apply to commercial uses.

Bibliography

Guedon, Jean-Claude (2001). In Oldenburg's Long Shadow: Librarians, Research Scientists, Publishers, and the Control of Scientific Publishing. In: Creating the Digital Future. Proceedings of the 138th Annual Meeting, Association of Research Libraries. Toronto, May 23-25, 2001. See also: http://www.arl.org/arl/proceedings/138/guedon.html

Houghton, J,, De Jonge, J, Van Oploo, M. (2009). Costs and Benefits of Research Communication: The Dutch Situation. SURF 2009. Retrieved from the web site http://www.surffoundation.nl/SiteCollectionDocuments/Benefits%20of%20Research%20Co mmunication%20_April%202009_%20FINAL_logos2.pdf.

Waaijers, L. (2007.) The DARE Chronicle: Open Access to Research Results and Teaching Material in the Netherlands. Ariadne (53), October 2007. Retrieved from the web site http://www.ariadne.ac.uk/issue53/waaijers/

Wesenbeeck, A. van, Van Luijt, M. (2007). Partners is Science: OJS, a Collaboratory Researcher's Workbench and an Open Repository. First Monday, 12 (10). Retrieved from the web site http://firstmonday.org/htbin/cgiwrap/bin/ojs/index.php/fm/rt/printerFriendly/ 2001/1876

PROST DOSTOP IN UPRAVLJANJE AVTORSKIH PRAVIC NA SLOVENSKIH UNIVERZAH

Dr. Maja Bogataj Jančič LL.M., LL.M.:

vodja Inštituta za intelektualno lastnino e-naslov: maja.bogataj@ipi.si

UDK: 655.411:004.65: 347.78: 378.4(497.4)

Izvleček

Univerze naj bi avtorske in sorodne pravice upravljale v skladu s cilji in vrednotami svojega poslanstva. Med pomembnejšimi cilji je ohranjanje in razširjanje znanja s pomočjo poučevanja in raziskovanja. Dobro oblikovana in v praksi učinkovita politika upravljanja avtorske in sorodnih pravic spodbuja prost pretok idej in svobodo misli ter tako prispeva k doseganju tega cilja. Poslanstvo javnih univerz ne more biti zasledovanje interesov posameznikov, ki delujejo na univerzi, niti ne zasledovanje interesov univerze kot institucije, ampak povečevanja občega dobrega. Učinkovita politika uprvaljanja avtorske pravice mora biti oblikovana in udejanjanja v praksi tako, da zasleduje to poslanstvo. Tudi slovenske javne univerze se spopadajo s problemom učinkovite politike upravljanja avtorskih pravic. V prispevku bo avtorica predstavila trenutni pravni okvir upravljanj pravic na slovenskih univerzah in opozorila na probleme, s katerimi se univerze srečujejo v praksi. Predstavila bo tudi predloge za nov učinkovitejši režim upravljanja s posebnim poudarkom na rešitvah, ki bodo zagotavljale prost dostop do znanja. Pri tem bo omenila tako predloge za spremembo zakonodaje, kot tudi druge pravne instrumente, ki bi lahko učinkovito spodbujali ne le ohranjanje in arhiviranje znanstvenih del, ampak tudi njihovo učinkovito razširjanje oziroma učinkovit dostop do znanja.

Ključne besede: prosti dostop, avtorske pravice, univerzi, upravljanje avtorskih pravic na slovenskih univerzah, dostop do znanja,

OPEN ACCESS AND COPYRIGHT MANAGEMENT AT THE UNIVERSITIES IN SLOVENIA

Abstract

Universities should manage copyrights and related rights in accordance with the goals and values of its mission. One of universities' most important goals is preservation and dissemination of knowledge through teaching and research. Well designed and effective copyright and related rights management policy stimulates free flow of ideas and freedom of thought. As such, it considerably helps universities to reach the above mentioned goal. Institutions of public universities are conducted for the common good and not to further the interest of either the individual teacher or the institution as a whole. Efficient copyright management should be designed to encourage the growth of the common good, which should also reflect in modeling and consequently in performance of suitable and effective copyright management policy. Slovenian universities also cope with the problem of efficient copyright management. Presentation will focus on the current legal framework of copyright management at Slovenian universities including its problems that universities have to deal with in practice. Authoress will present proposal for new and more effective copyright

management with special focus on solutions that could ensure more open access to knowledge. Amendments to legislation as well as other legal instruments to enhance and give incentive not only to preservation but also to efficient dissemination and access to knowledge.

Key words: copyright, copyright management at Slovenian universities, access to knowledge, open access

ACTA CHIMICA SLOVENICA - SLOVENSKA ZNANSTVENA REVIJA Z NAJVEČJIM FAKTORJEM VPLIVA

prof. dr. Aleksander Pavko

Univerza v Ljubljani, Fakulteta za kemijo in kemijsko tehnologijo e-naslov: saso.pavko@fkkt.uni-lj.si

UDK: 54:001.8

Izvleček

V Sloveniji so le štiri znanstvene revije z IF (Acta Chimica Slovenica, Informacije MIDEM, Strojniški vestnik in Javnost), med katerimi dosega Acta Chimica Slovenica (ACSi) najvišjo vrednost v zadnjih letih. Izhaja že 57 let. Prvič je bila z IF = 0,12 ocenjena za leto 2002. V naslednjih letih se je vrednost IF povečevala in za leto 2007 dosegla za nacionalno revijo zavidljivo visoko vrednost 1,093. Za leto 2009 pa je imela vrednost IF = 0,84. Od leta 1998 je Acta Chimica Slovenica prosto dostopna na spletni strani revije in je vpisana v DOAJ. V prispevku so na kratko opisani razvoj revije ter njeno strokovno in tehnično urejanje, finančna problematika in uredniška politika v zadnjem desetletju.

Ključne besede: Acta Chimica Slovenica, faktor vpliva, prosti dostop, znanstvene revije

ACTA CHIMICA SLOVENICA- SLOVENE SCIENTIFIC JOURNAL WITH THE HIGHEST IMPACT FACTOR

Abstract

In Slovenia, there are merely four scientific journals (Acta Chimica Slovenica, Informacije MIDEM, Strojniški vestnik and Javnost) with the impact factor IF. Among the latter, Acta Chimica Slovenica (ACSi) has obtained in the recent years the highest value. It has been edited for 57 years already. In 2002, ACSi was for the first time evaluated with IF = 0.12. In the following years, its IF increased and obtained in 2007 the enviable value for a national journal, i.e. IF = 1.093. The impact factor in 2009 was 0.84. Acta Chimica Slovenica is a free acces journal, registered in DOAJ since 1998. A brief description of the progress of ACSi, its scientific and technical editing, financial aspects and editorial policy is given in this work.

Key words: Acta Chimica Slovenica, impact factor, open acces, scientific journals

Uvod

Zadnjih nekaj let Agencija za raziskave in razvoj (ARRS) ocenjuje raziskovalno uspešnost posameznikov in raziskovalnih (programskih) skupin. Eden izmed glavnih kriterijev ocenjevanja je točkovanje bibliografskih enot oz. znanstvenih publikacij. Pri znanstvenih člankih je glavno merilo vrednotenja kvaliteta revije, ki je članek objavila. Mednarodna bibliografska baza podatkov Web of Science revije razvršča po faktorju vpliva (impact factor, IF), ki se izračuna kot razmerje med številom citatov in pa številom objavljenih člankov v reviji za določeno leto. Predvsem evropski avtorji pogosto nasprotujejo IF faktorju. Ta

namreč privilegira angleško govoreče narode v škodo manjših narodov, ter ameriško potrošniško kulturo postavlja nad manjše, a zgodovinsko bogatejše evropske kulture. Vendar ga danes široko uporabljajo pri kriterijih ocenjevanja. Vsekakor pa se je nacionalnim revijam na to lestvico težko uvrstiti.

Acta Chimica Slovenica je razdeljena v dva dela: v prvem, strokovnem delu, ki je napisan v angleškem jeziku, so zbrani znanstveni in strokovni članki. Ti so iz aktualnih področij kemije, pisani v angleškem jeziku s slovenskim povzetkom. Prispevki so strogo recenzirani. Pri tem je preverjana znanstvena kakovost in primernost predstavitve, ki mora ustrezati normativom mednarodnih kemijskih publikacij. Vsebine vseh člankov so sprotno povzete v publikaciji Ameriškega kemijskega društva Chemical Abstracts, Science Citation Index Expanded, Current Contents: Physical, Chemical and Earth Sciences, Chemistry Citation Index, ISI Alerting Services, prizadevamo pa si tudi za indeksiranje v Medline. Prav tako so vsi članki sproti ustrezno katalogizirani v sistemu COBISS.

V drugem delu, ki je večinoma napisan v slovenščini, pa so objavljene društvene vesti. Te obsegajo sezname diplom, magisterijev in doktoratov s slovenskih univerz s študijskimi programi na področju kemije, biokemije, kemijske tehnike in materialov, poročila delovanja sekcij slovenskega kemijskega društva in recenzije knjig. Prav tako občasno objavimo tudi zanimive strokovne članke. Pripravimo tudi obvestila o konferencah, simpozijih in drugih srečanjih. Društvene vesti predstavljajo približno 10 % objavljenih strani.

Revijo v nakladi 1200 izvodov dobivajo člani Slovenskega kemijskega društva; v elektronski obliki je prosto dostopna na spletni strani društva http://acta.chem-soc.si. Približno 200 tiskanih izvodov dobijo knjižnice in raziskovalne inštitucije po celem svetu. Okrog ene tretjine vseh prispevkov napišejo domači znanstveniki, tako, da je o raziskavah v Sloveniji dobro obveščena tuja znanstvena javnost.

Uredniško delo, ki ga področni uredniki, univerzitetni profesorji ter sodelavci inštitutov opravljajo voluntersko, je časovno precej zahtevno, saj uredniki komunicirajo s številnimi avtorji in recenzenti iz celega sveta.

Strokovno urejanje revije

Visoka ocena IF je za nacionalno revijo izreden uspeh, ki pa ga lahko pripišemo predvsem dobri uredniški politiki. Pridobivanje ugleda revije je plod dolgoletnega dela in truda številnih, ki so pri tem sodelovali. Acta Chimica Slovenica izhaja že 57 let. Uredniški odbor od leta 1977 vodi prof. dr. Branko Stanovnik, na mestu glavnega urednika pa se je do leta 2004 zvrstilo več sodelavcev (prof. dr. Drago Kolar, prof. dr. Ljubo Golič, prof. dr. Andrej Petrič). Leta 2005 je mesto glavnega urednika prevzel prof. dr. Janez Košmrlj, ki je poskrbel za temeljito preobrazbo revije: nadel ji je popolnoma novo, svežo obliko ter uredniški odbor okrepil s področnimi uredniki.

V zadnjih petih letih v uredništvo prispe preko dvesto prispevkov na leto, od katerih se jih več kot tretjino zavrne. S povečevanjem faktorja vpliva in s tem kvalitete revije se število člankov iz vsega sveta povečuje. Delo je z leti postajalo vse bolj obsežno in odgovorno. Na

pobudo prof. dr. Aleksandra Pavka, ki je mesto glavnega urednika prevzel leta 2006, so se področni uredniki ob izidu vsake številke začeli srečevati, si izmenjevati izkušnje in načrtovati vsebine naslednjih številk ter tako postavljali nove temelje uredniške politike revije. Želja urednikov je vzdrževati soliden IF. K temu pripomore stroga recenzentska politika in pa tematska strokovna usmeritev revije na aktualna znanstvena področja. Slednje dosegamo s pripravo tematskih in posvečenih številk, za katere povabimo k pisanju člankov ugledne avtorje, po možnosti iz celega sveta.

Slika 1: Impact faktor revije Acta Chimica Slovenica

Pri urejanju revije sodelujejo glavni urednik, področni uredniki, tehnični urednik, tajnica in uredniški odbor. Zadnjih šest let komunikacija med avtorji, recenzenti in uredniki poteka izključno po elektronski pošti, evidenca pa se vodi v tajništvu društva in pri urednikih, ki vodijo recenzentske postopke. Vse članke v roke najprej dobi glavni urednik in jih pregleda.

160 -

140 -

C

120 -

>tj ■C

100 -

'c

80 -

ÜT

O

60 -

.<3

40 -

iB

>tn

20 -

0 -

objavljeni znanstveni kratki

vrsta članka

□ 2005 0 2006

□ 2007

□ 2008 ■ 2009

strokovni pregledni

Slika 2: Število prispelih in objavljenih člankov

Če so tematsko ustrezni in pripravljeni ter poslani v skladu z navodili, se v tajništvu zavedejo in pošljejo v obdelavo področnim urednikom. Področje fizikalne kemije ureja prof. Marija Bešter Rogač, področje organske kemije doc. Krištof Kranjc in doc. Janez Cerkovnik, področje anorganske kemije dr. Barbara Malič in prof. Primož Šegedin, področje analizne kemije doc. Matija Strlič in prof. Boris Pihlar, področje kemijskega inženirstva pa prof. Aleksander Pavko. Približno 10 % člankov zaradi neustreznosti glavni urednik zavrne, preden se začne recenzentski postopek. Področni uredniki za vse članke pridobijo dve neodvisni oceni večinoma uglednih strokovnjakov iz tujine in šele na podlagi pozitivnih mnenj se začne tehnično urejanje članka za objavo. Recenzentski postopki trajajo različno dolgo, odvisno od sreče z recenzenti. Dogaja se, da tudi več recenzentov v 14-dnevnem roku za odgovor odkloni recenziranje ali pa sploh ne odgovori, kar lahko podaljša recenzentski postopek tudi na pol leta.

Tabela 1: Seznam tematskih in posvečenih številk ACSi v zadnjih petih letih

Številka ACSi

ACSi 2006, 53(1) ACSi 2006, 53(2) ACSi 2006, 53(3) ACSi 2007, 54(1) ACSI 2007, 54(3) ACSi 2007, 54(4) ACSi 2008, 55(1) ACSi 2008, 55(4) ACSi 2009, 56(1) ACSi 2009, 56(3)

Področje

Oseba

analizna kemija anorganska kemija fizikalna kemija analizna kemija fizikalna kemija kemijsko inženirstvo biokemija anorganska kemija fizikalna kemija organska kemija

prof. Davorin Dolar, in memoriam

prof. Jože Škerjanc, 70.obletnica prof. Vojko Ozim, in memoriam

prof. Ljubo Golič, in memoriam prof. Josef Barthel, 80. obletnica prof. Branko Stanovnik, 70. obletnica

Na Sliki 3 so prikazani objavljeni prispevki razvrščeni po državah korespondenčnih avtorjev. Kriterij je več kot 10 objavljenih člankov v petih letih. Prednjačita Slovenija ter vzhodna in jugovzhodna Evropa, v petih letih je bilo objavljenih le 34 člankov iz zapadne Evrope in 9 člankov iz ZDA. V Tabeli 1 so prikazane tematske oziroma posvečene številke. Pri posvečenih številkah obstaja povezava s številom objavljenih prispevkov po državah. Na Sliki 4 so prikazani objavljeni prispevki po področjih.

Vsebino slovenskega dela revije izbere glavni urednik skupaj s tajnico, ki ga potem pripravi za tehničnega urednika. Veseli smo vsakega slovenskega strokovnega prispevka. Acta je nenazadnje le glasilo Slovenskega kemijskega društva, ki med drugim skrbi tudi za kulturo slovenskega znanstvenega in tehničnega izrazoslovja.

80

70

JŠ 60 >(j

j: 50

lit 40

(O

iT 30 o

Sk 20 ju

.tš 10

□ 2005 O 2006

□ 2007

□ 2008 ■ 2009

rOli^

Slovenija Z Evropa

V in JV Evropa

Indija

države

Iran

Kitajska Turčija

Slika 3: Število objavljenih prispevkov po državah korespondenčih avtorjev Tehnično urejanje revije

Pred dobrimi desetimi leti je v uredništvo prvič v enem letu prispelo preko 100 prispevkov, od katerih jih je bila dobra polovica objavljenih. Avtorji so tekst po navodilih pisali v za to pripravljen okvir, ki je bil prosto dostopen na spletni strani revije, in so članek morali sami pripraviti v končni obliki. Zaradi izdajanja revije v elektronski obliki so ga morali v uredništvo poslati tudi v elektronski obliki. Leta 1998 je bila revija vpisana v DOAJ in so tako celotni članki postali prosto dostopni na spletni strani revije, leta 2000 pa je bil uveden tudi grafični abstrakt. Takrat sta revijo strokovno in tehnično urejala glavni urednik in sourednik. Leto 2005 je pri tehničnem urejanju revije prelomno leto, saj je revija poleg nove oblike prešla na dvokolonski tisk, tehnično urejanje na amaterskem nivoju pa je prevzel kolega Vinko Volk, tehnični sodelavec na FKKT Univerze v Ljubljani. Priprava na ta prehod je trajala skoraj leto dni, novo podobo in naslovnico pa je oblikoval akademski slikar Simon Kajtna. V zadnjih letih revijo tehnično ureja profesionalni urednik.

Sprejeti članki se zbirajo v posebni mapi in že teden dni po izidu se začne priprava na novo številko. Glavni urednik iz mape izbere približno trideset člankov glede na datum prispetja v uredništvo. Te prevzame tehnični urednik in v dveh mesecih pripravi krtačne odtise, ki jih pred izidom dobijo avtorji v pregled in korekturo. Po morebitnih popravkih tehnični urednik skupaj z glavnim urednikom določi vrstni red člankov in pripravi grafično vsebino. Material preda uredniku spletne postavitve revije in tiskarni do prve polovice marca, junija, septembra in decembra tako da revija do konca meseca izide na spletu in v tiskani obliki.

0

Finance

I

C

>tJ ■C

o o

60 50 -40 -30 -20 -

10 -

organska anorganska fizikalna kemija kemija kemija

analizna kemija

področje

biokemija

kemijsko inženirstvo

Slika 4: Število objavljenih prispevkov po področjih

Revijo ACSi ob finančni podpori ARRS ter sponzorjev (fakultete, inštituti, podjetja) izdaja Slovensko kemijsko društvo. Sredstva ARRS predstavljajo največji delež prihodkov na osnovi razpisov za triletno financiranje. Del prihodkov predstavlja tudi društvena članarina. Svoje finančne prispevke že vsa leta dajejo tudi vse tri slovenske 'kemijske' fakultete v Ljubljani, Mariboru in Novi Gorici, Fakulteta za farmacijo Univerze v Ljubljani ter Kemijski inštitut in Inštitut Jožefa Stefana. Ti prispevki so predmet vsakoletnih dogovorov.

Prihodki v letu 2005

Prihodki v letu 2009

BARRS (36%) □ DONACIJE (30%) H OGLASI (33%) ■ NAROČNINA (1%)

BARRS (68%) □ DONACIJE (24%) H OGLASI (7%) NAROČNINA (1%)

Slika 5: Delež prihodkov v letih 2005 in 2009

0

Stroški v letu 2005

■ TISK (44%)

□ OBLIKOVANJE (10%)

□ DRUGO (46%)

Stroški v letu 2005

■ TISK (48%)

□ OBLIKOVANJE (27%)

□ DRUGO (35%)

Slika 6: Delež stroškov v letih 2005 in 2009

Zaželeno je, da se zagotovi dolgoročen in stabilen vir financiranja, ki bi zagotovil tudi varno prihodnost in nadaljnji razvoj naše revije. To je nenazadnje tudi edini razlog, da do sodelovanja s tujo ugledno založbo, ki nam je pred leti pnudila sodelovanje, še ni prišlo. Težko si je predstavljati da je ugledni firmi za oglas v najbolj priznani slovenski znanstveni reviji težko dati 1000 Eurov, pri tem pa gre lahko desettisoče evrov za sponzoriranje športnikov in športnih klubov.

Ne majhen del prihodkov pa smo vsaj pred leti dobili s pomočjo oglaševanja, žal pa ta vir z leti usiha. Na Sliki 5 so prikazani deleži virov dohodkov v letih 2005 in 2009. Delež sofinanciranja s strani ARRS se je povečal, delež donacij pa precej zmanjšal. na Sliki 6 pa deleži stroškov v letih 2005 in 2009. Stroški oblikovanja so narastli zaradi predaje dela profesionalnemu oblikovalcu.

Zaključki in perspektive

In kako naprej? Nedvomno je poseben izziv listanje novega 'papirnatega' izvoda revije, ko začutiš vonj po tiskarni in otipaš svež, na prste rahlo lepljiv papir. Vendar razvoj informacijske tehnologije nezadržno napreduje in naklada tiskanih revij se v svetu hitro zmanjšuje na račun revij dostopnih na spletu v elektronski obliki. Kot kaže bo zaradi tradicionalnih pogledov članov Slovenskega kemijskega društva, izdajatelja revije, naša Acta v papirni obliki izhajala še kar nekaj časa. Revija je prosto dostopna na spletu, kar zagotavlja solidno branost in temu primerno število poslanih in objavljenih člankov. Želimo si več zapadno evropskih in ameriških avtorjev, kar po možnostih urejamo z vabili k pisanju člankov. Za ugledne slovenske znanstvenike ima naša revija verjetno prenizek IF.

Poslujemo na robu finančnih sredstev, ki ne dovoljujejo povečanja obsega in nadaljnjega razvoja revije. Naslednji korak bi lahko bil prehod na elektronsko oddajanje prispevkov, ki pa je ob potrebnem povečanju finančnih sredstev lahko dvorezen meč. Vsekakor bi to olajšalo urejanje revije, vendar bi lahko izgubili del kontrole nad primerno tematiko prispevkov. Število prispevkov bi se povečalo in trajanje recenzentskih postopkov bi se ob ne prav velikem številu kooperativnih recenzentov lahko podaljšalo.

PROST DOSTOP DO DOSEŽKOV SLOVENSKIH ZNANSTVENIKOV PREK PORTALA DLIB.SI

Zoran Krstulovic

Narodna in univerzitetna knjižnica, pomočnik ravnatelja NUK e-naslov: zoran.krstulovic@nuk.uni-lj.si

mag. Karmen Štular Sotošek

Narodna in univerzitetna knjižnica, vodja Službe za digitalno knjižnico e-naslov: karmen.stular@nuk.uni-lj.si

Daša Pokorn

Narodna in univerzitetna knjižnica, Služba za digitalno knjižnico e-naslov: dasa.pokorn@nuk.uni-lj.si

UDK: 655.411:004.65(497.4)

Izvleček

Digitalna knjižnica Slovenije, ki deluje v okviru Narodne in univerzitetne knjižnice, omogoča prek informacijskega portala za upravljanje z znanjem (http://www.dlib.si) dostop do znanstvenih in strokovnih del domačih in tujih avtorjev. Zbirke so skrbno načrtovane in se po zaslugi uspešne mreže partnerstev dnevno dopolnjujejo ter širijo. V sodelovanju z avtorji, založniki, knjižnicami, Javno agencijo za raziskovalno dejavnost RS (ARRS), Univerzo v Ljubljani, Ministrstvom za visoko šolstvo, znanost in tehnologijo ter Ministrstvom za kulturo Digitalna knjižnica Slovenije domačim znanstvenim in strokovnim publikacijam nudi razpoznavno mesto na svetovnem spletu - poglavitnem viru informacij za številne strokovnjake in raziskovalce. Celotna besedila doktorskih tez, monografskih publikacij ter člankov, objavljenih v mednarodno priznanih znanstvenih revijah, so dostopna brez omejitev; v skladu z zahtevami uporabnikov in sodobnimi standardi pa se portal, njegova funkcionalnost in podoba nenehno razvijajo. Kot ponudnik najširšega prostega dostopa do digitalnih vsebin s področja znanosti in kulture NUK z Digitalno knjižnico Slovenije ohranja in poglablja svojo osrednjo vlogo v družbi znanja in družbi prihodnosti.

Ključne besede: knjižnice, digitalne knjižnice, informacijski portali, prost dostop, digitalizacija, e-vsebine, znanost

1 Digitalna knjižnica Slovenije

1.1 Vsebinska zasnova Digitalne knjižnice Slovenije in njen razvoj

Dandanes le redki uporabniki svojo raziskovalno pot začnejo v klasični knjižnici. Svetovni splet, ki dominira kot komunikacijsko orodje, je zavzel tudi prvo mesto pri iskanju najrazličnejših informacij, s tem pa se je spremenila vloga knjižnice kot ponudnika informacij. Narodna in univerzitetna knjižnica (NUK) se kot osrednja slovenska ustanova za zbiranje, klasificiranje, obdelavo in diseminacijo knjižničnega gradiva že desetletja uspešno spopada z

izzivi nove paradigme knjižničarstva. Leta 2003 je bil zasnovan projekt digitalne knjižnice, dve leti kasneje javnosti predstavljen kot prosto dostopen portal dLib.si. Od leta 2006 dalje se projekt izvaja kot redna naloga NUK in se financira iz različnih virov; razvoj in program Digitalne knjižnice Slovenije sofinancirajo Ministrstvo za kulturo, Ministrstvo za visoko šolstvo, znanost in tehnologijo ter od leta 2007, ko je bil sprejet projekt Digitalna knjižnica Slovenije - dLib.si / Digital Library of Slovenia - dLib.si, Norveški finančni mehanizem.

Širjenje digitalne knjižnice je potekalo na podlagi digitalizacije gradiva, povezovanja z drugimi knjižnicami, zlasti splošnimi, hkrati pa s sodelovanjem z izdajatelji slovenske znanstvene periodike. Oblikovane so bile številne zbirke in razvito je bilo okolje za arhiviranje slovenskih elektronskih publikacij na spletu. V drugi polovici prvega desetletja tega stoletja smo naredili bistven premik pri vzpostavljanju spletnega arhiva, s spletno storitvijo za predložitev obveznega izvoda e-publikacij (portal SVAROG), pa smo olajšali in pospešili sodelovanje z založniki. Spletni portal dlib.si smo vse bolj razvijali glede na uporabnost spletnega mesta in tehnično ustreznost in obiskanost spletnega mesta se je občutno povečala.1 V celoti je zaživela tudi storitev EOD (digitalizacija po naročilu).

1.2 Poslanstvo, naloge ter uresničevanje strateških ciljev

Digitalna knjižnica Slovenije (www.dlib.si) je predvsem informacijski portal za upravljanje z znanjem. Zagotavlja popolnoma neomejen dostop do knjižničnih katalogov in zbirk digitalnega gradiva - tako ustvarjenega v digitalni obliki kot digitaliziranega. Na enem mestu je tako mogoč vpogled v objekte slovenske kulturne dediščine, ki jih hranijo NUK in druge slovenske knjižnice, ter v zbirke aktualnih informacij ter sodobnih znanstvenih publikacij.

Digitalna knjižnica Slovenije s svojimi zbirkami, storitvami in znanjem zavzema aktivno vlogo pri ustvarjanju informacijske družbe, knjižnične mreže ter akademske skupnosti prihodnosti, kot celovita digitalna knjižnica naroda in osrednji digitalni arhiv pa nudi osnovno infrastrukturo novi paradigmi knjižničarstva. Svoje poslanstvo uresničuje v sodelovanju s partnerji - akademskimi in raziskovalnimi ustanovami, gospodarskimi družbami in uporabniki.

Izhodišča, ki podpirajo razvoj digitalnih vsebin, so bila opredeljena v Resoluciji o nacionalnem programu za kulturo 2004-2007 (Ur. l. RS 28/2004),2 razvoj dLib.si pa je uvrščen v Resolucijo o nacionalnem programu za kulturo 2008 - 2011. Slednji predvideva podporo nadaljnjemu razvoju spletnega portala in aktivnemu sodelovanju pri razvoju Evropske digitalne knjižnice. Digitalna knjižnica Slovenije sledi usmeritvam Komisije Evropske skupnosti (strategija i2010: Digitalne knjižnice), na področju trajnega ohranjanja digitalne kulturne dediščine pa

1 Oktobra 2008 začela obiskanost portala strmo naraščati in je dosegla vrh v novembru (218% povečanje glede na januar 2008). V letu 2008 je portal obiskalo 282.106 različnih uporabnikov (leta 2007 86.502). Število obiskov portala strmo narašča: leta 2008 je bilo 2.791.999 vpogledov v vsebine, v letu 2009 pa se je število vpogledov vsebine povzpelo na 11.188.254.

2 V okviru načrtovane informatizacije v kulturi, kot splošne prioritete kulturne politike v obdobju 2004-2007, je naštetih nekaj ukrepov, katerih naravni rezultat je digitalna knjižnica.

upošteva Resolucijo Sveta Evropske skupnosti o ohranjanju bodočega spomina - ohranjanje digitalnih vsebin za bodoče generacije (2002), Listino UNESCO o ohranjanju digitalne dediščine (2003) ter upošteva sklepe in priporočila konference v Haagu (2004).3 Nove naloge NUK na tem področju je opredelil tudi Zakonu o obveznem izvodu publikacij (Ur. l. RS št. 69/06), zlasti zbiranje elektronskih publikacij na spletu, njihovo arhiviranje ter zagotavljanje dostopnosti arhiva spletnih publikacij. Področje dodatno ureja Pravilnik o vrstah in izboru elektronskih publikacij za obvezni izvod (Ur. l. RS št. 90/07).

Strategija razvoja informacijske družbe v Republiki Sloveniji - si2010 predvideva nadaljnji razvoj Digitalne knjižnice Slovenije kot enega izmed strateških ciljev na področju e-kulture.

Že leta 2006 je Strategija razvoja Digitalne knjižnice Slovenije dLib.si 2007-2010 natančno določila namenske cilje Digitalne knjižnice Slovenije:

• izboljšati dostopnost informacijskih virov in storitev knjižnic z uporabo sodobnih informacijskih kanalov;

• zagotoviti trajno ohranjanje digitalne kulturne dediščine z zbiranjem izvorno digitalnega gradiva (slovenike), s pretvorbo gradiva, zapisanega v analogni obliki v digitalno obliko zapisa in z ustrezno hrambo digitalnega gradiva v arhivu digitalne knjižnice;

• razvijanje družabništva in enakopravnega sodelovanja s knjižnicami, založniki in drugimi ustanovami s področja kulture, izobraževanja in znanosti;

• povečati prisotnost slovenskega jezika in slovenske kulture na spletu;

• povečati stopnjo uporabe informacijskih virov in storitev knjižnic in drugih ustanov s področja kulture, znanosti in izobraževanja ter promoviranje teh virov in storitev v spremenjenih okoliščinah, ki jih prinaša tehnološki razvoj.

Uresničevanje poslanstva Digitalne knjižnice poteka v treh fazah od zajema gradiv do njegovega ohranjanja in distribucije. Digitalna knjižnica organizira in skrbi za izvajanje digitalizacije izvorno analognega gradiva (gradiva na klasičnih nosilcih), hkrati pa zajema izvorno digitalne vsebine in jim nudi ustrezni spletni arhiv. Za potrebe ohranjanja digitalnih vsebin razvija varen digitalni arhiv, namenjen shranjevanju celotne vsebine digitalnih zbirk. Distribucija vsebin poteka prek sodobnega spletnega portala, ki je uporabniku prijazen in v skladu z aktualnimi smernicami za e-dostopnost. Tehnološke rešitve portala so zasnovane na implementaciji protokola Open Archive Initiative (OAI), avtomatičnemu zajemu podatkov in metapodatkovnem modelu Dublin Core. Delovanje Digitalne knjižnice Slovenije obsega tudi vse s tem povezane dejavnosti, kot na primer: urejanje pravnih vprašanj, povezanih z avtorskimi in sorodnimi pravicami, oblikovanje marketinške strategije ter skrb za prepoznavnost portala in digitalnih zbirk.

3 Sklep Sveta Evropske unije zahteva od držav članic pripravo nacionalnih strategij in večletnih finančnih načrtov za shranjevanje, digitalizacijo in dolgoročno hranjenje, seznanjanje javnosti, izobraževanje ter usposabljanje na tem področju. (Permanent access to the records of science. Proceedings EU conference. The Hague, Koninklijke Bibliotheek, 2004)

Narodna in univerzitetna knjižnica je s svojimi nalogami ter aktivnostmi na področju e-vsebin vpeta v evropski prostor. Sodeluje pri razvoju Evropske knjižnice (The European Library -TEL), skupnega portala evropskih nacionalnih knjižnic, in Europeane, skupnega portala celotnega kulturnega sektorja. NUK je sodeloval pri številnih evropskih projektih povezovanja digitalnih zbirk ter povečanja dostopnosti. Z novembrom 2009 se je zaključilo nadaljevanje projekta DRIVER (DRIVER II), katerega namen je bil povezati digitalne znanstvene repozitorije oziroma digitalne zbirke znanstvenih publikacij. V okviru projekta je bila razvita infrastruktura, ki je postala osnova za povezovanje vsebinsko in formalno različnih digitalnih repozitorijev in za ustvarjanje evropske mreže digitalnih zbirk. Nadalnji razvoj infrastrukture ter povezovanje z drugimi celinami bo zagotavljala konfederacija COAR (Confederation of Open Access Repositories), ustanovljena oktobra 2009.

Slika 1: Mreža evropskih repozitorijev glede na lokacijo in vsebino. (vir: h ttp://www. driver-repository. eu/)

2 Zbirke znanja na dLib.si

2.1 Pomen prostega dostopa

Krogotok znanja med izobraževalnimi ustanovami, posamezniki, ustanovami s področja raziskovanja, javnimi zavodi ter agencijami ter založniki znanstvenih publikacij je krogotok

javnega interesa, po katerem krožijo in se plemenitijo vsebine, bistvene za napredek slovenske družbe kot družbe znanja. Prost dostop do rezultatov znanstvenega raziskovanja prek svetovnega spleta pa zaradi prevlade sodobnih tehnologij ni več izbira, temveč nujnost. S koncentracijo del slovenskih znanstvenikov in raziskovalcev na portalu dlib.si Narodna in univerzitetna knjižnica skrbi za neokrnjeno kroženje znanja ter informacij med javnostjo, posamezniki ter ustanovami.

Digitalna knjižnica Slovenije deluje v javnem interesu in si v skladu s sodobnimi standardi prizadeva slediti potrebam uporabnika in mu na enem mestu nuditi prost dostop do čim širšega spektra informacijskih virov, saj izkušnje kažejo, da si vsak posamezen uporabnik želi dostopati do različnih digitalnih vsebin. Nedvomno ima Digitalna knjižnica Slovenije največji vpliv v raziskovalnih in akademskih sferah, od koder prihajajo tudi njeni najbolj aktivni uporabniki. Statistični podatki kažejo, da tipičen uporabnik Digitalne knjižnice Slovenije sodi v starostno skupino med 25 in 35 let ter je visoko izobražen (Ambrožič, Badovinac, 2009). Številni raziskovalci dnevno obiskujejo portal dLib.si in dostopajo do zanje pomembnega gradiva, hkrati pa sodelujejo pri oblikovanju zbirk in portala, saj opozarjajo na pomanjkljivosti, dajejo predloge za digitalizacijo in v zbirke prispevajo svoja dela.

Znanstvenikom, raziskovalcem ter študentom doma in v tujini uporaba portala dlib.si nudi številne prednosti, predvsem preprost in hiter dostop do domače znanstvene in strokovne literature ter hitro iskanje po ključnih besedah ali celotnem besedilu. Raziskovalci s številnih področij, na primer jezikoslovja, zgodovine, slovenske književnosti in podobno pa lahko na istem mestu dostopajo tudi do primarnih virov: starejših slovenskih časnikov in revij ter digitalnih kopij redkih in dragocenih tiskov in rokopisov ali historičnih zemljevidov.

Kot vir za znanstveno in raziskovalno dejavnost je zelo pomembna tudi zbirka programskih in projektnih poročil Javne agencije za raziskovalno dejavnost (ARRS), ki vsebuje polna besedila poročil projektov, zaključenih v letu 2008 in jih je sofinancirala ARRS. Krog znanja je sklenjen: na spletni strani SICRIS - Informacijski sistem o raziskovalni dejavnosti v Sloveniji, ki ga razvijata in vzdržujeta Institut informacijskih znanosti v Mariboru (IZUM) ter ARRS - najde uporabnik ob naslovu projekta oziroma poročila povezavo do dokumenta na portalu Digitalne knjižnice Slovenije.

2.2 Zbirke visokošolskih del, znanstvenih člankov in časopisja

Gradiva, ki še posebej zanimajo strokovno javnost, so uvrščena v posebne zbirke. V okviru projekta DIZZIS (Razvoj digitalne zbirke znanstveno-raziskovalnih in strokovnih publikacij) je bila zasnovana zbirka visokošolskih del, ki se še vedno dopolnjuje. Konec septembra 2010 zbirka vsebuje eno specialistično, 4 diplomska, 121 magistrskih in 681 doktorskih del. Med slednjimi je 500 doktorskih disertacij Univerze v Ljubljani, ki smo jih v sodelovanju z Univerzo v Ljubljani in številnimi knjižnicami fakultet digitalizirali v okviru projekta Digitalna knjižnica Slovenije - dLib.si (EEA SI0014); zbirka nudi vpogled v dosežke slovenske znanosti od ustanovitve Univerze do leta 1968.

Visokošolska dela so produkt slovenske znanosti in stroke na različnih področjih. Za vključitev posameznega dela v Digitalno knjižnico se odločajo avtorji sami.

4

3

4 3 3

]10

47

Univerza vljubljani, Teološka fakulteta Univerza vLjubljani, Pedagoška fakulteta Univerza v Ljubljani, Naravoslovnotehniška fakulteta Univerza vljubljani, Medicinska "bkulteta Univerza v Ljubljani, Filozofska fakulteta Univerza v Ljubljani, Fakulteta za šport Univerza v Ljubljani, Fakulteta za strojništvo UniverzavLjublj3ni,Fakultetazasodalnodelo Univerza vljubljani. Fakulteta za računalništvo in infomnatiko Univerza v Ljubljani, Fakulteta za n^atematiko in fiziko Univer7avljubljani,F3kultetazakemijoinkennijskotefinologijo M 14 UniverzavLjubljani,F3kultetazagradbeništvoingeodezijo | 44 Univerza v Ljubljani, Fakulteta za elektrotehniko Univerza v Ljubljani, Fakulteta za dmzbenevede Univerza vljubljani. Fakulteta za arhitekturo Univerza vLjubljani, Biotehniška fakulteta Narodna in univerzitetna knjižnica tuje ustanove

Centralna tehniška knjižnica UniverzevLjubljani

■ 21 1 29

43

O 50 100 150 200 250 300 350 400 450 I Digitalizirano v okviru projekta dUb.si

Slika 2: Pregled visokošolskih del na portalu dLib.si glede na izvor (fakulteto nastanka ali knjižnico, ki je gradivo prispevala za digitalizacijo v okviru projekta dLib.si)

Zbirka znanstvenih člankov obsega skoraj 17 000 enot iz 62 publikacij, številka pa vztrajno raste. V dogovoru z založniki številne znanstvene in strokovne serijske publikacije objavljamo tudi v obliki celih številk, saj je nekaterim uporabnikom takšen pristop bližji.

Oblikovanje zbirk znanstvenih člankov, znanstvene periodike in strokovnih del je smiselno le, če vanje uvrščamo dela, ki imajo takšno ali drugačno aktualno uporabno vrednost. Za številna raziskovalna področja pa velja, da so aktualna predvsem novejša spoznanja. Urejanje pravnih vprašanj povezanih z avtorskimi in sorodnimi pravicami, je torej neobhodno. Letni načrt pridobivanja dovoljenj za objavo oblikujemo na podlagi podatkov o branosti in iskanosti sodobnih znanstvenih publikacij z vseh področij. NUK vprašanja avtorskih in sorodnih pravic rešuje s sklepanjem dogovorov tako s posameznimi avtorji kot z založniki. Številni založniki se že zavedajo pomena prisotnosti na svetovnem spletu ter dodane vrednosti, ki jo prinašajo urejenost v zbirko, dostop z enega mesta ter različne možnosti iskanja. Z veseljem ugotavljamo, da se založniki znanstvenih publikacij, zlasti tistih, katerih izhajanje sofinancira ARRS oziroma Javna agencija za knjigo (JAK) in so že zavezani k oddaji obveznega elektronskega izvoda, vse pogosteje in lažje odločajo za objavo aktualnih in celo

za digitalizacijo starejših letnikov publikacije. Hkrati pa se vse manj založnikov odloča za objavo s časovnim zamikom. Digitalna knjižnica Slovenije ponuja tudi objavo na spletu pred tiskano izdajo, tako imenovani 'online first'.

Slika 3: Znanstvene in strokovne publikacije, ki jih je sofinancirala ARRS, na novo pridobljene v letih 2007 - 2009

Glede na tematiko zbirka znanstvenih člankov pokriva skoraj vsa področja, saj v njej najdemo prispevke iz medicine, zoologije, arhitekture, jezikoslovja, umetnosti in drugih ved. Statistika razkriva, da je bilo avgusta 2010 največ člankov s področja jezikoslovja in književnosti ter prava, čeprav po številu naslovov serijskih publikacij prevladujejo naravoslovne vede, sledita pa jim medicina ter serijske publikacije s področja geologije in geografije.

umetnost glasba družbene vede pravo socialno delo psihologija metodologija geodezija bibliotekarstvo računalništvo vzgoja, izobraževanje etnologija tehnologija, obrt in industrija ekonomija organizacija in m en ed ž m en t jezikoslovje in književnost zgodovina in arheologija medicina geologija in geografija kmetijstvo in gozdarstvo naravoslovne vede

" 151

210

■ 48

■ S4

1 33

■ 37

203

172

311

3134

3173

3134

3173

Slika 4: Število znanstvenih člankov na portalu dlib.si glede na tematiko (stanje avgusta 2010)

Slika 5: Število naslovov znanstvenih revij na portalu dlib.si glede na tematiko (stanje avgusta 2010)

Glede na to statistika prenosov datotek ni presenetljiva. V prvih osmih mesecih so med vsemi strokovnimi in znanstvenimi publikacijami uporabniki najpogosteje posegli po Glasniku Slovenskega etnološkega društva (letnik 47, št. 1/2), ki je dosegel zavidljivo številko 2576 prenosov. Sledi mu druga številka Acta agriculturae Slovenica iz istega leta, nato pa številni članki s področja medicine. Statistika iskanj in prenosov med drugim razkriva, da so znanstvena dela na portalu dlib.si enako iskana kot dokumenti slovenske kulturne dediščine.

2.3 Krog znanja in sodelovanja

Povezovanje je ključno za učinkovito digitalno knjižnico. V vseh letih delovanja Digitalna knjižnica Slovenije spleta učinkovita in široko zasnovana partnerstva z akademskimi in raziskovalnimi ustanovami, gospodarskimi družbami, založniki, avtorji in uporabniki. Sodeluje z ARRS, Zavodom RS za šolstvo, z Univerzo v Ljubljani ter s številnimi knjižnicami, inštituti ter društvi.

Splošne knjižnice, založniki znanstvene in strokovne periodike, avtorji in drugi so v zbirko Digitalne knjižnice Slovenije do konca leta 2009 prispevali 37 % vsega gradiva.

Slika 6: Gradivo na portalu dlb.si glede na izvor; razmerje med NUK in partnerji (stanje ob koncu leta 2009)

Z dnevno promocijo in naraščajočo ozaveščenostjo o prednosti spletne objave se interes založnikov ter akademskih in visokošolskih ustanov povečuje. Številni dogovori in posledično dobre prakse so izhajali in še izhajajo iz skupnega interesa: digitalizacije starejših letnikov revij, ki imajo v slovenskem prostoru dolgo tradicijo, in hkratni spletni objavi aktualnih številk. Nenazadnje se za sodelovanje z Digitalno knjižnico Slovenije in za spletno objavo na dLib.si odločajo tudi številni posamezniki, kar je razvidno predvsem iz zbirke visokošolskih del, ki se dnevno povečuje.

Založniki znanstvenih in strokovnih publikacij, ki jih sofinancira ARRS oziroma JAK, z NUK vsako leto sklenejo približno toliko dogovorov o sodelovanju, kot založniki drugih publikacij.

3.1

Slika 7: Dogovori z založniki; razmerje med založniki znanstvenih in strokovnih publikacij, ki jih je sofinancirala ARRS, ter drugimi založniki med leti 2007 - 2009

Povezovanja in nadgradnje

Povezovanje obstoječih vsebin ter vključevanje novih v dLib.si, nove storitve in oblike dostopa

Uporabniki in zbirke zahtevajo nenehno dopolnjevanje, ne le v obsegu dostopnega gradiva, temveč tudi v funkcionalnosti njegove predstavitve. Zaradi digitalizacije starejših gradiv ter naraščajoče zavesti o prednostih objave na spletu se zbirke Digitalne knjižnice Slovenije širijo, portal pa se mora množini gradiv prilagajati tako, da zbirke ostajajo pregledne in uporabniku ter partnerjem prijazne. Uporabniki, ki svoje raziskovalne poti začenjajo z iskanji po bazi COBISS, v nekaterih zapisih že najdejo neposredno povezavo do gradiva, ki je dostopno na portalu dlib.si. V sodelovanju z Institutom informacijskih znanosti Maribor (IZUM) načrtujemo sistemsko rešitev, ki bo omogočila vnos enotnih označevalcev virov (URN) brez domene razreševalca v bazo COBISS za gradivo, ki je v digitalni obliki dostopno na portalu dLib.si.

V okviru projekta dLibPlus, ki je potekal od avgusta 2009 do septembra 2010, smo iskalni vmesnik dLib.si prilagodili spletiščem partnerskih organizacij in dLib.si dodali nove funkcionalnosti, ki omogočajo ločen dostop do različnih zbirk in njihovih delov. Raziskovalci bodo tako imeli možnost, da izberejo dostop le do gradiva določene organizacije, določenega področja ali formalno do več zvrsti vsebin. Implementacija pregibnika podjetja Amebis na dLib.si spletnem portalu poenostavlja iskanja vsebin, saj se bo uporabnikova iskalna zahteva primerjala z eno ali več samostalniških, pridevniških ali glagolskih oblik, nato pa se bo izvedlo iskanje po polnem besedilu podatkovne baze. Na voljo so vsi termini, ki so nastali v procesu optične prepoznave besedila (OCR), tudi če je uporabnikova zahteva v drugi obliki, spolu ali številu. S tem ima uporabnik pogled v večje število zadetkov tudi takrat, ko uporabnikova iskalna zahteva ne vsebuje iskalnega niza. Za sorodne organizacije v javnem sektorju na področju kulture in znanosti razvijamo generator URN z možnostjo razširitve na druge imenske prostore. Implementiran bo distribuirani nacionalni sistem za dodeljevanja in razreševanja trajnih identifikatorjev oziroma enotnih razreševalcev vira (URN). Za potrebe upravljalcev in partnerskih institucij izdelujemo vmesnik za podrobno spremljanje statistike uporabe in vsebin dLib.si.

3

Vsak uporabnik bo imel možnost, da portal prilagodi svojemu delu oziroma svojim zanimanjem. Implementirani modul »Moj dLib« bo brez dajanja dodatnih parametrov in filtriranja množice zbirk uporabniku ponudil le gradiva, ki si jih bo predhodno nastavil sam. Poosebitev portala dLib.si bo olajšala delo predvsem specializiranemu uporabniku.

V okviru teme Zgodovina slovenskega jezika in slovstva bomo javnosti ponudili pomembnejša dela slovenske pisne kulturne dediščine, združena v zbirko 1000 let besed. Že obstoječe vsebine s tega področja smo obogatili z metapodatki in organizirali v tematske in kronološke skupine. Primarne vire, digitalne kopije temeljnih del slovenske kulturne dediščine, smo povezali z besedili iz zbirke znanstvenih člankov ter tako na nit pregleda razvoja nanizali sklope gradiv, ki bodo služili predvsem v študijske namene. (Šavnik, 2010) Zasnovali smo digitalno geoknjižnico, ki omogoča dostop do knjižničnega gradiva na osnovi prostorskega povpraševanja z geolokacijo preko spletne storitve. Osnovni del digitalne geoknjižnice so digitalizirane kartografske zbirke in baze prostorskih podatkov (sodobne ali historične, tematske ali topografske karte, v različnih merilih).

3.2 Vzpostavitev nacionalnega agregatorja e-vsebin s področja kulture in trajno ohranjanje digitalnih virov

NUK je septembra 2009 dobil nalogo, da vzpostavi nacionalni agregator e-vsebin s področja kulture in zagotovi enotno točko spletnega dostopa do njih ter prične z vzpostavljanjem pogojev za trajno hranjenje e-vsebin s področja kulture in znanosti. Osnova za oblikovanje konceptualnih in tehnoloških rešitev agregatorja bo tehnologija in infrastruktura, ki je vzpostavljena za delovanje Digitalne knjižnice Slovenije. Hkrati spletno mesto dLib.si postaja vse bolj poznan, relevanten in pomemben vir, ki se ga poslužujejo in ga navajajo druge ustanove v spletnem okolju ali publikacijah tiskane oblike.

Sestavni del Digitalne knjižnice Slovenije je tudi informacijski portal za trajno ohranjanje digitalnih virov, ki je bil ustvarjen v okviru projekta dLibPlus. Portal je namenjen širjenju informacij na področju trajnega ohranjanja digitalnih virov, pri čemer združuje spoznanja različnih strok. Na spletnem mestu so na voljo standardi in priporočila, zakoni, predpisi in pravilniki, ki urejajo to področje, ter strokovna dela.

Nacionalni agregator bo zagotovil hitrejši napredek na vseh področjih delovanja e-kulture, saj bo spodbujal digitalizacijo vseh vrst kulturnih vsebin, ustrezno dokumentiranje, razvoj slovenske terminologije in trajno shranjevanje digitalnih vsebin. Vzpostavil bo internetni dostop na enem mestu za vsebine s področja kulture in znanosti v Sloveniji, ki bo povezan z evropsko digitalno knjižnico Europeano ter drugimi skladišči digitalnih vsebin v svetu.

Slika 8: Vloga agregatorjev v organizacijski strukturi Europeane (Vir: Europeana

Content Strategy, August 2009.)

Zbrane vsebine, trajno shranjene v centralnem repozitoriju, bodo dostopne širši javnosti s poudarkom na skupinah s posebnimi potrebami in poudarkom na sodobnih tehnologijah za dostop do vsebin. Decentralizirano upravljanje portala, ki bo potekalo preko posebnega vmesnika za skrbnike objavljenih digitalnih gradiv, bo spodbujalo sodelovanje različnih ustanov na področju kulture in znanosti.

Projekt nacionalnega agregatorja sodi v okvir uresničevanja javnega interesa, saj je njegov cilj zagotoviti javen, odprt, enoten in trajen dostop do e-vsebin s področja kulture in znanosti, hkrati pa vzpodbuja nastajanje e-vsebin v javnih zavodih, zlasti v tistih, ki do sedaj niso imeli tehnoloških, kadrovskih in drugih možnosti vstopa v digitalno okolje. Agregator povezuje in usklajuje sodelovanja med obstoječimi in bodočimi portali, ter zvišuje preglednost digitalnih vsebin. Projekt podpira številne strateške cilje na področju e-vsebin, saj načrtuje zagotovitev e-vsebin v slovenskem jeziku na področjih, ki pomembno vplivajo na življenje in delo posameznikov, v ustreznem obsegu in kakovosti, prav tako pa želi uporabnikom zagotoviti kar najširši dostop do ustreznega obsega kakovostnih e-vsebin v tujih jezikih, ki so temeljno gradivo za znanstveno, strokovno in drugo dejavnost.

S sodelovanjem v številnih mednarodnih projektih na področju zagotavljanja prostega dostopa do znanstvenih in kulturnih vsebin, s spodbujanjem k digitalizaciji in prizadevanji za odpravo zakonskih ovir, zlasti pa s prostim dostopom, ki ga ponuja prek Digitalne knjižnice Slovenije, Narodna in univerzitetna knjižnica uresničuje svoje temeljno poslanstvo. Zagotavlja in bo tudi v prihodnje zagotavljala informacijske vire in storitve, bistvene za razvoj družbe. Trajno ohranja slovensko kulturno in znanstveno dediščino v digitalni obliki in z zmanjševanjem frekvence uporabe izvirnikov tudi dediščino na klasičnih nosilcih. NUK digitalne zbirke na portalu dlib.si, storitve ter samo podobo in funkcionalnost uporabniškega vmesnika nenehno nadgrajuje in izpopolnjuje v skladu s potrebami uporabnika ter sodobnimi standardi.

Kot ponudnik najširšega in prostega dostopa do digitalnih vsebin s področja kulture in znanosti Narodna in univerzitetna knjižnica z Digitalno knjižnico Slovenije ostaja in vse bolj tudi postaja bistvena vez v krogotoku znanja, z delovanjem v javnem interesu pa nepogrešljivi temelj družbe znanja.

Bibliografija

Ambrožič, M, Badovinac, B. (2009). Mnenje uporabnikov o delovanju in storitvah NUK. Ljubljana: Narodna in univerzitetna knjižnica

Ambrožič, M., Šavnik, M., Krstulovic, Z., Katic, U., Svoljšak, S. (2006) Strategija razvoja digitalne knjižnice Slovenije : dLib.si 2007-2010. Ljubljana: NUK - Narodna in univerzitetna knjižnica, 2006. http://www.dlib.si/documents/2007/Strategija_Dlib.pdf.

Kragelj, M., Krstulovic, Z., Musek, T. (2008). Interoperabilnost kot izziv informatiki - primer Digitalne knjižnice Slovenije. V: Dnevi slovenske informatike 2008 - DSI, Portorož, Slovenija, 09. -11. april. Interoperabilnost kot izziv informatiki, Zbornik prispevkov. Ljubljana: Slovensko društvo Informatika.

Kragelj, M., Krstulovic, Z., Musek, T. (2009). Odprtokodne rešitve - razvojna priložnost v času recesije. V: Dnevi slovenske informatike 2009 - DSI, Portorož, Slovenija, 15.-17. april 2009. Z inteligentnimi sistemi do strateške prednosti: zbornik prispevkov. 1. izd. Ljubljana: Slovensko društvo Informatika.

Krstulovic, Z. (2006). Koncept razvoja digitalne knjižnice. V: AMBROŽIČ, M., BALAŽIC, D.. Slovenska nacionalna knjižnica : ob 60-letnici preimenovanja v Narodno in univerzitetno knjižnico. Ljubljana: Narodna in univerzitetna knjižnica, str. 137-141.

Krstulovic, Z., Kragelj, M., Musek, T. (2006). Digitalna knjižnica Slovenije - portal: zasnova in izvedba. V: Novakovic, A. (ur.). Dnevi slovenske informatike 2006, Portorož, 19.-21. april. V partnerstvu z informatiko do poslovne odličnosti: zbornik posvetovanja. Ljubljana: Slovensko društvo Informatika, str. 217.

Krstulovic, Z., Šetinc, L. (2005). Digitalna knjižnica Slovenije - dLib.si. V: Novakovic, A. (ur.), Schlamberger, N. (ur.), Indihar Štemberger, M. (ur.), Poženel, J. (ur.), Bajec, M. (ur.). DSI -Dnevi slovenske informatike 2005, Portorož, Slovenija, 13.-15. april. Informatika kot temelj povezovanja : zbornik posvetovanja. Ljubljana: Slovensko društvo Informatika, str. 683-689.

Krstulovic, Z., Štular Sotošek, K. (2007). Digitalna knjižnica Slovenije - dLib.si : namen, dosežki in strateške usmeritve (2005-2007) = The digital library of Slovenia - dLib.si : purpose, achievements and strategic goals (2005-2007). V: Ambrožič, M. (ur.). Knjižnice za prihodnost : napredek in sodelovanje : zbornik referatov : development and collaboration : proceedings. Ljubljana: Zveza bibliotekarskih društev Slovenije, str. 351-355.

Krstulovic, Z.. (2010). Nacionalni agregator e-vsebin s področja kulture. Slovenske digitalne kulturne vsebine, nacionalna konferenca EuropeanaLocal. Predstavitveno gradivo. Ljubljana, 15. september 2010.

Pokorn, D., Krstulovic, Z. (2009). Prost spletni dostop do rezultatov domače ustvarjalnosti -»conditio sine qua non« razvoja = Free online access to the products of national creativity -»conditio sine qua non« of developement. V: Knjižničarji in knjižnice / Strokovno posvetovanje Zveze bibliotekarskih društev Slovenije, Maribor, 6.-8. oktober 2009 = Professional Conference of Slovenian Library Association, Maribor, October 6-8, 2009. -Ljubljana : Zveza bibliotekarskih društev Slovenije = Slovenian Library Association, str. 241245.

Pokorn, D., Krstulovic, Z., Štular Sotošek, K.. (2009). Dostop do elektronskih virov : delovanje Digitalne knjižnice Slovenije. Organizacija znanja 14 (4), 180-185.

Šavnik, M. (2010). 1000 let besed: pregled razvoja slovenskega jezika in slovstva. Interno gradivo. Ljubljana, Narodna in univerzitetna knjižnica

Vsebinski predlog načrtovanih aktivnosti in predlog finančnega načrta za vzpostavitev nacionalnega agregatorja e-vsebin s področja kulture. Interno gradivo. Ljubljana, Narodna in univerzitetna knjižnica, 14.9.2009.

Resolucija o nacionalnih razvojnih projektih za obdobje 2007-2023 (2006). Ljubljana: Vlada Republike Slovenije.

Zakon o uresničevanju javnega interesa za kulturo. Uradni list RS, št. 77/07 - uradno prečiščeno besedilo in 56/08.

Pravilnik o vrstah in izboru elektronskih publikacij za obvezni izvod. Uradni list RS št. 90/07.

Zakon o obveznem izvodu publikacij. Uradni list RS št. 69/06.

Resolucija o nacionalnem programu za kulturo 2004-2007. Uradni list RS 28/2004.

Resolucija o nacionalnem programu za kulturo 2008-2011. Uradni list RS, št. 35/08.

Strategija razvoja Digitalne knjižnice Slovenije dLib.si 2007-2010. Pridobljeno s spletne strani http://www.dlib.si/?urn=URN:NBN:SI:DOC-EJGC736G

Council of the European Community, resolution of 25 June 2002 on preserving tomorrow's memory - preserving digital content for future generations (2002/C 162/02).

UNESCO. Charter on the Preservation of the Digital Heritage (17 October 2003).

Permanent access to the records of science. Proceedings EU conference. The Hague, Koninklijke Bibliotheek, 2004

Strategija razvoja informacijske družbe v Republiki Sloveniji - si2010. (2007). Ljubljana: Vlada Republike Slovenije. Pridobljeno s spletne strani http://www.mvzt.gov.si/ fileadmin/mvzt.gov.si/pageuploads/pdf/informacijska_druzba/si2010.pdf

Letno poročilo 2009. Narodna in univerzitetna knjižnica. Ljubljana, 16. februar 2010.

Program dela za leto 2010. (2010). Ljubljana: Narodna in univerzitetna knjižnica.

Digital Repository Infrastructure Vision for European Research (DRIVER). Pridobljeno s spletne strani: http://www.driver-repository.eu/

Confederation of Open Access Repositories (COAR). Pridobljeno s spletne strani: http://coar-repositories.org/

Trajno ohranjanje digitalnih virov. Pridobljeno s spletne strani: http://www.dlib.si/todv/ hranjenje/novice-dogodki/

I2010 Europa. Pridobljeno s spletne strani: http://ec.europa.eu/information_society/ eeurope/i2010/index_en.htm

ARHIV DRUŽBOSLOVNIH PODATKOV IN STORITVE PROSTEGA DOSTOPA DO ZNANSTVENIH PODATKOV V REPUBLIKI SLOVENIJI

Doc. dr. Janez Štebe

Univerza v Ljubljani, Fakulteta za družbene vede, predstojnik Arhiva družboslovnih podatkov E-naslov: janez.stebe@fdv.uni-lj.si

UDK: 001.103.2(086.82)

Izvleček

Prikazali bomo delovanje podatkovnega centra za področje družboslovja, Arhiva družboslovnih podatkov (ADP). Uporabili bomo model vlog, pravic, odgovornosti in povezav za osvetlitev treh pogojev delovanja tovrstne dejavnosti. Ti so podpora s strani javnih financerjev znanosti, pripravljenost za sodelovanje s strani znanstvene skupnosti, ter ustrezna profesionalizacija delovanja za zagotavljanje kakovostnih storitev. Javna agencija za raziskovalno dejavnost Republike Slovenije vrednoti izročanje podatkov v podatkovni arhiv tako kot znanstveno publikacijo. Zagotavlja tudi dolgoročno financiranje storitev podatkovnega arhiva kot raziskovalnega infrastrukturnega projekta na nacionalni ravni, njegovo vključevanje v Evropsko raziskovalno infrastrukturo, pripravlja pa tudi uvedbo prostega dostopa do podatkov po načelih OECD. Pomembna vloga arhiva podatkov je, poleg opravljanja storitev izbora in prevzema, priprave in shranjevanja, ter posredovanja podatkov uporabnikom, da kot center znanja skrbi za seznanjanje in usposabljanje izdelovalcev podatkov za kakovostno pripravo podatkov, ustrezno zahtevam prostega dostopa, npr. uporabo uveljavljenih metapodatkovnih standardov kot je Data Documentation Initiative -DDI. Pomembna je tudi promocija uporabe podatkov in usposabljanje uporabnikov za bolj zahtevno uporabo. Izkušnje delovanja ADP bi lahko prenesli tudi na druga disciplinarna področja v Sloveniji.

Ključne besede: arhiv družboslovnih podatkov, podatki raziskav, metapodatkovni standardi,

SOCIAL SCIENCE DATA ARCHIVES AND OPEN DATA SERVICES IN THE REPUBLIC OF SLOVENIA

Abstract

We will present a review of activities of a disciplinary data centre for social sciences, the Social Science Data Archive (ADP). A model of roles, rights, responsibilities and relations will be used for a discussion on three pre conditions of working data infrastructure. These are an explicit support of research founding organisations, willingness of the members of the scientific community to participate and a sufficient level of skills and work professionalization to ensure a high quality service delivery. ARRS enacted a valuation of data submission equivalent to a journal scientific publication. They also provide long-term support for ADP services through funding as an infrastructure research program. Their next intention is to support a national membership in the European research infrastructure, CESSDA ERIC. They are engaged in preparing the strategy of Access to Research Data from Public Funding according to OECD principles. It is important to recognise the role of a data archive not only in selecting, ingesting, managing, and disseminating data, but also that it acts as a specific data related skills centre, which advocates and advises the data producer in

quality data generation, which fits the open access requirements, e.g. by using shared and agreed upon metadata standards, as is Data Documentation Initiative Metadata - DDI. Equally important to the role of data service, is also to actively promote the data use, and further facilitate advanced data usage, e.g. by providing user training and exchange. Experience of ADP could encourage development in other disciplinary areas in Slovenia.

Key words: Social Science Data Archives, datas, metadata standards

Uvod

Prost dostop do podatkov za raziskovalne namene

Področje zagotavljanja storitev dostopa do raziskovalnih podatkov zahteva veliko sodelovanja. Obstaja vrsta modelov, po katerih se lahko razvija, ob tem pa je vprašanje specifičnih opredelitev strategij države v znanosti, strategij raziskovalnih ustanov in ponudnikov podatkovnih storitev, katerega od njih izbrati v posameznem primeru. Podatki so lahko prosto dostopni na podlagi samo-arhiviranja, vloženi v zbirke prosto dostopnih gradiv institucij, ali v podatkovne centre posameznih disciplin, ali pa spremljajo objavo v znanstveni reviji. Tudi različna disciplinarna področja imajo različne pristope in zahteve. Ena sam recept verjetno ne ustreza vsem. Obenem z ohranjanjem posebnosti raziskovalnih področij pa se je na nivoju oblikovanja nacionalnih in mednarodnih strategij potrebno izogniti podvajanju infastrukturnih podatkovnih storitev in omogočiti njihov združljivost, npr. pri agregiranju za namene iskanja in dostopa s strani uporabnikov.

Pri odnosu do prostega dostopa gre tudi za različne interese. Raziskovalni podatki so pred vsem rezultat intelektualnega in delovnega napora raziskovalcev, članov raziskovalne skupnosti, ki so sodelovali pri izdelavi podatkov. Ti isti raziskovalci si lastijo podatke, ko gre za vprašanje tekmovanja in prestiža prvih objav rezultatov analiz, ter zahtevajo prost dostop do podatkov drugih raziskovalcev, kadar to pripomore k bolj relevantnih lastnim objavam. Širjenje kulture medsebojnega deljenja podatkov je lahko počasno, če je prepuščeno samo sebi, kakor kažejo tudi izkušnje s samo-arhiviranjem objav v klasičnih digitalnih repozitorijih ustanov (Harnard 2006, povzeto po Green in Gutmann 2006). Zgodbe o težavah, na katere bomo naleteli pri prvem odzivu raziskovalcev ob pobudi izročanja podatkov v odprto dostopne arhive, so zelo poučne (glej Nelson, 2009). Zato je koristno to pospešiti z oblikovanjem politik na tem področju, ki upoštevajo interese in potrebe vseh vpletenih in so narejene na realističnih temeljih, tako da omogočajo in ne samo zahtevajo njihovo izvrševanje. Odločitev, da naj tudi za raziskovalne podatke, in ne le znanstvene objave v obliki člankov v revijah, zahtevamo prosti dostop, izhaja iz istega principa, da tudi podpora znanosti prihaja iz javnega vira ter je kot javno dobro tudi vsem na razpolago za izkoriščanje, ter da je preglednost in množična dosegljivost podatkov prav tako pogoj za boljša, bolj kakovostna in bolj obsežna znanstvena spoznanja1. Povečan pomen podatkov se kaže v

1 Denimo OECD deklaracija našteva prednosti prostega dostopa od podatkov za "odprto znanstveno raziskovanje, spodbudo analizam in pogledom iz različnih izhodišč, omogoča

zahtevah po hkratnem objavljanju znanstvenih člankov in podatkov pri pomembnih revijah različnih disciplin. Zato je vedno več naprednih znanstvenih politik (ZDA - NSB 2005, Avstralija - ANDS 2007, Velika Britanija - UKRDS 2008, Švedska - DISC 2008) sprejelo načela odprtega dostopa do podatkov in pripravlja strategije za izvedbo ob upoštevanju potreb sodelujočih in ekonomični porabi sredstev.

Model nosilcev in vlog pri vzdrževanju življenjskega cikla podatkov

V nadaljevanju bomo predstavili delovanje področnega podatkovnega centra za družboslovje, Arhiva družboslovnih podatkov. Prikaz se bo naslonil na model vlog, pravic, odgovornosti in povezav posameznih nosilcev v fazah življenjskega cikla podatkov2. Namen tovrstnega prikaza je poudariti medsebojne odvisnosti, pri katerih izpolnjevanje nalog enega pogojuje možnosti delovanja drugega, omeniti dobre rešitve, ki bi se lahko iz družboslovja prenesle na druga področja, opozoriti na pomanjkljivosti in v tem primeru nakazati, kaj načrtujemo za odpravo teh. Podporo takšnemu pristopu k presoji delovanja in načrtovanju storitev podatkovnega dostopa najdemo tudi v načelih in deklaracijah RCUK in OECD3. Tudi aktualno poročilo iz ZDA (Committee, 2009) poudarja celovitost skrbi za kakovostno znanstveno produkcijo podatkov ter skrbi za shranjevanje in uporabo, kjer imajo svojo vlogo tako strokovnjaki s področja ravnanja s podatki, kot raziskovalce in financerji raziskav.

Pregled je narejen s perspektive obstoja močnega področnega podatkovnega centra. Mogoče so tudi druge rešitve, kot je model samo-arhiviranja, ali pa model repozitorijev digitalnih gradiv ustanov. Naša teza gre v to smer, da je obstoj področnih podatkovnih centrov hrbtenica celovitega sistema zagotavljanja dostopa do raziskovalnih podatkov. Ostale storitve so lahko dopolnilo ali vmesne rešitve, med tem ko je robusten in vzdržen sistem sodelovanja raziskovalcev in področnih podatkovnih centrov edini zmožen učinkovito zagotoviti trajni dostop in izkoriščanje najbolj kakovostnih podatkovnih virov za znanost.

Denimo, Green in Gutmann (2006) na podlagi situacije v ZDA, kjer je za razliko od Slovenije zelo razvita mreža digitalnih repozitorijev po ustanovah, izpostavljata naslednje prednosti področnih podatkovnih centrov kot je Interuniversity Consortium for Political and Social Research (ICPSR), ki delujejo že dolga desetletja in so prepoznavni in uveljavljeni znotraj znanstvene skupnosti. Repozitoriji ustanov nastopijo svojo vlogo pri koncu raziskovalnega cikla - pretežno prevzemajo že v končni obliki pripravljene publikacije in druga gradiva, nudijo malo ali nič podpore glede priprave podatkov, metapodatkov in njihove izrabe,

nova raziskovanja, uporabo novih metod ali preverjanje drugačnih in dopolnjenih hipotez, spodbuja raziskave metod zbiranja podatkov in merjenja, izobraževanje novih raziskovalcev, raziskovanje tematik, ki jih primarni raziskovalci niso predvidevali, pripravo novih podatkovnih datotek z kombiniranjem več virov med sabo." (OECD 2007, 11)

2 Glej Green in Gutman 2006, Lyon 2007, Roussalep 2008, Jones 2009.

3 Prvi princip skupnega dokumenta Znanstvenih svetov v Veliki Britaniji (RCUK) se glasi: »Vloga in odgovornost raziskovalcev, raziskovalnih ustanov in financerjev mora biti opredeljena čim bolj jasno (... ) za zagotovitev zavedanja in izpolnjevanja odgovornosti ustvarjalcev in uporabnikov raziskovalnih podatkov(...)« (RIN 2008, 8). Podobno razglašajo načela preglednosti, formalne odgovornosti in profesionalizma iz OECD (2007) deklaracije.

prevzem je pretežno avtomatiziran in gradiva spremljajo metapodatki brez nujnih podrobnosti za razumevanje konteksta nastanka in vsebinskih lastnosti gradiv, z minimalnim preverjanjem na ravni skladnosti formatov. Za razliko od njih so področni podatkovni repozitoriji osredotočeni na izpolnjevanje potreb posameznih disciplinarnih področij tako glede vsebin kot oblik in načina dostopa do podatkovnih gradiv, storitve pa se raztezajo v vse faze življenskega cikla podatkov, od nastanka, hrambe, objavljanja ter ponovne uporabe.

Slika 1: Življenjski cikel podatkov in metapodatkov s podporo DDI (Data Documentation

Initiative) (Copyright © 2009, DDI Alliance)

Idealno tipsko bomo ločili naslednje nosilce aktivnosti pri podpori sistemu storitev dostopa do podatkov: nosilce in izvajalce nacionalnih raziskovalnih politik, kot sta Ministrstvo za visoko šolstvo znanost in tehnologijo (MVŠZT) ter Javna agencija za raziskovalno dejavnost RS (ARRS), nato člane znanstvene skupnosti, ki nastopajo v različnih vlogah kot uporabniki ali ustvarjalci in dajalci podatkov, ter področni podatkovni center za družboslovje, katerega vlogo izpolnjuje ADP.

Vloga in odgovornost financerjev znanosti

Vsi ostali nosilci so najprej odvisni od podpore njihovi dejavnosti s strani javnih financerjev znanosti. ADP dobiva sredstva za svojo dejavnost od ARRS preko razpisov za infrastrukturne raziskovalne programe. Formalno smo del Mreže raziskovalnih infrastrukturnih centrov Univerze v Ljubljani (MRIC UL), vendar nastopamo tu znotraj s povsem svojim programom. Dobro je, da je dejavnost ADP priznana kot infrastrukturna dejavnost za podporo znanosti in izobraževanju, saj bi bilo v nasprotnem primeru potrebno plačevati za storitve, kar pa bi bilo z vidika čim širšega izkoriščanja gradiv neoptimalno.

Model financiranja infrastrukturnih raziskovalnih centrov je prilagojen financiranju lastnih infrastrukturnih potreb ustanov, od česar pa dejavnost ADP, ki je opredeljena v celotnem disciplinarnem spektru družboslovja in za celotno državo, odstopa. To pomankljivost bo po pričakovanjih odpravil dopolnilni način financiranja nacionalnih podatkovnih storitev v okviru evropske podatkovne infrastrukture za družboslovje CESSDA - ERIC. Osnutek dejavnosti mreže CESSDA - ERIC je bil pripravljen v okviru projekta na posebnem razpisu EU FP7 projekta »Preparatory Phase Project for a Major Upgrade of the Council of European Social Science Data Archives (CESSDA) Research Infrastructure«.4 Nova oblika delovanja predstavlja organizacijsko in strokovno nadgradnjo podatkovne infrastrukture na področju družboslovja. Izkorišča možnosti sodelovanja nacionalnih organizacij, teritorialno zadolženih za skrb za podatke, na ravni Evrope tako, da se poveže delo na razvojnih projektih, pri implementaciji standardiziranih rešitev pri ravnanju s podatkovnimi gradivi in s poenotenjem ravni kakovosti zagotavljanja storitev. Na kratko je cilj nove organizacije zagotoviti pogoje za vzpostavitev dobro opredeljene, celovite in med seboj povezane podatkovne infrastruture za družboslovje tako na nacionalni in mednarodni ravni.

Naslednja področja smo v okviru pripravljalnega projekta (PPP) bodočega CESSDA opredelili kot ključna:

• Poenotenje postopkov izročanja podatkov pri zajemu, tako da so varovane avtorske pravice dajalcev.

• Uporabniki se bodo imeli možnost registrirati za dostop do podatkov v svoji državi z uporabo poenotene ontologije statusov glede na pravice do uporabe gradiv, ki bodo usklajene s poenotenimi kategorijami dostopnosti gradiv. Dostop bo možen na daljavo preko enotnega vmesnika.

• Dajalci (raziskovalci) bodo preko svojih nacionalnih svetovalnih centrov in v okviru mednarodnih izobraževalnih aktivnosti usposobljeni za uporabo načel in orodij, ki zagotavljajo pripravo kakovostnih podatkovnih virov za predajo v nacionalni podatkovni arhiv kot pooblaščeno mesto sprejema, pregledovanja in nadaljnje distribucije gradiv. Izdelovala se bodo skupna orodja za podporo priprave, dokumentacije in predaje podatkov v arhiv.

• Uskladila se bo širina tematskega zajema, tako da bodo posamezna področja, ki morda nacionalno niso tako zastopana, vključena v celovito ponudbo podatkovnih virov, primernih tako za disciplinarno kot interdisciplinarno izrabo. Npr. v Sloveniji bomo širili zajem na ekonomijo, etnologijo, socialno medicino in socialno delo.

• Opredeljene bodo obveznosti glede izročanja podatkov raziskav iz javnih sredstev, skladno z deklaracijo OECD, pri čemer bo vzpostavljena storitev pooblaščenega mesta prevzema podatkov.

• Izdelovala se bodo skupna orodja in portali za opravljanje storitev dodane vrednosti na podatkih, kot je harmonizacija in povezovanje podatkov iz različnih virov, povezovanje z različnimi produkti znanja kot so objave, izpeljana bo zasnova in podpora za delovanje repozitorija banke anketnih vprašanj, programov za zbiranje podatkov in upravljanje s podatki.

• Širitev in podpora pri razvoju sorodnih dejavnosti na nacionalni ravni ter v državah, kjer to še ni razvito s storitvami svetovanja, izmenjave in usposabljanja.

http://www.cessda.org/project/

4

• Razvoj najboljših praks v celotnem spektru storitev, skladno s konceptom življenjskega cikla podatkov. Ob tem bo potekalo vpeljevanje novih metapodatkovnih standardov (trenutno DDI3).

• Razvoj in potrjevanje sistemov za dolgotrajno hrambo.

• Ob tem poteka tudi priprava vseh pravnih in organizacijskih podlag za delovanje nove organizacije.

Podpora vključevanja Slovenije v novo organizacijo je utemeljena tudi z zavezami na ravni nacionalnih strategij. Na dokaj splošnem nivoju je podpora države prostemu dostopu do raziskovalnih podatkov izražena v zavezah podpore razvoju in uporabi izobraževalnih in znanstvenih e-vsebin ter nacionalne infrastrukture za arhiviranje digitalnih podatkov (Si2010, 46). Nove strategije na področju informacijske družbe in znanosti, tako kot je napovedana Raziskovalno inovacijska strategija Slovenije v pripravi na Direktoratu za znanost, bodo še bolj poudarjale pomen znanstvene podatkovne infrastrukture.

Najbolj jasno se je k izgradnji sistema prostega dostopa do podatkov Slovenija zavezala z včlanitvijo v OECD in s sprejetjem obveznosti že nekajkrat omenjene deklaracije, ki izhaja iz priporočil Odbora OECD (2007) za znanstveno in tehnološko politiko iz leta 2006 {Recommendation of the Council concerning Access to Research Data from Public Funding, 14 Decembre 2006, C (2006)184}. Izjemen pomen te pobude je v tem, da, za razliko od znanih pobud širjenja odprtega dostopa do znanstvenih publikacij (npr. Berlinska, Budipeštanska pobuda ...), v ospredje postavlja raziskovalne podatke, opredeljene kot primarne zapise iz znanstvenih opazovanj, ki jih znanstvene skupnosti priznavajo kot ustrezne za preverjanje veljavnosti raziskovalnih spoznanj. Prosti dostop pomeni enakopravnost vseh pripadnikov znanstvene skupnosti in zagotovilo najnižjih mogočih stroškov, da dostopajo po vnaprej opredeljenih postopkih in pravilih do primarnih podatkov ter jih izkoriščajo v okviru raziskovanja in usposabljanja. Poudarek je torej na primarnih, surovih podatkih, ki jih v različnih disciplinah lahko najdemo tako v obliki številskih zapisov kot v drugih oblikah, skratka podatke, ki jih je mogoče uporabiti za nadaljnje znanstvene analize.

Skladno z našimi izhodišči glede razdelitve obveznosti in vlog so oblikovalci nacionalnih strategij na področju znanosti dolžni zagotoviti ustrezen okvir predpisov in motivacije za izpeljavo nalog zagotavljanja odprtega dostopa do podatkov, zlasti s finančnega in organizacijskega vidika. ARRS je v letošnjem letu s podporo Ministrstvo za visoko šolstvo, znanost in tehnologijo (MVŠZT) razpisalo projekta v okviru razpisa za CRP »Oblikovanje strokovnih podlag za postopno vzpostavitev celovitega sistema odprtega dostopa do digitaliziranih podatkov javno financiranih raziskav v Sloveniji«, katerega podlaga je ravno izpolnjevanje zahtev OECD (2007). MVŠZT je, po našem mnenju pravilno, presodil, da za pripravo izvedbene strategije potrebuje strokovna izhodišča, ki bodo upoštevala izkušnje z delovanjem storitev dostopa do raziskovalnih podatkov v Sloveniji, zgled česar je prav delovanje ADP. Koristno bo tudi poglobljeno poznavanje situacije v drugih državah, ki smo si ga pridobili s pogostimi stiki z našimi partnerji v tujini.

Strategije in politike na določenem področju morajo upoštevati želje in poglede vseh relevantnih akterjev že v fazi priprave izvedbene strategije. Ti ključni akterji so pripadniki

znanstvene skupnosti, ki jih je potrebno seznaniti z možnostmi odprtega dostopa do znanstvenih podatkov, prednostmi tega za izboljšanje znanstvenih odkritij, ter po drugi strani nalogami, ki jih je potrebno opraviti, da bodo prednosti prišle do izraza. Naloga omenjenega projekta je tako pripraviti predlog, ki bo zdržal tako s strokovnega vidika kot tudi vključeval zaveze in konsenz glede rešitev s strani akterjev. To nameravamo doseči skozi pregled trenutnega stanja v Sloveniji, razpravo in oblikovanje želja med predstavniki znanstvene skupnosti, ob sodelovanju z obstoječimi znanstvenimi informacijskimi storitvami in nosilci znanstvene politike, ter ob upoštevanju zgledov iz tujine. Predlog akcijskega načrta razvoja sistema odprtega dostopa do podatkov za znanstvene namene bo utemeljen s posameznimi primeri obstoječih dobrih praks in načeli deklaracije OECD. Poleg ponujenih rešitev, kjer bomo ugotovili visoko soglasje vseh akterjev, bomo identificirali posamezna vprašanja, pri katerih izbira ponujenih opcij zahteva nadaljnje študije izvedljivosti in podrobne ocene finančne in kadrovske zahtevnosti (primerjaj Beagrie et al 2008 in UKRDS 2008). Cilj je pregled različnih problemov in opcij načrtov za rešitev, s tem, da bodo odgovori v takih primerih lahko podani samo skozi dejanski proces izvedbe. Tematika projekta bo tudi priprava izhodišč za merila kakovosti in učinkovitosti podatkovnih storitev, katerih uporaba bo vodila nadaljnje podrobne korake pri implementaciji (primerjaj ANDS 2008).

Vloga in odgovornost znanstvene skupnosti

Cilj napredne nacionalne raziskovalne politike mora biti spodbujanje visoke kakovosti raziskovanja z vzpostavitvijo sistema prostega dostopa do podatkov, pri čemer je potrebno pazljivo načrtovanje na nivoju strateških odločitev nacionalne porabe sredstev za dodatno delo, ki je potrebno pri zagotavljanju odprtega dostopa, v primerjavi z vlaganji v druga področja, npr. samo izdelavo podatkov (NSB 2005; ANDS 2007). Razrešitev teh dilem gre v razvitih raziskovalnih okoljih, ki jih lahko jemljemo za zgled, v smeri spodbujanja zelo kakovostnih projektov produkcije podatkov, pri katerih sodeluje več raziskovalnih skupin, te podatke pa z intenzivnim dodatnim vlaganjem v spravilo in razširjanje naredijo dostopne za najširši krog zainteresiranih raziskovalcev. Osnova delovanja tovrstnih projektov so zelo jasne zahteve glede izpolnjevanja standardov kakovosti pri izdelavi podatkov, kasnejše beleženje meril izpolnjevanja teh standardov, naknadna analiza kakovosti in uvajanje potrebnih popravkov zaradi morebitne pristranosti podatkov v okviru analiz. Zgled za tovrstna stroga pravila so nekateri mednarodni projekti primerjalnih anketnih raziskav, pri katerih morajo nacionalne skupine dokazati usposobljenost za izpolnjevanje zelo podrobnih izvedbenih zahtev (glej ESS 2009). Zanimiv je tudi pristop, ki ga uveljavlja pobuda za pridobivanje potrdila o ustreznosti podatkov za dolgotrajno uporabo - Data Seal of Approval (DSA) (tabela 1). Ta, za razliko od nekaterih drugih tovrstnih postopkov preverjanja, ki so usmerjeni na procese digitalne hrambe v ožjem smislu (glej pregled v Štebe in Vipavc Brvar 2010), izraziteje poudarja vlogo dajalca pri ustrezni pripravi podatkov, tako da ti izpolnjujejo pogoje za vstop v sistem dolgotrajne hrambe.

Tabela 1: Prva tri vodila DSA5

1. Ustvarjalec podatkov izroči raziskovalne podatke v podatkovni repozitorij z zadostnimi spremljajočimi informacijami da lahko drugi ovrednotijo znanstveno kakovost raziskovalnih podatkov skladno z merili posameznih disciplin in etičnimi zahtevami

2. Ustvarjalec podatkov priskrbi raziskovalne podatke v obliki, ki jo priporoča podatkovni repozitorij

3. Ustvarjalec podatkov priskrbi raziskovalne podatke skupaj z metapodatki ustrezno zahtevam s strani podatkovnega repozitorija

Načela prostega dostopa do podatkov kot javne dobrine (Kaul in drugi, 1999) zahteva posebno pozornost pri ravnanju s podatki že pri izdelavi podatkov, da se zagotovi ustrezna vsebinska obdelava, dokumentacija in priprava za nadaljnjo uporabo. Vse to zahteva dodatno delo s strani ustvarjalcev podatkov, za kar morajo biti ustrezno usposobljeni in motivirani. To je konkretna naloga financerjev znanosti (motivacija) in področnih podatkovnih centrov (usposabljanje dajalcev), v okviru prej omenjenega zagotavljanja finančnih in organizacijskih pogojev. Kar zadeva ADP, je za dajalce pomembna informacija glede zahtev, ki jih naj podatki izpolnjujejo. Na splošno je naša politika ta, da sprejemamo podatke, ki dosegajo osnovna znanstvena merila kakovosti in vsebinske zanimivosti za nadaljnje analize, hkrati pa izpolnjujejo vsaj minimalne pogoje glede popolnosti in preglednosti dokumentacije (glej podrobneje v Štebe in Vipavc, 2010). Konkretna spodbuda s strani ARRS za izročanje podatkov v ADP je upoštevanje tega v okviru vrednotenja bibliografij. Izročeni podatki namreč štejejo kot znanstvena objava po merilih ARRS6. V določenem smislu je presoja ustreznosti podatkov za arhiv podobna recenzijskemu postopku pri objavah v revijah, saj se ravno tako presoja pomen in uporabnost za znanost.

Zelo jasno se podpora izročanju podatkov s strani ADP kaže v tem, da dajalcem podatkov ponujamo podrobna navodila in obrazce za pripravo in oddajanje podatkov v arhiv. Usposabljanje za pripravo podatkov je tematika občasnih seminarjev, namenjenih dajalcem (Štebe in Vipavc Brvar 2008) Partnerske organizacije in v skupnem sodelovanju pripravljamo vrsto vodičev za dajalce (CESSDA7, ICPSR8, DATA PASS9, UK DA10). Značilen konkreten primer težav pri izročanju podatkov je reševanje problema prostovoljnega pristanka in zaupnosti podatkov v okviru kvalitativnih raziskav (Štebe in ostali, 2009). Vprašanje zaupnosti je v širšem smislu povezano tudi z dostopnostjo podatkov statističnih uradov. Na eni strani je naloga dajalca, da (skupaj s podatkovnih arhivom) opredeli postopke za anonimizacijo in kriterije glede zahtev zaupnosti. Kadar dajalec podatkov opredeli omejitve glede namena uporabe ali kategorije uporabnika, je naloga arhiva podatkov, da omogoča ustrezno

5 http://www.datasealofapproval.org/, 30. 9. 2010.

6 Pravilnik o kazalcih in merilih znanstvene in strokovne uspešnosti, 5. člen, točka 3.E. (http://www.arrs.gov.si/sl/akti/prav-znan-strok-uspesn-maj07.asp)

7 http://www.cessda.org/sharing/, 30. 9. 2010

8 http://www.icpsr.umich.edu/icpsrweb/ICPSR/access/deposit/, 30. 9. 2010

9 http://www.icpsr.umich.edu/icpsrweb/DATAPASS/best-practices.jsp, 30. 9. 2010

10 http://www.data-archive.ac.uk/deposit, 30. 9. 2010

registracijo uporabnikov in kontrolira dostop do gradiv glede na opredeljen omejitve glede dostopnosti in upoštevaje pravice uporabnikov. Tovrsten sistem zahteva nadaljnjo uskladitev in sodelovanje na ravni mednarodne izmenjave in dostopa do podatkov, kar je ena od nalog projekta sodelovanja partnerjev CESSDA in Statističnih uradov v Evropi - Data Without Boundaries (DwB). Rešitev pri integraciji sistemov dostopnosti in različnih režimov dostopa do podatkov je lahko ta, da se poenoti in med sabo poveže samo metapodatkovne opise, namenjene iskanju in presoji uporabnosti podatkovnih gradiv za sekundarno analizo s strani uporabnika (glej Le Clerc 2006), kar se nanaša na nekatere podatke statističnega urada. Fizično mesto dostopa je lahko še vedno pri dajalcu.

Poseben problem usklajevanja nalog ustvarjalcev podatkov s pričakovanji arhiva je uporaba ustreznih formatov za dolgotrajno hrambo, verziranje datotek in uporaba stalnih identifikatorjev, uporaba harmoniziranih in standardnih demografskih spremenljivk, povezovanje podatkov in njihova dokumentacija skladno s standardi. Na področju družboslovja se uveljavlja standard za metapodatke DDI11. Verzija 3.1 standarda je zato, ker pokriva celoto življenjskega cikla digitalnih objektov, zelo zanimiva prav za ustvarjalce podatkov, saj s svojo arhitekturo podpira registracijo konceptualno opredeljenih spremenljivk, z njimi povezanih operacionalizacij npr. v obliki anketnih vprašanj, večjezičnost in verziranje ter s tem tudi ponovno uporabo pri zasnovi novih podatkovnih virov in združevanju podatkov iz različnih virov. Sam standard je zanimiv tudi zato, ker zagotavlja modele za sledljivost korakov pri pripravi in ravnanju s podatki, kar je pomembno z vidika zahtev sistemov dolgotrajne hrambe. Uvedba tega standarda zahteva kar nekaj znanja in uporabo ustreznih orodij, kar lahko zagotovi samo dovolj velika skupnost med sabo povezanih uporabnikov.

Potreba po načrtovanju in usposabljanju

Iz deklaracije OECD povzemamo eno od ugotovitev:

V posameznih vejah znanosti je odsotnost načrtovanja in izvajanja ustrezne skrbi za dokumentacijo in arhiviranje podatkovnih datotek ključna ovira pri doseganju maksimalne vrednosti na podlagi vlaganj v raziskovalne podatke. Načrtovanje projektov in programov na vseh nivojih mora neposredno izpostaviti problematiko podatkov v najzgodnejši fazi zato, da se lahko predvidijo finančne in tehnične zahteve osnovne priprave in skrbništva nad podatki. Poskrbeti je treba za podporo pobudam in strokovnem usposabljanju na vseh področjih upravljanja s podatki. (OECD 2007,19)

Ob tem, ko je izpostavljena tudi potreba po usposabljanju za delo s podatki, problematika, ki je lepo povzeta v enem od poročil DCC12, je poudarek na načrtovanju in zagotavljanju pogojev za skrb za podatke.

Aktualna je pobuda financerjev znanosti v ZDA13 in VB, da bodo od prijav na raziskovalne projekte zahtevali načrt upravljanja s podatki in delitve podatkov (Jones, 2009). Načrt bo kot

11 http://www.ddialliance.org/

12 Swan in Brown (2008).

del prijave šel skozi recenzijski postopek. Britanski Digital Curation Centre pripravlja pripomoček14 in navodila za pripravo načrta15. Britanski arhiv družboslovnih podatkov UK DA ponuja gradiva in svetovanje že pri pripravah projektov in v zgodnji fazi njegovega izvajanja16. Značilnost tega modela je, da financer obenem, ko zahteva načrt upravljanja s podatki, zagotavlja tudi, da se temu delu namenijo stroški projekta.

Vloga področnih podatkovnih centrov

Podatkovni center ne nastopa več samo na koncu procesa raziskovanja, da kot izdajatelj obenem z dokončanim raziskovalnim poročilom objavi tudi podatke. Raziskovalci so, potem, ko se seznanijo z orodji in pristopi pri ravnanju s podatki, ob ustrezni podpori področnega podatkovnega centra, sposobni že v zgodnjih fazah ustvarjanja podatkov uvesti postopke upravljanja in dokumentiranja tudi za lastne namene učinkovitejšega vodenja raziskovalnega projekta. Omenjali smo možnosti integracije računalniških skript za vodenje anketiranja s sistemom dokumentacije registra in repozitorija spremenljivk in podatkov o terenu v okviru standarda DDI. Takšno sodelovanje, katerega začetek seže v obdobje priprave projekta, kjer se predvidi naloge in potrebna sredstva za kakovostno pripravo podatkov, in ki se intenzivira ob zgodnjem začetku projekta s prejemom informacije o potrditvi projektu, ki sproži medsebojno obveščanje in uskladitev nalog med arhivom in raziskovalno skupino, se zaključi izročitvijo za arhiviranje popolnoma pripravljenih podatkov.

Področni podatkovni arhiv je s strani financerjev pooblaščen za prevzem podatkovnih gradiv. Skladno z načrti upravljanja podatkov, ki jih pripravljajo ustvarjalci, nastajajo načrti za prevzem in digitalno hrambo specializiranih podatkovnih centrov, z jasno opredeljenimi notranjimi in zunanjimi vlogami in odgovornostmi v celotnem procesu (primerjaj Štebe in Brvar 2010). Zopet v tem sistemu financer, obenem ko od ustvarjalcev podatkov zahteva njihovo izročanje, zagotavlja tudi sredstva za ustrezno raven storitev področnega podatkovnega centra, da se opravi prevzem podatkov. Omenjali smo že, da se, podobno kot skozi merila za ocenjevanje kakovosti priprave podatkov s strani dajalcev, tudi za storitve pridobivanja, shranjevanja in razširjanja podatkov oblikujejo merila in postopki za presojo. V širšem smislu se običajno preverja skladnost z OAIS standardom (OAIS 2002; primerjaj tudi Sesink et al. 2008).

Pomembno poslanstvo in vloga podatkovnih centrov je tudi strokovno usposabljanje, razvijanje novih standardov in orodij, ter njihova promocija na področjih, povezanih s skrbjo za podatke.

Vloga področnega podatkovnega arhiva je pomembna tudi pri promociji uporabe podatkov. V tem pogledu se ne razlikuje zelo od knjižnic. Ponuja kataloge in možnosti iskanja, dostopa

13 Press Release 10-077, Scientists Seeking NSF Funding Will Soon Be Required to Submit Data Management Plans, http://www.nsf.gov/news/news_summ.jsp?cntn_id=116928, 30. 9. 2010

14 DMP Online. http://dmponline.hatii.arts.gla.ac.uk/

15 http://www.dcc.ac.uk/resources/data-management-plans

16 CREATE & MANAGE DATA, http://www.data-archive.ac.uk/create-manage/, 30. 9. 2010

do gradiv na daljavo in možnosti analiz na daljavo, možnost registracije, usposabljanje za delo na podatkih z vodiči in seminarji, sprotne nasvete in pomoč uporabnikom17 .

ADP glede na svojo majhnost nima tako široke in razvejane ponudbe učnih gradiv kot nekateri najbolj razviti. ADP ponuja nekaj na daljavo dostopnih priročnikov za uporabnike, npr. napotke za pripravo podatkov za izročanje, gradiva za pomoč uporabnikom pri iskanju, dostopu in analiziranju podatkov in pa gradiva za samoizobraževanje za povečevanje podatkovne in statistične pismenosti, ali za uporabo pri poučevanju, kjer je vključeno tudi izkoriščanje podatkovnih virov.

arhiv družboslovnih podatkov

Sit

Podatki Isitanje Vsebinsita področja Serije

čja^^l

Podpora uporabniltom O podatitih Usposabljanje Izročanje podatkov O arhiviranju

Pouezaue skupnosti Evidentiraj raziskavo Prispevaj podatke Prispevaj gradiva Blog

Tu ]e na voljo podpora tistim, l<i bi radi izboljšali znanje, potrebno za polno izkoriščanje možnosti podatkov in drugih arhivskih stontev.

Na razpolago so:

• gradiva za pomoč uporabnikom pn iskanju, dostopu in analiziranju podatkov;

• gradiva za samoizobraževanje za povečevanje podatkovne in statistične pismenosti, ali za uporabo pn poučevanju, kjer je vključeno tudi izkoriščanje podatkovnih virov;

• dajalci podatkov se bodo podrobneje seznanili s postopkom izročanja podatkov;

• za bojše razumevanje našega delovanja imamo predstavljena navodila in standarde o postopkih arhiviranja podatkov in z njimi povezanih stontev.

arhtv dRJžbosrovnih

desetlet

ADP hrani tudi to raziskavo...

PB3/00. Politbarometer, Slovenij. 2000/3, Marec 2000, CJMMK

P

Prijava na eNovice

Ce želite biti na tekočem s dogajanjerr Arhivu družboslovnih podatkov^ prijavite na naše eNovice, Enkrat mesec vas bomo seznanili z najnovejš dogajanjem v ADP, E-naslov;

Slika 2: Pomemben del dejavnosti ADP je podpora uporabnikom

Gradiva za samoizobraževanje in poučevavanje v ožjem smislu v glavem obsegajo pretekle predstavitve ADP v elektronski obliki za različne javnosti. V tej rubriki vodimo tudi pregled zanimivih in tako ali drugače uporabnih gradiv za naše uporabnike od drugod, pri tem pa uporabljamo socialno orodje za beleženje dokumentnih oznak Connotea18. Le-ta omogoča, da tudi drugi uporabniki kolektivno delijo dokumentne oznake zanimivih virov v omrežni skupnosti. Tu je tudi povezava na pretekle Nagrade Klinarjevega sklada za visokošolska dela, ki temeljijo na podatkih iz ADP, te pa vodijo v digitalno zbirko visokošolskih del na Fakulteti za družbene vede19. Ta del spada pod gradiva, ki so namenjena učenju skozi zgled, ki ji zelo ustrezno ravno za področje metodološke in statistične pismenosti, kjer velik del znanj predstavljajo t. i. tiha znanja ('tacit knowledge'). Na tem konceptu učenja so denimo zastavljena zelo zanimiva gradiva zgledov študij uporabe mednarodnih podatkov britanskega ESDS, ki jih prispevajo sami uporabniki20, nekaj podobnega pa je tudi na področju zgledov uporabe kvalitativnih podatkov pri poučevanju21.

17 http://www.adp.fdv.uni-lj.si/za_uporabnike/

18 http://www.connotea.org/tag/gradivo za raziskovalce - materials for researchers

19 http://dk.fdv.uni-lj.si/DelaFDV/

20 http://www.esds.ac.uk/international/casestudies/

21 http://www.esds.ac.uk/qualidata/support/reuseexamples.asp

Naloge ADP pri bodočem CESSDA ERIC

Omenjali smo že, da se Slovenija resno pripravlja za članstvo v CESSDA ERIC, ki predstavlja enega od nosilcev evropsko povezane raziskovalne infrastrukture za družboslovje. Konkretne predvidene aktivnosti nacionalnih nosilcev podatkovnih storitev v tej povezavi so:

• Področje skrbništva digitalne hrambe, npr. uvajanje sistema stalnih identifikatorjev, orodja za upravljanje z repozitorijem, ureditev notranjih protokolov pri ravnanju s podatki, povezanih s sistemom dolgoročne hrambe, skladen s pravili OAIS ali drugimi strokovno opredeljenimi načeli dolgotrajne hrambe.

• Širša promocija izročanja podatkovnih gradiv dajalcev in usposabljanje za kakovostno pripravo podatkovnih gradiv. V tem okviru tudi ureditev zajema, hrambe in dostopa do kvalitativnih podatkov. Na tem področju deluje veliko slovenskih raziskovalcev, ki še nimajo ustrezno zagotovljenih možnosti za nadaljnjo izrabo gradiv. Narejena je pripravljalna študija s popisom stanja na tem področju in prednostnih nalog, pri kateri je sodelovalo več raziskovalcev tako s področja etnologije kot socialnega dela skupaj s sodelavci ADP (Štebe et al. 2009).

• Popis podatkovnih gradiv, dopolnjevanje protokolov in orodij za dostop do osebno občutljivih podatkov, oddaljeni dostop ipd. na področju podatkov Statističnega urada in drugih javnih ustanov, kot je Inštitut za varovanje zdravja. Že omenjeni projekt z naslovom Data without Boundaries (DwB),, v katerim skupaj z množico partnerjev po Evropi nastopamo skupaj ADP in Statistični urad RS, bo nakazal rešitve, ki jih bo potrebno implementirati nacionalno.

• Okrepljeno izobraževanje uporabnikov in promocija zahtevne uporabe tako v znanosti kot pri poučevanju družboslovja, tudi z izkoriščanjem povezav z ostalimi partnerji v tujini ter z vključevanjem vsebin upravljanja s podatki v poletne šole statistike in metodologije. Leta 2008 smo imeli ob 10 letnici delovanja ADP niz izjemno odmevnih delavnic, s katerimi bomo nadaljevali v širših okvirih mednarodnih in nacionalnih povezav. Posebno področje je tudi priprava izhodišč za učne programe in oblikovanje kariere in kadrovskega profila vloge skrbnika nad podatki. Pomembno je tudi strokovno napredovanje in usposabljanje za kakovostno in učinkovito opravljanje nalog v nacionalnem okviru sodelavcev ADP.

• Mednarodna promocija domačih podatkovnih gradiv za spodbujanje uporabe podatkov o slovenski družbi v mednarodni znanstveni skupnosti in v okviru primerjalnega raziskovanja. Konkretno so predvidena vlaganja v slovenski prevod večjezičnega tezavra ELLST22 in njegova implementacija. Posodobitev spletne predstavitve ADP v angleškem jeziku. Sodelovanje pri razvoju in uporaba skupnih orodij na mednarodni ravni. Osnovna ideja je, da se integrira delovanje nacionalnih servisov na mednarodni ravni. Mednarodno sodelovanje pomeni prihranek pri stroških razvoja, skupno prijavljanje na projekte, ipd. Orodja lahko prilagodimo in nadgradimo nacionalno pri povezovanju, agregiranju, centralnem dostopu do vsebin in registraciji uporabnikov.

Zaključki

22 European Language Social Science Thesaurus

Večina omenjenih nalog, povezanih s predvidenimi zahtevami polnega članstva v CESSDA ERIC, vsebinsko in tehnološko predstavljajo kakovostno nadgradnjo tekoče dejavnosti ADP. Priključitev k CESSDA ERIC je tako tudi priložnost, da se zagotovi nacionalne storitve dostopa do podatkov, ki so primerljive razvitejšim okoljem. Na ta način se bo z relativno majhnimi vlaganji zagotovil prirast znanstvenih odkritij in splošne ravni usposobljenosti za raziskovalno delo s podatki, skladno s svetovnim trendom na podatkih in povezanih znanjih osnovane kakovostne znanstvene produkcije. ADP nastopa kot podlaga za kakovosten preboj slovenske znanosti, ki je lahko utemeljen le na prostem dostopu do najbolj kakovostnih podatkovnih virov. Omogoča primerjalno raziskovanje in uporabo domačih podatkovnih virov uporabnikom od drugod. Za polno sodelovanje pri ogrodju CESSDA ERIC, ki ga načrtujemo, morajo biti v nacionalni ravni izpolnjeni finančni in organizacijski pogoji kakovostnega opravljanja s podatki povezanih storitev, ustreznega kadrovskega pokritja skupaj s perspektivo strokovnega usposabljanja in napredovanja, ter podpore okolja pri širjenju kulture prostega dostopa do podatkov.

Obstoj močnega področnega podatkovnega centra bo zagotavljalo kritično maso ohranjanja in razvijanja strokovnega znanja za ravnanje s podatki. To bo podlaga za koordiniran nastanek novih področnih podatkovnih centrov za discipline, kjer tega še ni (ekonomija, psihologija, medicina, zdravstvo, geografski podatki, kemija, agronomija, meteorologija, itd.). Raziskati pogoje in pripraviti izvedljiv načrt, prilagojen okoliščinam slovenskih razmer v znanosti, je tudi izziv projekta CRP implementacije načel OECD: ODPRTI PODATKI - Priprava akcijskega načrta za vzpostavitev sistema odprtega dostopa do podatkov iz javno financiranih raziskav v Sloveniji. Izhodišče tega projekta je, da v Sloveniji na področju dostopa do raziskovalnih podatkov ne razvijamo nekaj povsem novega. ADP deluje več kot 10 let; treba je ohraniti sedanje stanje in ga nadgraditi v smeri kakovosti delovanja v okviru celovitega sistema med seboj prepletenih vlog in odgovornost. Naša naloga je prenesti izkušnje na druga področja, kjer so podatkovne storitve še v zametkih, jih prilagoditi potrebam uporabnikov in posebnostim posameznih disciplin, poskrbeti pa tudi za integracijo strokovnih pristopov, orodij in storitev tam, kjer je to bolj optimalno z vidika porabe sredstev, človeških naporov in nivoja zagotavljanja kakovosti storitev.

Bibliografija

ANDS Technical Working Group (2008) Towards the Australian Data Commons A proposal for an Australian National Data Service. Pridobljeno s spletne strani: http://www.pfc.org.au/bin/view/Main/Data

Beagrie, N., Chruszcz, J. Lavoie B. (2008) Keeping research data safe. JISC Reports. Pridobljeno s spletne strani: http://www.jisc.ac.uk/publications/publications/keepingres earchdatasafe.aspx

Committee on Ensuring the Utility and Integrity of Research Data in a Digital Age; National Academy of Sciences: Ensuring the Integrity, Accessibility, and Stewardship of Research Data in the Digital Age. (2009). Pridobljeno s spletne strani: http://www.nap.edu/ catalog.php?record_id=12615

Ann Green, Myron Gutmann, (2006) Building Partnerships Among Social Science Researchers, Institution based Repositories and Domain Specific Data Archives http://hdl.handle.net/2027.42/41214

DISC - Database Infra-Structure Committee. (2008). Pridobljeno s spletne strani dne 29. 9. 2010: http://www.vr.se/omvetenskapsradet/organisation/radgivandeorgan/discdatabase infrastructurecommittee.4.bfcea3310ab2bd97898000264.htm

Harnad, S. (2006), Generic Rationale for University Open Access Self-Archiving Policy. Pridobljeno s spletne strani: http://eprints.ecs.soton.ac.uk/12078/01/genericSApolicy-linked.html

ESS - European Social Survey. (2009). Round 5 Specification for Participating Countries. London: Centre for Comparative Social Surveys, City University London. Pridobljeno s spletne strani: http://www.europeansocialsurvey.org/index.php?option=com_docman&task=doc_ download&gid=602&Itemid=80

Jones, S. (2009). A report on the range of policies required for and related to digital curation, DCC POLICIES REPORT, Deliverable H1.1, Version: 1.2, Glasgow. Pridobljeno s spletne strani: http://hdl.handle.net/1842/3371

LeClere, F. B. (2006). Data Sharing for Demographic Research at ICPSR. ICPSR Bulletin, 26 (2), 3-8. Pridobljeno s spletne strani: http://www.icpsr.umich.edu/files/ICPSR/org/publications /bulletin/2006-Q1.pdf

Lyon, L. (2007) Dealing with Data: Roles, Rights, Responsibilities and Relationships. Pridobljeno s spletne strani: http://www.jisc.ac.uk/media/documents/programmes/digital repositories/dealing_with_data_report-final.pdf

OECD. (2007) OECD Principles and guidelines for access to research data from public funding. Pridobljeno s spletne strani: http://www.oecd.org/dataoecd/9/61/38500813.pdf

Library of Congress-National Science Foundation Digital Preservation Project Descriptions. Pridobljeno s spletne strani: http://www.digitalpreservation.gov/partners/researchproj.html

National Science Board (NSB). (2005). Long-Lived Digital Data Collections: Enabling Research and Education in the 21st Century: Report of the National Science Board (Pre-publication draft, Approved by the National Science Board May 26, 2005, subject to final editorial changes.). Technical Report.

Nelson, B. (2009). Data sharing: Empty archives. Published online 9 September 2009 | Nature 461, 160-163, doi:10.1038/461160a

OAIS. (2002). Reference Model for an Open Archival Information System (OAIS), CCSDS. Pridobljeno s spletne strani: http://www.ccsds.org/documents/650x0b1.pdf

RIN - RESEARCH INFORMATION NETWORK. (2008). Stewardship of digital research data -principles and guidelines. London: RIN. Pridobljeno s spletne strani: http://www.rin.ac.uk/ data-principles

Ruusalepp, R. (2008). A comparative study of international approaches to enabling the sharing of research data. Pridobljeno s spletne strani: http://www.dcc.ac.uk/docs/publi cations/reports/Data_Sharing_Report.pdf

Sesink, L., Van Horik R., Harmsen H. (2008). Data seal of approval. Quality guidelines for digital research data in the Netherlands. Pridobljeno s spletne strani: http://www.datasealofapproval.org/files/datakeurmerk1-2_en_kleur_web.pdf

Si2010 - Strategija razvoja informacijske družbe v Republiki Sloveniji, 2007. Pridobljeno s spletne strani: http://193.2.236.95/dato3.nsf/OC/0707011323466/$file/128v1_7.doc

Štebe, J., Hudales J., Kragelj B. 2009. Qualitative longitudinal research and qualitative resources in Europe: mapping the field and exploring strategies for development : Slovenia : country report for Bremen workshop. V: Qualitative longitudinal research and qualitaive resources in Europe / ALLF, University of Bremen. - Bremen : ALLF, University of Bremen. Str. [86-111].

Štebe, J., Vipavc Brvar I. (2008). Vodič za pripravo družboslovnih podatkov za arhiviranje [Elektronski vir]. Ljubljana: Univerza v Ljubljani, Fakulteta za družbene vede, Arhiv družboslovnih podatkov. Pridobljeno s spletne strani: http://adp.fdv.uni-lj.si/za_uporabnike/delavnice/#vodic

Štebe, J., Vipavc Brvar I. (2010). Analiza stanja in perspektiva digitalne hrambe v Arhivu družboslovnih podatkov (ADP). Narodna in univerzitetna knjižnica, Ljubljana. Prispevek v okviru Projekta dLib.siPlus - nove vsebine in storitve digitalne knjižnice Slovenije (čaka na objavo)

UKRDS - UK Research Data Service feasibility study. Pridobljeno s spletne strani: http://www.ukrds.ac.uk/

ZAGOTAVLJANJE PROSTEGA DOSTOPA DO DIGITALNIH VIROV NA UNIVERZI V MARIBORU

izr. prof. dr. Milan Ojsteršek

Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko e-naslov: ojstersek@uni-mb.si

mag. Janez Brezovnik

Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko e-naslov: janez.brezovnik@uni-mb.si

Marko Ferme:

Univerza v Mariboru, Fakulteta za naravoslovje in matematiko, Oddelek za matematiko in računalništvo

e-naslov: marko.ferme@uni-mb.si

UDK: 655.411:004.65(497.4Maribor)

Izvleček

V članku bomo predstavili organizacijski in tehnični vidik realizacije digitalne knjižnice Univerze v Mariboru. Najprej bomo opisali njene osnovne značilnosti in funkcionalnosti, nato se bomo osredotočili na funkcionalnosti, ki so značilne za našo knjižnico. Te so detekcija plagiatov, napredna statistika, segmentacija vsebin, povezovanje vsebin z drugimi viri in interoperatibilnost s kataložnim sistemom COBISS.

Ključne besede: knjižnice, digitalne knjižnice, informacijski portal, prost dostop, digitalizacija, e-vsebine, znanost

OPEN ACCESS TO DIGITAL RESOURCES AT THE UNIVERSITY OF MARIBOR Abstract

Organizational and technical background of digital library at University of Maribor is described in this paper. We start with basic description of the library and its purpose, but the main focus is set on features, that are mostly not found in other digital libraries. Features like plagiarism detection, informative and useful statistics, content segmentation, interoperatibility with catalog COBISS and specific content extraction are described.

Key words: libraries, digital libraries, natural language processing, plagiarism detection, Slovenian language, text processing

Uvod

Z razvojem informacijskih tehnologij in interneta je širjenje informacij postalo sila enostavno. Velika količina podatkov je dosegljiva praktično vsakomur. Ker želi tudi Univerza v Mariboru (v nadaljnjem besedilu UM) širši javnosti ponuditi dostop do svojih raziskovalnih in

pedagoških del, smo septembra 2007 vzpostavili digitalno knjižnico Univerze v Mariboru (v nadaljnjem besedilu DKUM). Vzporedno so se izvajale aktivnosti za vzpostavitev sistemske rešitve za oddajo zaključnih del dodiplomskega in podiplomskega študija na Univerzi v Mariboru. V okviru tedanje Komisije za knjižnični in informacijski sistem pri Senatu UM je bila leta 2007 imenovana delovna skupina, z namenom zagotoviti sistemsko urejen in trajen dotok zaključnih del Univerze v Mariboru v elektronski obliki. Delovna skupina je oblikovala navodila o pripravi in oddaji e-diplom ter predlog sprememb Pravilnika o postopku priprave in zagovora diplomskega dela na dodiplomskem študiju (2008), ki sedaj v 16. členu obvezuje študente k oddaji zaključnih del v elektronski obliki. Kako se to stori, opredeljujejo Navodila o pripravi in oddaji e-diplom. Del prej omenjenega pravilnika je tudi izjava o istovetnosti tiskane in elektronske verzije diplomskega dela in objavi osebnih podatkov diplomantov.

Temeljni cilj projekta je vzpostaviti dostop do vseh elektronskih informacijskih virov Univerze v Mariboru iz ene vstopne točke. Želimo integrirati različne zbirke elektronskih publikacij in drugih informacijskih virov, ki nastajajo na Univerzi v Mariboru ali se jih kupuje za potrebe znanstvenoraziskovalne, strokovne in umetniške dejavnosti na Univerzi v Mariboru, kot so e-diplomska, magistrska in doktorska dela, zbirka el. univerzitetnih učbenikov in ostalega učnega gradiva, spletne izdaje znanstvenih in strokovnih revij, katerih izdajatelj ali soizdajatelj je Univerza v Mariboru, el. zbirke del (članki, tehnična poročila, elaborati, izverdenska mnenja ...) v polnem besedilu visokošolskih učiteljev in sodelavcev Univerze v Mariboru, komercialne zbirke el. informacijskih virov (e-knjige, e-časopisi, podatkovne zbirke) in ostale e-zbirke, ki nastajajo na univerzi. Za dosego tega cilja je 21. 6. 2010 Senat UM sprejel Pravilnik o obveznem izvodu publikacij Univerze v Mariboru, ki v petem členu pravi: »Elektronske publikacije, ki so predmet obveznega izvoda, morajo biti predložene brez elektronske zaščite dostopa ali pa morajo zanje založniki ali drugi primerljivi subjekti zagotoviti UKM dostopno geslo za prevzem. Depozitarno okolje za predložitev elektronskih publikacij je Digitalna knjižnica Univerze v Mariboru.« Z uveljavitvijo tega pravilnika je odprta pot k izgradnji prostodostopnega repozitorija digitalnih virov, ki bodo predstavljala celotno produkcijo vsebin v digitalni obliki na Univerzi v Mariboru. Trenutno naša digitalna knjižnica1 omogoča prost dostop do zaključnih del, tj. diplomskih, magistrskih, doktorskih nalog in drugih del, ki nastajajo na članicah UM. V DKUM je vključenih vseh 16 fakultet in Univerzitetna knjižnica Maribor. Ko bo za vse zaposlene na UM omogočena enolična avtentikacija, bodo lahko sami vstavljali svoja elektronska gradiva v DKUM, saj so po Pravilniku o obveznem izvodu to dolžni narediti. Pričakujemo, da bo organizacijsko in tehnično sistem vzpostavljen v decembru 2010. V DKUM bomo do takrat za nazaj vključili tudi vsa dela zaposlenih na UM, ki so že dosegljiva na različnih spletnih naslovih in so katalogizirana v sistemu COBISS.

V drugem poglavju našega članka bomo podali pregled različnih statistik dostopa do DKUM. Arhitekturo DKUM bomo prikazali v tretjem poglavju. V četrtem poglavju smo opisali kako smo integrirali DKUM z informacijskima sistemoma COBISS in AIPS ter omogočili povezovanje s pomočjo protokola OAI-PMH z drugimi prostodostopnimi repozitoriji in registri (Driver, WorldCat, ROAR, Open DOAR, Celestial in Base). V petem poglavju bomo opisali postopek oddaje zaključnih del študentov UM. V šestem poglavju smo predstavili do

1 http://dkum.uni-mb.si/

kakšnih vsebin lahko pride neprijavljen uporabnik DKUM-a. V sedmem poglavju podamo možnosti, ki jih nudi DKUM skrbnikom (knjižničarjem, referentom, vodstvenim delavcem, zaposlenim na UM in skrbnikom sistema). Ker je ena od slabosti dostopa do digitalnih virov lažje kopiranje vsebin in predstavljanje le-teh kot lastno delo, smo izdelali lastno programsko rešitev. ki omogoča detekcijo plagiatov v DKUM. To rešitev smo predstavili v osmem poglavju. V devetem poglavju smo podali zaključne misli in napotke za nadaljnje delo.

Pregled statistik dostopa do DKUM-a

Statistika DKUM I Osnovno || Top lestvice || Gradiva || Datoteke || Letna poročila || Mentor |

V tabeli so navedene organizacije, ki so vkijučene v digitalno knjižnico UM. Zajeta so samo gradiva s poinim besediiom (z datoteko). Upoštevana so tudi gradiva boionjskih študijskih programov. Kot nova so šteta tista gradiva, ki so bila objavljena v zadnjih 30-ih dneh. Polja z sprožijo iskanje, polja z s» pa omogočajo naročanje na RSS.

V tabeli so navedene organizacije, ki so vkijučene v digitalno knjižnico UM. Zajeta so samo gradiva s poinim besediiom (z datoteko). Upoštevana so tudi gradiva boionjskih študijskih programov. Kot nova so šteta tista gradiva, ki so bila objavljena v zadnjih 30-ih dneh. Polja z sprožijo iskanje, polja z s» pa omogočajo naročanje na RSS.

Organizacija

Diplanie

Magisteiiji

Doktorati

Ostalo

Skupaj

Vseh

Novih

Vseh

Novih

Vseh

Novih

Vseh

Novih

Vseh

Novih

FERI - Fakulteta za elektrotehniko, računalništvo in informatiko

643

4

B

7

22

4

33

4

2

n

1

699

9

EPF - Ekonomsko-poslovna fakulteta

2631 ctä,

50

11

1

2642 d

s» 51

FG - Fakulteta za gradbeništvo

271 4

39

11

4

3

k

1

1

286

» 40

FKKT - Fakulteta za kemijo in kemijsko tehnologijo

98 ^^

11

3

15

Ck

116 dl

s 11

FS - Fakulteta za strojništvo

382 ,

k

71

21

4

k

18

k

9

430

» 71

FOV - Fakulteta za organizacijske vede

1905 =1

SI

72

n,

SI

5

1,

12

1994 d

a

FF - Filozofska fakulteta

468 ,

I.

25

7

3

k

1

478 ,

» 25

PEF - Pedagoška fakulteta

508 ^

SI

22

1

tt,,

509 n

J» 22

FNM - Fakulteta za naravoslovje in matematiko

152 ,

k

6

2

2

J,

156 J

» 6

FW - Fakulteta za varnostne vede

498 ^

a

19

42

läs

9

19

*

1 1

559 d'

F> 29

FKBV - Fakulteta za kmetijstvo in biosistemske vede

146 *

49

13

1

J,

1

160 .1

» 49

17

R

4

4

1

355 »■=, 22

UKM - Univerzitetna knjižnica Maribor

r

1

1

1 J

FL - Fakulteta za logistiko

1 ^

2

IS

275 d s

MF - Medicinska fakulteta

1

4

1

1

2

PF - Pravna fakulteta

C314 ct

26

4

T

1

318 d

=s 27

FE - Fakulteta za energetiko

--r

1 ^L

1

1

1 dl»

Skupaj

8580 n

342

269

15

85

k

3

52

1 2

8986 dis 362

Zadnja osvežitev: 17.10.2010

Zadnja osvežitev: 17.10.2010

Zadnjih 7 dni 10.10 - 17.10

Zadnjih 30 dni 17.09 - 17.10

Vseh 29.05.2008 - 17.10

Gradiva;

15.599

69.352

1.715.603

Datoteke:

8.064

32.049

609.848

Slika 1: Pregled števila objavljenih e-publikacij na DKUM po članicah UM

Poglejmo si podrobneje statistiko2 dostopa do DKUM (slika 1). 17. oktobra 2010 je bilo v polnem besedilu dosegljivih 8580 diplomskih nalog, 269 magistrskih nalog, 85 doktorskih disertacij in 52 drugih gradiv (učna gradiva, tehnična poročila ...). V zadnjih tridesetih dneh je bilo vstavljenih 362 del. V metapodatkih je dosegljivih 14704 zapisov (tu je vključenih tudi zgoraj omenjenih 8986 gradiv, ostala bodo dosegljiva po določenem času). V tednu od 10. do 17. septembra je bilo 15599 dostopov do metapodatkov gradiv in 8064 prenosov polnih besedil (datotek). Tabela s slike 1 prikazuje statistiko vstavljenih gradiv po članicah UM in predstavlja prvo možnost dostopa do gradiv. Klik na celice stolpca »Vseh« namreč sproži iskanje po izbrani vrsti gradiva in članici Univerze v Mariboru. Klik na celice stolpca »Novih« omogoča naročanje na obveščanje o novostih preko RSS. Uporabniki lahko do gradiv pridejo še preko enostavnega ali naprednega iskalnika in z brskanjem po drevesni hierarhiji. Statistika omogoča tudi prikaz lestvic največkrat klikanih gradiv (prikaz njihovih

http://dkum.uni-mb.si/Statistika.php?cmd=intro

2

metapodatkov) in največkrat naloženih datotek na teden in mesec, izpis grafikonov vstavljenih gradiv po fakultetah, izpis grafikonov po vrstah datotek (pdf, doc, zip, ostalo) in poročil o vstavljenih gradivih po fakultetah glede na koledarsko leto ali šolsko leto.

Na spletnem strežniku DKUM imamo nameščen tudi program Google Analytics3, ki nam za obdobje od 17. 9. 2010 do 17. 10. 2010 prikaže 5,4 % porast obiska. DKUM je v tem obdobju obiskalo 41 389 obiskovalcev, ki so opravili 57 981 obiskov.

Slika 2: Število objavljenih zaključnih del, pri katerih je bil zaposleni na UM mentor v preteklih

letih

Statistika DKUM

I Osnovno Top lestvice I Gradiva I Datoteke Letna poročila I Mentor I

Osnovno | Objave zaključnih deil|Top kjučne bese^ [Pojavnost ključnih besed] | Komentorji|

Tabela zajema ključne besede vseh zaključnih del, pri katerih oseba sodeluje kot mentor. Ključne besede so urejene po številu ponovitev, največkrat ponovljene na vrhu. Iz ključnih besed z zgornjega dela tabele je mogoče sklepati na tematike, s katerimi se je oz. se mentor ukvarja.

Oseba: Milan Ojsteršek

Vseh ključnih besed je 194, ki se skupaj pojavijo 243 krat.

26 ključnih besed (13.4% vseh) se pojavi večkrat, skupaj 75 krat (30.86% vseh pojavitev).

št. o^ Ključne Lesede

8X 10,67% XML 6x 8% spletne aplikacije

5X 6,67% internet 4x 5,33% ASP, COM

3x 4% XSU procesiranje naravnega jezika, svetovni spiet, elektronsko preverjanje znanja, spletne storitve, porazdeljeni računalniški sistemi

2x 2,67% varovanje osebnih podatkov, varnost, spletni obrazci, ASP,NET, informacijski sistemi, WML, spletno rudarjenje, tekstovno rudarjenje, aplikacije za internet, e-

izobraževanje, spletni iskalniki, potrditveni sistemi, e-učenje, porazdeljeno procesiranje, slovenski jezik IX ogrodje, Microsoft .Net, spletna aplikacija, poosebitev, piškotki, filtriranje s pomočjo pravil, spletni profil, ogrodje,NET, J2EE, ADO,NET, Linux, upravljanje z

digrtalnimi identitetami, enkratna pnjava, poenostavljena pnjava, portaii, digitalne identitete, elektronska pošta, paralelno procesiranje, porazdeljena podatkovna baza, ogrodje ,NET, SMS sporočila, portieti, avtonzacija, omrežje, operacijski sistemi, strežniki, požarni zid, filtnranje glede na vsebino, stontve sodelovanja, avtentikacija, poosebitev portslov, iskanje po portalu, standard 3SR, sistem za zaznavo vdorov, vecslojni modeli programske opreme, aplikacije na internet, virtualne galerije, ODBC, multimedija, elektronski organizatorji, spletni rokovnik, publiciranje dokumentov, Delphi, obdelava slik, ASP tehnologija, uporabniški vmesniki, WAP, metrike, sintakse, programski jeziki, avtomatska generacija programov, programska oprema, porazdeljeni sistemi, geografski informacijski sistemi, zemljevidi, ADO, tunstična statistika, kaskadni slogi, HTML, spletni portall, XSLT, COM+, spletne predstavitve. UDDI, WSDL, generični personalizacijski strežnik, pnporočanje, obveščanje, SOAP, vozni redi, radijski sprejemniki, CLDC, KVM, navidezni stroj, mobilne naprave, MIDP, Java, krmiljenje, kodiranje zvoka, streaming, filtriranje ob sodelovanju, SNMP, evidenca kalibriranja meril, kontrolni postopki merjenja,, pomenski splet, ontologije, splet, SQL, platforma kot storitev, programska oprema kot storitev, ,NET, pomenski opis podatkovnih baz, spletni uporabniški vmesnik, uporabniški profili, poosebitveni strežnik, zasebnost, nadzor, XUL, XAML, Microsoft InfoPath, XFORMS, UIML, infrastruktura kot storitev, oxite, vrste sistemov IDS, varovanje, optimizacija spletnih strani, SEO, sistemi za zaznavanje vdorov, varnostna politika, vdon, nepooblaščen dostop, standardi, oblikoslovno označevanje, NLP, računalništvo v oblaku, oblak, Windows Azure, spletni dnevnik, programski dodatki, programsko ogrodje, naravni jezik, lematizacija, procesiranje besedil, anonimizacija, šifriranje, BizTaik, e-poslovanje, proizvodni informacijski sistemi, energetski sistem, povezovanje aplikacij, [S0900L, SSL, upravljanje z dokumenti, WORKFLOW, SCADA, procesna podatkovna baza, izobraževanje na daljavo, študij na daljava, modeli študija na daljavo, računalniško podprto učenje, upravljanje omrežij, varovanje IS, poročilni sistem, IMS, omrežja, PHP, QTI, podjetniški vin, SSA, elektronsko poslovanje, računalniško izmenjevanje podatkov, strojno učenje, iskanje informacij, analiza jezika, obdelava naravnega jezika, semantični splet, programski paketi, Microsoft SQL strežnik, varnostna orodja, varne spletne aplikacije, SCORM, varnostne strategije, varovanje podatkov, Oracle podatkovni strežnik, dostavni protokol, zaščita sistemov, izobraževanje

Slika 3: Pojavnost ključnih besed mentorja skozi celotno časovno obdobje

https://www.google.com/analytics/

3

Zelo so zanimive so statistike, ki so vezane na posamezne zaposlene na UM (zavihek Mentor). Na sliki 2 je prikazan grafikon števila objavljenih zaključnih del, pri katerih je bil zaposleni na UM mentor v preteklih letih. Slika 3 prikazuje pojavnost ključnih besed mentorja skozi celotno časovno obdobje. Na ta način lahko določimo s katerimi področji se mentor ukvarja. Zanimiv je tudi graf iz slike 4, ki prikazuje pojavnost ključnih besed mentorja po letih. Iz tega grafikona lahko sklepamo ali je mentor skozi celotno časovno obdobje spreminjal fokus svojega raziskovanja ali ne. Zanimive so tudi statistike, iz katerih lahko ugotovimo s katerimi somentorji je mentor sodeloval pri realizaciji zaključnih del. Enake statistike bomo naredili tudi za znanstvena ( članki, monografije, tehnična in raziskovalna poročila), strokovna ter pedagoška dela, katera bodo do konca leta začeli vnašati zaposleni na UM.

Slika 4: Pojavnost ključnih besed mentorja po letih

Arhitektura DKUM-a

DKUM je sestavljen iz dveh delov, ki tečeta na različnih platformah. Prvi je predstavitveni del, izdelan s pomočjo spletnega portala CHP (Ojsteršek et al., 2003), ki teče na platformi Microsoft Windows Server 2008. Ta del skrbi za objavo raznih informacij v zvezi z DKUM. Drugi del DKUM je knjižnični del in deluje na platformi LAMP (Linux, Apache, MySQL in PHP). Oba dela DKUM-a je implementiral Laboratorij za heterogene računalniške sisteme, Fakultete za elektrotehniko, računalništvo in informatiko Univerze v Mariboru4. DKUM je implementiran na principu tri-nivojske arhitekture, ki zajema podatkovni nivo, poslovno logiko in uporabniški vmesnik. Podatkovni nivo je v celoti implementiran v MySql 5.x podatkovni bazi, dostop je mogoč samo preko shranjenih procedur, tj. SQL poizvedb v obliki

http://chp.uni-mb.si/

4

funkcij, ki so zapisane v bazi in se tam tudi izvajajo. Kot osnovni metapodatkovni model za zapis gradiv se uporablja nabor elementov Dublin Core (Dublin Core Metadata Initiative, 2009). Gre za standardizirano zbirko petnajstih meta podatkovnih elementov, ki se uporabljajo za opis digitalnih virov. Elementi so navedeni v tabeli 2 v angleškem jeziku.

Tabela 1: Zbirka elementov Dublin Core

Tabela 1: Zbirka elementov Dublin Core

Title

Creator

Subject

Description

Publisher

Contributor

Date

Type

Format

Identifier

Source

Language

Relation

Coverage

Rights

K elementom Dublin Core so bili dodani še drugi elementi, ki so potrebni za delovanje DKUM-a. Pri izpisu podatkov o posameznem gradivu v uporabniškem delu so na voljo povezave, preko katerih lahko dobimo izpis v Dublin Core ali v DKUM naboru elementov v obliki XML (angl. »Extensible Markup Language«) ali RDF (angl. »Resource Description Framework«). Poslovna logika je implementirana v skriptnem jeziku PHP, večinoma po principih objektno usmerjenega programiranja. Uporabniški vmesnik je implementiran v obliki spletnih strani. PHP skripte generirajo veljavno XHTML kodo po standardu XHTML 1.0 Transitional. Uporabljajo se še tehnologije CSS in JavaScript, ponekod se uporablja tudi ogrodje jQuery5. Pri spletnih straneh s statistiko se izrisujejo grafi v JavaScript-u s pomočjo ogrodja JsCharts6. Oblikovno je DKUM skladen s spletnim portalom Univerze v Mariboru7.

Integracija DKUM-a z drugimi informacijskimi sistemi in viri

Trenutno je DKUM integriran oz. povezan z informacijskima sistemoma COBISS.SI in AIPS (Akademski informacijski podsistem Univerze v Mariboru). COBISS (angl. »Co-operative Online Bibliographic System & Services«) je knjižnični informacijski sistem za vzajemno katalogizacijo. COBISS povezuje lokalne knjižnične kataloge v vzajemni katalog, preko katerega so dosegljivi podatki vseh katalogov. Nekatere fakultete imajo svoj lokalni knjižnični katalog, ali pa so fakultete združene v skupno knjižnico (npr. Knjižnica tehniških fakultet ali Miklošičeva knjižnica), ki izvaja knjižnične storitve za več fakultet in uporablja skupno lokalno knjižnično bazo). Te lokalne baze so avtonomne, a imajo skupno platformo.

DKUM je povezan s COBISS-om preko protokola Z39.50, ki omogoča poizvedbe v lokalne knjižnične kataloge in pridobivanje podatkov o gradivih. V skrbniškem delu DKUM-a je tako mogoče preko COBISS identifikacijske številke gradiva uvoziti podatke iz COBISS v DKUM. Na ta način je mogoče v DKUM vstaviti gradiva, ki so že katalogizirana v COBISS-u, kar se dogaja tudi v primeru zaključnih del, ki so bila izdana pred vzpostavitvijo DKUM-a. Takšna dela knjižničarji uvozijo iz COBISS-a, naknadno pa se v DKUM naloži še datoteka PDF, ki predstavlja zaključno delo v digitalni obliki (če je bila podpisana izjava o odstopu avtorskih pravic UM in če je bila k tiskani verziji zaključnega dela, priložena tudi elektronska verzija).

5 http://jquery.com/

6 http://www.jscharts.com/

7 http://www.uni-mb.si/

Nova zaključna dela študentje v DKUM vstavljajo sami. Ko se gradivo katalogizira v COBISS-u, se izvede delni izvoz podatkov iz COBISS v DKUM. Pri delnem izvozu se prenesejo samo podatki, ki še niso v DKUM-u, npr. identifikator COBISS in klasifikator UDK. Protokol Z39.50 omogoča prenos podatkov v različnih formatih. Za potrebe DKUM se uporablja COMARC zapis v obliki XML. COMARC (angl. kratica za »Cooperative Machine-Readable Cataloging«), ki predstavlja format za izmenjavo bibliografskih podatkov. Vrnjen COMARC XML se s pomočjo XSLT transformira v DKUM XML zapis, ki ga je mogoče uvoziti v DKUM.

Protokol Z39.50 deluje na principu strežnik-odjemalec. Za strežniški del poskrbi COBISS, kot odjemalec pa je v DKUM-u uporabljena komponenta YAZ/PHP8. Za vsako lokalno knjižnično bazo je v DKUM izdelana ločena povezava do Z39.50 strežnika na IZUM-u. Prenos podatkov je enosmeren, tj. iz COBISS v DKUM, obratno pa prenos zaradi pravil s strani COBISS-a ni dovoljen.

DKUM je med drugim povezan še s sistemom AIPS9. AIPS med drugim hrani podatke o študentih, izpitnih rokih, študijskih programih in fakultetah Univerze v Mariboru. Študentom omogoča elektronski vpis na študij, prijavo na izpite, pregled ocen in hrani podatke o zaključnem delu. Eden od razlogov za povezavo med DKUM-om in AIPS-om je enotna prijava študentov. DKUM študentom omogoča oddajo zaključnega dela, za kar se morajo prijaviti, pri tem pa uporabijo AIPS uporabniško ime in geslo. Ko se prijavijo v DKUM, morajo za oddajo zaključnega dela izpolniti več korakov (vpis osnovnih podatkov o zaključnem delu, izpolnitev izjave o istovetnosti tiskane in elektronske verzije, prenos elektronskega gradiva). Pri prvem obisku vnosnega obrazca, programska oprema DKUM nekatere podatke o zaključnem delu prebere iz AIPS ter napolni vnosni obrazec, študent pa obrazec samo dopolni. Poleg podatkov o diplomi pa so v AIPS še podatki o fakultetah in študijskih programih, ki bodo v prihodnje uporabljeni za samodejno gradnjo drevesne hierarhije, ki omogoča brskanje po gradivih DKUM (več o tem kasneje).

Vsa komunikacija med AIPS.om in DKUM-om je izvedena preko spletnih storitev (angl. »web services«) in je enosmerna, tj. podatki se prenašajo iz AIPS v DKUM, obratno pa ne, saj za to ni potrebe.

DKUM omogoča izmenjavo podatkov z drugimi digitalnimi repozitoriji preko OAI-PMH 2 protokola. OAI10 je angl. kratica za »Open Archive Initiative« in je iniciativa, ki se zavzema za razvoj ogrodij in standardov za lažjo izmenjavo podatkov med digitalnimi viri, npr. med digitalnimi knjižnicami. PMH11 oz. »Protocol for Metadata Harvesting« je konkreten protokol, ki je nastal v okviru OAI in za komunikacijo uporablja format XML preko protokola HTTP. Za prenos podatkov o gradivih se običajno uporablja Dublin Core v obliki XML. Zadnja verzija protokola je OAI-PMH 2, ki ga DKUM podpira. V programski opremi DKUM je implementiran strežniški del, ki omogoča odjemalcem, da berejo podatke o gradivih DKUM-

8 http://indexdata.dk/phpyaz/

9 http://aips.uni-mb.si/

10 http://www.openarchives.org/

11 http://www.openarchives.org/pmh/

a. Kot osnova za implementacijo OAI-PMH 2 je bila izbrana PHP implementacija, dosegljiva na spletu (Stamerjohanns, 2009).

S pomočjo protokola OAI-PMH 2 DKUM izmenjuje podatke z drugimi knjižnicami. Trenutno izmenjujemo podatke z digitalno knjižnico, ki nastaja v okviru projekta DRIVER12 (angl. »Digital Repository Infrastructure Vision for European Research«). Ta knjižnica omogoča iskanje po repozitoriju raziskovalnih del evropskih univerz. Po protokolu OAI-PMH 2 so metapodatki gradiv iz DKUM-a preneseni v to digitalno knjižnico, vsebina gradiv v digitalni obliki pa je še naprej dosegljiva samo preko spletnega portala DKUM. Knjižnico smo registrirali še v repozitorijih WORLDCAT13: (preko tega repozitorija nas indeksirajo Google, Yahoo, Bing in nekateri drugi iskalniki), ROAR (Registry of Open Access Repositories):14, Celestial, Open DOAR15 in Base, ki lahko preko OAI-PMH iščejo po našem repozitoriju:

Oddaja zaključnih del študentov UM

Slika 5: Oddaja študentskih gradiv v DKUM

12 http://www.driver-repository.eu/

13 http://www.worldcat.org/

14

http://roar.eprints.org/

15 http://www.opendoar.org/find.php?rID=1857

DKUM omogoča študentom oddajo zaključnih del v digitalni obliki (slika 5). Za oddajo se študent prijavi v DKUM z uporabniškim imenom in geslom, ki ga dobi za prijavo v AIPS. Študentom se po prijavi odpre dodatna možnost, preko katere oddajo zaključno delo, oddaja pa poteka v štirih korakih:

• Vpis osnovnih podatkov o gradivu, kjer študent vpiše naslov, kratek povzetek in ključne besede v slovenskem in tujem jeziku. Dodatno navede še mentorje in komentorje.

• Prenos gradiva v digitalni obliki. Študent mora obvezno oddati datoteko v formatu PDF, ki ne sme biti zaščitena z geslom, saj zaščito datoteke nastavi programska oprema DKUM. Po želji lahko odda še izvorno datoteko (s končnico doc, docx ali odt) ali datoteko ZIP, v kateri so stisnjene vse ostale datoteke, ki jih želi oddati (računalniški programi, preglednice, datoteke proizvedene z različnimi specializiranimi programi (npr. AutoCAD, ArchiCAD ...).

• Prenos izjave o istovetnosti tiskane in elektronske verzije in objavi osebnih podatkov avtorja. Izjavo študent dobi, če je v celoti izpolnil prva dva koraka. Izjava je v formatu PDF in je izpolnjena vnaprej, manjka le podpis študenta. Podpisano izjavo odda v referatu fakultete skupaj s tiskano verzijo zaključnega dela.

• Zadnji korak je samo obvestilo o nadaljnjem poteku oddaje zaključnega dela.

S tem je oddaja zaključnega dela opravljena. Študent se lahko v DKUM prijavi večkrat, postopek oddaje pa lahko opravlja po korakih, spreminja podatke, nadomesti že oddane datoteke itd. Ko odda podpisano izjavo in tiskano verzijo na referatu fakultete, se mu spreminjanje zapisa v DKUM onemogoči.

Uporabniški del DKUM-a

Digitalna gradiva so v DKUM-u dosegljiva vsem uporabnikom brez zahtevane prijave preko iskalnika, ki omogoča iskanje po metapodatkih in polnem besedilu ali s pomočjo brskanja po različnih hierarhijah portala DKUM. Iskalnik omogoča enostavno in napredno iskanje. Pri enostavnem iskanju lahko iščemo po naslovu, ključnih besedah, povzetku, polnem besedilu in avtorju, medtem ko lahko pri naprednem iskanju kriterije določimo natančneje. Obe iskanji lahko sprožita iskanje tudi po COBISS-u tako, da DKUM sestavi primeren naslov URL in s tem naslovom sproži iskanje na spletnih straneh COBISS-a. Obe iskanji izpišeta rezultate na enak način, izpis zadetkov je razdeljen na strani z največ 10 zadetki na stran (slika 6). Uporabnik lahko pride do digitalnega gradiva že na strani z izpisom zadetkov, lahko pa klikne na naslov gradiva in s tem dobi še ostale podatke o gradivu in dodatne funkcionalnosti, kot so izvoz podatkov v raznih formatih, pregled ocene in komentarjev gradiva (slika 7).

Uporabnik lahko do gradiv pride tudi preko brskanja po drevesni hierarhiji. Ta je zaenkrat izdelana ročno in ima na prvem nivoju tipe gradiv (doktorati, magisteriji, diplomska dela, specialistična dela in ostalo), na drugem nivoju so fakultete (v nadaljevanju organizacije), na tretjem pa so dosegljiva gradiva. Izpis gradiv v hierarhiji je identičen izpisu zadetkov iskanja. Hierarhija se polni samodejno enkrat dnevno.

DKUM omogoča tudi RSS, preko katerega objavlja nova gradiva. Objavljenih je več RSS virov, ločeno glede na organizacijo in tip gradiva, zaenkrat le diplomske, magistrske in doktorske naloge. RSS se osveži dvakrat na teden.

Prijavljeni uporabniki imajo poleg tega še možnost ocenjevanja in komentiranja gradiv. Funkcionalnost je zaenkrat na voljo zgolj študentom, ki se prijavljajo preko AIPS-a in osebam s skrbniškim računom, saj DKUM registracije trenutno še nima implementirane.

Slika 6: Izpis rezultatov iskanja e-diplomskih del na DKUM-u Skrbniški del DKUM-a

DKUM ima obsežen skrbniški del, ki je dosegljiv preko spleta z uporabniškim imenom in geslom. Manjši del skrbniškega dela je dosegljiv tudi knjižničarjem in referentom posamezne fakultete.

Ko pride študent na referat z izjavo in tiskano verzijo zaključnega dela, se na referatu prijavijo v DKUM in poiščejo ustrezen zapis zaključnega dela. Zapis poiščejo kar na podlagi vpisne številke študenta. Nato preverijo ustreznost vpisanih podatkov in na hitro prelistajo oddano datoteko PDF. Če zapis v DKUM-u ustreza, se ga zaklene, s tem pa onemogoči nadaljnjo spreminjanje s strani študenta. Zaklenjeno gradivo še ni objavljeno. Za objavo poskrbijo v knjižnici fakultete, kjer tiskano verzijo katalogizirajo v COBISS-u, nato pa izvedejo delni uvoz v DKUM (gre za replikacijo dela podatkov iz COBISS-a v DKUM). Vzpostavi se tudi obratna povezava tako, da se v COBISS zapis doda povezavo URL na objavljeno datoteko PDF. S tem je objava zaključnega dela končana tako v DKUM kot v COBISS.

^ DKUM Ogled gradiva (BETA) Windows Internet Explorer

I ^ hii:i:p://dkum.uni-mb,si/IzpisGradiva,phip?id^l.

^ Priljubljene

Q ligtfbresovnikjanez

J DKUM - Ogled gradiva (B,,, X |■*! brezovnik janež - Iskanje Gc^

Ogled gradiva

Naslov: IZDEUWA SISTEMA SENZORJEV PRI GOVORJ^EM UPRAVUANJU INVALIDSKEGA VOZIČKA Avtorji: Šafarič. Riko (Mentor) Šumei, Kristijan (Avtor)

Opis:V diplomski nalogi je opisan sistem senzorjev govorno upravljanega invalidskega vozička. Opisan je razvoj aparaturne in programske opreme, opisano je upravljanje invalidskega vozička z govorom ter varnostna funkcija s sistemom senzorjev, ki preprečuje trke invalidskega vozička z ovirami, Sama prepoznava govora z usmerjeno nevronsko mrežo je bila izvedena na DSP procesorju. Učenje usmerjene nevronske mreže pa je bilo izvedeno na osebnem računalniku v programskem paketu Visual Studio ,NET 2003,

Ključne besede:sistem senzorjev, prepoznava govora, DSP procesor, vodenje invalidskega vozička z govorom, preklopno vezje, CAN vodilo 2009 Maribor Slovenski jezik Diplomsko delo

Leto izdaje; Izvor; Jezik: Vrsta gradiva; Število ogledov; Število prenosov: 1

Datoteke:[7] VS Sumej Knstijan 1982.pdf fl.399.407 Metapodatki;

PodrQqa:ICTFMB - FERI Skupna ocena: (O glasov)

Vaša ocena: Ocenjevanje je dovoljeno samo priiavhenim uporabnikom,

Dodaj komentar

Komentarji W

Ni komentarjev!

sta/t ^ DKUM - Ogled gradiv... Prejeto v

f@ 3 Microsoft Office

Links ^^ NamiEje ** SL P f

Slika 7: Izpis meta podatkov v polnem formatu na DKUM-u Detekcija plagiatov

Detekcija plagiatov je postopek odkrivanja kopiranih ali podobnih delov dokumentov. Za procesiranje besedil v slovenskem jeziku uporabljamo oblikoslovni slovar, ki vsebuje okrog 8.000.000 izvlečkov in okrog 300.000 lem, ki smo ga pridobili od Inštituta za slovenski jezik Frana Ramovša ZRC SAZU v Ljubljani. Izdelali smo lastno programsko ogrodje za procesiranje besedil v naravnem jeziku, imenovano TextProc (Brezovnik, 2009). To ogrodje je povezovalni člen med ločenimi dodatki, ki jih je možno združevati v TextProc procese, posamezen proces pa opravlja specifično nalogo s področja procesiranja naravnega jezika ali tekstovnega rudarjenja (npr. razčlenjevanje vsebine, oblikoslovno označevanje, razreševanje sklicev, pomensko označevanje, delno avtomatsko dopolnjevanje pomenskega slovarja, pomenski opis procesa ...). Posamezni proces je sestavljen iz dodatkov, njihovih nastavitev in korpusa, tj. zbirke dokumentov, ki jih dodatki obdelajo. Dodatki delujejo na principu označevanja besedila. Uporabili smo splošno pomenski slovar, ki ga je izdelala v okviru svoje doktorske disertacije Darja Fišer (Fišer, 2009) in domensko specifični pomenski slovar, ki smo ga zgradili s pomočjo ključnih besed, ki se pojavljajo v delih DKUM. V naši implementaciji detektorja plagiatov (Brezovnik in Ojsteršek, 2010) primerjamo besedilo na nivoju odstavkov in povedi. Postopek se izvede v dveh korakih:

• obdelava besedil in priprava za detekcijo plagiatov,

• primerjava obdelanih besedil in izdelava poročila detekcije.

Pripravo besedil izvede TextProc proces z dodatki, postopek pa je naslednji:

• Najprej razbije golo besedilo na osnovne enote, kot so besede, ločila in ostale znake.

• Zatem združi nekatere nize, ki sicer spadajo skupaj, npr. okrajšave, zapisi decimalnih števil, datumov in podobno.

• Nato pretvori besede v osnovno obliko s pomočjo slovenskega oblikoslovnega slovarja. Ta dodatek poskrbi, da je detektor plagiatov imun na razlike v sklonih besed. Zaradi uporabe slovenskega jezikovnega slovarja je ta dodatek najbolj odvisen od jezika. Teoretično bi zgolj z menjavo slovarja omogočili procesiranje nekaterih drugih jezikov (npr. angleščine, slovanskih jezikov ipd.).

• Zatem razdeli besedilo na odstavke, stavke in povedi, za detekcijo se uporabijo samo povedi.

• Nato uredi leme po abecednem vrstnem redu ter združi lematizirano besedilo na nivoju odstavkov in povedi. Med besede se doda en presledek ne glede na to, kaj se med besedami nahaja v izvornem besedilu. Z urejanjem lem po abecednem vrstnem redu dosežemo, da je detektor imun na spremembe v vrstnem redu besed.

• Zatem izračuna zgostitveno vrednost nizov prejšnjega dodatka. Ta dodatek se v procesu pojavi dvakrat, saj eden računa zgostitveno vrednost za odstavke, drugi pa za povedi. V obeh primerih se uporabi algoritem MD5, ki vrača niz 32 znakov, dodatek pa že omogoča nekaj različic algoritma SHA.

• Na koncu prvega koraka shrani zgostitvene vrednosti in nekaj metapodatkov o dokumentu v podatkovno bazo.

Drugi korak se izvede v ločenem TextProc procesu, ki vsebuje samo en dodatek z imenom pdReport. Ta primerja zgostitvene vrednosti odstavkov in povedi ter sestavi poročilo detektorja plagiatov, ki je v obliki XML. V poročilu so navedeni vsi odstavki in povedi, katerih zgostitvene vrednosti so enake v več različnih dokumentih celotnega korpusa.

Detektor plagiatov smo uspešno vključili v DKUM. Edina možnost integracije je bila uporaba spletnih storitev, saj gre za različne tehnologije; DKUM je implementiran v PHP, medtem ko je TextProc v Microsoft .NET v programskem jeziku C#. Obe aplikaciji tečeta tudi na različnih računalnikih z različno platformo, saj DKUM v produkciji teče na Linux-u, medtem ko TextProc na operacijskem sistemu Windows.

V času najmanjše aktivnosti spletne strani DKUM16 se na strežniku DKUM sproži skripta, ki prične izvajati prvo fazo, tj. pošiljanje golega besedila gradiv iz DKUM-a v TextProc in priprava za detekcijo. Pošiljajo se samo besedila javno objavljenih gradiv, za golo besedilo poskrbi DKUM večinoma že prej za potrebe iskalnika po polnem besedilu, sicer pa se golo besedilo pridobi v tej fazi. Spletna storitev se kliče za vsako gradivo posebej in v primeru uspešne izvedbe se v DKUM pošlje potrditev v obliki dodeljenega identifikatorja gradiva iz TextProc. Posamezno gradivo se v TextProc pošlje samo enkrat. Skripta se izvaja določen čas, npr. eno uro, ne glede na količino preostalih neobdelanih gradiv. Po izvedbi prve faze se sproži druga skripta, ki na podoben način izvede drugo fazo. Za vsak že poslan dokument se od TextProc zahteva poročilo detekcije plagiatov. Poročilo se vrne v obliki XML, ki ga DKUM obdela in shrani v podatkovno bazo. V bazo se ne shrani celoten XML, ampak samo podatki,

16 Po statistiki produkcijskega strežnika je to med 1. in 5. uro zjutraj.

potrebni za izpis v skrbniškem delu, poročilo XML se zavrže. Skripta druge faze se prav tako izvaja določen čas, ne glede na količino preostalih neobdelanih gradiv. Obe fazi oz. skripti se izvajata dnevno. Poročilo detektorja plagiatov se zahteva za vsak dokument samo enkrat in zato zajema trenutno stanje, torej samo dokumente, ki so bili obdelani v času izdelave poročil

a. Ko se v DKUM dodajo novi dokumenti, se izdelajo poročila samo za nove dokumente, v poročilih pa se lahko pojavijo podobnosti s starimi dokumenti. Pri vstavljanju poročil v bazo so podatki zapisani v takšni obliki, da shranjevanje podatkov novih poročil samodejno obnovi podatke starejših, saj če je dokument A v nekem delu podoben dokumentu B, potem velja tudi obratno.

Poročila detekcije plagiatov je trenutno mogoče videti samo v skrbniškem delu DKUM, če poročilo za gradivo obstaja. Primer izpisa je prikazan na sliki 8.

Slika 8: Izpis poročila detektorja plagiatov v DKUM

Na vrhu so izpisani podatki o gradivu, ki je trenutno v urejanju. V seznamu levo so izpisana podobna gradiva, seznam je urejen padajoče glede na odstotek podobnosti. S klikom na gradivo v seznamu se na desni izpišejo odstavki oz. povedi, ki so enaki ali podobni. Na sliki 8 je izbrano drugo gradivo, ki ima podobnost v dveh povedih. Druga poved je označena s svetlo rdečo barvo, ker se niza dejansko razlikujeta, detektor pa je kljub temu določil, da gre

za podobnost. Konkretno se povedi razlikujeta v zadnjih treh besedah, kjer se prva konča z »razvoja in obstoja«, druga poved pa ima te tri besede zapisane v obratnem vrstnem redu.

Zaključek

Čeprav je Digitalna knjižnica Univerze v Mariboru že nekaj časa v uporabi, še vedno ni popolnoma dokončana. Trenutni cilj je prenova iskalnika, ki pri določenih poizvedbah deluje počasneje kot je zaželjeno. Nadgrajena bo tudi drevesna hierarhija, ki bo grajena samodejno na podlagi organizacijskih podatkov iz sistema AIPS-a. V razvoju je tudi rešitev uvedbe poddrevesa v isto hierarhijo na podlagi klasifikatorja UDK s samodejnim vstavljanjem gradiv. Načrtovana je možnost grajenja hierarhij gradiv po drugih klasifikatorjih (npr. ISCED, Frascati, ACM, IEEE, CiteSeer, DBLP ...).

Dolgoročno gledano je načrtovana cela vrsta sprememb v DKUM-u. V prvi vrsti bo potrebno implementirati možnost registracije novih uporabnikov ter nato funkcionalnosti poosebitve, kot so priporočanje gradiv, osebnih zaznamkov gradiv in razvoj raznih orodij, namenjenih posamezniku.

V ozadju DKUM se načrtuje razširitev ponudbe v smislu dodajanja novih tipov gradiv. Pojavljajo se namreč ideje o objavljanju video vsebin in drugih velikih datotek, kot so učna gradiva v obliki CD/DVD formatov (npr. ISO slike). Glavni problem je vstavljanje takih gradiv, predvsem zaradi omejitev HTTP prenosov na strežnik. Uvedli bomo tudi možnost omejitve dostopa do gradiv samo določeni skupini uporabnikov (npr. samo študentom določenega letnika študijskega programa).

Razmišljamo tudi o uvedbi protokola BitTorrent za porazdeljen prenos gradiv med uporabniki. Gre za P2P (angl. »peer-to-peer«) protokol, ki omogoča prenos datotek ne samo od strežnika k odjemalcu, ampak tudi med odjemalci, medtem ko ti prenašajo datoteko k sebi. Uvedba protokola je smiselna predvsem pri prenosih velikih datotek. V ta namen bi bilo potrebno namestiti lasten sledilnik (angl. »tracker«) in nadgraditi programsko opremo DKUM, da tvori datoteke s končnico torrent, ki jih potrebujejo odjemalci BitTorrent za izvajanje prenosa.

Vsebinsko želimo DKUM razširiti tako, da bodo v DKUM vsa gradiva, ki se publicirajo na Univerzi v Mariboru (tehnična poročila, članki in druga dela zaposlenih, ki se zavajajo v COBISS-u in so dostopna v digitalni obliki, e-revije, monografije, digitalni arhivi, ki so zanimivi za širšo javnost ...).

Izdelati želimo tudi sistem, ki bo omogočal obdelavo besedil, ki se hranijo v DKUM, povezovanje teh besedil s pojmi, ki jih najdemo v različnih virih znanja (npr. Wikipedia, Wordnet, različni strokovni slovarji, domensko specifične baze podatkov ...). Vsebino iz DKUM-a pa želimo uporabiti tudi v sistemu, ki omogoča odgovarjanje na vprašanja, zastavljena v slovenskem jeziku (Čeh, 2009).

Na vsebinskem nivoju bomo nadaljevali z vključevanjem novih tipov gradiv. Vzpostaviti želimo repozitorij celotne znanstvene dediščine Univerze v Mariboru. Platformo DKUM-a pa

želimo uporabiti tudi za objavo elektronskih verzij dragocenega arhivskega gradiva, ki ga hrani Univerzitetna knjižnica Maribor (npr. časopis Marburger Zeitung).

Bibliografija

Brezovnik, J. (2009). Programsko ogrodje za procesiranje besedil v naravnem jeziku : magistrsko delo. Maribor: [J. Brezovnik], XIV, 96 f. Pridobljeno s spletne strani http://dkum.uni-mb.si/Dokument.php?id=12573

Brezovnik, J., Ojsteršek, M. (2010). Detekcija plagiatov v digitalni knjižnici Univerze v Mariboru. V: Dnevi slovenske informatike 2010 - DSI, Portorož, Slovenija, 14.-16. april 2010. Uravnotežite naložbe, tveganja in razvoj za uspeh : zbornik prispevkov. Ljubljana: Slovensko društvo Informatika.

COBISS (Kooperativni online bibliografski sistem in servisi). (2009). Maribor: IZUM. Pridobljeno 29. 6. 2009 s spletne strani http://www.cobiss.si.

Čeh, I., Ojsteršek, M. (2009). Sistem za odgovarjanje na vprašanja zastavljena v slovenskem jeziku. V Dnevi slovenske informatike 2009 - DSI, Portorož, Slovenija, 15.-17. april 2009. Z inteligentnimi sistemi do strateške prednosti : zbornik prispevkov. Ljubljana: Slovensko društvo Informatika.

Digitalna knjižnica Univerze v Mariboru. (2009). Maribor: Univerza. Pridobljeno 29. 6. 2009 s spletne strani http://dkum.uni-mb.si/.

Dublin Core Metadata Initiative. (2009). Pridobljeno 29. 6. 2009 s spletne strani http://dublincore.org/.

Fišer D. (2009). Izdelava slovenskega semantičnega leksikona z uporabo eno- in večjezičnih jezikovnih virov, doktorska disertacija. Ljubljana.

Ojsteršek, M., Gorenjak, B., Bregant, A., Potočnik, M. (2003). Portal Fakultete za elektrotehniko, računalništvo in informatiko. V: Dnevi slovenske informatike: zbornik posvetovanja. Ljubljana: Slovensko društvo Informatika, 352-357.

Stamerjohanns, H. (2009). Open Arhives. Pridobljeno 29. 6. 2009 s spletne strani http://physnet.uni-oldenburg.de/oai/.

Pravilnik o postopku priprave in zagovora diplomskega dela na dodiplomskem študiju: št. A3/2008 41 AG. (2008). Maribor: Univerza v Mariboru. Pridobljeno 12. 9. 2009 s spletne strani http://www.uni-mb.si/dokument.aspx?id=13273.

SLOVENSKI BIOGRAFSKI LEKSIKON V PROSTEM DOSTOPU: MED IZDELAVO IN NADGRADNJO

mag. Petra Vide Ogrin

Slovenska akademija znanosti in umetnosti, Biblioteka e-naslov: petra.vide@zrc-sazu.si

Jan Jona Javoršek

Inštitut Jožef Stefan, Odsek za eksperimentalno fiziko osnovnih delcev e-naslov: jona.javorsek@ijs.si

Mojca Mlinar Strgar

Slovenska akademija znanosti in umetnosti, Biblioteka e-naslov: mojca.mlinar-strgar@zrc-sazu.si.

dr. Tomaž Erjavec

Inštitut Jožef Stefan, Odsek za tehnologije znanja e-naslov: tomaz.erjavec@ijs.si

UDK: 929(497.4):655.411:004.65

Izvleček

Slovenski biografski leksikon (SBL) je temeljno delo slovenske biografske vede in plod dela številnih priznanih znanstvenikov več generacij. Izhajal je skoraj sedem desetletij, od 1925 do 1991. Obsega 16 zvezkov, 5047 gesel in čez 5100 oseb, saj so nekatera gesla posvečena rodbinam in vsebujejo več oseb. Biografska metoda, uporabljena pri pisanju gesel, še danes zagotavlja relevantnost in zanesljivost podatkov. Zaradi uporabnosti in obenem nedostopnosti zlasti zgodnejših zvezkov sta se Slovenska akademija znanosti in umetnosti in Znanstvenoraziskovalni center SAZU odločila za digitalizacijo tiskane izdaje in pripravo spletne verzije. Danes je tako spletni SBL prosto dostopen vsem uporabnikom. Pri postopku digitalizacije smo se naslonili na odprtokodno programje in mednarodno sprejete standarde. Za strukturno označevanje podatkov v besedilu smo upoštevali smernice TEI (Text Encoding Initiative), ki so de facto standard za strukturno označevanje na področju humanistike, so dobro dokumentirane ter omogočajo izmenljivost in trajnost podatkov. Za označevanje biografskih podatkov smo se posebej naslonili na modul za označevanje biografskih in prozopografskih podatkov. Datoteko SBL smo integrirali v odprtokodni repozitorijski sistem Fedora Commons, ki omogoča iskanje po metapodatkih, celotnem besedilu, odnosih med elementi zbirke ter ključnih besedah s pomočjo iskalnih razširitev (v našem primeru smo uporabili Lucene/Solr) ter zagotavlja sledenje sprememb in varno hranjenje podatkov. Sistem trenutno nadgrajujemo v Slovensko biografijo, ki bo združila tri biografske leksikone -SBL, Primorski slovenski biografski leksikon in nove članke nastajajoče izdaje SBL2 - v enotni poizvedovalni sistem. S tem bo uporabniku omogočen dostop do najrelevantejših biografskih podatkov vseh treh leksikonov.

Ključne besede: Slovenski biografski leksikon, digitalizacija

OPEN ACCESS TO THE SLOVENIAN BIOGRAPHICAL LEXICON: BETWEEN CONSTRUCTION AND EXTENSION

Abstract

Slovenian Biographical Lexicon (SBL, 1925-1991) is the fundamental work of Slovenian biographical studies and the result of research of several generations of scholars. It comprises 16 volumes, 5047 entries and covers over 5100 people, some of the entries being family names. The biographical method used in the articles even today provides relevant and reliable data. As the SBL is, on the one hand, a highly relevant reference work, but, on the other, out of print and practically unavailable, the Slovenian Academy of Sciences and Arts (SASA) and the Scientific Research Centre of SASA have decided to digitise the SBL and prepare it as an online edition. Today the online SBL enables open access to all. The process of digitisation relied on open software and internationally accepted standards. For data encoding we followed the Text Encoding Initiative Guidelines, the de facto mark-up standard in the field of humanities; the TEI Guidelines are well documented and enable interoperability and sustainability of data. For the encoding of the biographical facts we specifically followed the TEI module on biographical and prosopographical data. The TEI encoded files are integrated in the open-source document repository system Fedora Commons, which allows for representation of metadata, intra-document relations and provides interfaces for advanced search engines (Lucene/Solr was used for our project), as well as enabling auditing of modifications and preservation of the data. The system is currently being upgraded and extended into the online Slovenian biography, bringing together three biographical lexicons - SBL, Primorski slovenski biografski leksikon and the new articles of SBL2 - into a single search and retrieval system with unified metadata. User will thus have open access to the most relevant biographical information of all three national biographical lexicons.

Key words: Slovenian Biographical Lexicon, digitisation

Večdesetletno nastajanje Slovenskega biografskega leksikona

Slovenski biografski leksikon (SBL) je temeljno delo slovenske biografike in plod temeljitega raziskovalnega dela številnih priznanih znanstvenikov več generacij. Izhajal je skoraj sedem desetletij, sprva s finančno podporo Zadružne gospodarske banke v Ljubljani, nato pa je prešel pod okrilje Slovenske akademije znanosti in umetnosti. Prvi zvezek je v uredništvu Izidorja Cankarja izšel leta 1925, nato pa je z nekajletnimi ali daljšimi presledki izšlo še 15 zvezkov, zadnji s kazalom leta 1991. V celoti so opisana življenja in delo več kakor 5100 oseb, saj publikacija obsega 5047 gesel, od katerih jih je 85 posvečenih rodbinam. Biografska metoda, ki so jo avtorji uporabljali pri svojem delu in pisanju gesel SBL, je historična znanstvena metoda in zagotavlja, da so navedeni podatki v geslih zanesljivi in vedno preverjeni na osnovi primarnih virov, obenem pa nekatera gesla vsebujejo celo znanstvene evalvacije in interpretacije dela in življenja določenih oseb. V dolgoletnem izhajanju je seveda razumljivo, da je prihajalo do določenih sprememb, vendar je bila osnovna naloga SBL, kakor je v spremnem besedilu k zadnjemu zvezku zapisal urednik Jože Munda, „ves čas

ista: opisati življenje in delo ljudi, ki so znanosti, kulturi in narodovemu razvoju sploh kaj tehtnega prispevali od daljnih do današnjih dni.« (Munda, 1991, V) Prav tako je bila metoda vseskozi ista: »zanesljivo podati bistvena biografska dejstva, važnejšo literaturo in jedrnato oceno, kjer je že možna.« (Ibid.) Zaradi te metode, ki pomeni, da so podatki, objavljeni v SBL, vselej preverjeni na osnovi primarnih virov, je bil in ostaja Slovenski biografski leksikon relevanten vir biografskih podatkov našim in tujim znanstvenim piscem.

Pri nastajanju SBL so sodelovali številni priznani strokovnjaki več generacij: Izidor Cankar, Franc Ksav. Lukman, France Kidrič, Alfonz Gspan, Jože Munda, če naštejemo samo poglavitne urednike. Osebe, ki so jih uredniki skupaj s sodelavci zajeli v izbor SBL, so morale s svojim delom pomembno vplivati na kulturni in zgodovinski razvoj slovenskega naroda. Izbor se je s pretežno humanističnih področij kasneje razširil tudi na druge dejavnosti, sčasoma so bile vanj vključene tudi mlajše uveljavljene osebe in leksikalni članki so postajali podrobnejši in obsežnejši. Po izidu zadnjega zvezka je bila že očitna tudi potreba po novi, popravljeni in dopolnjeni izdaji, tako zaradi razkoraka med prvimi in zadnjimi zvezki, kakor zaradi zastarelosti podatkov ter neupoštevanja nekaterih oseb. Poleg tega so zgodnejši zvezki danes razprodani in nedosegljivi.

Zato sta se Slovenska akademija znanosti in umetnosti ter Znanstvenoraziskovalni center SAZU odločila, da digitalizirata tiskano izdajo in pripravita spletno objavo, ki bo prosto dostopna in bo omogočala vpogled v podatke SBL brez omejitev, obenem pa bi v prihodnosti omogočala tudi prenovo in razširitev vsebine tiskanega SBL. Pri izbiri programja in načrtovanju postopka digitalizacije smo imeli v mislih zlasti prostodostopnost, izmenljivost in trajnost podatkov. Zato smo se odločili, da gradimo na odprtokodnem programju in da pri metodologiji označevanja upoštevamo smernice TEI.

Smernice TEI in označevanje podatkov v SBL

TEI ali Text Encoding Initiative ima svoje začetke v letu 1987; tedaj se je oblikoval konzorcij strokovnjakov s področij humanistike, družboslovja in računalništva [1] ter izdal prve smernice ali priporočila za strukturno označevanje elektronskih besedil. Smernice so se od svojega nastanka do danes razvijale in doživele nekaj sprememb, pomembnejšo denimo iz verzije P3 v P4 pri prehodu iz jezika SGML v XML, hkrati pa so širile področje uporabnosti in dejanski krog uporabnikov. Danes veljavna verzija smernic TEI je l. 2007 sprejeta verzija P5, ki vsebuje več sto elementov, tako temeljnih, uporabnih za vse vrste besedil, kakor specifičnih in namenjenih posameznim področjem proze, poezije, drame, leksikografije, rokopisov idr. Priporočila konzorcija TEI so postala de facto standard za strukturno označevanje besedilnih dokumentov s področja humanistike, deloma pa tudi družboslovja.

Ko govorimo o TEI na področju bibliotekarstva oz. v ožjem smislu digitalne knjižnice, je treba omeniti Digital Library Federation (DLF), ki je l. 1998 v prostorih Kongresne knjižnice organizirala delavnico z naslovom TEI in XML v digitalnih knjižnicah z namenom, da bi preučili uporabo smernic TEI za elektronska besedila v zbirkah digitalnih knjižnic ter začrtali pravila dobre prakse za bibliotekarje, ki se ukvarjajo z digitaliziranjem besedil. Smernice TEI so se odtlej spričo razvoja jezika XML in ustreznih pretvorbenih programskih orodij (XSLT) razvijale, s čimer so se dopolnjevala tudi priporočila dobre prakse in uporabe teh smernic na področju

digitalnih knjižnic, ki naj bi zadovoljevale specifične potrebe bibliotekarske stroke. Zadnji izpopolnjen dokument, ki ga je skupina delujočih na tem projektu podpisala l. 2006, predvideva več ravni označevanja besedil. [2] Razlog je ta, da se različne knjižnice lotevajo različno zahtevnih projektov digitalizacije gradiva in za razne namene, priporočila pa želijo zadostiti ambicijam vseh stopenj: tako tistim z osnovnim in popolnoma avtomatiziranim označevanjem kakor onim, ki zahtevajo visoko strokovno znanje, analizo in urejanje. Priporočila smernic TEI za knjižnice obsegajo pet stopenj. Vsaka naslednja stopnja vključuje zahteve nižjih stopenj in jih nadgradi, pri čemer stopnje 1-4 dopuščajo konverzijo in označevanje besedil brez globljega vsebinskega znanja, 5. stopnja pa je namenjena zahtevnejši, znanstveni analizi besedila. Vsako stopnjo je mogoče kadarkoli nadgraditi z dodatnimi oznakami.

Slika 1 je skeletni prikaz celotnega dokumenta TEI: vsak dokument v formatu XML/TEI vsebuje na začetku uvodno deklaracijo XML, nato pa korenski element TEI, o verziji in kodiranju ter deklaracijo sheme, po kateri dokument validiramo, tj. preverimo veljavnost glede na shemo. Nato sledi najprej kolofon TEI, ki vsebuje podatke o dokumentu: o naslovu in avtorju dokumenta, založniku, kraju in letu izida, o redakciji oz. osebah, ki so posegale v elektronski dokument in ga urejale ipd., sledi pa element <text>, ki vsebuje obvezni element <body> in neobvezna elementa <front> in <back>. V element <front> sodijo spremna besedila, ki jih običajno najdemo na začetku knjige: naslovnica, predgovor, zahvala, vsebinsko kazalo ipd., v element <back> pa besedila, ki jih običajno najdemo na koncu knjige: spremne študije, kazala (imensko, stvarno), seznam kratic, avtorjeva biografija ipd. Obvezni element <body> vsebuje besedilo dokumenta, v našem primeru celotna besedila leksikalnih člankov, ki so razdeljena na odstavke, označene z elementi <p> za angl. paragraph.

<?xiiil version="l.G" encoding="utf-8"?> <TEI xiiilns=" http; //wv, tei - c. o rg/ns/1. G" >

<teiHeader> <!-- vsebina --> </teiHeader>

Slika 1: Skeletni prikaz strukture dokumenta v formatu XML/TEIP5

V projektu digitalizacije SBL smo se pri označevanju podatkov v dokumentu odločili za uporabo smernic TEI, ker so na področju humanistike in družboslovja danes standard za strukturno označevanje podatkov, so zelo dobro dokumentirane, prilagodljive oz. uporabne za označevanje raznovrstnih podatkov in omogočajo njihovo izmenljivost (in trajnost). Obenem omogočajo strukturno označevanje tako na ravni celotnega besedila kakor na ravni metapodatkov. To pomeni, da pri označevanju podatkov na obeh ravneh ostanemo znotraj iste označevalne sheme TEI, kar omogoča enotno strojno procesiranje podatkov.

Iz tiskane v elektronsko obliko

V prvih fazah digitalizacije smo tiskano izdajo SBL skenirali, skenograme smo obdelali s programom za optično prepoznavanje znakov (OCR) in tako dobili besedilo v elektronskem tekstnem formatu. Po opravljenem postopku OCR je bilo treba besedilo ročno pregledati in popraviti napake. Besedilo smo shranili v besedilnem formatu OpenOffice, ki je ne le prostodostopen urejevalnik besedila, temveč uporablja dokumentiran format XML, tako da je bilo mogoče s pretvorbenimi programi (XSLT) celotno besedilo samodejno preoblikovati v drug format XML, in sicer v preprosto strukturo TEI (TEI Lite).

Dokument, ki smo ga dobili s pretvorbo iz formata OpenOffice v format XML/TEI P5, je vseboval le malo strukturnih oznak (TEI Lite): označeni so bili nekateri podatki v preprostem kolofonu TEI v elementu <teiHeader> ter odstavki celotnega besedila v elementih <p>.

S pomočjo programov (Perl) smo nato iz besedila leksikalnih člankov izluščili bistvene biografske podatke o posameznih osebah; ta postopek je olajšalo dejstvo, da so osnovni biografski podatki v vseh člankih večinoma enotno navedeni: priimek in ime z variantami v oklepajih kot geselska iztočnica, nato pa so za vejico sledili poklic/i ali področje delovanja ter datum in kraj rojstva in/ali smrti (slika 2). Izluščene podatke je program glede na smernice TEI umestil v ustrezne elemente znotraj elementa <person>: <sex>, <persName>, <birth>, <death>, <floruit> in druge nadalje gnezdene elemente za podrobnejše podatke: datume v <date>, kraje v <placeName> ipd. Sledila sta obsežna ročna redakcija in popravljanje podatkov.

Pohlin Marko o., d.i6'kal«eat (med ere-torn Anton), sprožite 1 j ßlofvenskega Icnjižev-nega preroda, r, 13. apr. 1785 v šempet. predmes-tju Lj. gostilničarju Janezu Juriju P.-u iz Kafoiuika (gl. öl. PoMin), u, 4. febr. 1801 za poidat^o v diietalc. Bamostauu v Ma^ riabrunuu pri Hütteldorfu zap. od Dunaja, Vsiljuje se misel, da so v Lj. imeli z njim sitnosti, preden je prišel z li2. L, morda po posredovanju p. Bernarda P. (gl. žl.), v fraw. gimii. v Novem mestu, kjer je dovršil 1/747/48 drugi, 1748/49 tretji razred. Učitelj mu je bil 1747/48 p. Romualdus Laurin, 1748/49 p. Ildephoinsus Earner, a med njegovimi soucenci so bili tudi Hrvatje. iNapredoval je dobro (1747/48: studii boni, bonorum morum; 1748/49: capacitatis et prclectus ipraestantis, morum cOTimendabi-liuira), a se vrnil v Lj., kjer je bil morda že kot četrtošol«! 1749/50 sprejet v Jezult-

Slika 2: Članek iz SBL z bistvenimi biografskimi podatki na začetku članka

V naslednji fazi smo se lotili še natančnejše redakcije in dopolnjevanja podatkov, npr.:

• variantna imena smo označili z ustreznimi atributi za različne oblike: psevdonim, ime po poroki, umetniško ime, ilegalno ime, vzdevek, redovno ime, ime med operozi,

krajšava ipd.;

• generacijske izraze smo označili z elementom <genName> za „mlajši", „starejši", „II" ipd.;

• nazive smo označili z elementom <roleName> in posameznimi atributi za razne oblike: cerkvene, plemiške ter članstvo v Academii operosorum Labacensis in Slovenski akademiji znanosti in umetnosti;

• plemenitost osebe ali rodbine smo označili z elementom <trait @type="noble">;

• z elementom <personGrp> smo označili rodbinska gesla;

• z atributom @lang smo označili jezikovne variante imen.

• normalizirali smo kraje, tj. ohranili historične oblike - kjer so obstajale - in označili sodobne sprejete oblike krajevnih imen;

• z elementoma <country> in <region> smo dodali državo in/ali regijo, z elementoma <settlement> in <district> pa smo podrobneje označili naselja in dele naselij;

• z atributom @lang smo dodali jezikovne variante pri dvojezičnih ali večjezičnih krajevnih poimenovanjih;

• z atributom @cert="medium" smo označili nezanesljivost podatka, kjer je bil že v besedilu indiciran;

• poenotili smo obliko zapisa vsebine elementov <floruit>, ki označuje obdobje delovanja in neredko tudi regijo ali kraj delovanja.

Izluščili smo tudi poklice in jih uredili v hierarhičen seznam (taksonomijo), ki smo ga preoblikovali v format TEI in integrirali v poizvedovalni sistem, da uporabniški vmesnik lahko omogoča brskanje po taksonomiji poklicev in iskanje po nadrednih pojmih. Delo pri vzpostavljanju taksonomije poklicev pa še ni končano, saj se pri tem soočamo z vrsto težav: sodobne razvrstitve poklicev v hierarhične sisteme temeljijo na sodobnih dejavnostih in poklicih, pri čemer uporabljeni izrazi ustrezajo trenutni terminološki rabi. Na obzorju SBL pa so po eni strani imenovani poklici, ki so izključno historično povezani z dejavnostmi določenega obdobja in jih danes v takšni obliki ne poznamo več, tako je npr. stavbar iz 16. st. združeval današnja poklica arhitekta in gradbenika. Spet drugačni so primeri, ko danes za posamezne poklice in dejavnosti uporabljamo drugačna poimenovanja, kakor so bila v rabi v času, ko so opisane osebe živele: npr. deželni fiz)k zdravnik, oz. ko so avtorji napisali članke za SBL: npr. tvorničar ^ tovarnar. Poleg tega smo se morali pri razreševanju poklicev spoprijeti še z naslednjimi tremi kategorijami posebnosti:

• dvojno poimenovanje istih poklicev: živinozdravnik - veterinar, zobozdravnik -stomatolog;

• različni zapis istega poklica: igravec - igralec;

• razlikovanje moške in ženske oblike poklica: igralec - igralka, arhitekt - arhitektka.

Poleg teh zapletov je treba opozoriti tudi na to, da so avtorji leksikalnih člankov ob osnovnih podatkih o poklicih na začetku gesla navajali tudi druge značilnosti posamezne osebe, npr. »osnovatelj in prvi predsednik Društva slovenskih pisateljev« ali »lastnik prve in edine rokopisne pesemske zbirke Simona Jenka« ali »borec za pravice koroških Slovencev« ipd. Tovrstne oznake smo izločili iz taksonomije poklicev in jih umestili v element <note>; tako je podatek strukturno označen in ga je mogoče izpisati na zaslonu kot posebno kategorijo med biografskimi podatki neke osebe.

<f o rename type=" monastic ">Marko</f o renaiiie> <roleName type="operoso rum">operoz</roleName>

<note>sprozitelj slovenskega književnega preroda</note> <date when="1735-Q4-13">13, apr, 1735</date>

<date when="18Ql-G2-G4">4, febr, 18Gl</date>

<settlement xml;lang="ger":^ien</settleiiient> <dis1:ric1: xml: Lang="ger">Mariabrunn</dis1:rict>

Slika 3: Primer podrobno označenih izluščenih in redigiranih biografskih podatkov

Redakcija, ki smo jo na kratko opisali, je torej potekala na ravni izluščenih in označenih podatkov o osebah, predstavljenih z biografskimi članki. Pri tem samih besedil člankov nismo podrobneje strukturno označili, prav tako ne spreminjali. Sčasoma se je pokazala potreba, da obe ravni ločimo v dva dokumenta: po eni strani zaradi lažjega dela na dveh dokaj različnih vrstah besedilnih podatkov - celotna besedila in neke vrste izluščeni biografski »metapodatki« iz celotnih besedil - po drugi pa zlasti z vidika nadaljnje integracije podatkov v poizvedovalni in repozitorijski sistem. Zato smo dokument SBL ločili na dokument s celotnimi besedili - še vedno ustrezno označen v formatu TEI - in na dokument z izluščenimi biografskimi podatki, natančno označenimi z oznakami TEI glede na modul za označevanje biografskih in prozopografskih podatkov. Kot rezultat smo dobili datoteko s celotnimi besedili člankov in posebno datoteko s podrobno označenimi biografskimi podatki, v kateri ima vsaka predstavljena oseba tudi trajno identifikacijsko številko, preko katere je mogoče

povezati besedilo posameznega članka v ločeni datoteki s celotnimi besedili z ustrezno osebo. Te oznake smo uporabili tudi na ravni XML TEI, kjer smo ohranili povezavo med člankom in opisano osebo s sklicevanjem na identifikacijsko številko kot identifikator relevantnega elementa v datoteki biografskih podatkov.

Glavnina dela v projektu spletne izdaje SBL je bila torej namenjena podrobnemu strukturiranju celotnega bloka izluščenih osebnih podatkov. Te smo dopolnjevali in preverjali s pomočjo širše palete virov in podatkovnih zbirk. Tako je elektronska izdaja SBL postala dvojni tesaurus slovenske biografike: oživila je staro zbirko prvotnih člankov v elektronski obliki, nad njimi pa je vzpostavila podatkovno zbirko izluščenih osebnih podatkov za vsak članek, ki so bili izdatno preverjeni, izpopolnjeni, posodobljeni, podrobneje opredeljeni, opremljeni s sodobnimi pravopisnimi ali geografsko standardiziranimi oblikami itn. S tem SBL postaja nenehno rastoč korpus biografskih podatkov, ki z razčlenjenostjo in bogastvom podrobnejših podatkov pridobiva dodatno vrednost, aktualnost in uporabnost.

Uporabniški vmesnik

Naslednji korak je bil vzpostavitev digitalne knjižnice, tj. repozitorija za dokumente, v katerem bi lahko digitalno izdajo objavili na spletu in hkrati zagotovili fleksibilnost in trajno dostopnost objav. Eden pomembnejših kriterijev pri izbiri digitalne knjižnice je bila fleksibilnost, saj smo si želeli, da bi bilo mogoče kar največ označenih podatkov aktivirati, bodisi s spletnimi povezavami in grafičnim poudarkom, bodisi z možnostmi iskanja in urejanja.

Izbrali smo odprtokodno platformo Fedora Commons, ki temelji na sprejetih standardih (prim. Logoze idr., 2005). Fedora Commons kot osnovni gradnik uporablja dokumente v obliki datotek XML. Fedorini dokumenti vsebujejo sistemske podatke (identifikator dokumenta, podatke o delu z dokumentom, kazalec na opis dovoljenih prikaznih metod, tipično v obliki transformacij XSLT, ter metapodatke v formatu DublinCore) ter poljubno število vsebinskih elementov, ki so samostojni vstavljeni dokumenti XML. To pomeni, da smo lahko v repozitorij neposredno vstavljali elemente v formatu TEI; v našem primeru smo vsak članek in vsako enoto z biografskimi podatki vključili v lasten dokument repozitorija. Postopek smo avtomatizirali, tako da lahko uredniki digitalne izdaje delajo neposredno z dokumentom TEI, skrbniki repozitorija pa skrbijo za pretvorbo v dokumente repozitorija. Ti so opremeljeni s kazalkami na medsebojne odnose dokumentov, ki npr. za vsak članek iz SBL kažejo, da je del SBL, v kateri zvezek in pod katero črko (za abecedne sezname) sodi, povezujejo pa tudi članek z ustreznimi biografskimi podatki.

Naslednji korak je bila vzpostavitev spletnega uporabniškega vmesnika. Uporabili smo transformacije XSLT, s katerimi iz fragmentov dokumentov TEI za vsak članek iz vsebine članka in pripadajočih biografskih podatkov sistem zgradi spletno stran, ki jo prikaže uporabniku. Isto tehniko smo uporabili tudi za zajem biografskih podatkov za vgrajeni register biografskih podatkov v formatu Dublin Core, ki ga uporablja tudi vmesnik za OAI-PMH (Open Archive Initiative Protocol for Metadata Harvesting), kar omogoča napredno zajemanje metapodatkov zunanjim servisom, ter za gradnjo seznamov iskalnih ključev. Iskalne ključe smo uporabili s pomočjo adapterja za iskalnik Lucene/SoLR, ki smo ga s

transformacijami XSLT integrirali v spletno aplikacijo in na njegovi osnovi zgradili uporabniški vmesnik za iskanje po biografskih leksikonih. Ker so metode za transformacije XSLT dostopne tudi preko dokumentiranih vmesnikov REST in SOAP, omogočajo tudi zunanji programski dostop do vsem zmožnosti uporabniškega vmesnika.

Uporabniški vmesnik omogoča tako enostavno kakor tudi zahtevno iskanje po več kategorijah strukturno označenih biografskih podatkov ter po celotnem besedilu leksikona. Tako se lahko odločimo za kompleksnejše poizvedbe, kakor je iskanje, denimo, vseh zdravnikov, ki so delovali v Mariboru v obdobju 1850-1900 ali vseh učiteljev, ki so se rodili v Višnji Gori itn. Poleg tega iskalni sistem poizvedovanje opravi tudi avtomatsko, kadar uporabnik npr. klikne na povezavo „Rojeni na današnji dan" ali „Sodobniki" (ki prikaže seznam sodobnikov trenutno izbrane osebe). Takšna orodja še razvijamo, saj se nam zdi pomembno, da so podatki ustrezno na voljo različnim profilom uporabnikom.

Slika 4: Uporabniški vmesnik SBL - prikaz funkcij zahtevnega iskanja

Prosto dostopne izdaje SBL [3] ne obiskujejo in uporabljajo le znanstveniki, temveč tudi širša, splošna publika. Izdajo smo vključili v Googlov sistem opazovanja spletnega prometa s pripadajočo statistiko uporabnikov Google Analytics. Ta servis je v obdobju od 1. 1. 2010 do 30. 9. 2010 zabeležil ok. 44.000 obiskov, 30.000 različnih obiskovalcev in povprečno 162 obiskov na dan; v vsem obdobju, odkar je spletni SBL v svoji poskusni obliki dostopen uporabnikom, pa je sistem zabeležil ok. 54.000 obiskov, 35.000 različnih obiskovalcev in povprečno 85 obiskov na dan. Navedena statistika kaže, da je spletni SBL že v testni fazi, ko je bila dostopna samo t. i. beta verzija in sploh še ni bil javno predstavljen, s svojo uporabnostjo upravičil vse napore za njegovo elektronsko objavo, obenem pa lahko ugotovimo kar 65 % porast novih uporabnikov v obdobju zadnjih devetih mesecev.

Nadgradnja in razširitev SBL

Podoben postopek digitalizacije kakor v primeru SBL načrtujemo in smo pričeli izvajati tudi za Primorski slovenski biografski leksikon (PSBL). PSBL je izhajal v Gorici v letih 1974-1994 in obsega 20 zvezkov z več kakor 4000 leksikalnimi članki. Avtorji so pri pisanju člankov za ta dragoceni regionalni leksikon upoštevali podobna načela, zato sta si SBL in PSBL po metodologiji in relevantnosti vsebine podobna, le da pokriva PSBL slovensko Primorje, in to njegovo integralno območje, tudi tisto, ki se nahaja v zamejstvu. Ta razsežnost PSBL je za osrednjo zbirko slovenske biografike še posebej pomembna, saj vanjo uvaja historično celovitost slovenskega kulturnega in narodnega prostora.

Obenem načrtujejo na Inštitutu za kulturno zgodovino ZRC SAZU pripravo novega temeljnega leksikona (urednik dr. A. Rahten), ki so ga za razliko od SBL1 (1925-1991) poimenovali SBL2. V prihodnosti nameravamo v sodelovanju z ZRC SAZU kontinuirano dopolnjevati baze z novimi biografskimi članki in postopoma vključiti celotni Primorski slovenski biografski leksikon ter vse tri leksikone - SBL1, SBL2 in PSBL - povezati v celovito bazo relevantnih in zanesljivih biografskih podatkov, imenovano Slovenska biografija. Doslej smo pripravili pilotsko verzijo krovnega biografskega sistema, ki obsega SBL1 v celoti, črko A iz PSBL in nekaj novih člankov nastajajočega SBL2.

Arhitektura celotnega sistema je zasnovana tako, da so biografski podatki za osebe enotni, kar pomeni, da so v posebni datoteki zgolj biografski podatki, ustrezno strukturno označeni v zapisu XML/TEI, ki so s pomočjo že omenjenih nezamenljivih in trajnih identifikacijskih številk povezani s celotnimi besedili pripadajočih leksikalnih člankov, bodisi da se ti nahajajo v SBL1, SBL2 ali PSBL oz. v vseh treh. Ti trije leksikoni pa ostajajo z gledišča arhitekture sistema trije ločeni dokumenti (slika 5) oz. trije ločeni biografski leksikoni, ki jih je mogoče po potrebi tudi natisniti. Datoteka z biografskimi podatki se zato dopolnjuje s podatki iz vseh treh leksikonov, pri čemer so osnova podatki iz SBL1. Vse podatke, pridobljene iz drugih dveh leksikonov, posebej označimo z atributom, ki nosi informacijo o viru podatka. Vir podatka se izpiše tudi na zaslonu in je viden uporabniku.

Slika 5: Shematični prikaz arhitekture sistema Slovenske biografije: enotni biografski podatki so povezani s celotnimi besedili člankov treh biografskih leksikonov.

Vzpostavljeni sistem medsebojnih odnosov v digitalni knjižnici Fedora Commons nam omogoča, da so posamezni članki in posamezni biografski podatki v sistemu zapisani samo enkrat, tako da jih je mogoče enoznačno posodabljati, vendar je mogoče pri vsakem članku (v zbirkah SBL1, SBL2 in PSBL) ter v registru oseb (Slovenska biografija) vedno prikazati vse relevantne podatke. To pomeni, da npr. pri prikazu članka o določeni osebi v SBL1 dejanski podatki o osebi (o imenu, rojstvu, smrti, dejavnosti ipd.) prihajajo iz metapodatkovnega registra Slovenske biografije, pri prikazu podatkov o osebi v Slovenski biografiji pa hkrati vidimo tudi vse članke iz vseh treh zbirk, ki se nanašajo na to enoto (osebo ali rodbino).

Poleg vsebinske razširitve baze biografskih podatkov načrtujemo tudi njihovo nadaljnje in podrobnejše označevanje, ki naj omogoča še bolj informativne poizvedbe:

• sorodstvene povezave med osebami;

• razdvoumljanje osebnih imen: razreševanje soimenjakov in krajšav;

• ureditev, razreševanje in podrobno označevanje bibliografskih virov pri leksikalnih člankih;

• razreševanje splošnih krajšav v celotnem besedilu.

Z načrtovano vsebinsko razširitvijo obstoječih gesel s članki PSBL ter z novimi članki SBL2 in z nadgradnjo na ravni strukturnega označevanja podatkov ter njihove integracije v poizvedovalni in repozitorijski sistem Slovenska biografija nedvomno nadaljuje pot, ki jo je začrtal že Slovenski biografski leksikon kot edinstven nacionalni biografski vir.

Bibliografija

Best practices for TEI in Libraries. Pridobljeno s spletne strani: http://www.tei-c.org/ SIG/Libraries/teiinlibraries/

Cankar I. et al. (ur.). (1925-1991). Slovenski biografski leksikon. 16 zv. Ljubljana: Zadružna gospodarska banka, Slovenska akademija znanosti in umetnosti.

Jevnikar, M. et al. (ur.). (1974-1994). Primorski slovenski biografski leksikon. 20 zv. Gorica: Goriška Mohorjeva družba.

Lagoze, C., Payette, S., Shin, E., Wilper, C. (2006). Fedora: an architecture for complex objects and their relationships. International Journal on Digital Libraries, 6 (2), 124-138.

Munda, J. (1991). Sklepna beseda k četrti knjigi. V: Slovenski biografski leksikon. Ljubljana: Slovenska akademija znanosti in umetnosti, zv. 15., str. V-VII.

Slovenski biografski leksikon 1925-1991, elektronska izdaja (v pripravi). Pridobljeno s spletne strani: http://nl.ijs.si/fedora/sbl/

TEI Consortium (2007). TEI P5: Guidelines for Electronic Text Encoding and Interchange. Version 1.7.0. Last updated on July 6th 2010. TEI Consortium. Pridobljeno s spletne strani dne 6. 10. 2010: http://www.tei-c.org/Guidelines/P5/

TEI Consortium. Pridobljeno s spletne strani: http://www.tei-c.org/

SPLETNI PORTAL ZGODOVINA SLOVENIJE - SISTORY: PROST DOSTOP DO DOSEŽKOV SLOVENSKEGA ZGODOVINOPISJA

dr. Mojca Šorn

Inštitut za novejšo zgodovino e-naslov: mojca.sorn@inz.si

dr. Jurij Hadalin

Inštitut za novejšo zgodovino e-naslov: jurij.hadalin@inz.si

UDK: 930:655.411(497.4)

Izvleček

Na Inštitutu za novejšo zgodovino v Ljubljani od leta 2006 poteka program raziskovalne infrastrukture, v sklopu katerega se razvija tudi spletni portal Zgodovina Slovenije - SIstory. Spletni portal SIstory je izobraževalni in raziskovalni portal slovenskega zgodovinopisja, ki je za javnost odprt od konca leta 2008. S prenosom starejših in tudi sodobnih verificiranih zgodovinopisnih in zgodovinskih gradiv v novo medijsko in tehnološko obliko imamo namen poskrbeti za ohranitev kulturne dediščine, del katere je tudi omenjeno gradivo, hkrati pa želimo razširiti in podaljšati njihove relevance. Portal, ki je zasnovan v slovenskem in angleškem jeziku, ima širok nabor vsebin in omogoča brezplačen, hiter, prost ter enostaven dostop do želenih vsebin tako zgodovinarjem pri raziskovalnem delu kot tudi raziskovalcem drugih disciplin oziroma zainteresirani javnosti na lokalnem, nacionalnem in mednarodnem nivoju.

Ključne besede: zgodovinopisje, digitalizacija, raziskovalna infrastruktura, prost dostop, portal slovenskega zgodovinopisja

WEB PORTAL HISTORY OF SLOVENIA - SISTORY OPEN ACCESS TO ACHIEVEMENTS OF SLOVENIAN HISTORIOGRAPHY

Abstract

A research infrastructure programme was initiated in 2006 at the Institute for Contemporary History, within which in 2008 the web portal History of Slovenia - SIstory was developed. SIstory is an educational and research portal of Slovenian historiography. By digitising literature, research analyses, historical sources and all the content that most appeals to researchers, college and university teachers and lecturers as well as students at any level of education, we aim to provide a broad, user-friendly, open and comprehensive access. SIstory portal is a way of simultaneously promoting the findings of Slovene historiography and to provide a platform for international and interdisciplinary debates. The portal enables local, national and international connections to be made in the field of research and education.

Key words: research infrastructure, open access, History of Slovenia - Sistory: the portal of Slovenian historiography

Na Inštitutu za novejšo zgodovino (INZ) v Ljubljani v okviru programa raziskovalne infrastrukture že od konca leta 2008 zainteresirani znanstveni, strokovni in laični javnosti na dvojezičnem (slovensko-angleškem) spletnem portalu Zgodovina Slovenije - SIstory (http://www.sistory.si/) omogočamo brezplačen dostop do najnovejših, predvsem pa do najbolj frekventnih dosežkov slovenskega zgodovinopisja, hkrati pa promoviramo dosežke zgodovinarjev starejših generacij, saj jim s prostodostopno objavo podaljšujemo relevantnost. Pojem digitalizacije razumemo kompleksno, se pravi, da se ukvarjamo tako z oblikovanjem sodobnih spletnih medijev kot tudi s samo valorizacijo in digitalizacijo kulturne dediščine in drugih gradiv ter njihovo objavo na spletu.

Portal SIstory je razdeljen v sklope, ki prezentirajo verificirano zgodovinopisno in zgodovinsko gradivo z adekvatnimi analitičnimi sistemi in ustreznim znanstvenim aparatom: serijske publikacije, monografije, analize, rokopise, učbenike, učne načrte, tiskane vire, arhivsko in muzejsko gradivo itd., uporabniki imajo na vpogled tudi bazo podatkov Smrtne žrtve med prebivalstvom na območju Republike Slovenije med drugo svetovno vojno in neposredno po njej. S tem gradivom pokrivamo potrebe tako raziskovalnega kot izobraževalnega polja.

Portal SIstory ni repozitorij v klasičnem pomenu besede, čeprav bi ga lahko označili tudi kot takšnega, vendar ga sami dojemamo kot specializiran portal. Do tega zaključka smo prišli zaradi kompleksnosti zasnove portala oziroma povezovanja posameznih vsebinskih sklopov in podsklopov. S pomočjo novih orodij sodobne tehnologije namreč razvijamo interaktivne in multimedijske prezentacije historičnih vsebin, zaradi česar je portal SIstory prerasel tudi vlogo spletne knjižnice oziroma arhiva.

Osnovna ideja, na podlagi katere gradimo spletni portal, je bila omogočiti podporo raziskovalnima skupinama na INZ. To fazo smo hitro prerasli in se oblikujemo v osrednjo e-točko slovenskega zgodovinopisja oziroma servisa o slovenskem zgodovinopisju in zanj. Širok nabor verificiranih vsebin tako nudi podporo ne samo zgodovinarjem raziskovalcem temveč tudi arhivistom, muzealcem, šolnikom, študentom, pa tudi vsem tistim, ki jih to področje zanima zgolj ljubiteljsko. Poleg prezentacije in ne nazadnje ohranjanja gradiva pa je pomembno tudi širjenje in pretok informacij, interpretacij itd., s tem pa oblikovanje prostora za nadaljnja interdisciplinarna in mednarodna srečanja, za odpiranje razprav na področju zgodovinopisja, humanistike, družboslovja.

Pri delu nas vodi želja po popularizaciji zgodovinopisja v javnosti, zato je tudi vse digitalizirano gradivo prosto dostopno. Pri tem pa nas tarejo različne težave, ki so v prvi vrsti finančne narave, saj je gradiva za digitalizacijo mnogo več, kot je finančnih sredstev. Seveda pa ta težava ni edina. Še večje breme predstavlja pridobivanje avtorskih pravic za objavo, ki jih urejamo po svojih zmožnostih. Glavnina gradiva, ki ga želimo objavljati, je seveda nastala v 20. stoletju in materialne avtorske pravice zanj še niso oziroma še dolgo ne bodo ugasnile. Predstaviti pa bi želeli celoten spekter dela slovenskih zgodovinarjev, saj so publikacije v javni domeni starejšega datuma in ne vedno povsem relevantne.

Finančna podhranjenost projekta se kaže že v temu, da je na programu raziskovalne infrastrukture redno (1700 raziskovalnih ur) zaposlena le ena oseba, vsi ostali sodelavci pa

so za svoje delo plačani iz materialnih sredstev. Prav zaradi tega portal le stežka vzdržuje enakomeren tempo razvoja.

V procesu bogatitve samega portala poskušamo vzpostaviti sodelovanje z različnimi ustanovami, to sodelovanje pa želimo zastaviti dolgoročno. Zato poskušamo te odnose pravnoformalno čim bolj urediti in uskladiti z normami, ki veljajo za organizacije, npr. arhivskimi, muzejskimi in konec koncev tudi bibliotekarskimi. To nam relativno dobro uspeva, čeprav smo se marsičesa naučili na napakah. Ker pa portal ni zamišljen statično, temveč deluje kot »živ organizem«, popravki, modifikacije, nadgradnja itd. niso nemogoči, ampak so stalna praksa.

Standardov se moramo držati tudi zaradi (bodoče) vpetosti v mednarodne baze metapodatkov. Naša prioriteta je vključitev v evropski projekt Digital Research Infrastructure for the Arts and Humanities - DARIAH, ta pa je vključen v program European Strategy Forum on Research Infrastructure (ESFRI). Cilj Dariah, ki je trenutno edini projekt raziskovalne infrastrukture za humanistiko in umetnost na evropskem nivoju ter edini mednarodni program digitalne humanistike na sploh, je vzpostaviti digitalno raziskovalno infrastrukturo za navedeni področji v Evropi. Pri tem moramo poudariti, da digitalna humanistika v večini držav še ni poznana, ter da je potrebno poenoteno raziskovalno infrastrukturo za humanistiko in umetnost na evropskem nivoju šele vzpostaviti. To bomo dosegli s poenoteno standardizacijo, organiziranjem znanja ter povezovanjem baz podatkov različnih nacionalnih akademskih tradicij in disciplin.

Glede na širok spekter ustanov, s katerimi sodelujemo, te pa so vključene v različne baze podatkov, ki v evropskem kontekstu nastajajo na njihovem specializiranem strokovnem področju, lahko že v bližnji prihodnosti pričakujemo, da se bomo s svojimi meta podatki vključili tudi vanje.

Strategijo razmeščanja gradiva v različne kategorije vodimo samostojno, v skladu z uredniško politiko, saj v mnogih primerih digitaliziramo primarno oziroma historično arhivsko gradivo, ki ga je potrebno valorizirati, spremljati njegovo digitalizacijo in ga pripraviti za uporabniku čim enostavnejšo uporabo. Kot primer skeniranega in po najsodobnejših standardih digitalno obdelanega arhivskega gradiva, ki šteje za pionirskega, naj navedemo popis prebivalstva Ljubljane iz leta 1830, ki ga hrani Zgodovinski arhiv Ljubljana, in je z računalniško obdelavo z različnimi orodji omogočil mnogo hitrejše in kompleksnejše raziskave tudi na doslej precej zapostavljenem rodoslovnem področju.

Zaradi težav pri realizaciji našega programa, ki so včasih finančne narave, še večkrat pa pravne ali logistične, se je spreminjala oziroma se sproti spreminja strategija prioritetnega pridobivanja želenih vsebin na portalu. Največji zalogaj so tako predstavljale zelo zaželene in uporabljane serijske publikacije, ki pa so po začetnem zagonu doživele rahlo stagnacijo, saj zaradi kompleksnejšega urejanja avtorskih pravic na splet dodajamo zgolj posamezne letnike, ne pa kompletov revij. Zaradi tega je bil v zadnjem času večji poudarek dan monografskim publikacijam, ki so zaradi manjših težav, povezanih s pridobivanjem avtorskih pravic, mnogo bolj zastopane. Ob temu je vredno omeniti, da v posebnih sklopih težimo tudi

k objavam doktorskih disertacij in magistrskih del oziroma z njihovo digitalizacijo širimo in populariziramo dosežke slovenskih znanstvenikov.

Kljub temu da si želimo čim bolj razširiti obseg in relevantnost prostodostopnega gradiva, nas pri tem »ovira« konzervativno mišljenje večine uredništev nizkonakladne znanstvene periodike, saj večinoma ne želijo objavljati vsebin tekočih številk, ker v nasprotju z ustaljenim mnenjem, da bi to le še povečalo doseg njihovega bralstva, menijo namreč, da jim bo okrnilo prodajo tiskanih izvodov. Zato je nekoliko kontradiktorno politika portala SIstory takšna, da je zaradi zelo majhnega interesa tovrstno gradivo dostopno šele dve leti po njegovem nastanku. Naša želja je, da bi v spodbudo ostalim uredništvom pričeli objavljati tudi lastno spletno revijo, vendar je ta projekt trenutno šele v idejni fazi.

Začetna zadrega, ki je nastala ob zapletih s pridobivanjem avtorskih pravic, pa na razvoj portala ni vplivala zgolj negativno, saj nas je »primorala«, da v obojestransko zadovoljstvo aktivno sodelujemo z inštitucijami, ki hranijo historično gradivo, uporabno ne le za raziskovalce zgodovine, je pa v javni domeni. Prav to širi našo osnovno vlogo, saj se razvijamo v smer osrednjega servisa o slovenskem zgodovinopisju, ker nekatere ustanove, s katerimi sodelujemo, ne premorejo lastne infrastrukture, druge pa kljub temu da to imajo, izkazujejo pripravljenost na sodelovanje s portalom SIstory. Ta jim namreč omogoči mnogo hitrejšo digitalizacijo gradiva, ki ga predlagamo in financiramo mi, za objavo pa ga pripravimo s skupnimi močmi, čeprav ni nujno na njihovem prioritetnem seznamu za digitalizacijo.

Pri pripravi portala ne sodelujejo zgolj inštitucije, temveč tudi posamezniki. Do zdaj smo z njimi opravili veliko intervjujev, ki so osnova za zbirko ustnih pričevanj, uspešno pa smo pridobili tudi prvo privatno zbirko slikovnega gradiva.

V lanskem letu smo se na INZ odločili, da portal SIstory izstopi iz okvirov zgolj »pisane zgodovine«. Z novimi orodji sodobne tehnologije smo začeli razvijati interaktivne in multimedijske prezentacije historičnih vsebin, s čimer bomo pritegnili tudi interes širše javnosti. V prvi fazi nadgradnje obstoječe tehnološke platforme se je kot plodno izkazalo sodelovanje z muzeji, ki so pokazali interes za medinstitucionalno sodelovanje oziroma za predstavitev posameznih razstav na portalu SIstory. Skupaj z muzealci smo poiskali vsebinske rešitve, z zunanjimi sodelavci-programerji pa smo dorekli končno podobo spletnih razstav. Oblikovali smo virtualne prostore dveh razstav, ki sta narejeni kot spletna stran, po kateri se obiskovalec sprehaja v 3D. Na tak način smo omogočili, da začasne razstave ohranijo svojo podobo tudi za zanamce. V klasični obliki težje dosegljiva razstava je tako brezplačno in popolnoma prosto dostopno dana na ogled obiskovalcem s celega sveta.

Projekt SIstory ne bazira zgolj na digitalizaciji analognega gradiva, ampak omogoča tudi dostop do baz podatkov (za zdaj do Zbirke smrtnih žrtev druge svetovne vojne in zaradi nje), tako da portal objavlja tudi gradivo, ki je po naravi svojega nastanka digitalno. Tudi to je pospremljeno s primernimi spremnimi besedili, ki osnovne podatke tudi analizirajo in interpretirajo. Poleg tega smo za portal pridobili tudi e-monografijo treh uglednih zgodovinarjev, ki so jo pripravili izključno v digitalni obliki za potrebe spletne objave.

Nismo zgolj knjižnica ali arhiv, smo interaktivni portal in želimo, da vsak naš zapis ni zgolj arhiviran in prostodostopen, temveč da živi v multimedijski interakciji. Ko se ozremo na naše delo, ne moremo mimo ugotovitve, da poudarek našega dela leži na vsebini, bistveno manj pa na kataloškem pristopu, ki mora to delo spremljati. Pri gradnji portala smo upoštevali tudi specifičen način dela in citiranja, ki sta značilna za zgodovinarsko stroko, zato so iskalniki temu prilagojeni, portal pa omogoča listanje po revijah, monografijah itd. ter nudi vpogled v celoten spekter objavljenega gradiva.

GRAFIČNA EVIDENCA RABE KMETIJSKIH ZEMLJIŠČ (GERK/RABA, RKG.GOV.SI/GERK)

Alenka Rotter

Ministrstvo za kmetijstvo, gozdarstvo in prehrano e-naslov: alenka.rotter@gov.si

Tine Petkovšek

Ministrstvo za kmetijstvo, gozdarstvo in prehrano e-naslov: tine.petkovsek@gov.si

Grega Milčinski

Sinergise d.o.o, Ljubljana

e-naslov: grega.milcinski@sinergise.com

Aleš Okorn

Sinergise d.o.o, Ljubljana e-naslov: ales.okorn@sinergise.com

Polonca Pucelj

Sinergise d.o.o, Ljubljana

e-naslov: polona.pucelj@sinergise.com

Dragan Vitas

Sinergise d.o.o, Ljubljana e-naslov: dragan.vitas@sinergise.com

UDK: 004:91

Izvleček

Sistem GERK (grafična enota rabe kmetijskega gospodarstva) je zaživel v letu 2005 v okviru projekta vzpostavitve sistema za identifikacijo kmetijskih parcel, ki je bil eden od pogojev za uspešno zaprtje vprašanja kmetijstva pri vključevanju Slovenije v Evropsko unijo, saj omogoča učinkovit nadzor nad uporabo proračunskih sredstev za spodbujanje kmetijstva in razvoj podeželja. V prispevku je opisan kronološki potek projekta, od same zasnove sistema, prek splavitve aplikacije v javnosti, razvoja v preteklih 5 letih do načrtov za nadaljnje korake. Na kratko so predstavljeni tehnološki gradniki, ki sestavljajo sistem, predvsem pa se posvečamo različnim načinom uporabe aplikacije GERK, ki so že takoj od začetka presegli zastavljene cilje. GERK spletni pregledovalnik je ogledalo miselnosti ekipe Registra kmetijskih gospodarstev znotraj Ministrstva za kmetijstvo, gozdarstvo in prehrano, ki projekt že od vsega začetka vodi na temeljih transparentnosti, enostavnega dostopa do zbranih podatkov ter možnosti ponovne uporabe le-teh v drugih projektih. Ti principi so se izdatno obrestovali - aplikacija je vzpodbudila razvoj popolnoma novih aplikacijskih rešitev v Sloveniji, hkrati pa je vzbudila občudovanje in posnemanje ostalih članic EU, ki kljub temu, da je GERK star že več kot 5 let, v tem merilu še vedno zaostajajo za Slovenijo.

Ključne besede: geografski podatki, GIS pregledovalniki

LAND PARCEL IDENTIFICATION SYSTEM IN SLOVENIA (GERK/RABA, RKG.GOV.SI/GERK)

Abstract

GERK system appeared in public during the year 2005 within the project of establishment of land parcel identification system (LPIS), which was one of the pre-conditions for successful closure of the EU accession chapter of agriculture and rural development. LPIS system provides a support for effective control over the use of subsidies for promotion of agriculture and development of rural areas. In this article we are describing the chronological overview of the project - starting with the design of the system, going live, additional developments in the last 5 years and further plans for improvements. We will shortly present the technological modules, which are building the system. Presentation will be focused towards different use cases of the GERK applications, which have exceeded the set goals shortly after the start. GERK web viewer is mirroring a way of thinking of the Farm register team within the Ministry of Agriculture, Forestry and Food, which is running the project on the basis of transparency, easy access to all gathered information and possible reuse of these data within other projects. These principles provided plentiful benefits - the application itself has motivated the development of completely new application solutions in Slovenia. At the same time, it has gained admiration and imitation of other EU member states. These have not succeeded in providing the similar results, regardless of the fact that GERK is old more than 5 years already.

Key words: GIS-DATA, geographical information, land parcel identification system (LPIS)

1 Kaj predstavlja GERK

GERK, grafična enota rabe kmetijskega gospodarstva, je osnovna enota identifikacijskega sistema za prijavo zemljišč v Register kmetijskih gospodarstev. Uporablja se za identifikacijo kmetijskih zemljišč pri razdeljevanju subvencij, spremljanju gibanja živali, izbruhih bolezni in še za mnogo drugih namenov.

Zaradi pomembnosti podatka - GERK v prispodobi predstavlja osebno izkaznico kmetijskega zemljišča - je bilo potrebno pri vzpostavitvi sistema upoštevati naslednja načela:

• vnos in urejanje podatkov mora biti popolnoma nadzorovan;

• obvezna uporaba vseh mogočih avtomatskih in administrativnih kontrol, ki preprečujejo potencialne namenske ali nenamenske napake;

• podatki morajo biti na pregleden in transparenten način dostopni širši javnosti.

Nekatera od navedenih načel so bila postavljena kot vodilo s strani Evropske unije, ki predpisuje učinkovito kontrolo razdeljevanja subvencij, druga pa so posledica odločitev ekipe, ki je sistem vzpostavljala.

2 GIS pregledovalniki

Geografski informacijski sistemi (GIS), oziroma bolj natančno, GIS pregledovalniki so dandanes večinoma spletne aplikacije, s pomočjo katerih lahko uporabniki pregledujejo geografske podatke - topografske karte, mestne načrte, ortofoto posnetke (posnetke z zraka), strokovne vsebine (GERK, vodovarstvena območja, Natura 2000 ipd.). To lahko počnejo brez uporabe napredne programske opreme ali zmogljivih računalnikov. Za lažjo predstavo naj omenimo, da posnetek z zraka za območje Slovenije predstavlja 81 giga-pikslov veliko sliko. To pomeni, da bi s povprečnim digitalnim fotoaparatom, ki snema 1 mega-pikslske slike, potrebovali 80.000 fotografij, da bi zaobjeli enako količino informacij. Posnetki zasedajo 0.5 TB diskovnega prostora. V kolikor to povežemo s potrebo, da do teh informacij dostopa tudi po nekaj sto ljudi hkrati, lahko ugotovimo, da mora v ozadju teči precej kompleksen sistem, da lahko uporabniki hitro in enostavno pridejo do želenih informacij.

GIS pregledovalniki so v Sloveniji obstajali že pred GERK-om. Eden izmed prvih pregledovalnikov je bil naravovarstveni atlas (NV Atlas) Agencije RS za okolje in prostor. So bili pa takratni pregledovalniki namenjeni ozkemu strokovnemu krogu ljudi in ponavadi z omejenim dostopom.

3 Namen aplikacije GERK pregledovalnik

GERK pregledovalnik je bil vzpostavljen za potrebe nosilcev kmetijskih gospodarstev, da bi lahko na enostaven in hiter način pregledali podatke o svojem gospodarstvu. S preprostim vpisom identifikacijske številke (KMG MID) pregledovalnik prikaže lokacijo kmetijskih parcel (GERK-ov) ter podatke o teh parcelah - vrsto dejanske rabe, površino, domače ime in nekaj drugih podatkov. Kmetovalci lahko s primerjavo z ortofoto slojem ugotovijo, ali podatki predstavljajo dejansko stanje, s pomočjo drugih slojev (digitalni model reliefa, območja omejenih dejavnikov ipd.) pa lahko preverijo, ali so upravičeni do posebnih subvencij.

4 Kronologija projekta

Vzpostavitev sistema za identifikacijo parcel (LPIS) se je začela že leta 1998, ko so bili zgrajeni prvi gradniki - aplikacija za vzdrževanje Rabe tal. Le-ta je predstavljala pomemben gradnik v LPIS sistemu, saj predstavlja enega od kontrolnih slojev podatkov, strokovno podprto fotointerpretacijo letalskih posnetkov, ki pove, na katerem mestu je kmetijska raba, kje gozd, reke, naselja in podobno.

Leta 2002 je bil v Sloveniji vzpostavljen prostorski sloj podatkov, ki bi se ga dalo povezati s kmetijskimi zemljišči, namreč digitalni katastrski načrti (DKN). Zato je bil na začetku LPIS osnovan na kombinaciji teh dveh slojev - DKN in Raba. Žal se je po nekaj mesecih temeljitih analiz pokazalo, da lokacijska natančnost DKN-ja ni dovoljšnja, da bi ustrezala pogojem za nadzor subvencij. Tako se je začel zajem GERK-ov.

Maja 2005 so se začela izobraževanja osebja MKGP, kmetijsko svetovalnih služb, upravnih enot, GURS in drugih, tekom katerih je bilo v nekaj mesecih usposobljeno več kot 750 oseb.

Le-te so do decembra 2008 uspele opraviti sestanke s več kot 50.000 kmetovalci, tekom katerih so v sistem vnesli preko 700.000 GERK-ov. Logistika tega projekta je bila nadvse zahtevna, prav tako pa sama tehnična izvedba. V ponazoritev naj povemo, da je v 6 mesecih bilo na aplikaciji za urejanje GERK opravljenih preko 110.000 ur, pri tem je bilo prenešenih preko 140 miljonov slik, kar je predstavljalo več kot 7 TB mrežnega prometa. V letu 2006 je GERK prešel v sistem vzdrževanja. Velika akcija je bila uspešno zaključena, od leta 2006 kmetovalci sami ali na poziv prihajajo sporočati spremembe uporabe njihovih zemljišč. V letu 2009 je bilo opravljen ponovni zajem letalskih posnetkov južnega dela Slovenije, ki se nadaljuje v letih 2010 in 2011. Skupaj s posodobitvijo Rabe tal tako poteka osveževanje podatkov o kmetijskih površinah.

5 Tehnološki moduli

Med sestavinami informacijskega sistema bomo izpostavili tri najzanimivejše komponente:

• spletni pregledovalnik

• GERK urejevalnik

• modul za monitoring

5.1 Spletni pregledovalnik

Za splošno javnost gotovo najbolj zanimiv del sistema, saj omogoča pregledovanje prostorskih podatkov na območju cele Slovenije. Dandanes aplikacija morda izgleda staromodno, leta 2005, ko je bila vzpostavljena v bolj ali manj isti obliki, pa je predstavljala višek takratnih tehnoloških zmožnosti - takrat npr. Google Maps še ni obstajal. Poleg klasičnih funkcionalnosti GIS pregledovalnikov so tu še:

• možnost povečanja okna zemljevida (majhnost okna je prilagojena takratnim velikostim ekranov in počasnim Internet povezavam);

• možnost naprednega iskanja po skoraj vseh slojih;

• 3D pogled področja z uporabo VRML tehnologij.

5.2 GERK urejevalnik

V upravnih enotah potekajo sestanki za usklajevanja podatkov z nosilci kmetijskih gospodarstev. Pri tem uporabljajo posebej prirejeno GIS aplikacijo, ki omogoča risanje mej GERK-ov, določanje informacij o zemljiščih, pri čemer se sproža vrsta avtomatskih kontrol, ki preprečujejo napake v podatkih, prekrivanja zemljišč in podobno.

5.3 Modul za monitoring

V podpornem centru MKGP lahko administratorji sistema v realnem času spremljajo delo vsakega od stotine uporabnikov, ki je priključen na sistem.

Aplikacija je bila razvita predvsem za pomoč pri uporabi - ker je urejanje GIS podatkov nadvse zahtevna naloga, uporabniki, ki skupaj s kmetovalci črtajo meje zemjlišč, pogosto potrebujejo pomoč - bodisi pri interpretaciji informacij ali pa pri tehnoloških zagatah. S pomočjo te aplikacije lahko podporni center enostavno in učinkovito identificira težavo ter jo tudi reši.

6 Širša uporaba

Osnovni namen uporabe GERK pregledovalnika smo že opisali. Je pa tega aplikacija prerasla že takoj po objavi na spletu. Ocenjujemo, da dandanes preko 70 odstotkov obiskovalec ne zanimajo vsebine s področja kmetijstva, ampak so tu zaradi drugih interesov.

Ker je aplikacija javno dosegljiva in brezplačna, pravzaprav vseh načinov uporabe ne poznamo. So bili pa preko analize dnevnika dostopov opažene tudi naslednje rabe:

• Pregledovanje ortofoto posnetkov - GERK pregledovalnik je bila prva aplikacija, kjer so bili javno dostopni ti podatki za Slovenijo; ker ljudi zanima, kako izgleda njihovo domovanje z zraka, so to funkcionalnost z zanimanjem uporabili. Še dandanes se na tem mestu pojavijo najbolj sveži letalski posnetki, ostale strani v Sloveniji pa sledijo z nekaj mesečnim zamikom.

• Brskanje po digitalnem katastrskem načrtu (DKN) - kljub temu, da ima Geodetska uprava RS svoj lasten pregledovalnik podatkov, na tisoče uporabnikov mesečno tu išče podatke o parcelah na določenem področju.

7 Dostop do podatkov in ponovna uporaba

Tekom preteklih 5 let je v okviru projekta GERK nastala vrsta podatkovnih setov, ki so uporabni tudi zunaj področja kmetijstva:

• raba tal, določena na podlagi fotointerpretacije letalskih posnetkov - uporabna za študije o biološki raznovrstnosti, vrednotenje zemljišč pa do statističnih raziskav;

• hidromelioracijska območja;

• karta talnih števil.

Vsi zbrani podatki so dosegljivi brezplačno prek uporabe spletne aplikacije, zainteresirani pa si jih lahko tudi v celoti prenesejo k sebi - popolne podatke, umaknjeni so zgolj osebni podatki.

S tem, ko so podatki dani na voljo širšemu občinstvu, je omogočena večkratna uporaba, širi se znanje ter omogoča izdelava novih zanimivih produktov.

8 Interoperabilnost

Sistem GERK pa ne omogoča zgolj širokega dostopa do podatkov, ampak omogoča tudi ponovno uporabo same infrastrukture - tako strežniške kot programske. Tako se aplikacije ali servisi uporabljajo znotraj drugih enot MKGP kot tudi zunaj samega ministrstva:

• Zavod za gozdove uporablja tehnologijo spletnega pregledovalnika za prikaz podatkov o gozdnih sestojih;

• Kataster melioracijskih sistemov in naprav v celoti uporablja infrastrukturo kot tudi register komasacij, register pridelovalcev grozdja in vina in še vrsto drugih.

• Spletni servis za dostop do prostorskih podatkov (t. i. Web Mapping Service - WMS) uporabljajo nekateri uporabniki znotraj in zunaj Ministrstva.

Infrastruktura, ki je potrebna za vzdrževanje informacij o GERK-ih, mora biti dovolj zmogljiva, da v obdobjih, ko poteka največ sprememb (od januarja do marca) zdrži veliko število uporabnikov. V preostalih obdobjih, ko je sprememb manj, se tako pojavijo prosti resursi, ki jih Ministrstvo deli z drugimi uporabniki in tako skrbi za racionalno uporabo proračunskih sredstev.

9 Učinki aplikacije v Sloveniji in Evropi

GERK pregledovalnik je vzbudil veliko zanimanja tako v Sloveniji kot tudi drugod po Evropi. Ne toliko zaradi same tehnološke dovršenosti kot zaradi načina, kako je javna inštitucija razgrnila svoje podatke in jih dala vsem na vpogled in uporabo. Tak pristop je na področju prostorskih podatkov nov - večino upravljalcev podatkov le-te drži zase oziroma jih daje na vpogled zgolj v omejenem obsegu, še bolj pogosto pa samo rezultate analiz. S svojimi principi prostega razpolaganja s podatki je sistem GERK vzpodbudil posnemanje drugih organizacij, kot primer:

• Geopedia.si - sistem deluje po istih principih, le da jih je razširil na širše področje vsebin - od turizma, okolja, vremena pa do ilegalnih odlagališč odpadkov.

ARKOD - hrvaški LPIS portal, ki praktično v celoti posnema GERK pregledovalnik.

10 Zaključek

Odločitev, ki so jo sprejeli odgovorni na Ministrstvu, o tem ali sistem razgaliti javnosti, ni enostavna. Že res, da je v skladu z osnovno miselnostjo demokratične družbe kot tudi z direktivo o racionalni porabi javnega denarja. Po drugi strani pa prinaša precejšnje število potencialnih težav. Ali bo sistem tehnološko zmogel dodatno uporabo? Ali bodo ljudje na tak način našli napake? Ali pa morda celo zlorabili sistem za svojo lastno korist? Predvsem pa je tu »ali je to res nujno«? Dandanes pravzaprav ni več pomembno, kakšni so bili razlogi za

odločitev. Sistem ni počepnil ob navalu obiskovalcev, kmetovalci so dobili na uporabo orodje, ki jim je olajšalo vsakoletno izpolnjevanje obrazcev za subvencije, poleg tega pa smo Slovenci dobili aplikacijo, s katero smo lahko raziskovali bisere Slovenije z nove perspektive. Dandanes je to, da aplikacija GERK obstaja, nekaj popolnoma normalnega. Verjamemo, da je s tem prispevala kamenček v mozaiku izboljšanja naše družbe.

Bibliografija

ARKOD. Pridobljeno s spletne strani: http://preglednik.arkod.hr/lpis/viewer.jsp Geopedia.si. Pridobljeno s spletne strani: http://www.geopedia.si

GERK spletni pregledovalnik. Pridobljeno s spletne strani: http://rkg.gov.si/GERK/viewer.jsp NV Atlas. Pridobljeno s spletne strani: http://www.naravovarstveni-atlas.si/ Projekt GERK. Pridobljeno s spletne strani: http://rkg.gov.si/GERK

VIDEOLECTURES.NET

Marjana Plukavec

Institut Jožef Stefan, Center za prenos znanja na področju informacijskih tehnologij, vodja

skupine VideoLectures.NET

e-naslov: marjana.plukavec@videolectures.net

UDK: 004:001.101

Izvleček

Portal VideoLectures.NET, ki ga upravljamo na Centru za prenos znanja na področju informacijskih tehnologij (CT3) skupaj z E8 - Odsekom za tehnologije znanja (v nadaljevanju E8), na Institutu Jožef Stefan, je trenutno največji spletni portal z video izobraževalno vsebino na svetu. Kot tak sledi viziji po vzpostavljanju svetovno prepoznavnih storitev prenosa znanja in izobraževanj. Poslanstvo portala je brezplačno ponujanje vrhunskih izobraževalnih video vsebin širšemu krogu obiskovalcev. Izvaja neomejen prenos znanj ter tako promovira znanost podiplomski in doktorski publiki, želeli bi pa ponuditi izobraževanje tudi za dodiplomsko in srednješolsko publiko na svetovnem in slovenskem nivoju, ter seveda celotni zainteresirani javnosti. Septembra 2009 smo prejeli odmevno WSA nagrado, ki jo podeljujejo Združeni narodi, v kategoriji "e-content and creativity": http://www.wsis-award.org/winners/winners.wbp.

Portal na naslovu http://videolectures.net trenutno ponuja brezplačen dostop do 486 dogodkov, 7243 avtorjev, 9206 predavanj in 11 313 video posnetkov. Na portal tedensko dodamo povprečno 50 novih video vsebin. Trenutno vsak dan portal obišče okoli 8000 obiskovalcev, kar znese več kot 120.000 obiskovalcev na mesec.

Na portalu so objavljena predavanja izbranih vrhunskih slovenskih in svetovnih znanstvenih konferenc, ter predavanja mnogih znanih svetovnih mislecev in raziskovalcev kot so Tim Barnes Lee, Noam Chomsky, Umberto Eco, Tom Mitchel, Walter H. G. Lewin, etc. Razen same video vsebine ponuja portal inovativne pristope pri celoviti podpori izobraževanju in sicer: istočasno prikazovanje videa, prosojnic in komentarjev, možnost gradnje in upravljanje individualnih kurikulov, sočasno distribucijo videa preko svetovnega spleta.

Razvijajo se nove storitve, ki bodo portal nadgradile z možnostmi kot so: postavitev virtualne univerze, inovativne mreže za distribucijo in izmenjavo video vsebin med podobnimi iniciativami v svetu (OpenCDN) ter prosto dodajanje novih vsebin.

Zaradi kakovosti in popularnosti portala, ter ponujanja neomejenega dostopa do velikih količin izobraževalnih vsebin smo že sklenili dogovore o sodelovanju in gostovanje vsebin univerz kot so: MIT - Massachusetts Institute of Technology (ZDA), MIT World, University of Cambridge (VB), University of Oxford (VB), Carnegie Mellon University (ZDA), Yale (ZDA), OpenCourseWare Consortium, CERN (CH), ETH, Isaac Newton Institute, Cambridge (UK), OCWC - OpenCourseWare Consortium ter z vrsto drugih uglednih svetovnih institucij. V Sloveniji že sodelujemo z nekaterimi članicami Univerze v Ljubljani (FF, FMF, FKKT) ter Javno agencijo za raziskovalno dejavnost republike Slovenije (ARRS). V svetovnem merilu pa potekajo dogovori z Institutom Max Planck (DE) ter Kitajsko mrežo raziskovalnih in izobraževalnih institucij.

Ključne besede: predavanja, prenos znanja, multimedija, znanost

VIDEOLECTURES.NET

VideoLectures.NET is a project of the Centre for Knowledge Transfer in Information Technologies (CT3), which works under the umbrella of the Institute "Jožef Stefan" in Europe, Slovenia.

JSI's VideoLectures.NET - http://videolectures.net currently offers to the scientific, research, business and general public the largest collection of high quality, pre-reviewed videos that are enriched with slides, documents and additional materials. It has 486 events, 7244 authors, 9206 lectures, 11313 videos, and it is the largest repository of graduate, state of the art and long tail video content on the web. By using advanced semantic technologies and different visualization techniques it offers a unique learning experience. VideoLectures.NET does not offer just a collection of videos but also structured training courses and tutorials that are being prepared by well known experts, mainly famous professors from the field. VideoLectures.NET thus serves as a common open learning video platform for students, scholars, academics, researchers, businesses and also general public. By offering free access to recorded lectures from famous universities and expensive conferences it also helps to overcome the economic divide. Currently it covers many different subjects like computer science, natural sciences, arts, political science and economy but also plenty of new and emerging scientific disciplines like complexity science, collaborative organizations and others. By storing recorded lectures at universities, conferences, workshops, tutorials and other scientific events, it helps preserving rich and dynamic European research landscape and provides materials that enrich the traditional libraries.

VideoLectures.NET is a default video content channel for many European R&D projects, and other advanced educational institutions such as MIT OpenCourseWare, CERN, Yale Open Courses, OpenCourseWare Consortium, MIT World, and Stanford Engineering Everywhere. The services of VideoLectures.NET, a global web portal for high definition academic videos, was recognized by world experts in the field of ICT and awarded first prize as one of the most outstanding examples of creative and innovative e-Content in the world. The World Summit Award (WSA) is a part of the United Nations Summit on Information Society and represents a unique global competition in best e-Content recognition and global creativity. The award represents great recognition and great success of Slovenian knowledge, as it presents the opportunity for Slovenia to become one of the leading open and free e-Education centres in the world.

Key words: videolectures, videolectures.net, open access

OPEN ACCESS POLICIES: AN OVERVIEW

Iryna Kuchma

EIFL Open Access programme manager e-mail: iryna.kuchma@eifl.net

UDK: 655.411:004.65

PREGLED POLITIK PROSTEGA DOSTOPA

Ključne besede: prosti dostop, znanost, univerza, projekti

Open access is now being debated by governments and publishers and mandated by funding bodies and universities throughout the world. There are considerable economic, social and educational benefits to making research outputs available without financial, legal and technical barriers to access [1]. Much still remains to be achieved, but it is clear that open access has permanently changed the field of scholarly communication.

Among the drivers of open access policies are: knowledge economy, e-science, e-research, virtual learning environment, accountability and assessment of science and research and freedom of information. In March 2000, the EU Heads of States and Governments agreed their aim to make the EU »the most competitive and dynamic knowledge-driven economy by 2010« (Lisbon Agenda). One of the key strategic means of achieving this goal was identified as »preparing the transition to a knowledge-based economy and society by better policies for the information society and R&D and specifically increasing investment in R&D to 3 % of GDP. And in a post-industrial economy there is increasing acknowledgement of the relationship between investment in R&D and access to knowledge, technology transfer and wealth creation.

The European Commission is conducting a pilot initiative on open access to peer reviewed research articles in its Seventh Research Framework Programme (FP7). It launched the open access pilot in August 2008, which will run until the end of FP7. The European Commission requires grant recipients in seven areas to »deposit peer reviewed research articles or final manuscripts resulting from their FP7 projects into an online repository and make their best efforts to ensure open access to these articles«.

The seven areas are:

1. energy;

2. environment (including climate change);

3. health;

4. information and communication technologies (cognitive systems, interaction, robotics);

5. research infrastructures (e-infrastructures);

6. science in society;

7. socio-economic sciences and the humanities.

Open access to these publications is to be ensured within:

• six months after publication in the first five areas listed

• twelve months in the last two areas listed.

The European Commission wants to ensure that the results of the research it funds under the EU's 7th Research Framework Programme (FP7) with more than ^ 50 billion from 2007 -2013, are disseminated as widely and effectively as possible to guarantee maximum exploitation and impact in the world of researchers and beyond. Open access to research articles helps to increase the impact of the EU's investment in research and development and to avoid wasting time and valuable resources on duplicative research.

With access to a wider selection of literature, researchers can build upon this knowledge to further their own work. Small and medium sized businesses and entrepreneurs can also benefit from improved access to the latest research developments to speed up commercialisation and innovation.

The ERC Scientific Council's Statement on Open Access of December 2006 stressed the fundamental importance of peer-review in ensuring the certification and dissemination of high-quality scientific research, as well as the importance of wide access and efficient dissemination of research results. In December 2007, the ERC Scientific Council followed this up with Guidelines for Open Access. These Guidelines state that:

1. The ERC requires that all peer-reviewed publications from ERC-funded research projects be deposited on publication into an appropriate research repository where available, such as PubMed Central, ArXiv or an institutional repository, and subsequently made Open Access within 6 months of publication.

2. The ERC considers essential that primary data - which in the life sciences for example could comprise data such as nucleotide/protein sequences, macromolecular atomic coordinates and anonymized epidemiological data - are deposited to the relevant databases as soon as possible, preferably immediately after publication and in any case not later than 6 months after the date of publication.

The ERC is keenly aware of the desirability to shorten the period between publication and open access beyond the currently accepted standard of 6 months.

OpenAIRE project http://www.openaire.eu aims to support the implementation of Open Access in Europe. It is building support structures for researchers in depositing FP7 and ERC funded research publications, establishing and operating the OpenAIRE e-Infrastructure for the repository networks, exploration and experimentation with scientific data management services.

To mention some other European open access policy initiatives: in May 2008 the General Assembly of EUROHORCs agreed to recommend a minimal standard regarding open access to its Member Organisations - all the major public funding agencies in 24 European countries are members of European Heads of Research Councils (EUROHORCs). The proposed minimal standard is an intermediate step towards a system in which free access to all scientific information is guaranteed without jeopardizing the system of peer review, quality control,

and long-term preservation. It encourages its members to reduce embargo time to not more than six months and later to zero. All MOs of EUROHORCs should sign the Berlin Declaration on Open Access (2003) and all scientists, either funded by or doing research for MOs, should be informed about the already existing mechanisms for Open Access and strongly advised to make use of them. As Peter Suber wrote in the SPARC Open Access Newsletter, issue #141, January 2, 2010: »The European Science Foundation (ESF) and the EuroHORCs plan to issue a joint OA mandate. The ESF represents 80 member organizations in 30 European countries. If endorsements of mandatory OA from ESF and EuroHORCs incline even half their members to adopt mandates, that would more than double the number of funder OA mandates in the world. Something to watch.« [3]

None of the Slovenian organisations have signed the Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities yet and we encourage them to do so. This declaration was issued on 22nd October 2003 and as of October 18, 2010, there are 286 signatories world-wide, including funding bodies and institutions. It reads that »Our mission of disseminating knowledge is only half complete if the information is not made widely and readily available to society. Signatories should promote open access by encouraging researchers/grant recipients to publish in open access; and encouraging the holders of cultural heritage to support open access by providing their resources on the Internet.« Open access contributions must satisfy two conditions: removing some permission barriers and permitting any users to read, download, copy, distribute, print, search, or link to the full texts, crawl them for indexing, pass them as data to software, or use them for any other lawful purpose, without financial, legal, or technical barriers. The only constraint on reproduction and distribution, and the only role for copyright in this domain, should be to give authors control over the integrity of their work and the right to be properly acknowledged and cited (based on the open access definition from the Budapest Open Access Initiative: http://www.soros.org/openaccess/read.shtml). And a second condition is that a complete version of the work is deposited in the open access repository supported and maintained by an academic institution, scholarly society, government agency, or other well-established organization that seeks to enable open access, unrestricted distribution, interoperability, and long-term archiving. Berlin declarations also encourages developing means to evaluate open access contributions and online-journals in order to maintain the standards of quality assurance and good scientific practice and to advocate that open access publication be recognized in promotion and tenure evaluation.

Alma Swan in her weblog [4] provided a graph on Open Access mandates to the end of the first half of 2009. We can see that there is an increasing number of open access policies from research groups and research centres, Universities, funding bodies, governments, national and international bodies. Peter Suber wrote (in the SPARC Open Access Newsletter, issue #141, January 2, 2010) that »2009 was Open Access Year in the Netherlands, but it might have been Open Access Year worldwide. The growth on every front was extraordinary.« [3]

According to the ROARMAP - Registry of Open Access Repository Material Archiving Policies - there are 238 Open Access mandates (102 institutional mandates, 25 departmental mandates, 46 funder mandates and 65 thesis mandates) [5]. The Wellcome Trust in the UK was the first funder to mandate Open Access - from October 1 2006, it became a condition

of funding that copy of any original research paper published in a peer-reviewed journal must be deposited into PubMed Central.

Governments have also begun to take an interest in Open Access out of a desire to ensure that the research which they fund reaches the largest possible audience, as well as out of a recognition of the waste of public resources which results from the old system in which taxpayers pay once for research and a second time for access to its results. For example, the U.S. National Institutes of Health (NIH), the largest funder of medical research in the U.S, implemented a policy requiring that its grant recipients make articles resulting from NIH funding publicly available within twelve months of publication in a peer-reviewed journal. This policy, passed by the U.S. Congress and signed into law by the President, went into effect in April 2008. The OA mandate at the NIH was made permanent by a bill passed by both houses of Congress signed by President Obama.

A group of high-profile public and private funders sponsored a study that recommended green libre OA mandates for medical research. The co-sponsors, convened by US Institute of Medicine, included the Gates Foundation, Burroughs Wellcome Fund, Merck Company Foundation, Rockefeller Foundation, and three cabinet-level departments in the US. This doesn't mean that the sponsoring organizations will adopt mandates of their own, but it means that they have heard the argument and have some investment in it.

Among Slovenian neighbours, Open access mandates were introduced in:

• Austria: Fonds zur Foerderung der wissenschaftlichen Forschung (FWF):

a) The FWF expects the results of the research it supports to be made public and when possible published also in digital form and made available free of charge on the Internet (open access). Contributions should be submitted to subject-specific or institutional electronic archives (repositories) in addition to being sent to scientific publishers or they should be published directly in peer reviewed journals that are freely available (e. g. in open access journals or in hybrid journals).

b) In their contracts with publishing houses, scientists participating in projects supported by the FWF should as far as possible attempt to secure lasting and non-exclusive rights for the electronic publication of their research results for the purpose of non profit-oriented utilization ... If there is a restricted period during which the submission of published research results to subject-specific or institutional electronic archives is not permitted, this should generally not last for longer than 6 months for journal articles and for 12 months in the case of books.

c) Applications for reimbursement of costs associated with the submission of scientific articles to refereed open access journals or with making articles in conventional journals freely available (hybrid journals) within three years of the end of the project may be sent to the FWF ...

d) Open access activities must be indicated in all reports submitted to the FWF. If there are legal reasons why the FWF's policy on open access may not be followed, these must be justified ...[6]

• Hungary: Hungarian Scientific Research Fund (OTKA): All scientific publications resulting from support by an OTKA grant are required to be made available for free

according to the standards of Open Access, either through providing the right of free access during publication or through depositing the publication in an open access repository. The deposit can be in any institutional or disciplinary repository, as well as in the Repository of the Library of the Hungarian Academy of Sciences - REAL: http://real.mtak.hu/ [7]

• Italy:

a) University of Sassari [8];

b) Istituto Superiore di Sanita (ISS) - All scientific works produced by ISS staff must be transmitted in electronic format (author's final copy, after peer-review: »post-print«) to the Publishing Activities Unit of ISS, at the moment of acceptance for publication. This Unit will immediately make them available on the ISS Intranet. The metadata will also be made available on the Internet, via DSpace.ISS and, after the publisher embargo period has expired, the full texts will be made available too. During the embargo period, individual works can be requested from their authors through an automated function of DSpace http://wiki.dspace.org/index.php//RequestCopy [9],

c) Telethon Italy - Lucia Monaco, Chief Scientific Officer, Telethon Italy, commented that »as a charity funded by patients, we are excited about the opportunity to make the primary outputs of our research freely available to scientists, patients, donors and the general public through UKPMC. The world-wide visibility offered by UKPMC through its connection to PMC and the European prospect it offers have made it the repository of choice for Telethon-supported publications« [10]

d) 20 thesis mandates in 20 Universities.

The University Associations support open access by introducing recommendations to their members. E.g. the European University Association that represents and supports higher education institutions in 48 countries provided general open access recommendations and explicitly stated that »University institutional policies should require that their researchers deposit (self-archive) their scientific publications in their institutional repository upon acceptance for publication.« [11]

If you are interested in introducing open access policy in your institution here are some of the recommendations (based on Peter Suber's Open access policy options for funding agencies and universities [12]):

• If you're serious about achieving open access for the research you fund, you must require it.

• If the institution decides to request and encourage open access, rather than a mandate it, then it can encourage submission to an open access journal and encourage deposit in an open access repository as well.

• But if it decides to mandate open access, then it should require deposit in an open access repository and not require submission to an open access journal, even if it also encourages submission to an open access journal.

• The institutions should require the deposit of the final version of the author's peer-reviewed manuscript, not the published version. For publishers who worry about circulation of multiple versions of the peer-reviewed text, it could offer the option to replace the author's manuscript in the repository with the published edition. It should require the deposit of data generated by the funded research project (in medicine and

the social sciences, where privacy is an issue, open access data should be anonymised). A peer-reviewed manuscript in an open access repository should include a citation and link to the published edition. The University should also allow the deposit of unrefereed preprints, previous journal articles, conference presentations (slides, text, audio, video), book manuscripts, book metadata (especially when the author cannot or will not deposit the full-text), and the contents of journals edited or published on campus. The university itself could consider other categories as well, such as open courseware, administrative records, and digitisation projects from the library, theses and dissertations. For simplicity and enforceability, it's better to follow the example of most funding agencies: to apply the open access policy to research the institution funds »in whole or in part«.Any embargo is a compromise with the public interest. The shorter they are, the better (no more than six months). Private notes and records not intended for publication, classified research and royalty-producing books should be exempted. Patentable discoveries should be either exempted or embargo long enough could be used to allow the researcher apply for a patent. Bibliography

[1] Open Access - What are the economic benefits? A comparison of the United Kingdom, Netherlands and Denmark http://www.knowledge-exchange.info/Admin/Public/DWSDownload.aspx?File=%2fFiles%2fFiler%2fdownloads%2fO

A_What_are_the_economic_benefits_-_a_comparison_of_UK-NL-DK_FINAL_logos.pdf

The reports of the fist two countries: Economic Implications of Alternative Scholarly Publishing Models: Exploring the costs and benefits by John Houghton, Bruce Rasmussen and Peter Sheehan, Victoria University and Charles Oppenheim, Anne Morris, Claire Creaser, Helen Greenwood, Mark Summers and Adrian Gourlay, Loughborough University: http://www.jisc.ac.uk/publications/documents/economicpublishingmodelsfinalreport.aspx SURF report: Costs and Benefits of Research Communication: The Dutch Situationhttp://www.surffoundation.nl/wiki/display/economicstudyOA/Home

[2] Open Access Policies: An Overview by David Prosser, SPARC Europe. http://www.eifl.net/cps/sections/services/eifl-oa/training/2009-nepal/10-david-prosser

[3] Peter Suber, SPARC Open Access Newsletter, issue #141, January 2, 2010: http://www.earlham.edu/~peters/fos/newsletter/01-02-10.htm

[4] OptimalScholarship: Alma Swan's weblog: An occasional commentary on issues that affect the progress of scholarship:

http://optimalscholarship.blogspot.com/?zx=d6cdc2f4f60c80f2

[5] ROARMAP - Registry of Open Access Repository Material Archiving Policies: http://www.eprints.org/openaccess/policysignup

[6]http://www.eprints.org/openaccess/policysignup/fullinfo.php?inst=Fonds%20zur%20Foer derung%20der%20wissenschaftlichen%20Forschung%20%28FWF%29

[7]http://www.eprints.org/openaccess/policysignup/fullinfo.php?inst=Hungarian%20Scientif ic%20Research%20Fund%20%28OTKA%29

[8]http://www.eprints.org/openaccess/policysignup/fullinfo.php?inst=University%20of%20S assari

[9]http://www.eprints.org/openaccess/policysignup/fullinfo.php?inst=Istituto%20Superiore %20di%20Sanit%C3%A0%20%28ISS%29

[10] European research funders throw weight behind UK open access repository: http://www.wellcome.ac.uk/News/Media-office/Press-releases/2010/WTX058744.htm

[11]http://www.eua.be/fileadmin/user_upload/files/Policy_Positions/Recommendations_O pen_Access_adopted_by_the_EUA_Council_on_26th_of_March_2008_final.pdf

[12] The SPARC Open Access Newsletter, issue #130 and The SPARC Open Access Newsletter, issue #127, by Peter Suber: http://www.earlham.edu/~peters/fos/newsletter/02-02-09.htm

OPEN ACCESS POLICIES IN IRELAND: WHERE IT BEGAN

Niamh Brennan

Trinity College Dublin, Programme Manager, Research Informatics, Ireland e-mail: nbrennan@tcd.ie

UDK: 655.411:004.65(417)

POLITIKE PROSTEGA DOSTOPA NA IRSKEM Ključne besede: prosti dostop, znanstvena politika, Irska

Almost every research funding council in Ireland has adopted an Open Access mandate. These mandates are all based on the EURAB recommendations »Scientific Publications: Policy on Open Access«1 to the European Commission, which recommended a policy described as »superb« by Open Access guru, Peter Suber:

»This is excellent news for many reasons. First, the policy would apply across Europe, not just within a single country or institution. Second, it encourages member states to adopt their own OA policies to buttress this EU-wide policy. Third, EURAB is an independent agency created by the EU to make recommendations on research-policy questions of exactly this kind. This report should carry weight.

_ the policy it recommends is superb. It's a mandate, not mere encouragement. It gives authors a choice of repositories for deposit. It caps the permissible embargo at six months. It recommends deposit of the published version, if possible, and the final version of the peer-reviewed manuscript otherwise. It uses what I call the dual deposit/release strategy or what Stevan Harnad calls the immediate deposit / optional access strategy _ There's no hint of compromise based on misunderstandings about copyright«2

The EURAB Working Group made the following recommendations (amongst others): EURAB recommends that the Commission should consider mandating all researchers funded under FP7 to lodge their publications resulting from EC-funded research in an open access repository as soon as possible after publication, to be made openly accessible within 6 months at the latest.

a) The repository may be a local institutional and/or a subject repository.

b) Authors should deposit post-prints (or publisher's version if permitted) plus metadata of articles accepted for publication in peer-reviewed journals and international conference proceedings.

1 http://ec.europa.eu/research/eurab/pdf/eurab_scipub_report_recomm_dec06_en.pdf

2 Peter Suber Open Access News 2007_01_07

http://www.earlham.edu/~peters/fos/2007_01_07_fosblogarchive.html#116845221537275 857

c) Deposit should be made upon acceptance by the journal/conference. Repositories should release the metadata immediately, with access restrictions to full text article to be applied as required. Open access should be made available as soon as practicable after the authorrequested embargo, or six months, whichever comes first.

d) Suitable repositories should make provision for long-term preservation of, and free public access to, published research findings.

Good Europeans we may be, but the influence of the EURAB recommendations in Ireland is particularly due to the work of Professor Jane Grimson, School of Computer Science and Statistics in Trinity College Dublin and former Vice Provost of Trinity College Dublin. Professor Grimson chaired the EURAB Working Group which presented the Open Access Recommendations.

Stevan Harnad siad about EURAB's recommended policy:

»It's not possible to design a better policy, or one that is surer to get the entire international research community to 100% OA more reliably, quickly or effectively. Here's the policy. Please emulate it at your university, research institution or funding agency and we'll reach the optimal and inevitable at long last«. Irish research funding councils did just that.

Irish Research Council for Science Engineering and Technology OA Mandate

IRCSET was the first Irish Funding Council to adopt an Open Access Mandate. These are the conditions to which IRCSET funded Award Recipients should adhere:

1. All researchers must lodge their publications resulting in whole or in part from IRCSET-funded research in an open access repository as soon as is practical, but within six calendar months at the latest.

2. The repository should ideally be a local institutional repository to which the appropriate rights must be granted to replicate to other repositories.

3. Authors should deposit post-prints (or publisher's version if permitted) plus metadata of articles accepted for publication in peer-reviewed journals and international conference proceedings;

4. Deposit should be made upon acceptance by the journal/conference. Repositories should release the metadata immediately, with access restrictions to full text article to be applied as required. Open access should be available as soon as practicable after the author-requested embargo, or six month, whichever comes first;

5. Suitable repositories should make provision for long-term preservation of, and free public access to, published research findings.

6. IRCSET may augment or amend the above requirements wherever necessary to ensure best practice in Open Access.

Science Foundation Ireland Open Access Mandate

Science Foundation Ireland is the largest funding council in Ireland. It's mandate is similar to IRCSET's:

1. All researchers are required to lodge their publications resulting in whole or in part from SFI-funded research in an open access repository as soon as possible after publication.

2. The publication to be so deposited relates to accepted peer-reviewed publications, conference proceedings and technical reports.

3. Publisher's copyright, licensing and embargo policies must be respected.

4. The protection of intellectual property, in any form, arising from the publication takes precedence over open access depositing and indeed over any form of publication.

5. The time by which open access depositing is to take place ranges from immediately on publication, if possible, up to six months from the date of publication.

6. Institutional and disciplinary repositories should be used in preference to an author's own website. In the Life Sciences, PubMed Central and/or a future European PubMed Central should be used. Information on the Irish universities' institutional repositories is available through IREL-Open, http://www.irel-open.ie.

7. The publication to be deposited is to be the publisher's version, if permitted, or the author's final version. It is required that there be a link from the deposited version to the publication site, and also that the DOI (Document Object Identifier) be used.

Higher Education Authority Open Access Mandate

Ireland's Higher Education Authority is the source of government funding for all Irish universities and the HEA is also a research funding agency, managing the Programme for Research in Third Level Institutions (PRTLI). This highly-influential funding programme is now about to start its fifth cycle. The HEA Open Access mandate requires the following:

1. All researchers must lodge their publications resulting in whole or in part from HEA-funded research in an open access repository as soon as is practical after publication, and to be made openly accessible within 6 calendar months at the latest, subject to copyright agreement.

2. The repository should ideally be a local institutional repository to which the appropriate rights must be granted to replicate to other repositories.

3. Authors should deposit post-prints (or publisher's version if permitted) plus metadata of articles accepted for publication in peer-reviewed journals and international conference proceedings.

4. Deposit should be made upon acceptance by the journal/conference. Repositories should release the metadata immediately, with access restrictions to full text article to be applied as required. Open access should be available as soon as is practicable but not later than six months after publication.

5. Suitable repositories should make provision for long-term preservation of, and free public access to, published research findings.

6. Books and book chapters are not covered by such repositories but the following condition applies in such cases. When a book goes out of print or four years following publication, whichever is sooner, and the publisher does not foresee a further print run or availability online for the work within a six-month period, then authors should make the work available online in an open and accessible way.

7. Metadata has already been noted under point 3. Data in general should as far as is feasible be made openly accessible, in keeping with best practice for reproducibility of scientific results.

8. Software, together with methods and algorithms, are not directly covered by Open Access repositories. However in keeping with best practice of scientific reproducibility key scientific results should be made available openly.

9. HEA may augment or amend the above requirements wherever necessary to ensure best practice in Open Access.

Health Research Board Open Access Recommendations

Ireland's Health Research Board has adopted a set of recommendations which are less strong: they require deposit in PubMed Central with optional additional deposit in an open access institutional repository.

Other Funders' Open Access Policies

Irish researchers are also funded by international agencies with Open Access Policies: European Research Council, European Commission, U.S. National Institutes of Science (NIH), Wellcome Trust, UK Medical Research Council and other UK research funding councils etc. Ensuring compliance with this raft of policies could be a nightmare for researchers, but this is mitigated by

• Institutional efforts to support their researchers via local institutional repositories and/or integrated CRIS/repository systems complemented by Library/Research Office advice and mediated deposit.

• The general coherence of approach from most of the major Irish funders which require deposit in an institutinal repository (rather than an external subject-based repository)

• Institutional Open Access Policies, which are starting to be adopted by Irish Higher Education institutions and which support both local and funder requirements

Institutional Policies

Two Higher Education Institutions in Ireland have recently adopted institutional mandates:

• Dublin Institute of Technology: DIT was the first Irish institution to adopt an Open Access institutional policy and requires the following: Academic staff, research assistants, research students and other members of the Institute are entitled and required to deposit digital copies of refereed and other research publications and documents. Other scholarly material which has been displayed, performed or publicly shown, to the extent that this material constitutes work carried out in the course of employment or relates to or is capable of relating to the business of the Institute, should also be deposited.

Such material should be deposited as full-text in the institutional repository http://arrow.dit.ie.

Exceptionally, material that is to be commercialised, or which can be regarded as confidential, or the publication of which would infringe a legal commitment of the Institute and/or the author, is exempt from inclusion in the repository.

Uploading of items into http://arrow.dit.ie is the responsibility of authors and researchers. It is desirable that items be self-archived. However, this task may be delegated to others or to Library Services.

All deposits of journal articles must comply with Publishers' policies.

The Repository Manager, Ms Yvonne Desmond, acting for the Institute, will have the right to restrict access to individual digital deposited files until issues of external publisher's agreements and intellectual property rights have been fully addressed.

b) Trinity College Dublin: Trinity College Dublin Open Access Publications Policy is the first such policy to be adopted by an Irish university. The policy was approved unanimously at TCD's Research Committee meeting on Tuesday, October 5th and took immediate effect. TCD's resolution is similar to those adopted by the universities of Harvard, Stanford, and MIT, but differs from those policies in that it does not require faculty members to retain copyright to their publications. Instead, it works within the boundaries of scholarly publishers' copyright policies:

To assist the University in providing Open Access to all scholarly papers published by its members of staff and research students, each staff member and research student will provide, immediately upon acceptance for publication, an electronic copy of the final peer-reviewed draft of each article at no charge to the appropriate representative of the Provost's Office in an appropriate format (such as PDF) specified by the Provost's Office. This can be done either by depositing it directly in TARA via the Research Support System or by emailing it to the Library to be deposited in our open access institutional repository on the author's behalf. Metadata will be made publicly available immediately; open access to the full text paper will be available as soon as is practicable, and not later than six months after publication. Embargos will be applied as necessary.

In order to support our researchers to comply with funders' Open Access mandates and in keeping with College's Information Systems Policy Guidelines and its requirement to reduce duplication of the creation of the same data, when metadata and papers are deposited in TARA the Library will undertake to assist with the deposit and/or enable harvesting of scholarly publications to other repositories (eg PubMed Central) as required by funders such as NIH, Wellcome Trust, SFI (life sciences), and HRB. Compliance with this policy automatically confers compliance with the IRCSET, HEA, European Research Council and SFI mandates.

The policy will apply to all scholarly articles, peer reviewed conference papers, reports and TCD research theses written while the person is a member of staff or a research student except for any publications completed before the adoption of this policy. The deposit of

books, book chapters and datasets associated with published research is strongly encouraged. The Library will undertake to develop and monitor a plan for a service or mechanism that will render compliance with this policy as convenient for our researchers as possible.

The Office of the Dean of Research in consultation with the Library will be responsible for interpreting this policy, resolving disputes concerning its interpretation and application, and recommending changes to the University from time to time. The effectiveness of author retention of copyright will be examined as part of this process. The policy is to take effect immediately; it will be reviewed after five years and a report presented to the College Board and to the College research community.

Implementation of the Institutional Open Access Policy in Trinity College Dublin

TCD Library will work with the Dean of Research and his Directors of Research Forum to oversee implementation and determine a workflow for adding content to TARA. The Library has established a group to examine how the Library will support this policy through its Faculty Liaison Librarians, Collection Management Librarians, Counter Staff, Research Support Staff and through the Research Informatics Office which is responsible for the TARA, Trinity's Open Access Policy. A campaign of awareness and support is also planned to be rolled out College-wide, supported by the Dean of Research and the Directors of Research in the Schools. In addition a number of improvements to the workflow and automatic means of populating the repository are under investigation.

DOSTOP DO REZULTATOV IN RAZISKOVALNIH PODATKOV, FINANCIRANIMI Z JAVNIMI SREDSTVI

Petra Tramte

Ministrstvo za visoko šolstvo, znanost in tehnologijo, Direktorat za znanost e-mail: petra.tramte@gov.si

UDK: 001.31:336.1

Izvleček

Dostop do znanstvenih informacij oz. podatkov o rezultatih raziskovalnega dela ter njihovo razširjanje in arhiviranje so v digitalni dobi eden glavnih izzivov na področju znanstvene oziroma raziskovalne dejavnosti. Postavlja se vprašanje kako z ustrezno tehnologijo, standardi in organizacijo dela zagotoviti boljšo dostopnost in medsebojno povezovanje raziskovalnih podatkov vključno z izmenjavo podatkov v mednarodnem merilu ter tako omogočiti njihovo učinkovitejšo izrabo. Da je dandanes to zelo aktualna tema kaže med drugim dejstvo, da sta jo v svoje prioritetne aktivnosti vključila tudi EU in OECD. Slovenija je bila skupaj z drugimi članicami EU oz. OECD v ta proces vključena preko dveh vprašalnikov. Slovenija se zaveda pomena zagotavljanja dostopa do raziskovalnih podatkov iz javno financiranih raziskav in ga v polni meri podpira. Temeljna vprašanja ravnanja z znanstvenimi informacijami na nacionalnem nivoju obravnava Strategija razvoja informacijske družbe v RS - si2010, ki je bila sprejeta leta 2007. Princip prostega, brezplačnega dostopa do raziskovalnih podatkov iz javno financiranih raziskav je omenjen tudi v Nacionalnem raziskovalnem in razvojnem programu 2006-2010, osrednjem nacionalnem strateškem dokumentu za področje raziskav in razvoja. Kot je lahko razvidno, so v obeh dokumentih opredeljena načela in splošne smernice, medtem ko je konkretno nacionalno politiko v tem specifičnem segmentu treba šele definirati. Začetek sistematičnega vzpostavljanja nacionalnega sistema za dostop do podatkov iz javno financiranih raziskav smo v Sloveniji zastavili s projektom Oblikovanje strokovnih podlag za postopno vzpostavitev celovitega sistema odprtega dostopa do digitaliziranih podatkov javno financiranih raziskav v Sloveniji, ki ga je razpisalo Ministrstvo za visoko šolstvo, znanost in tehnologijo v okviru CRP Konkurenčnost Slovenije 2006-2013 leta 2009. Namen projekta je vzpostaviti pregled nad stanjem v Sloveniji ter z razpravo in usklajevanjem interesov med predstavniki znanstvene skupnosti ob sodelovanju z obstoječimi ponudniki znanstvenih informacijskih storitev in z nosilci znanstvene politike, pripraviti nacionalni akcijski načrt za postopen razvoj celovitega sistema dostopa do raziskovalnih podatkov iz javnega financiranja v državi.

Ključne besede: javna sredstva, znanost, projekti, prost dostop

ACCESS TO RESEARCH OUTPUT AND RESEARCH DATA FROM PUBLIC FUNDING Abstract

Access to scientific information its dissemination and preservation are major challenges of the digital age on scientific and research activities. The question is how to use appropriate technology, standards and working methods to enable more efficient use of data, for a better access and integration of complex data, including the sharing of data at intenational level and, how to contribute to the enhacement of the quality of science. Nowadays that

issue is very important what has also been illustrated by the fact that the issue has been included in priorities of OECD and EU. Along with other members Slovenia was also involved in that process of activities through two questionnaries. Slovenia is aware of the importance of providing access to research data from publicly funded research and fully supports the process. The strategy for Development of the Information Society in the Republic of Slovenia - si2010 adopted in 2007 addresses fundamental issues that are relevant for the treatment of scientific information. The principle of free access to research data from publicly financed research is also stressed in the National Research and Development Programme 2006-2010, a central national strategic document for the field of R&D. As it can be seen, only principles and general guidelines for the particular field of scientific information are set in both documents, while an explicit national policy towards this still needs to be formulated. The beginning of systematic establishment of a national system for access to data from a publicly funded research in Slovenia is set by the project »Formation of expert base for gradual establishment of a comprehensive system of open access to digital information publicly funded research in Slovenia«. The call for proposals was launched in 2009 by the Ministry of Higher Education, Science and Technology as a part of the Targeted Research Programme Competitiveness of Slovenia. The purpose of the project is to establish an overview of the situation in Slovenia and to start discussion and coordination of interests among representatives of the scientific community, and in cooperation with existing providers of scientific information services and scientific policy makers, prepare a national action plan for the gradual development of a comprehensive system of access to research data from public funding in the country.

Ključne besede: science, public funding, projects, open access

Uvod

Raziskave temeljijo na preteklem raziskovalnem delu in so zatorej odvisne od možnosti, ki jih imajo znanstveniki na področju dostopa do znanstvenih objav in podatkov iz obstoječih raziskav. Različne zainteresirane strani imajo različna stališča o tem, kako doseči izboljšave na področju dostopa, razširjanja in arhiviranja podatkov.

Da je dandanes to zelo aktualna tema kaže med drugim dejstvo, da sta jo v svoje prioritetne aktivnosti vključila tudi EU in OECD. Slovenija je bila skupaj z drugimi članicami EU oz. OECD v ta proces vključena preko dveh vprašalnikov. Vprašanja so se nanašala na stanje in nacionalno politiko glede dostopa, razširjanja in arhiviranja znanstvenih informacij. Odgovori držav članic bodo prispevali k razvoju politike obeh organizacij na tem področju, v EU predvsem v sklopu 8. okvirnega programa za raziskave in razvoj.

Stanje v Sloveniji

Za razliko od večine razvitih držav, kjer je pogosto problem, kako dobro delujoče storitve na posameznih raziskovalnih področjih1 razširiti na druga področja raziskovanja, uskladiti raven storitev in s tem omogočiti čez disciplinarno uporabo podatkov, je v Sloveniji problem velika razpršenost in nepovezanost obstoječih podatkovnih storitev. Dejansko je večina podatkov še vedno shranjena v okviru projektov, kjer so nastali, ter je zelo malo celo znotraj disciplinarnega povezovanja v uporabi in dostopu do podatkov. V splošnem lahko pri nas govorimo o zelo nizki razvitosti podatkovnega upravljanja in podatkovnih storitev. Posledice takšnega stanja je njihova slaba izrabljenost zaradi slabe dostopnosti, kar hkrati zmanjšuje motivacijo za zagotavljanje njihove kakovosti že v izvoru. Glede na to, da so stroški za pridobivanje podatkov ponavadi zelo visoki, pomeni to veliko izgubo v javnih sredstvih za financiranje raziskav. Omejevanje dostopa do podatkov kot javne dobrine je potemtakem neupravičeno, razen kadar gre za upoštevanje interesov nacionalne varnosti, zaupnosti osebnih podatkov ali intelektualne lastnine.

Trenutno je zatorej v Sloveniji prost dostop do podatkov načeloma na voljo, vendar po zelo različnih poteh, brez celovitega sistema. Nekatere zametke takšnega sistema pa vendarle že imamo.

Nacionalna in univerzitetna knjižnica - NUK je vključena v projekt 7. OP DRIVER II, preko katerega razvijajo nacionalno mrežo odprtih repozitorijev. Trenutno NUK gradi repozitorij, temelječ na odprtokodni programski opremi Fedora in si želi postati nacionalni agregator (zbirno mesto) za slovenske znanstvene publikacije, ki bo omogočal prost dostop do znanstvenih publikacij v pravem pomenu besede.

Slovenija ima poleg tega institucijo, organizirano točko, ki sistematično omogoča dostop do podatkovnih baz s področja družboslovja, to je Arhiv družboslovnih podatkov - ADP. Arhiv preko interneta omogoča dostop do izbranih visoko kvalitetnih surovih podatkov iz raziskovalnih projektov s področja družboslovja v državi. Kakorkoli že, dosežki ADS niso rezultat usmerjene nacionalne politike in ureditve, ampak prostovoljne presoje raziskovalnih skupin, da podatke vlagajo v ADP. Posledica je neenakomerna pokritost posameznih družbenih ved v okviru širšega družboslovja.

Dostop do mikro podatkov za znanstvene namene, ki temelji na prilagojenih postopkih za uporabnike slednjič omogoča še Statistični urad RS. Tudi v ADP najdemo anonimne različice statističnih mikro podatkov, vendar le izjemoma.

Odprt dostop do podatkov kot javne dobrine zahteva posebno pozornost pri ravnanju s podatki že pri pripravi podatkov, kjer se mora zagotoviti njihova ustrezna vsebinska obdelava, dokumentacija in priprava za nadaljnje uporabe. ADP skladno s tem uvaja zgodnje seznanjanje sodelavcev raziskovalnih projektov z zahtevami po končnem izročanju podatkov ter ponuja ustrezna navodila ter orodja. ARRS pa npr. uvaja kategorijo »Zaključena

1 Npr. v Veliki Britaniji podatki iz domene Natural Environment Research Council - NERC ali pa Economic and Social Research Council - ESRC),

znanstvena zbirka podatkov ali korpus« kot nagrado avtorjem za delo, vloženo v pripravo podatkov oz. podatkovnih zbirk. To je nedvomno dragocena spodbuda za razširitev dostopnosti raziskovalnih podatkov, medtem ko bi bilo še bolje, če bi vidik upravljanja s podatki vključili kot reden sestavni del v vrednotenje raziskovalnih predlogov v razpisih ARRS.

Ureditev

Slovenija se zaveda pomena zagotavljanja dostopa do raziskovalnih podatkov iz javno financiranih raziskav in ga v polni meri podpira. Konec koncev je z včlanitvijo v OECD sprejela deklaracijo o dostopu do podatkov iz javno financiranih raziskav (iz leta 2007).

Temeljna vprašanja ravnanja z znanstvenimi informacijami na nacionalnem nivoju obravnava Strategija razvoja informacijske družbe v RS - si2010, ki je bila sprejeta 2007. Potreba po prostem dostopu do izobraževalnih in znanstvenih vsebin je poudarjena v strateškem cilju 3.1, ki se ukvarja z zagotavljanjem e-vsebin in e-storitvami, vključno s problemi digitalizacije, arhiviranja in razširjanja. V dokumentu so poudarjeni številni izzivi na področju ravnanja z informacijami. Princip prostega in brezplačnega dostopa do raziskovalnih podatkov iz javno financiranih raziskav je omenjen tudi v Nacionalnem raziskovalnem in razvojnem programu 2006-2010 - NRRP, osrednjem nacionalnem dokumentu za področje raziskav in razvoja. V obeh dokumentih so torej opredeljena načela in splošne smernice, medtem ko je konkretno nacionalno politiko v tem specifičnem segmentu treba šele definirati in v njej na celovit način povezati tudi razdrobljene obstoječe aktivnosti, ki smo jih že omenili.

Finančni mehanizmi

Za izboljšanje dostopa do podatkov pri nas zaenkrat ni posebnih davčnih ugodnosti, DDV se ne povrne. Predpisana stopnja DDV za znanstvene monografije in tiskane revije je 8,5 %, medtem ko so digitalne revije in knjige še vedno obdavčene z 20 % DDV-jem. MVZT skupaj z MF pripravlja predlog za spremembo obstoječe zakonodaje, kjer bodo tudi digitalni časopisi in knjige vključeni v kategorijo izdelkov in storitev, ki so obdavčeni z nižjo, 8,5 % stopnjo DDV.

Po metodologiji iz Frascatskega priročnika, ki je svetovni metodološki standard na področju statistike RR, v stroške za RR sodijo le vlaganja v dejavnosti, infrastrukturo in osebje, ki so neposredno povezani z raziskavami, medtem ko se dejavnosti in z njimi povezane investicije, namenjene razširjanju znanstvenih informacij (znanstvena srečanja, revije, promocija znanosti), ne štejejo v RR.

Sredstva, namenjena upravljanju (digitalnih) podatkov v samih raziskovalnih projektih so lahko sestavni del stroškov raziskovalnih projektov in zatorej sodijo med izdatke za RR. V Sloveniji zaenkrat za upravljanje (digitalnih) podatkov še ne namenjamo posebnih sredstev (vsaj ne v obliki jasno definiranega zneska), jih pa načrtujemo v prihodnje.

Mednarodno vključevanje

V sklopu projektov, ki jih je kot evropsko pomembne in prioritetne opredelila evropska platforma ESFRI2, se bo Slovenija vključila v tiste mednarodne projekte, kjer bo mogoče pričakovati, da bodo njihovi rezultati in rešitve bolj kakovostni, kot če bi ista sredstva in napore vlagali v oblikovanje nacionalnih rešitev. Na področju upravljanja in dostopa do podatkov se na primer na področju družboslovja in humanistike kot takšni projekti potencialno kažejo CESSDA3, DARIAH4, CLARIN5 in SHARE6. CESSDA predstavlja krovno organizacijo za evropske arhive družboslovnih podatkov in torej posega na področje, kjer imamo preko Arhiva družboslovnih podatkov (ADP) že vzpostavljene celovitejše podatkovne storitve in mednarodne povezave. Strokovnjaki ADP v okviru CESSDA že nekaj časa sodelujejo pri aktivnostih, kot je priprava portala, protokolov za izmenjavo in dostop do podatkov, pri strokovnem usposabljanju ter pripravah skupnih orodij za podporo dejavnosti. Za izenačitev ravni storitev in sodelovanje v novi inštalaciji CESSDA pa bi bila potrebna dodatna vlaganja v nadgradnjo slovenskega dela zagotavljanja storitev, kar pomeni dodatno delo ter dopolnitve v infrastrukturi, kadrih in usposabljanju uporabnikov.

Nadvse pomembno je tudi to, da bi sodelovanje Slovenije v mednarodnih projektih, katerih pričakovani rezultati so relevantni za področje upravljanja in dostopa do podatkov, Sloveniji omogočilo neposreden prenos izkušenj in zgledov pri organiziranju celovitega nacionalnega sistema dostopa do raziskovalnih podatkov za vsa disciplinarna področja.

Projekt CESSDA npr. odpira pot za vzpostavitev oz. prilagoditev pravnega okvira za zbiranje vseh podatkov iz javno financiranih raziskav ne glede na raziskovalno področje, seveda v ustrezni obliki na ustreznem mestu:

• na način osebnega oz. institucinalnega samoarhiviranja (za podatkovna gradiva iz projektov manjšega pomena);

• na način nacionalnega disciplinarno pooblaščenega podatkovnega arhiva, povezanega v vzporedne mednarodne integracije (primer je ADP, povezan v CESSDA); ali pa

• na način direktnega zalaganja ustreznega mednarodnega arhiva s podatkovnimi gradivi posameznega disciplinarnega področja.

Sicer pa imamo v Sloveniji na področju upravljanja s podatki že zdaj elemente mednarodnega povezovanja tudi v drugih raziskovalnih okoljih (npr. na področju humanistike, medicine, rabe prostora, zgodovine), le da niso tako sistematični oz. obsežni, kot to velja za ADP oz. CESSDA.

2 ESFRI - European Strategy Forum on Research Infrastructures (Evropski strateški forum za raziskovalne infrastrukture)

3 CESSDA - Council of European Social Science Data Archives (Svet Evropskih arhivov družboslovnih podatkov)

4 DARIAH - Digital Research Infrastructure for the Arts and Humanities

5 CLARIN - Common Language Resources and Technology Infrastructure

6 SHARE - Survey of Health, Ageing and Retirement in Europe

Razvoj sistema

Začetek sistematičnega vzpostavljanja nacionalnega sistema za dostop do podatkov iz javno financiranih raziskav smo v Sloveniji zastavili s projektom Oblikovanje strokovnih podlag za postopno vzpostavitev celovitega sistema odprtega dostopa do digitaliziranih podatkov javno financiranih raziskav v Sloveniji, ki ga je razpisalo Ministrstvo za visoko šolstvo, znanost in tehnologijo v okviru CRP Konkurenčnost Slovenije 2006-2013 leta 2009. Med prijavitelji je bila izbrana Univerza v Ljubljani.

Namen projekta je vzpostaviti pregled nad stanjem v Sloveniji ter z razpravo in usklajevanjem interesov med predstavniki znanstvene skupnosti ob sodelovanju z obstoječimi ponudniki znanstvenih informacijskih storitev in z nosilci znanstvene politike pripraviti nacionalni akcijski načrt za postopen razvoj celovitega sistema dostopa do raziskovalnih podatkov iz javnega financiranja v državi. Pri tem bodo predlagane rešitve upoštevale načela deklaracije OECD in se opirale na zglede iz tujine (primeri obstoječih dobrih praks).

V naši državi je na področju vzpostavljanja odprtega dostopa do raziskovalnih podatkov kar nekaj prizadevanj, ki pa niso povezana med seboj. S pobudo o ustanovitvi ekspertne delovne skupine visokošolskih partnerjev za pripravo strokovnih podlag za vzpostavitev nacionalnega prostodostopnega repozitorija se je na naše ministrstvo nedavno obrnila tudi rektorska konferenca. Te pobude smo na MVZT zelo veseli, saj kaže, da dozoreva čas za resnejšo aktivnost na nacionalni ravni. Pri tem pa se moramo zavedati, da bo vzpostavitev sistema nacionalnega repozitorija uspešna le ob polnem sodelovanju vseh predstavnikov znanstvene skupnosti in znanstvene politike. To pomeni, da bodo v procesu morali sodelovati prav vsi akterji na različnih ravneh: raziskovalne organizacije, strokovna društva in znanstveniki v različnih vlogah, podporne organizacije (arhivi, digitalne knjižnice), producenti podatkov, pa tudi vladni predstavniki, agencije in naročniki raziskav.

Pri oblikovanju akcijskega načrta bo seveda treba upoštevati posebnosti znanstvene skupnosti v Sloveniji, kot so organiziranost po posameznih velikih inštitutih ter po drugi strani razdrobljenosti in nepovezanost univerzitetnega raziskovanja. Pri delu s podatki je namreč nujno upoštevati specifične potrebe posameznih znanstveno- raziskovalnih tradicij in tudi namenov uporabe.

Najširša razprava, ki naj bi vključevala vse glavne zainteresirane strani v Sloveniji, naj bi odprla tudi druga vprašanja v zvezi s sodobno politiko znanstvenih informacij, hkrati pa mora biti naš skupni cilj, da v Sloveniji optimiziramo vse raziskovalne infrastrukture in se izognemo podvajanju podatkov in nesmotrni porabi javnih sredstev. Pri tem, kot rečeno, ministrstvo računa na odziv vseh zainteresiranih skupin, hkrati pa lahko tudi one računajo na našo podporo.

TEZA SPLETNE SLOVENISTIKE : MNENJE RAZISKOVALCA KOT UPORABNIKA PROSTODOSTOPNIH ZNANSTVENIH VSEBIN IN MOŽNEGA AVTORJA SLEDNJIH - PODROČJE HUMANISTIKE:

prof. dr. Miran Hladnik

Univerza v Ljubljani, Filozofska fakulteta e-naslov: miran.hladnik@guest.arnes.si

UDK: 655.411:004.65:821.163.6.02

Izvleček

Poročilo o dostopnosti infrastrukture in znanstvenih objav s področja slovenistične literarne vede vsebuje opis inštitucionalne organiziranosti predmetnega področja in pregled trenutno spletno dostopnih revij, monografij, zbornikov in podatkovnih zbirk. Kritično je do inertnosti in nenaklonjenosti inštitucij (fakultet, inštitutov, založb, avtorske agencije) ter raziskovalcev do spletnega objavljanja in se zavzema za projekte, ki pospešujejo prosti dostop: za digitalizacijo literarne in literarnovedne dediščine (dLib, Wikivir), za gradnjo podatkovnih zbirk in repozitorijev (Videolectures), za uporabo diskusijskih forumov v strokovni komunikaciji (Slovlit) in za zamenjavo copyrighta s prožnejšo avtorsko licenco creative commons.

Ključne besede: slovenistika, literarna veda, prosti dostop, spletno publiciranje, wikipedija, creative commons

THE IMPACT OF WEB-BASED SLOVENE LITERARY STUDIES

Key words: Slovene studies, literary scholarship, open access, web publishing, wikipedia, creative commons

Akademska slovenistika združuje dve področji, slovenistično jezikoslovje in slovenistično literarno vedo. Kot literarni zgodovinar bom izčrpneje poročal o literarnovedni polovici. V tujini je struktura slovenistika drugačna: tam ima status regionalnega študija (area studies) in ob interesu za jezik in literaturo vključuje še etnologijo oz. folkloristiko, kulturo, zgodovino, umetnost, politiko itd., s čimer vsem naj bi tuje študente slovenistike seznanjali slovenski lektorji. Revija Slovene Studies, ki izhaja v ZDA in Kanadi, vsebuje razprave z naštetih področij.

Slovenistika je ena izmed nacionalnih filologij (kot npr. bohemistika, italijanistika, skandinavistika ...) in kot taka del humanističnega paketa akademskih disciplin, ki se tradicionalno študirajo na filozofski fakulteti. Radi poudarjamo, da je bila leta 1919 ob otvoritvi ljubljanske univerze ena izmed ustanovnih disciplin, in pri tem pozabimo povedati, da tedaj inštitucionalno ni bila samostojna, ampak se je gojila v okviru slavistike na oddelku za slovanske jezike in književnosti, postopoma krepila svoj delež in se s samostojnim oddelkom lahko ponaša šele od leta 2002 dalje. Ker sta bila študijska predmeta slovenistike slovenščina in slovenska književnost v 19. stoletju ključna elementa nacionalne identifikacije

in identitete ter prvo sredstvo nacionalne konstitucije in emancipacije, se slovenistiki še danes pripisuje poseben »pomen za narodno ali državno samobitnost in kulturo« (Merila, 2001), čeprav imata v resničnem življenju tak status le šport in estrada, ki pritegneta neprimerno več javnega interesa in državnih subvencij. Privilegij posebnega pomena za nacionalno kulturo je vprašljiv, ker nas izloča iz znanstvene konkurence in ker nas utegne zazibati v udobno prepričanje, da si za mednarodno promocijo slovenistične literarnovedne misli ni treba prizadevati.

Dejansko težo slovenistike razkrivajo podatki o njenem proračunskem deležu. Cela Filozofska fakulteta v Ljubljani obrača s 27-28 milijoni evrov letno, od česar so za slovenistiko približno trije milijoni. Če prištejemo še mariborsko, koprsko in novogoriško slovenistiko ter inštitute za jezik in književnost na ZRC SAZU ter lektorate po svetu, pridemo, tako čez palec, do številke največ devet milijonov, kar je manj, kot porabita npr. ljubljanska opera in balet (Čakš 2010), ki sta posebej pomembna za nacionalno kulturo le v zelo širokem pomenu besede, saj gredo Slovenci v opero lahko kamor koli v sosednja velika mesta, slovenščine pa v tem obsegu kot pri nas ne morejo študirati na nobeni drugi univerzi po svetu. V nasprotju z deklarirano neobhodnostjo in velikim nacionalnim pomenom je dejanska teža slovenistike majhna.

Pri pregledu slovenistične kadrovske zasedbe se omejujem na literarno vedo. Vseh aktivnih literarnih zgodovinarjev je nekaj nad 140, s tistimi vred, ki se ukvarjajo z drugimi književnostmi, to je dvakrat manj, kot je zaposlenih pri ljubljanski operi in baletu. Skupaj s 50 upokojenci in skoraj 100 pokojnimi je v stroki do danes delovalo blizu 300 literarnih zgodovinarjev. Na Filozofski fakulteti je 36 % vseh naših literarnih zgodovinarjev, od tega na slovenistiki 9 učiteljev in asistentov in na primerjalni književnosti, kjer se v veliki meri ukvarjajo s slovensko književnostjo, 7. Ko dodamo še akademski Koper, Maribor, ZRC SAZU in druge posamezne lokacije, pridemo do števila 50 literarnih zgodovinarjev, ki se trenutno ukvarjajo s slovensko književnostjo. Študentov slovenske književnosti je na slovenistiki blizu 400, na primerjalni književnosti 400, na slovenskih lektoratih po svetu se vsaj do neke mere s slovensko književnostjo seznanja še 1800 študentov, skupaj 2600 študentov. Število »uporabnikov« slovenske literarne vede bi se močno povečalo, če bi študentom, akademskim učiteljem in raziskovalcem prišteli še sloveniste v primarnem in sekundarnem izobraževalnem sektorju, vendar je interesentov za sveža literarnovedna spoznanja med njimi malo, povečini se zadovoljijo z vednostjo iz ubčenikov.

Slovenistična literarna veda komunicira z uporabniki ustno (s študenti na predavanjih, govorilnih urah in izpitih, s kolegi in drugimi splošnimi interesenti v radijskih, televizijskih in drugih govornih nastopih) in preko objav. Naslov Prost dostop do dosežkov slovenskih znanstvenikov zastavlja vprašanje, ali je pristop uporabnikov do slovenističnih literarnovednih objav brez ovir. Ne, čisto prost ni dostop nikoli, skoraj vedno je treba premagati kakšno oviro: lastno lenobo ali nezainteresiranost, strošek za vpis v knjižnico, čakanje na knjigo, kadar je ta izposojena, nakup računalnika in internetne povezave pri e-knjigah, jezikovno bariero v primeru tujejezičnih ali v strokovnem žargonu katere od hermetičnih literarnovednih šol napisanih knjig itd.

Težave z dostopom so pri starejših knjigah, ki jih iz knjižnic ni mogoče odnesti domov niti nam jih ne dovolijo prefotografirati, češ da jim to škoduje, v resnici pa iz zaslužkarskih razlogov ali zgolj zato, ker so pač taka pravila. Kadar je za knjigo treba globlje seči v žep, že lahko rečemo, da je pristop oviran. Na spletu se pojavi ovira, ko najdemo članek z obetavnim naslovom in izvlečkom, ko pa kliknemo nanj, se nam odpre okno za izpolnitev podatkov s kreditne kartice. Oviranega se čutim ob prosto dostopni knjigi na spletu, če je ta zgolj v slikovnem formatu in po njej ni mogoče iskati. Še bolj nerodno je, kadar knjiga na spletu je, pa je iskalniki ne najdejo, ker ni nihče poskrbel za to, da bi bila podvržena indeksiranju.

Izraz prost pristop torej ni sinonim za pristop preko računalnika, je pa v praksi prost pristop z računalniškimi pristopom močno povezan, saj za objave na papirju, tudi če so zastonj, tega izraza ne uporabljamo. Ne gre samo za bralno dostopnost, ampak tudi za možnost kopiranja celega besedila za potrebe strojne analize ali njegovih delov za potrebe citiranja. Objava v prostem pristopu je tista objava na spletu, ki je opremljena z licenco creative commons ali sorodno avtorsko licenco, ki v prvi plan ne postavlja zaščite avtorske lastnine ampak človekovo pravico biti informiran. Vprašanje o prostosti dostopa v stroki je identično vprašanju o infrastrukturi te stroke. Pod infrastrukutro razumemo namreč v prvi vrsti internetne vsebine in orodja za udobno delo (Borgman 2007). Samoumevno se nam zdi, da so na klik dosegljivi bibliografski in biografski podatki pa tudi besedila sama. Novo v naših infrastrukturnih pričakovanjih je, da med osnovne pogoje za funkcioniranje literarnovednega sistema štejemo tudi možnost nemudnega spletnega objavljanja, hrambe študij ter strokovnega diskutiranja.

S stališča lahke spletne dostopnosti bom pregledal glavne publikacijske kanale slovenistične literarne vede: revije, monografije, zbornike in podatkovne zbirke. Publicistično sceno poznam iz različnih zornih kotov: kot avtor razprav in knjig, kot dolgoletni član uredništva osrednje strokovne revije, nekdanji predsednik komisije za tisk učbenikov na domači fakulteti in kot urednik različnih tiskanih in spletnih objav.

Na razpolago imamo troje osrednjih glasil, »ki jim stroka priznava mednarodno odmevnost« (Merila, 2001), to so Slavistična revija (na spletu od 1997, za nazaj tudi 1993-95), Jezik in slovstvo (v celoti dosegljiva tudi v Digitalni knjižnici Slovenije) in Primerjalna književnost (na spletu z enoletnim zamikom od 2005). Revija Slovene Studies napoveduje skorajšnji dostop do arhivskih izvodov od začetka izhajanja (1979-). Revija Slavia Centralis, ki jo od leta 2008 izdaja Univerza v Mariboru (naklada 300 izvodov), je na spletu z enoletnim zamikom. Naklada Jezika in slovstva je 1000, Slavistične revije 650 izvodov, vendar niso vsi naročniki revij tudi plačniki in redni bralci, zato uredništva načrtujejo zmanjšanje naklade.

Revije so vključene v različne bibliografske baze, tudi v AHCI, ki v humanistiki velja največ, čeprav je slava tega ameriškocentričnega citatnega indeksa pretirana, saj nam ne ponudi podatka o faktorju vpliva in bi bil ustreznejši, čeprav omejen na angleščino, Googlov Učenjak. Ni mi jasno, zakaj slovenski informacijski sistem o raziskovalni dejavnosti Sicris za določanje teže slovenskih humanističnih objav ne poseže po njegovih podatkih in vztrajno upošteva samo indeks Web of Science, ki objav v naših strokah ne registrira. Kolegi, ki si to lahko privoščijo (recimo redni profesorji, ki jim ne gre več za točke), objavljajo tudi v drugih specializiranih revijah (npr. Otrok in knjiga, Knjižnica) ali v popularnejših revijah in dnevnem

tisku (Sodobnost, Literatura, Književni listi Dela ...). Objavljanje v tujih revijah je redkost, saj slovenistična tematika zanje v glavnem ni zanimiva. Da bi ugodili kriteriju mednarodne odmevnosti, uredništva slovenskih revij občasno pripravijo tematske številke v angleščini, ne glede na to, da je število bralcev, ki jih zanima slovenistična tematika, slovensko pa ne znajo, zanemarljivo majhno.

Objava monografije je v humanistiki še vedno ultimativni kazalec posameznikove akademske uspešnosti; brez knjižne objave ni strokovnega ugleda, ustrezneje: brez zadostnega števila knjižnih objav ni strokovnega ugleda. Publicistična kondicija je med kolegi zelo neenakomerno razporejena. Nepresežni primer knjižnega publiciranja je bil npr. Taras Kermauner, ki je samo o slovenski dramatiki napisal 120 knjig in je s 13 milijoni besed verjetno najplodnejši pisec na Slovenskem, daleč pred pisatelji številnih obsežnih romanov Mimi Malenšek (2,6 mio besed), Francetom Bevkom (1,6 mio besed) in Ivanom Sivcem (0,8 mio besed). 23 knjig opusa Tarasa Kermaunerja je dostopno samo v elektronski obliki na spletišču Kermauner.net. Slovenistična literarna veda je v zadnjih desetih letih producirala 208 monografij (Kocijan, 2010).

Literarnovedne monografije se pojavljajo v zbirkah. Slavistično društvo izdaja Slavistično knjižnico (na spletu od 2006), mariborsko slavistično društvo se je ponašalo s knjižno zbirko Zora, a jo je prepustilo domači filozofski fakulteti; na spletu so samo povzetki knjig. Ljubljanska filozofska fakulteta izdaja literarnovedne knjige med učbeniki in v seriji Razprave Filozofske fakultete. Paradna zbirka ZRC SAZU je bila Literarni leksikon, zdaj Studia litteraria; nobena ni na spletu. Bibliografija beleži kot monografije tudi diplomska dela, magisterij in doktorate, ki predstavljajo večino spletnih objav. Najdemo jih v Digitalni knjižnici Univerze v Mariboru, vendar slovenističnih literarnovednih doktoratov za enkrat še ni med njimi. Med nekaj deset literarnovednimi diplomskimi deli je slovenističnih manjšina. Filozofska fakulteta UL je pred leti poskusila s sprotnim objavljanjem diplomskih del na svojih spletnih straneh,vendar zadeva ni stekla in je fakulteta celo ukinila povezavo do njih, tako da je deset slovenističnih literarnovednih diplomskih del dostopno le z internega Seznama avtorjev diplomskih nalog iz slovenske književnosti. Odmevnost knjižnih izdaj je znotraj strokovnih krogov pičla, saj je v zadnjih desetih letih oceno doživelo le 16 slovenističnih literarnovednih monografij (Kocijan, 2010).

Objave v strokovnem zborniku avtorjem ne prinašajo ne honorarja ne velikega števila točk. V zadnjem desetletju je izšlo 86 zbornikov z literarnovedno vsebino. Gre za redne letne publikacije inštitucij in društev. Oddelek za slovenistiko izdaja simpozijski zbornik Obdobja (na spletu od 2002) in Zbornik predavanj SSJLK (Seminar slovenskega jezika, literature in kulture, na spletu od 2004). 2009 je postavil dva zbornika (Zbornik 4. slovensko-hrvaškega slavističnega srečanja in Slovenistika: Pogledi na eno od ustanovnih strok Univerze v Ljubljani ob njeni 90-letnici). Slavistično društvo Slovenije vsako leto pripravi kongresni zbornik, z vzporedno spletno verzijo od leta 2005. Starejši festschrifti, ki so izšli ob obletnicah osrednjih predstavnikov stroke (Kidričev, Ocvirkov, Slodnjakov ...), so seveda samo v tiskani obliki, prav tako zborniki ob obletnicah pomembnih pesnikov in pisateljev (Trubarjev, Levstikov, Trdinov ...). Včasih izide posamezna številka Slavistične revije in revije Primerjalna književnost kot zbornik, npr. ob visokih okroglih obletnicah svojih bivših urednikov in na zaokrožene teme. V strokovni periodiki doživi oceno le vsak deseti zbornik.

Založbe literarnovednih publikacij imajo status znanstvenih založb. Na prvem mestu preseneča v zadnjih desetih letih s 35 izdajami Slovenski gledališki muzej, ki je založil 28 Kermaunerjevih knjig, od tega 25 iz serije Rekonstrukcija in reinterpretacija slovenske dramatike. 26 enot gre na račun SAZU in ZRC SAZU (8 del v seriji Studia litteraria, 6 v seriji Dela SAZU). Sledijo z 20 enotami tri veje Mohorjeve družbe, celjska, goriška in celovška. Znanstvena založba Filozofske fakultete v Ljubljani je udeležena z okroglo 20 publikacijami (10 Zbornikov SSJLK, 5 zbornikov Obdobja, 5 Razprav FF), mariborska FF pa z 11 knjigami v zbirki Zora. Z 12 literarnovednimi knjigami ostaja relevantna znanstvena založba Slovenska matica (4 zvezki v zbirki Razprave in eseji). Druga pogostejša mesta so Slavistično društvo Slovenije (kongresni zbornik vsako leto, 6 knjig Slavistične knjižnice) in Društvo slovenskih književnih prevajalcev s prevajalskimi zborniki. Sledi založba Literarno-umetniškega društva Literatura z zbirko Novi pristopi (11), Študentska založba (9), Zavod RS za šolstvo (7), Nova revija (7), Mladinska knjiga (7), DZS (6). V vseh primerih gre za izdaje na papirju.

Založbe za digitalizacijo niso zainteresirane, pa naj gre za založbe akademskega ali komercialnega tipa. Na svojih spletnih straneh objavljajo samo naslovnice in kazala, v najboljšem primeru kakšen odlomek iz knjige. Prosto dostopne spletne knjige so redkost in posledica avtorjeve osebne iniciative, npr. Hladnikova Praktični spisovnik (2002) in Slovenski zgodovinski roman (2009).

Nekoliko hitreje kot znanstvene objave se pospletenju in prostemu dostopu odpirajo podatkovne zbirke in gradivo. Od 1997 je na spletu zbirka diplomskih nalog iz slovenske književnosti na Filozofski fakulteti od 1950 dalje (http://www.ff.uni-lj.si/hp/dnsk), od 1999 pa zbirki Slovenski zgodovinski roman (http://www.ff.uni-lj.si/slovjez/mh/zgrom) in Slovenska kmečka povest (http://www.ff.uni-lj.si/slovjez/mh/kmpov). Bolj sveže so leksikonske informacije biografskega značaja na Wikipediji spletna verzija Slovenskega biografskega leksikona (SBL) ter skenirani Primorski slovenski biografski leksikon (PSBL).

V zbirko Digitalne objave pri ZRC SAZU so vključene Elektronske znanstvenokritične izdaje slovenskega slovstva (e-ZISS), ki jih pripravlja Inštitut za slovensko literaturo in literarne vede in je do zdaj spravil skupaj sedem znanstveno kritičnih izdaj. Gre v glavnem za starejša besedila (Brižinski spomeniki, Škofjeloški pasijon, pridige Antona Martina Slomška, korespondenca Žiga Zoisa, mestne prisege), bližje sodobnosti pa so pesmi Antona Podbevška in roman S poti Izidorja Cankarja. Druge izobraževalne in raziskovalne inštitucije se za zdaj lahko pohvalijo le z lepimi načrti: Digitalna knjižnica Pedagoškega inštituta npr. napoveduje zbirko Clavis litterarum Slovenicarum z znanstvenokritičnimi edicijami slovenskih knjig in Zbrana dela Primoža Trubarja.

Značaj virov in gradiva so dobile starejše literarnovedne publikacije, ki so zaradi prehoda v javno last v vedno večjem številu dosegljive na spletu. Frana Levca rokopisno Slovensko slovstvo (1871/72) smo digitalizirali in prepisali sami, druge so prinesli digitalizacijski projekti pri Googlu ali dLibu in je tako na naših ramenih samo njihovo korigiranje in prestavljanje na Wikivir; strojno prepoznavanje je namreč pri starejših slovenskih tekstih pogosto problematično in je korektorjeva ročna intervencija nujna. DLibovo pospletenje edicije Knezova knjižnica, ki jo je izdajala prva slovenska založba znanstvenega tiska Slovenska matica, in pospletenje Slovenskih večernic je naplavilo literarnovedne študije Frana Levca o

Bleiweisu (1880), Valjavcu (1895) in Prešernu (1900), Josipa Cimpermana o Franju Serafinu Cimpermanu (1874), Gregorja Kreka Einleitung in die slavische Literatur-geschichte (1887) in nemško razpravo o Aškercu (1899), Ivana Prijatelja Dramo Prešernovega duševnega življenja (1905) in Dragotina Lončarja oceno Prijateljeve študije Janko Kersnik, njega delo in doba (1914).

Največja pridobitev tujih digitalizacij sta dve knjigi Ivana Macuna, Cvetje slovenskiga pesničtva (1850) in Kratak pregled slovenske literature (1863) - poetika z antologijo in literarnozgodovinski pregled. V več kopijah so na voljo štiri knjige Zgodovine slovenskega slovstva Karla Glaserja (1894-98), deloma se slovenski književnosti posveča tudi Matije Murka Geschichte der älteren südslawischen Litteraturen (1908). Stare bibliografije imamo za zdaj zgolj v obliki posnetkov, po katerih ni mogoče iskati: Franc Simonič, Slovenska bibliografija (1550-1900), Janko Šlebinger, Slovenska bibliografija za l. 1907-1912 in Niko Kuret, Slovenska knjiga: Seznam po stanju v prodaji dne 30. junija 1939.

Narašča število posnetih predavanj. Na portalu Videolectures je v kategoriji Humanities: Literature osem predavanj (Milena Blažic, Miran Hladnik, Gregor Pompe, Alojzija Zupan Sosič, Andrej E. Skubic, Borut Telban, Jana Kolar), v drugih kategorijah pa še predavanja Tarasa Kermaunerja, Petra Svetine in Toneta Smoleja. Še druge najdemo na portalu Youtube (Helgo Glušič, Igorja Krambergerja) ali na seznamu v Slovenistični literarnovedni kašči (Gregorja Kocijana, Janeza Vrečka, Marijo Mitrovic, Matjaža Zupančiča). Popularnejše oblike literarnovednega diskurza v zvočnem ali filmskem zapisu se vsaj za nekaj časa pojavljajo tudi na radijskih in televizijskih spletnih straneh.

Bolj kot segment strogo znanstvenega publiciranja sta digitalizacija in pospletenje doletela strokovno publiciranje. Sem štejemo študentske infrastrukturne projekte na Wikipediji, ki se jih lotevamo na ljubljanski slovenistiki in na Pedagoški fakulteti v Ljubljani: Slovenski literarni zgodovinarji, Slovenska mladinska književnost, Slovenska literarna veda itd. V treh letih smo v okviru diplomskega seminarja postavili 160 gesel o slovenskih literarnih zgodovinarjih, zdaj postavljamo gesla o literarnovednih pojmih, inštitucijah, publikacijah in avtorjih, kar vse se zbira na literarnem portalu (Portal:Literatura) na domači Wikipediji.

Vzporedno poteka digitalizacija glavnega predmeta slovenistične literarne vede, to je slovenske književnosti. Prvo slovenistično podjetje tega tipa, Prešernove konkordance, je zastavil nemški slovenist Peter Scherber sredi 70. let. V Nemčiji sem v začetku 90. let poskrbel za prvo obširnejšo digitalizacijo klasikov; javno dostopni so ti teksti postali leta 1995, ko je v okviru literarnega spletišča na strežniku Inštituta Jožef Štefan zaživela stran z naslovom Zbirka slovenskih leposlovnih besedil. Zadnja leta sveže digitalizirana besedila postavljamo na Wikivir (Slovenska leposlovna klasika), ki omogoča širšo udeležbo strokovnjakov in laikov. Nasploh se moramo za digitalizirana besedila v veliki meri zahvaliti tujini: Tržačanu Franku Luinu iz Švedske (Beseda: Virtualna slovenska knjigarna), Erichu Prunču iz Gradca (TraDok), ameriškima projektoma Google Knjige in Internet Archive.

Infrastrukturna podjetja so na vseh področjih obsežna in finančno zahtevna, zato se jih lotevajo velike inštitucije z državno podporo. Bilo bi zelo nenavadno, če bi pri naštevanju akterjev, ki vzpostavljajo infrastrukturne pogoje za funkcioniranje slovenske literarne vede,

ostali le pri tujcih, domačih volonterjih ter študentih. Domače inštitucije, od katerih smo pričakovali akcijo (univerze, inštituti, nacionalna knjižnica, akademija in ustrezna ministrstva), so na civilizacijski izziv odreagirale sprva nekam zaspano in bile zato deležne mojih kritičnih pripomb, vendar je v zadnjih letih delo steklo in vzbuja zaupanje, da bo digitalni dostop do vsebin postopoma nadomestil tradicionalnega. Od leta 2005 največ k rasti digitalnih vsebin prispeva Digitalna knjižnica Slovenije (dLib) v okviru Nacionalne in univerzitetne knjižnice, ki prednostno digitalizira starejšo fizično občutljivo in težko dostopno periodiko; knjig je trenutno prebranih okrog 1000.

Globalne količine so takele: na svetu je med 65 in 75 milijoni knjig, od česar jih je okrog 25 milijonov v javni lasti - kar pomeni, da so njihovi avtorji v grobu že več kot 70 let - in torej brez vprašanja na voljo digitalizaciji. Približno 10 milijonov knjig je že prosto dostopno na internetu (Hart 2009). Slovenske količine so ustrezno manjše. Delež elektronskih izdaj je med 3,5 milijona vpisov v Cobissu v najboljšem primeru komaj dober odstotek. Ko se pridruži še 300.000 dLibovih enot, se bo povzpel na 10 %. Koliko od tega spada na področje slovenistike ali še ožje slovenske literarne vede, je težko določiti. Po zelo grobi oceni bi bilo vsega izvirnega slovenskega leposlovja 300-600 milijonov besed, v digitalni obliki imamo po zelo prilbližni oceni za 30-60 mio besed leposlovja, kar je nekje med 5 in 20 %. Dveh tretjin celotne mase leposlovja žal zaradi avtorske zakonodaje, ki preprečuje prosto uporabo del tistih avtorjev, ki so mrtvi manj kot 70 let (zadnjih 70 let pa je, če sklepamo po zgodovinskem romanu, prispevalo dve tretjini leposlovne zaloge) ne moremo digitalizirati. Domnevamo, da smo nekje na polovici tega, kar je mogoče postaviti na splet brez spraševanja avtorjev ali avtorske agencije oz. brez dodatnih stroškov, kar je podobno globalnim razmeram (Hladnik 2009).

Slovenski literarni zgodovinarji razen izjem ne razpolagajo svobodno s svojimi besedili. Če razpravo odstopijo uredništvu znanstvenega ali drugega časopisa ali založbe, jima prepustijo odločitev o tem, ali bo razprava prosto dostopna tudi na spletu. Znanstveni časopisi z zamikom enega leta poskrbijo za pospletenje svojih objav, kar je vredno povale, avtorji sami pa razen izjem svojih besedil na splet ne postavljajo.

Za pomanjkljiv pretok znanstvenih informacij so krive v prvi vrsti avtorske agencije in založbe, ki niso pripravljene tvegati z alternativnimi poslovnimi modeli, ki jih zahteva splet, in se je njihova vloga omejila na sestavljanje pogodb, ki jemljejo avtorjem pravico do prostega razpolaganja s svojim delom, na izogibanje prostodostopnim licencam in na prežanje na spletne objave ter njihovo preprečevanje. Postale so agresivne in v knjižnem impresumu prakticirajo sovražni govor: »je prepovedano reproduciranje, distribuiranje, dajanje v najem, javna priobčitev, predelava ali druga uporaba avtorskega dela ali njegovih delov v kakršnem koli obsegu ali postopku, vključno s fotokopiranjem, tiskanjem, javnim interaktivnim dostopom ali shranitvijo v elektronski obliki. Vsa ta dejanja so kazniva.« Grožnje v kolofonu spominjajo na svarilna besedila na cigaretnih škatlicah in sugerirajo, da so knjige nekakšen zdravju nevaren proizvod. Žuganje kupcem s sodnim pregonom, kot da bi bili potencialni tatovi, nikakor ne sodi v prodajalski bonton.

Žal se brez potrebne refleksije in brez vizije tako obnašajo tudi subvencionirane znanstvene založbe, ki bi si v nasprotju s komercialnimi založniškimi hišami lahko privoščile poskus

spletnih objav. Do sprememb bo prišlo, ko bodo akademske inštitucije, v okviru katerih delujejo znanstvene založbe, spoznale, da objavljanje ni priložnost za zaslužek, ampak prvovrstni dokaz znanstvene aktivnosti in uspešnosti. Univerzitetna slovenistika je skupaj z drugimi humanističnimi disciplinami zadržana pri nujnem prehodu s tiskanih na prosto dostopne digitalne objave. Težko se navaja na to, da je primarna oblika objave danes elektronska in da je tiskani izvod (print on demand 'knjiga na zahtevo') samo stranski produkt. Verodostojnost spletnih objav ni nič manjša, če za njimi stoji enak recenzijski mehanizem kot pri tiskanih znanstvenih revijah. Pritisk na inštitucije, da rezultate raziskav, ki so financirane iz davkoplačevalskega denarja, objavljajo zastonj, je vedno večji. Avtorji in založbe bi morali postopoma nehati dojemati avtorsko delo kot lastnino in ga razumeti kot javno dobro. Namesto skrbi, ki jo vlagajo v zaščito, varstvo in obrambo avtorskih pravic, naj se raje angažirajo pri promociji pridobljenega znanja.

Nerazumljivo je, da univerza okleva s prehodom na alternativne avtorske licence creative commons oz. ustvarjalne gmajne, ki ponujajo pravne rešitve po vsakršni meri. Zelo sem si prizadeval, da bi bile knjige Filozofske fakultete opremljene z njimi, pa mi je uspelo samo pri svojih knjigah - očitno je prevladala konservativna pravna logika, ki si zakriva oči pred radikalnimi spremembami v znanstvenem publiciranju in pred nujo po prilagoditvi zakonodaje. Pred kratkim smo dosegli majhno zmago s sprejetjem diplomskega reda, ki po novem od piscev diplomskih del pričakuje njihovo strinjanje s spletno objavo in jih ne zavaja več z možnostjo, da rezultatov svojih raziskav ne objavijo. Naslednji korak bi moral biti storjen v smer prosto dostopnega, trajnega in privlačnega repozitorija za znanstvene in strokovne objave študentov, akademskih učiteljev in raziskovalcev, ki bi nadomestil objavljanje na osebnih spletnih straneh in poskrbel za enoten format publikacij. Akademska inštitucija, ki prisega na svojo odličnost, bi morala biti še kako zainteresirana za sprotno objavo vseh svojih diplomskih, magistrskih in doktorskih del. Z znanstvenimi objavami zdaj služijo komercialne založbe, čeprav bi morali biti rezultati raziskav, ki so jih financirali davkoplačevalci, zastonj (Greenberg 2010).

Univerza je bila vedno prostor širšega razumevanja avtorske zaščite, kot jo je zahtevala črka copyrighta. Akademsko okolje je predpostavljalo neprofitno rabo z upoštevanjem principa poštene ali korektne rabe (fair use). Danes se fakultete v novorojenem strahu pred restriktivno avtorsko zakonodajo obnašajo veliko bolj togo kot kdaj prej, kar sem občutil tudi na svoji koži, ko mi v lastni hiši sedem mesecev ni bilo mogoče postaviti podatkovne zbirke Slovenska literatura na spletu, ki je agregat naslovov pospletene slovenske književnosti (trenutno preko 2000 naslovov, http://slovenskaliteratura.ff.uni-lj.si/sl.html oz. http://www.ff.uni-lj.si/slovjez/sl/sl.html).

Sodim, da se slovenistična literarna veda še najbolj povezuje preko moderiranega diskusijskega foruma Slovlit (1999-), ki beleži strokovne dogodke in nudi interesentom prostor za vplivanje v strokovnih zadevah. Skoraj 1300 naročnikom, med katerimi je precej ljudi neliterarnegain neslovenističnega profila, postreže s povprečno dvema strokovnima obvestiloma dnevno in mimo uradnih mehanizmov za merjenje strokovnega vpliva utrjuje smisel in težo stroke.

Mentalna ovira hitrejšemu, neoviranemu pretoku znanstvenih informacij je zastarel koncept avtorstva, na katerem sloni zloglasni copyright. Romantično dojemanje kulturne zgodovine kot zaporedja velikih tekstov genialnih avtorjev se umika in s tem se umika tudi zahteva po občudujočem odnosu do avtorja. Kjer ni ekskluzivne avtoritete, tudi ni ene same, ekskluzivne resnice. Avtoriteto vedno bolj dojemamo kot nekaj, kar hromi kreativnost subjekta in omejuje njegovo svobodo, torej je v nasprotju z identiteto sodobnega sveta. Sodobne avtorske licence razpuščajo avtorsko blagovno znamko. Licenca creative commons še zahteva, da se pri uporabi intelektualnega produkta sklicujemo na avtorja in njegovo voljo in ne posegamo v njegovo delo, članki v Wikipediji, ki so metafora sodobnega strokovnega pisanja, pa tega ne predvidevajo več. Ime avtorja ali avtorjev se ne nahaja več v glavi ali na dnu teksta, ampak ga najdemo šele v historiatu redakcij članka, avtorji se podpisujejo s psevdonimi in se strinjajo, da njihov prispevek takoj postane javna last in predmet nadaljnjih predelav. Avtorstvo je sicer do vejice natančno dokumentirano, vendar ima popolnoma spremenjen status: ni več osrednji element v komunikaciji, ampak je v službi bralca. Naj bo taka tudi bodoča slovenistična literarna veda na spletu.

Bibliografija

Borgman, C. L. (2007). Scholarship in the Digital Age: Information, Infrastructure and the Internet. MIT Press. http://scholcomm.columbia.edu/files/BorgmanColumbia20090324.pdf

Čakš, A. (2010, 17. sept.). Ravnatelj ima nižjo plačo kot pomočnika. Finance 181. http://www.finance.si/289599/Ravnatelj-ima-ni%BEjo-pla%E8o-kot-pomo%E8nika%20--

Greenberg, M. L., A. Emmet (2010, 4. sept.). Zakaj potrebujemo gibanje Prosti dostop: Problem znanstvenega komuniciranja. Delo, Sobotna priloga. 30-31.

Hart, M. (2009). Re: [Humanist] 22.639 looking back, Humanist Discussion Group 22/641. http://lists.digitalhumanities.org/pipermail/humanist/2009-March/000341.html

Hladnik, M. (2008, 20. dec.). Slovene student projects in Wikipedia and Wikisource [Referat na 3. regionalni konferenci Wikimedije v Beogradu].

http://meta.wikimedia.org/wiki/Slovene_student_projects_in_Wikipedia_and_Wikisource

Hladnik, M. (2009). Infrastruktura slovenistične literarne vede. Infrastruktura slovenščine in slovenistike. Ur. M. Stabej. Ljubljana: Znanstvena založba FF (Obdobja, 28). 161-69. Dostopno tudi na spletu.

Kocijan, G. (2010). Nekaj o kritiki in o dveh knjigah mlade znanstvenice. Pripravljeno za objavo v Slavistični reviji.

Merila za volitve v nazive visokošolskih učiteljev, znanstvenih delavcev in sodelavcev. Ljubljana: Univerza, 2001. http://www.ff.uni-

lj.si/fakulteta/Fakulteta/SkupneStrokovneSluzbe/Kadrovska/habilitacije/MerilaZavolitveVNa zive.html

HOW TO START: SETTING UP REPOSITORIES

Iryna Kuchma

EIFL Open Access programme manager e-mail: iryna.kuchma@eifl.net

UDK: 044.65: 655.411

KAKO ZAČETI: VZPOSTAVITEV REPOZITORIJA Ključne besede: prosti dostop, znanost, univerza, projekti How to set up an open repository in 23 steps

(based on the Proposed checklist for the implementation of an Institutional Repository Developed by the Department of Library Services in the University of Pretoria, South Africa)

Making a Case: Explaining the need for a repository & the expected benefits; Strategic Planning and Business Cases; Defining Scope and Planning Checklists

Assumptions:

1. Management has approved the implementation of an institutional repository (IR) (Proposal).

2. A server is in place to host the IR.

3. An IR Manager (project leader) has been identified to manage the project - and will have to do most of the work initially.

Steps 1 - 10

Step 1. Start with a repository Steering Group (or Project Board, Management Committee, Working Group, etc.) that undertakes the high level management of a repository on behalf of the Institution.

Involve key stakeholders: senior management and policy makers, academic staff, library staff, technical support staff, other support staff.

Step 2. Assign a project leader (IR Manager), and identify members to form part of the implementation team (e.g. external consultant, copyright officer, metadata specialist/ head cataloguer, digitization specialist, 2-3 subject librarians, IT etc.).

Step 3. Identify 1 to 4 champions at the faculty to work with initially. Involve them in your meetings and make them part of the implementation team.

Step 4. Conduct a needs analysis and compile a needs analysis report (as an example you can use the

University of Pretoria Digital Institutional Research Repository Needs Assessment (Example only): http://ir.sun.ac.za/wiki/files/needs_assessment.doc).

Step 5. Evaluate available software and decide on which software to use (e.g. you can use Proposal Document Using DSpace Open Source Software to implement a Digital Repository at the University of Pretoria http://ir.sun.ac.za/wiki/files/proposal.doc).

Step 6. Join existing mailing lists.

Step 7. Start thinking of a name for the IR.

Step 8. Decide on how communities and collections will be structured within the IR. Step 9. Define the workflows.

Step 10. Discuss licensing & copyright issues with the legal department. The planning checklist

(adaptation from the Repository Support Project, the UK: http://www.rsp.ac.uk/)

1. What is an institutional repository and what does it mean to you?

2. Have you outlined and documented the purpose and drivers for institutional repository establishment in your institution?

3. Have you defined your vision and initial goals?

4. Have you decided how to position your institutional repository within your wider information environment?

5. What is the target content of the repository?

6. Do you have an institution wide intellectual property rights policy?

7. Do any of your Departments already have other digital stores of publications?

8. How will you manage duplication, transfer of resources and metadata etc.?

9. Does your institution have an information management strategy?

10. Have you defined roles and responsibilities for your institutional repository development?

11. What sort of statistics and management reports will you want from your institutional repository? Have you decided if and how you will collect usage and item download statistics for your repository? Will you use a tool built into your chosen repository, or an external tool or repository add-on? (e. g. you can use recommendations here: http://ir.sun.ac.za/wiki/index.php/Web_Analytics).

Steps 11 - 23

Step 11. Compile a business plan and present to management (e.g. you can use the University of Pretoria Digital Institutional Research Repository Business Plan Example Only http://ir.sun.ac.za/wiki/files/business_plan.doc).

Step 12. Register project with IT department and establish a service level agreement (you can use these recommendations: For Services (The IT guy) http://ir.sun.ac.za/wiki/index.php/Main_Page).

Step 13. Incorporate IR as part of role description for cataloguers & subject librarians. Step 14. Start working on IR policy, and continue to document all important decisions taken. Also address service definition, open access, copyright, preservation, metadata standards, digitization, selection criteria etc.

Step 15. Identify faculty members, which will participate in the evaluation, and present a training session on how to use the software.

Step 16. IT staff deploys software on developmental server and implementation team and other role players evaluate, then moving to the quality assurance server and then to the production server.

Step 17. Create Communities & Collections for faculty champions and populate in order to demonstrate to library staff and community

Step 18. Register IR with international harvesters, search engines, have it listed on web pages etc (for recommendations use

http://www.jiscinfonet.ac.uk/infokits/repositories/technical-framework/registering and

http://www.jiscinfonet.ac.uk/infokits/repositories/technical-framework/search).

Step 19. Start developing a marketing presentation (which can be customized for specific

subject areas), marketing leaflets, training material, online help e.g. copyright clearance

process (for recommendations you can use this presentation:

http://ir.sun.ac.za/wiki/files/marketing.pdf).

Step 20. Introduce IR to rest of community e.g. departments, individuals, etc. Host open sessions over lunch hour, use organisational newsletters, present at meetings & conferences.

Step 21. Invite all to register new collections. Communicate procedure on e.g. IR home page. Frequently communicate e. g. via e-mail, monthly newsletter, etc. Frequently communicate statistics

Step 22. Launch IR when ready. Invite administration, heads of faculties & departments, other key-players etc.

Step 23. Budget each year and plan for the following year. Keep monitoring server capacity, stay updated through mailing lists and reading articles, attending conferences etc.

Staffing requirements:

• Repository Manager - who manages the 'human' side of the repository including content policies, advocacy, user training and a liaison with a wide range of institutional departments and external contacts.

• Repository Administrator - who manages the technical implementation, customisation and management of repository software, manages metadata fields and quality, creates usage reports and tracks the preservation issues

Some recommendations:

http://www.sherpa.ac.uk/documents/Staff_and_Skills_Set_2009.pdf http://www.sherpa.ac.uk/documents/GenericTechJobDescriptionAug09.pdf

Sustainability

(Resourcing repositories for sustainability, adaptation from the Repository Support Project, the UK: http://www.rsp.ac.uk/)

1. Have you properly and fully specified the requirements of your repository?

2. What is the anticipated growth of your repository?

3. Are you running a pilot project or a production service? If the former, who, when, if and how will it transfer to a production service?

4. Who will answer support/help desk queries relating to the repository?

5. Have you considered how your repository may grow over the next year, 3 years, 5 years, 10 years?

6. Which digital formats can the repository commit to preserve in the longer-term? Is the repository collecting author source formats? Is there a viable action plan for monitoring the formats stored in the repository and the preservation risks associated with those formats? Do you know which tools are available to do this?

Marketing and Advocacy

1. Open repository for researchers: Long term preservation and back-up; Usage statistics; Web-presences - personal profiles, actual CVs, publication lists.

Opportunities: Citations, Collaborative projects, Financing.

2. Open repository for research managers: Information management & Research management; Quality assurance: statistics, web metrics, etc; Web-presences - personal profiles; Marketing; Competitiveness; Print-on-demand services; Virtual learning environment.

Opportunities: Collaborative projects, Financing, Good students. Advocacy Options Top-down

1. Explore institutional requirement for deposit (mandates)

2. Obtain supporting statements from the very highest level of the institution.

Invite stakeholders to join repository steering groups to assist in exploring unique institutional challenges; influencing the strategic position of the repository. Keep the Pro-VC for research (or similar) and key committees informed of developments and successes. This ensures the repository is embedded in the organisation.

(The Digital Repositories infoKit:

http://www.jiscinfonet.ac.uk/infokits/repositories/management-framework/options) Advocacy Options Bottom-up

1. Locate repository champions. Enthusiastic early adopters can act as change agents, taking your messages out on a peer-to-peer basis.

2. Demonstrate how new researchers can contribute, and gain a flying start to their careers. Repository usage statistics can provide powerful encouragement.

3. Engage students, especially graduates, by promoting the use of open access research material. In turn they will influence their peers and mentors.

4. Inform and involve support staff, ensuring they understand the importance of the repository to the institution's strategy.

(The Digital Repositories infoKit:

http://www.jiscinfonet.ac.uk/infokits/repositories/management-framework/options) Advocacy Options Targeted

1. Identify so-called 'green' publishers - those who allow self-archiving in any form - and then asking the academics who have published in those journals for permission to deposit those papers in the institution's institutional repository. To check the list of publisher copyright policies on self-archiving, visit RoMEO.

2. Work with departments most likely to benefit from the repository, such as: those reviewing research management/reporting processes; subject areas with Funder

Mandates; those who's academics publish in wide range of journal publications; subject areas with Open Access services such as PubMed Central and Arxiv.

(The Digital Repositories infoKit:

http://www.jiscinfonet.ac.uk/infokits/repositories/management-framework/options) Useful reading

IR Wiki: http://ir.sun.ac.za/wiki/index.php/Main_Page The Digital Repositories infoKit:

http://www.jiscinfonet.ac.uk/infokits/repositories/index_html

Open Access Scholarly Information Sourcebook by Alma Swan and Leslie Chan: http://www.openoasis.org

SPARC Institutional Repository Checklist & Resource Guide: www.arl.org/sparc/bm~doc/IR_Guide_&_Checklist_v1.pdf

Creating an Institutional Repository: LEADIRS Workbook: http://dspace.mit.edu/handle/1721.1/26698

A Guide to Developing Open Access Through Your Digital Repository by Kylie Pappalardo and

Dr Anne Fitzgerald with the assistance of Professor Brian Fitzgerald, Scott Kiel-Chisholm,

Damien O'Brien and Anthony Austin, Open Access to Knowledge Law Project: http://www.oaklaw.qut.edu.au/node/32

PILOT 7. OKVIRNEGA PROGRAMA EVROPSKE KOMISIJE NA TEMO PROSTEGA DOSTOPA IN PROJEKT OPENAIRE

dr. Mojca Kotar

Univerza v Ljubljani, Univerzitetna služba za knjižnično dejavnost e-naslov: mojca.kotar@uni-lj.si

UDK: 655.411:044.65(4)

Izvleček

Znanstvena komunikacija se preoblikuje v smeri prostega dostopa do znanstvenih objav in podatkov brez naročniških ali avtorskopravnih omejitev, kar omogoča večjo vidnost in odmevnost rezultatov znanstvenoraziskovalnega dela ter učinkovitejšo izrabo javnih sredstev. Evropska komisija se je odločila za postopno uvedbo obveznega shranjevanja objav raziskovalcev v prostodostopne repozitorije in v ta namen začrtala pilot 7. okvirnega programa na temo prostega dostopa. Podobne zahteve in dodatno še obvezno shranjevanje podatkov raziskav je postavil tudi Evropski raziskovalni svet. Projekt OpenAIRE bo omogočil vzpostavitev evropske infrastrukture prostega dostopa. Slovenija bo morala zgraditi nacionalno infrastrukturo prostega dostopa do dosežkov slovenskih znanstvenikov.

Ključne besede: znanost, publiciranje, prost dostop, projekt OpenAIRE

OPEN ACCESS PILOT IN FP7 AND OPENAIRE PROJECT Abstract

Communication in science is transforming itself towards open access to scientific publications and data without subscription or permission barriers, which enables better visibility and higher impact of research results as well as more efficient use of public funding. The European Commission decided to gradually mandate the deposit of researchers' publications into open access repositories and drafted an open access pilot in the Seventh Framework Programme. Similar requirements and additional open data mandate were also imposed by the European Research Council. The OpenAIRE project will enable the setting up of the European open access infrastructure. Slovenia will have to build the national infrastructure for open access to the achievements of Slovenian scientists.

Key words: science, public, open access, Open Aire

Sprememba znanstvene komunikacije in odziv Evropske komisije

Znanstvena komunikacija, ki se odvija v obliki znanstvenih revij, se od prvih tiskanih različic sredi 17. stoletja do vključno pojava njihovih elektronskih oblik konec 20. stoletja ni veliko spremenila. Avtorji v člankih, ki jih pregledajo njihovi vrstniki, poročajo o rezultatih svojih raziskav, ki so jih financirale njihove ustanove ali pa so sredstva pridobili na nacionalnih ali mednarodnih razpisih. Pretežni delež objavljenih rezultatov raziskav je financiran iz javnih

sredstev, del je nefinanciranih ali financiranih s strani zasebnih ustanov. Avtorji ob sprejemu članka v objavo svoje materialne avtorske pravice prenesejo na založnika, slednji dostop do rezultatov raziskav omogoča ob plačilu naročnine na revijo. Večina raziskovalcev je zaposlena v javnih zavodih, ki morajo preko plačila naročnin svojim raziskovalcem omogočiti dostop do najnovejših dognanj stroke. Nezadovoljstvu z omejevanjem dostopa do rezultatov javno financiranih raziskav preko naročnin se je pridružilo še spiralno povečevanje cen znanstvenih revij, ki v oteženih finančnih razmerah zahteva vedno večji delež sredstev raziskovalnih ustanov v razvitem svetu in še povečuje razlike v možnostih dostopa do znanstvenih informacij v svetovnem merilu.

Po letu 2000 se v svetu v obliki deklaracij, pobud in projektov vedno bolj širi podpora prostemu dostopu do rezultatov znanstvenoraziskovalnega dela v obliki objav ali podatkov brez naročniških ali avtorskopravnih omejitev in s tem njihovi večji vidnosti in odmevnosti (ne le financiranim iz javnih sredstev). Elektronsko okolje omogoča vzpostavitev prostega dostopa do objav bodisi v obliki avtorjeve končne recenzirane različice članka v plačljivi reviji (t. i. prednatis), shranjene v prostodostopnem repozitoriju, objave v prostodostopni reviji ali kot prosto dostopnega članka v naročniški reviji. Prosto dostopne objave lahko vsebujejo povezave do podatkov ali druge funkcionalnosti. Po zadnjih ocenah je v svetovnem merilu že okoli 20 odstotkov znanstvenih objav prosto dostopnih.

Evropska komisija se je odločila za postopno uvedbo obveznega shranjevanja objav raziskovalcev v prostodostopne repozitorije in s tem možnost prostega dostopa do rezultatov znanstvenoraziskovalnega dela tako, da je začrtala pilot 7. okvirnega programa na temo prostega dostopa. Praktično izvedbo pilota bo omogočil projekt OpenAIRE, v okviru katerega bo vzpostavljena infrastruktura za identifikacijo, shranjevanje, dostop do in nadzor oddaje objav, ki nastanejo v projektih sedmih testnih področij, financiranih s strani 7. okvirnega programa in Evropskega raziskovalnega sveta.

Raziskovalno delo temelji na dosežkih predhodnikov in je vitalno odvisno od možnosti dostopa do in razširjanja znanstvenih informacij. S prostim dostopom do znanstvenih objav in podatkov je napredek znanosti hitrejši, povečata se lahko obseg in razpon raziskav ter izboljša izkoristek javnega financiranja. Omejitve dostopa do in uporabe rezultatov iz javno in zasebno financiranih raziskav upočasnijo in lahko tudi zmanjšajo kakovost in učinkovitost nadaljnjih raziskav ter izrabo javnih sredstev.

Pilot 7. okvirnega programa na temo prostega dostopa

Evropska komisija je avgusta 2008 za čas do konca 7. okvirnega programa zasnovala pilot, v okviru katerega je potrebno v predvidenem roku zagotoviti prost dostop do recenziranih znanstvenih člankov, nastalih v projektih sedmih tematskih področij 7. okvirnega programa (približno 20 odstotkov proračuna 7. okvirnega programa). Ta področja so:

1. energija,

2. okolje,

3. zdravje,

4. informacijske in komunikacijske tehnologije (Izziv 2: kognitivni sistemi, interakcije, robotika),

5. raziskovalne infrastrukture (e-infrastrukture),

6. znanost v družbi,

7. družboslovno-ekonomske in humanistične vede.

Vsak pogodba o sofinanciranju projekta teh področij, ki je bila podpisana po začetku pilota, vsebuje poseben člen (Special Clause 39), ki od raziskovalcev projekta zahteva:

• da članke, v katerih so objavili rezultate projekta, takoj po sprejemu v objavo shranijo v institucionalni ali tematski repozitorij,

• da zagotovijo prost dostop do teh člankov v šestih (energija, okolje, zdravje, informacijske in komunikacijske tehnologije, raziskovalne infrastrukture) ali dvanajstih mesecih (znanost v družbi, družboslovno-ekonomske in humanistične vede).

V Sloveniji je trenutno 45 projektov navedenih področij 7. okvirnega programa, katerih koordinatorji (dva) ali partnerji so tudi slovenske ustanove in bodo morali članke takoj po sprejemu v objavo shraniti v prostodostopni repozitorij ter omogočiti njihovo prosto dostopnost v predvidenem roku (informacija o številu projektov prejeta 15. 10. 2010).

Evropska komisija pričakuje, da bodo raziskovalci v prostodostopni repozitorij shranili svojo končno različico članka (prednatis), ki je vsebinsko popolnoma identična objavljenemu članku v reviji, ni pa še grafično oblikovana v slogu revije. Trenutno že 80 odstotkov založnikov naročniških znanstvenih revij po svetu dopušča tako shranjevanje. Podrobnosti glede dovoljenj je za velike in mednarodne založnike in revije moč najti na spletni strani Sherpa RoMEO (primer za založbo Springer na sliki 1).

Pub|isher: Springer Verlag (Germany)

✓ author can archive pre-print (ie pre-refereeing)

Author's Pre-print:

Author's >

author can archive post-print (ie final draft post-refereeing) author cannot archive publisher's version/PDF

Publisher's Version/PDF:

General • Authors own final version only can be archived Conditions: • Publisher's version/PDF cannot be used

• On author's website or institutional repository

• On funders designated website/repository after 12 months at the funders request or as a result of legal obligation

• Published source must be acknowledged

• Must link to publisher version

• Set phrase to accompany link to published version (The original publication is available at www.springerlink.com)

• Articles in some journals can be made Open Access on payment of additional charge

Mandated OA: Compliance data is available for 34 funders Open Choice

Paid open access:

Copyright: example copyright transfer statement - Self-archiving Policy RoMEO: This is a RoMEO green publisher Updated: 23-Jun-2010. Suggest an update for this record

This summary is for the publisher's default policies and changes or exceptions can often be

negotiated by authors. All information is correct to the best of our knowledge but should not be relied upon for

legal advice.

Slika 1: Informacija o dovoljenjih, pogojih in plačljivi opciji prostega dostopa za založbo

Springer

Podobne zahteve, kot jih je Evropska komisija postavila v pilotu, je Evropski raziskovalni svet zastavil že decembra 2007 (ERC Scientific Council Guidelines for Open Access), kjer dodatno zahteva tudi takojšnjo shranitev podatkov raziskav v ustrezno zbirko in njihovo prosto dostopnost najkasneje v šestih mesecih.

Projekt OpenAIRE

Projekt Open Access Infrastructure for Research in Europe (OpenAIRE) je triletni projekt 7. okvirnega programa v skupni vrednosti 5 mio EUR, s katerim želi Evropska komisija podpreti izvedbo pilota na temo prostega dostopa in zahtev Evropskega raziskovalnega sveta (trajanje projekta od 1. 12. 2009 do 30. 11. 2012). V projektu sodeluje 38 partnerjev iz 26 držav EU in Norveške. Slovenijo zastopa Univerza v Ljubljani.

V okviru projekta bo zgrajena infrastruktura in vzpostavljeni podporni mehanizmi za identifikacijo, shranjevanje, dostop do in nadzor oddaje objav, ki nastajajo v projektih sedmih testnih področij, financiranih s strani 7. okvirnega programa in Evropskega raziskovalnega sveta. Raziskovalcem in ustanovam bodo preko evropskega sistema pomoči s centralno pomočjo in nacionalnimi kontaktnimi točkami zagotovljene potrebne informacije in pomoč. Portal OpenAIRE je že vzpostavljen, ravno tako so sodelavci projekta že pripravili navodila repozitorijem za kompatibilnost s projektom OpenAIRE (OpenAIRE Guidelines 1.0). Skladnost repozitorija s temi navodili omogoča avtomatsko identifikacijo objav raziskovalcev, shranjenih v skladu s posebnim členom številka 39 pogodbe o sofinanciranju.

Slika 2: Portal OpenAIRE

Slika 3: Evropski sistem pomoči in zbirka pogostih vprašanj

V okviru projekta bo v skladu z zahtevo Evropskega raziskovalnega sveta za pet znanstvenih področij analizirana možnost zbiranja in upravljanja podatkov raziskav. Projekt OpenAIRE se povezuje z drugimi iniciativami na temo prostega dostopa, založniki in informacijskimi sistemi o raziskovalni dejavnosti. Za raziskovalce, ki nimajo možnosti shranjevanja objav v institucionalni repozitorij oziroma ni na voljo ustreznega tematskega repozitorija, bo OpenAIRE zagotovil namensko vzpostavljen repozitorij, ki ga bo zgradil CERN.

Vzpostavitev infrastrukture prostega dostopa v Sloveniji

Prost dostop do rezultatov znanstvenoraziskovalnega dela slovenskih raziskovalcev je trenutno mogoč preko člankov, objavljenih v slovenskih sofinanciranih revijah (ki morajo elektronske oblike oddati na portal Digitalne knjižnice Slovenije dLib.si), kar verjetno predstavlja manjši del njihovega publiciranja. Vse preostale objave, če jih raziskovalci niso objavili v prostodostopnih revijah ali sami oziroma njihovi tuji soavtorji shranili v katerega od repozitorijev, niso prosto dostopne njihovim mednarodnim vrstnikom. Slovenija in njeni raziskovalci tako niso deležni dokazanih koristi prostega dostopa do objav in podatkov: država v smislu boljšega izkoristka javnih sredstev, hitrejšega razvoja znanosti in še večje znanstvene prepoznavnosti, raziskovalci pa večje vidnosti in odmevnosti objav.

Čas do novembra 2012, ki ga Evropska komisija v okviru projekta OpenAIRE namenja vzpostavitvi evropske infrastrukture prostega dostopa, bi morali v Sloveniji nameniti vzpostavitvi nacionalne infrastrukture prostega dostopa: sprejeti odločitev o obvezni oddaji objav raziskovalcev v prostodostopne repozitorije (obveza bodisi s strani financerjev raziskav in/ali javnih raziskovalnih zavodov), vzpostavitev osrednje informacijske točke za pomoč raziskovalcem v okolju prostega dostopa, izgradnja nacionalnega repozitorija znanstvenih objav in podatkov ali nacionalnega agregatorja distribuiranih repozitorijev, oba povezana z Informacijskim sistemom o raziskovalni dejavnosti v Sloveniji (SICRIS-om).

Evropska komisija po besedah podpredsednice Neelie Kroes meni, da »morajo biti rezultati raziskav, financiranih iz javnih sredstev, prosto in javno dostopni, namesto da so zaklenjeni za požarnim zidom naročnin znanstvenih založnikov« in bo to stališče upoštevala ob načrtovanju 8. okvirnega programa. Slovenija bi morala slednjega pričakati z ustrezno nacionalno infrastrukturo prostega dostopa do dosežkov slovenskih znanstvenikov.

Bibliografija

ERC Scientific Council guidelines for open access. 17. 12. 2007. Pridobljeno 16. 10. 2010 s spletne strani

http://erc.europa.eu/pdf/ScC_Guidelines_Open_Access_revised_Dec07_FINAL.pdf.

Harnad, S. Current percentage of green and gold OA. American Scientist Open Access Forum [e-pošta], 25. 8. 2010.

Hudson, R. L. EU aims to make data access and planning a part of research funding. Science Business, 7. 10. 2010. Pridobljeno 15. 10. 2010 s spletne strani

http://bulletin.sciencebusiness.net/ebulletins/showissue.php3?page=/548/art/20007&ch=1.

Open access pilot in FP7. European Commission, European Research Area, Publications Office. Pridobljeno 16. 10. 2010 s spletne strani ftp://ftp.cordis.europa.eu/pub/fp7/docs/open-access-pilot_en.pdf.

OpenAIRE guidelines 1.0: guidelines for content providers of the OpenAIRE information space. July 2010. Pridobljeno 16. 10. 2010 s spletne strani

http://www.openaire.eu/attachments/067_OpenAIRE-Guidelines_v1.pdf.

Open Access Infrastructure for Research in Europe - OpenAIRE. Pridobljeno 16. 10. 2010 s spletne strani http://www.openaire.eu/.

Open Access Infrastructure for Research in Europe - OpenAIRE: Liaison Office / National Open Access Desks Toolkit. [15. 6. 2010].

Sherpa RoMEO: publisher's copyright & archiving policies. Pridobljeno 16. 10. 2010 s spletne strani http://www.sherpa.ac.uk/romeo/.

Special clause 39: open access. Pridobljeno 16. 10. 2010 s spletne strani http://ec.europa.eu/research/press/2008/pdf/annex_1_new_clauses.pdf.

Suber, P. Open access overview: focusing on open access to peer-reviewed research articles and their preprints. 15. 9. 2010. Pridobljeno 16. 10. 2010 s spletne strani http://www.earlham.edu/~peters/fos/overview.htm.

PROSTO DOSTOPNA DELOVNA GRADIVA - POT DO UČINKOVITE IZMENJAVE ZNANSTVENIH INFORMACIJ

mag. Kristina Hacin-Ludvik

Banka Slovenije

e-naslov: kristina.hacin@bsi.si

mag. Tjaša Obal

Banka Slovenije e-naslov: tjasa.obal@bsi.si

UDK: 330:001.83

Izvleček

V internetnem okolju smo priča hitremu porastu spletnih mest z bogatim naborom prosto dostopnih delovnih gradiv. Gre za tipično obliko sive literature, ki je na ekonomskem področju visoko cenjena in ima dolgoletno tradicijo. Omogoča hitro in učinkovito kroženje znanstvenih informacij pri relativno nizki ceni objave. Prispevki niso recenzirani, za kvaliteto objavljenega jamčijo priznani avtorji in institucije. Prosta dostopnost zato ne vpliva toliko na porast citiranja, temveč bolj na povečan obseg uporabe, s čimer odpira možnosti za hitrejši dostop do izsledkov svetovne akademske sfere. Na ekonomskem področju spletišča z delovnimi gradivi postajajo prva izbira pri iskanju informacij, princip publiciranja raziskav pa lahko služi kot prototip cenovno ugodnega znanstvenega publiciranja. Zato smo preverili načine izdajanja in uporabe teh gradiv v slovenskem prostoru. V intervjujih s strokovnjaki s področja bančništva smo skušali ugotoviti njihov odnos do uporabe in objavljanja prosto dostopnih delovnih gradiv.

Ključne besede: siva literatura, delovna gradiva, ekonomija, bančništvo, Slovenija, prost dostop, spletišča, avtorske pravice, citiranje

OPEN ACCESS WORKING PAPERS - THE WAY TO EFFICIENT CIRCULATION OF SCIENTIFIC INFORMATION

Abstract

In the Internet environment, we are witnessing the rapid rise of Web sites with rich selection of open access working papers. This is a typical form of the gray literature, which is highly appreciated in the field of Economics, and has a long lasting tradition. These working papers enable a rapid and efficient circulation of scientific information at a relatively low publishing cost. However, the articles are not peer-reviewed. Instead, quality control is guaranteed by recognised authors and institutions. Open access therefore does not improve citation rates, but increase readership and thus makes academic research more accessible on a global scale. In the field of economics, working papers sites are becoming become the preferred venue for the search of information, and the new mode of their publishing research can serve as a prototype of low price scientific publishing. Therefore, we verified the ways of publishing and use of working papers in Slovenia. In interviews with experts in banking we tried to identify their practices in using and posting open access working papers.

Key words: grey literature, working papers, economics, banking, Slovenia, open access, networked information space, copyright, citations

1 Uvod

Pojem siva literatura označuje publikacije (polpublikacije), ki niso dostopne javnosti preko običajnih kanalov (izdajateljev). Namenjene so predvsem zaključenemu poslovnemu ali strokovnemu krogu ljudi. To so razna poročila sej, kongresni zborniki, raziskovalna poročila in delovna gradiva.

Delovna gradiva (working papers - WP) so nekomercialne publikacije (predobjave akademskih člankov, poglavij knjig, recenzij), ki nastajajo v skladu z aktualnimi dogajanji in prinašajo mnenja ter zaključke avtorjev. Namenjene so predvsem komunikacijskemu procesu, v katerem avtorji dobijo povratno informacijo oz. spoznajo strokovna mnenja kolegov. Na področju družboslovja, predvsem ekonomije je bila takšna strokovna komunikacija v praksi že davno. Z razvojem svetovnega spleta pa se je še bolj razmahnila.

1.1 Med sivo literaturo in recenziranimi informacijskimi viri

Med tem ko Davis EP al (2007) ugotavljajo, da je v osem letnem obdobju citiranost člankov shranjenjenih v arXivu porastla za 35 odstotkov, citiranost prosto dostopnih delovnih gradiv ostaja praktično nespremenjena. Kljub nedvomnemu pomenu in tradiciji delovnih gradiv v ekonomiji, avtorji še vedno dajejo prednost citiraju recenziranih člankov, ko ti izidejo. Zato prosti dostop sicer vpliva na porast branosti ne pa tudi na citiranost (Frandsen, 2009). Zbirke delovnih gradiv namreč ne sledijo pravilom izdajateljev in besedila niso recenzirana. Edina potrditev njihove verodostojnosti in kvalitete je renome avtorja ali institucije, iz katere ta izhaja. Z javno dostopnostjo se možnost kritike prenese na širšo strokovno javnost. Kot navajajo Ober et al. (2007), ta nastopa kot nevidna roka na »tržišču idej« in deluje kot arbiter kvalitete. Tako se ocenjevanje kvalitete iz ozkega kroga recenzentov prenese na številne uporabnike, kar lahko postopno vpliva na spremembo kriterijev za merjenje kvalitete.

1.2 Pomen in vloga prosto dostopnih delovnih gradiv

Prosto dostopna spletišča z delovnimi gradivi zagotavljajo, da se izsledki svetovne akademske sredine iz ozko zaprtih krogov razširijo med zainteresirano javnost in tako omogočajo hitro izmenjavo idej. Informacija postaja »javno dobro«, ki lahko bistveno vpliva na kvaliteto znanstvenih objav. Glede na to, da so ekonomisti, ki so že profesionalno občutljivi na razmerje med ceno in doprinosom vložka, od nekdaj podpirali izdajo delovnih gradiv, so še toliko bolj naklonjeni cenejšim in ažurnim spletnim izdajam. Spletišča z delovnimi gradivi zato postajajo prva izbira pri iskanju informacij. Njihova uporaba se širi ne glede na geografske meje.

Ker gre za dela »v nastajanju«, lahko avtorji s t. i. predobjavo »registrirajo« svoja odkritja, preden se zaključi dolgotrajni proces objave recenziranega prispevka. V tem obdobju

navadno nastane več različic. Soočenje strokovnih mnenj, ki ga nudi prosta dostopnost delovnih gradiv, pa lahko vodi do zelo spremenjene končne objave v priznanih znanstvenih revijah. Zato se odpirajo vprašanja glede trajnosti in ažurnosti teh objav. Snovalci spletnega mesta delovnih gradiv na Princetonu menijo, da morajo biti na spletu arhivirane različice časovno označene, oz. ustvarjene povezave z njihovimi objavami v sferi tradicionalnih založnikov (Ober, 2007).

Zastavlja pa se vprašanje, kakšno vlogo lahko pri tem igrajo komercialni založniki in kakšno knjižnice. Založniki skušajo ohraniti svojo tradicionalno mesto v založništvu na osnovi zaščite intelektualne lastnine. Kot ugotavlja Blaaij (1999), je možno, da so velike založniške hiše že v zatonu. Nedvomno jim spletne objave delovnih gradiv kot prototip cenovno ugodnega znanstvenega publiciranja predstavljajo nov izziv iz digitalnega sveta. Za knjižnice pa prosto dostopna delovna gradiva predstavljajo možnost za »brezplačno« obogatitev svoje ponudbe.

2 Dostopnost delovnih gradiv s področja ekonomije oz. bančništva

Finančne ustanove kot so IMF (Mednarodni denarni sklad), BIS (Banka za mednarodni razvoj), EBRD (Evropska banka za raziskave in razvoj) in organizacija OECD (Organizacija za ekonomsko sodelovanje in razvoj) ter večina centralnih bank tako Evrosistema kot Ameriške centralne banke (Federal Reserve System - FED) ponujajo svoja delovna gradiva brezplačno. Dosegljiva so pod različnimi imeni kot npr. discussion papers, research technical papers, working paper series. Obravnavajo splošne in ozko specializirane teme (npr.: gospodarstvo, socialne zadeve posameznih držav, denarno in fiskalno politiko itd.). Frekvenca izhajanja ni določena. Odvisna je od aktualnih problemov, ki jih avtorji želijo izpostaviti.

Tudi mnogi nacionalni in privatni inštituti kot so NIESR - Britanski nacionalni inštitut za ekonomske in sociološke raziskave, WIIW - Dunajski inštitut za mednarodno gospodarstvo, WIFO - Avstrijski inštitut za gospodarstvo, Petersonov inštitut za mednarodno ekonomijo ipd. ponujajo prosti dostop do vseh svojih delovnih gradiv. Tematika je v glavnem povezana s svetovnim in domačim gospodarstvom.

Med tem ko spet drugi inštituti kot npr. CEPR (Center for economic policy research) dostope do delovnih gradiv zaračunavajo. Prosto dostopni so samo izvlečki.

V teoriji bi bilo spletno mesto delovnih gradiv po zgledu ProQuestovega prostega dostopa do disertacij zelo dobrodošel komunikacijski kanal. Vendar so se do sedaj založniki na takšne potrebe odzvali tako, da v svoje zbirke vključujejo delovna gradiva, jih ustrezno indeksirajo in svojim naročnikom ponujajo direktni dostop do polnih besedil ali povezave na osnovne spletne strani. Pri povezavah je potrebno poudariti, da so gradiva, ki jih institucije t. i. izdajateljice zaračunavajo, plačljiva.

2.1 Dostopnost delovnih gradiv slovenskih institucij

Tudi v Sloveniji se srečujemo s ponudbo delovnih gradiv z ekonomskega področja. Gre za tematiko s področja ekonomije, poslovnih znanosti in poslovne informatike predvsem naravnano na ravnanje slovenske ekonomske politike in slovenskih podjetij. Delovna gradiva

izdajajo razne ustanove kot npr.: UMAR (Urad RS za makroekonomske analize in razvoj), IER (Inštitut za ekonomske raziskave) in RCEF (Raziskovalni center ekonomske fakultete) ter EIPF (Ekonomski inštitut pravne fakultete). Objavljajo jih na svojih domačih straneh v obliki polnih besedil in so prosto dostopna, razen EIPF, ki objavlja le povzetke. Da bi omogočili čim širšo izmenjavo mnenj tako doma kot tudi po svetu in spodbudili hitro izmenjavo idej izdajajo tudi različice v angleškem jeziku.

3 Mnenja strokovnjakov o uporabnosti, dostopnosti in relevantnosti delovnih gradiv

Na podlagi mnenj strokovnjakov, ki smo jih pridobili s pomočjo intervjujev z uporabniki knjižnice Banke Slovenije, smo ugotavljali uporabo, dostopnost in relevantnost delovnih gradiv.

Mnenja intervjuvancev potrjujejo, da so delovna gradiva priljubljena zaradi svežih informacij in ciljne naravnanosti publikacij ne glede na časovno obdobje. Uporabniki se pri spremljanju gradiv osredotočajo predvsem na ciljno tematiko. Le nekateri spremljajo posameznega avtorja ali renomirano ustanovo oz. zgolj starejše ali novo izdane publikacije.

Do gradiv dostopajo preko internetnih strani izdajateljev, občasno pa tudi preko strani avtorjev - raziskovalcev. Pregledujejo in shranjujejo jih v elektronski obliki, za bolj poglobljeno branje pa si jih natisnejo. Le redko se poslužujejo knjižnične izposoje, arXiva pa ne poznajo. Večina pa meni, da bi bilo smiselno vzpostaviti spletno mesto prosto dostopnih delovnih gradiv, ki bi bila ustrezno indeksirana.

Zanimivo je, da prav vsi intervjuvanci izsledke delovnih gradiv citirajo pri svojem delu. Za objavljanje delovnih gradiv pa se odločajo zaradi prepoznavnosti tovrstnih publikacij v strokovni javnosti in seveda, če to narekuje usmeritev ustanove, v kateri so zaposleni.

4 Zaključek

Prosti dostop do delovnih gradiv omogoča hitro interakcijo med strokovnimi krogi in obveščenost širše javnosti z določeno aktualno problematiko, hkrati pa zagotavlja množični odziv oz. kritiko na določeni problem. Knjižnice, ki skrbijo za pretok informacij, bi se morale vključiti v ta proces. Predvsem na področjih, kjer ima izdajanje delovnih gradiv bogato tradicijo, bi bilo smiselno izkoristiti ta brezplačni komunikacijski kanal. Knjižničarji imajo za to vsa potrebna specialna znanja. S sistematično - vsebinsko in kronološko organizacijo spletnih mest z delovnimi gradivi lahko zapolnijo vrzel med drago komercialno in razpršeno prosto dostopno ponudbo gradiv. Poleg tega lahko s spremljanjem uporabe nudijo podatke za oblikovanje dodatnih kriterijev merjenja kvalitete znanstvene uspešnosti.

Bibliografija

Banka Slovenije. Ljubljana: Banka Slovenije. Pridobljeno 2. 8. 2010 s spletne strani: http://www.bsi.si/

Blaaij, Cees A.T. Intellectual property on the move: some observations on author's rights, grey literature, publishers and last but not least access to information in a cyberian age. GL'99 plenary session three, p. 143-155

Central bank websites. (4. 3. 2009). Basel:Bank for international settlement. Pridobljeno 2.8.2010 s spletne strani: http://www.bis.org/cbanks.htm

Davis, P.M., Fromerth, M.J. (2007). Does the arXiv lead to higher citations and reduced publisher downloads for matematics articles? Scientometrics, vol. 71, no. 2, p. 1-17.

Delovni zvezki. Ljubljana: EIPF, Ekonomski inštitut d.o.o. Pridobljeno 2. 8. 2010 s spletne strani: http://www.eipf.si/publikacije/delovni-zvezki.html

Discussion papers. London: Center for economic policy research. Pridobljeno 2. 8. 2010 s spletne strani: http://www.cepr.org/pubs/new-dps/dp_papers.htm

Ebscohost. Birmingham: Ebscohost - world's foremost premium research database service. Pridobljeno 2. 8. 2010 s spletne strani: http://search.ebscohost.com/

ECB: Research bulletin ECB. Frankfurt: European central bank homepage. Pridobljeno 2. 8. 2010 s spletne strani: http://www.ecb.int/home/html/index.en.html

Ekonomska fakulteta Univerze v Ljubljani. Ljubljana: Raziskovalni center ekonomske fakultete. Pridobljeno 2. 8. 2010 s spletne strani: http://www.ef.uni-lj.si/rcef/delovniZvezki.asp

European bank for reconstruction and development. Pridobljeno 10. 8. 2010 s spletne strani: http://www.ebrd.com/pages/homepage.shtml

Frandsen, T. F. The effects of open access on un-published documents: a case study of economics working papers. (12.01.2009). Pridobljeno 3. 8. 2010 s spletne strani: http://hprints.org/docs/00/35/23/69/PDF/OA_advantage_for_WP.pdf

IMF working papers. Washington, DC: International monetary fond. Pridobljeno 2. 8. 2010 s spletne strani:

http://www.imf.org/external/pubs/cat/wp1_sp.cfm?s_year=2010&e_year=2010&brtype=de fault

Inštitut za ekonomska raziskovanja. Ljubljana: Inštitut za ekonomska raziskovanja. Pridobljeno 2. 8. 2010 s spletne strani: http://www.ier.si/content-57.php

National institute of economic and social researches. Pridobljeno 10. 8. 2010 s spletne strani: http://www.niesr.ac.uk/index.html

OECD working paper series. Paris: Organisation for economic co-operation and development. Pridobljeno 2. 8. 2010 s spletne strani:

http://www.oecd.org/document/7/0,3343,en_2649_201185_44222919_1_1_1_1,00.html

Open to responses. Frankfurt: Committee of european banking supervisors. Pridobljeno 2. 8. 2010 s spletne strani: http://www.c-ebs.org/Publications/Consultation-Papers/Open-to-responses.aspx

Peterson institute for international economics. Pridobljeno 10. 8. 2010 s spletne strani: http://www.iie.com/

Proquest. Cambridge: Proquest - central to research around the world. Pridobljeno 2. 8. 2010 s spletne strani: http://proquest.umi.com/login

Towards open access in ancient studies: the princeton-standford working papers in classics. (February 2007). Pridobljeno 2. 8. 2010 s spletne strani: http://www.atypon-link.com/ASCS/doi/pdf/10.2972/hesp.76.1.229?cookieSet=1

UMAR - delovni zvezki. Ljubljana: Urad za makroekonomske analize in razvoj. Pridobljeno 2. 8. 2010 s spletne strani: http://www.umar.gov.si/publikacije/delovni_zvezki/?no_cache=1

WIFO - working papers. Wien: Österreichisches Institut für Wirtschaftsforschung. Pridobljeno 2. 8. 2010 s spletne strani: http://www.wifo.ac.at/wwa/jsp/index.jsp?&fid=27840

PROST DOSTOP IN PRENOS SLOVENSKIH BIOTEHNIŠKIH ZNANSTVENIH DOKUMENTOV V SISTEME FAO AGRIS (WEBAGRIS) IN GOOGLE UČENJAK (SCHOLAR)

Izr. prof. dr. Tomaž BARTOL

Univerza v Ljubljani, Biotehniška fakulteta, Oddelek za agronomijo e-naslov: tomaz.bartol@bf.uni-lj.si

UDK: 655.411:044.65:57

Izvleček

V internetnem okolju smo priča hitremu porastu spletnih mest z bogatim naborom prosto dostopnih delovnih gradiv. Gre za tipično obliko sive literature, ki je na ekonomskem področju visoko cenjena in ima dolgoletno tradicijo. Omogoča hitro in učinkovito kroženje znanstvenih informacij pri relativno nizki ceni objave. Prispevki niso recenzirani, za kvaliteto objavljenega jamčijo priznani avtorji in institucije. Prosta dostopnost zato ne vpliva toliko na porast citiranja, temveč bolj na povečan obseg uporabe, s čimer odpira možnosti za hitrejši dostop do izsledkov svetovne akademske sfere. Na ekonomskem področju spletišča z delovnimi gradivi postajajo prva izbira pri iskanju informacij, princip publiciranja raziskav pa lahko služi kot prototip cenovno ugodnega znanstvenega publiciranja. Zato smo preverili načine izdajanja in uporabe teh gradiv v slovenskem prostoru. V intervjujih s strokovnjaki s področja bančništva smo skušali ugotoviti njihov odnos do uporabe in objavljanja prosto dostopnih delovnih gradiv.

Ključne prost dostop, znanstveno publiciranje, internet

OPEN ACCESS WORKING PAPERS - THE WAY TO EFFICIENT CIRCULATION OF SCIENTIFIC INFORMATION

Abstract

In the Internet environment, we are witnessing the rapid rise of Web sites with rich selection of open access working papers. This is a typical form of the gray literature, which is highly appreciated in the field of Economics, and has a long lasting tradition. These working papers enable a rapid and efficient circulation of scientific information at a relatively low publishing cost. However, the articles are not peer-reviewed. Instead, quality control is guaranteed by recognised authors and institutions. Open access therefore does not improve citation rates, but increase readership and thus makes academic research more accessible on a global scale. In the field of economics, working papers sites are becoming become the preferred venue for the search of information, and the new mode of their publishing research can serve as a prototype of low price scientific publishing. Therefore, we verified the ways of publishing and use of working papers in Slovenia. In interviews with experts in banking we tried to identify their practices in using and posting open access working papers.

Key words: open access, scientific publishing, internet

Uvod

Podatkovna zbirka AGRIS (International Information System for Agricultural Science and Technology) vsebuje več milijonov bibliografskih zapisov z vseh področij biotehniških znanosti. Komercialno je dostopna prek namenskih iskalnih programov (npr. OVID), brezplačno in brez omejitev pa tudi prek strežnika FAO (Food and Agriculture Organization -of the United Nations). Agris velja za enega najstarejših globalnih večjezičnih informacijskih sistemov. Podatki se zbirajo lokalno po mednarodni metodologiji, in sicer ob upoštevanju normativne kontrole za glavne bibliografske elemente. Pri osrednjem centru v Rimu se podatki z nacionalnih centrov združijo v globalno zbirko. Zbirati in procesirati je možno različne tipe dokumentov. Zapise prispevajo pooblaščeni nacionalni, mednarodni in medvladni centri s celega sveta. Pomemben element sistema Agris je tudi večjezični tezaver (biotehniška ontologija) Agrovoc.

Metode: vnos podatkov v lokalno zbirko

Slovenija se je v sistem vključila l. 1994. Programska oprema se je namestila na izbrane osebne računalnike na centru Agris pri Biotehniški fakulteti. Na začetku je bila v rabi aplikacija, vezana na MS DOS, kasneje pa nova programska oprema (strežnik Xitami + program WebAgris), ki je omogočila delo v sodobnih računalniških okoljih. Lokalni sistem za upravljanje podatkov WebAgris je prek gesla spletno dostopen povsod v lokalni hišni mreži. Vhodne maske imajo več strani (Slika 1). Poseben poudarek je namenjen normativni vsebinski obdelavi ter podatkom za spletne (URL) naslove različnih elementov. Pri periodiki je možno vnesti informacijo tako o spletni strani posameznih prispevkov kot revije v celoti. Normativna vsebinska obdelava s predmetnimi oznakami iz tezavra Agrovoc (17,000 kontroliranih deskriptorjev in več kot 10,000 drugih identifikatorjev) je pomembna predvsem zato, ker postanejo predmetne oznake - tako deskriptorji kot širše predmetne aktegorije -tudi element bibliografskih zapisov, ki jih indeksira Google učenjak. Angleške predmetne oznake slovenskim dokumentom priredi informacijski strokovnjak, specialist za mednarodno biotehniško terminologijo.

Rezultati: prenos podatkov na globalni splet

Po vnosu zaključene skupine metapodatkov, npr. za nek kongresni zbornik, posamezno številko ali letnik revije se v vhodni maski določi razpon lokalno oštevilčenih zapisov, ki se prepišejo v datoteko formata XML (Slika 2). Datoteka se nato kot priponka pošlje na centralno enoto pri FAO. Lokalno zbrani in na FAO poslani podatki se po končni redakciji objavijo globalno in postanejo dostopni kot normirana zbirka, kjer so urejene povezave do celotnih besedil (Slika 3). Zbirka je dostopna prek različnih portalov (npr. že prej omenjeni OVID). Bibliografske zapise oz. metapodatke, vključujoč povezavo do celotnega besedila vsakega zapisa, že kmalu zajame tudi Google učenjak (Slika 4). Deskriptorji vsakega zapisa so prek Googla najdljivi tudi v španski in francoski obliki (Slika 5), saj se že na ravni lokalnega vnosa avtomatsko prevedejo iz angleščine tudi v ta dva jezika. Na spletu je za obdobje več kot 15 let tako dostopnih že skoraj 5000 zapisov iz Slovenije. Za zadnja leta so pri vseh zapisih urejene povezave do celotnih besedil in spletnih strani publikacij (Slika 5).

Sklepi

Podatkovna zbirka za biotehniške informacije AGRIS predstavlja dokaj edinstven globalni kooperativni informacijski sistem, kjer lahko sodelujoče dežele oz. centri po skupni kooperativni metodologji pospešijo dostop do celotnih besedil znanstvenih podatkov iz svojega okolja. Dokumenti, ki jih indeksira zbirka in posledično Google Scholar so v polnem besedilu formata pdf tudi sicer objavljeni na različnih strežnikih, tako da bi jih Google našel v vsakem primeru, vendar pa je treba poudariti, da gre pri zajemanju dokumentov prek sistema WebAgris za organiziran in spletno javno dostopni bibliografski sistem, ki je normiran po mednarodnih standardih. Na različnih ravneh se tu prepletajo dejavnosti tradicionalnih bibliografskih baz, elektronskega založništva, odprtega arhiviranja in odprtega dostopa. Sistem deluje kot dodatni povezovalni repozitorij za različne slovenske biotehniške dokumente v celotnem besedilu. Ti dokumenti so lahko objavljeni na različnih strežnikih, a jih prek sistema Agris povezuje skupna normativna obdelava oz. številni mednarodno standardizirani metapodatki. To povečuje njihovo vidnost in najdljivost na globalnem spletu in tako prispeva k promociji znanstvenih objav in domačih publikacij.

Slika 1: Priprava maske za vnos podatkov, primer Slovenian Veterinary Research

-<clc:title >:ml:lang="en">|

- <![CDATA[

Survey of predatory mites of family Phytoseiiclae Berlese in apple orchards in northeast part of Slovenia]] :: </ags:creator Personals

<ags:creatorConference>8th Slovenian Conference on Plant Protection (8. slovensko posvetovanje o varstvu rastlin), Radenci (Slovenia), 6-7 March 2007</ags:creatorConference>

- <ags:publisherName>

- <i[CDATA[Plant Protection Society of Slovenia, Ljubljana (Slovenia)]]::

</ags:publisherName> <ags:publisherPlace>Ljubljana (Slovenia)</ags:publisherPlace>

;dc:identifier scheme="ags:ISBN">978-961-90950-5-8</dcidentifier;

- <dc:identifier scheme="dcterms: URI">

<i[CDATA[http://www.dvrs.bf.uni-lj.si/spvr/2007/34miklavc_07.pdf]]

</dc: identifiers

Slika 2: Bibliografski zapis v lokalni bazi v formatu XML, primer 8. slovensko posvetovanje o

varstvu rastlin

□ Seasonal dynamics of xyogenesis and phloiemogenesis in silver fir (Abies alba Gricar, J.; Oven, P.; Cufar, K. nmn^

View full-text

Tim

□ structure of high quality beech stands with regard to their volume and value, and their increment in Slovenia Kadunc, A.; Kotar, M. more^

View full-text

Slika 3: Seznam zapisov v globalni bazi, primer Zbornik gozdarstva in lesarstva

Scholar

Articles and patents

anytime | include citations ^ Create email alertResults 31

Genetic paiaineteis for growth in Charolais calves: Genetski parametri za rast pri teletih sarole pasme

M Cepon... - Acta agriculturae Slovenica (Slovenia), 2008 - agris.fao.org

... Availal]ility number, 20I]8I]|]0I]58. Serial Title, Acta agriculturae Slovenica (Slovenia). Serial ID -

ISSN, 158I]-4I]|]3.... BFUL (Slovenia). Jamnlkarjeva 101. 1I]0I] Ljubljana, Slovenia. Contact: Tomai

BARTOI_____URL: http://www.agroweb.bf.unl-lj.3i/. AGRIS 2010 - FAO of ttie United Nations

Cached

Response of tomato cultivars differing in growth habit to nitrogen and phosphorus fertilizers and spacing on vertisol in Ethiopia: Vpliv gnojenja z dušikom in fosforjem ...

T Balemi... - Acta agriculturae Slovenica (Slovenia), 2008 - aghs.fao.org ... Availability number, 200800G011. Sehal Title, Acta agriculturae Slovenica (Slovenia). Sehal ID -ISSN, 1580-4003.... BFUL (Slovenia). Jamnlkarjeva 101. 1000 Ljubljana, Slovenia. Contact: Tomaz BARTOL.... URL: http://www.agroweb.bf.unl-lj.si/. AGRIS 2010 - FAO of the United Nations Cached - Find in COBIB.SI

Plant disease resistance genes: Geni za odpornost proti škodljivim organizmom pri rastlinah

p Kozjak... - Acta agriculturae Slovenica (Slovenia), 2008 - aghs.fao.org

Ävail3hilit^/nllmhpr 9nnRnnnni3 Rph^l Titip flrtn nfiriciiltiirnp Slnvpnir^ ffilnvpninl Serial ID -_

Slika 4: Seznam, kot ga generira Google Učenjak, primer Acta Agriculturae Slovenica

~ Goto AGRIS search

,cta agriculturae Slovenica (20138)

3enetic parameters for growth in Charolais calves

epon, M., l-jutiljana Univ. (Siovenia). Biotechnicai Fac., Zootechnicai Dei^.; Simcic, M.

Record iiiiiiiher Title (si)

Personal fiiitliors

Diite of |>ul)lici)tioii

AGRIS Categories

AGROVOC Eiiylisli terms

AGROVOC French terms

AGROVOC Spanish terms

Language Fullt^Kt

SI2008000058

Genetski pnrametri za l ast pri teletih sarole pasme

Cepon, M., Ljubljana Univ. (Slovenia). Biotechnicai Fac., Zootechnicai Deist; Simcic, M.

2008

Animal genetics and breeding; Mathematical and statistical methods

Cattle; Calves; Breeds (animals); Genetic parameters; Body weight; Genetic correlation; Heritability; Genetic inheritance; Statistical methods; ivlodels; Data collection; Sex; Age

Bovin; Veau; Race (animal); Parametre geneticjue; Folds corporel; Correlation genetigue; Heritabiiite; Heredite; ivlethode statistigue; ivlodele; Collecte de donnees; Sexe; Age

Ganado bovino; Ternero; Razas (animales); Parametros geneticos; Peso corporal; Correlacion genetica; Heredabilidad; Herencia genetica; ivletodos estadisticos; ivlodeios; Coieccion de datos; Sexo; Edad

English

httij;ffaas.bfrg,uni-li,si/92-20Q8/FDF/92-20Q8-2-1 Q3-1 Q9.Pdf_

omogoča Coiigfi

▼About the Title Lai^aS GENETIC PARAMETERS FOR GROWTH Genetic parameters for yrowtli in Charolais calves. 113. Table 1. Descriptive statistics for birth weight (kg) and body weights (l<g) up to one year... aas.bf.uni-lj.si

▼About the Title [a:i£i!ö] lzvlečl<i 92(december 2Wß\2 V manjši meri pa pasmo še vedno uporabljajo la prirejo mleka v tradicionalnih regijah za planšarstvo ... GENETSKI PARAMETRI ZA RAST PRI TELETIH ŠAROLE PASME ... aas.bf.uni-lj.si

▼About the author Cepon, tt^.,

Ljubljana Univ. ffiJSjia)

GENETIC PARAMETERS FOR GROWTH I

a) Univ. of Ljiil>ljana, Biotechnical Fac., Dept. of Animal Science, Groblje 3, ... Key words: cattle / calves / l)reeds / Charolais genetic parameters / body .... Cepon, M et al. Genetic parameters for growth in

Slika 5: Bibliografski zapis s povezavami do celotnega besedila (Google Učenjak) Bibliografija

Bartol, T. (1997). Present state and possible future roles of AGRIS in the European library community : the Slovenian experience. Quarterly Bulletin of IAALD, 42 (3-4), 213-218.

Bartol, T. (2008). Pregled zbiranja in urejanja metapodatkov pri sistemu za upravljanje biotehniške zbirke WebAgris. Knjižnica, 52 (4), 89-109.

Kaloyanova, S., Onyancha, I., Salokhe, G., Ward, F.L.H. & H. Keizer, J. (2007). Information technologies and standards for agricultural information resources management: AGRIS application profile, AGROVOC and LISAGR. Quarterly Bulletin of IAALD, 52 (1-2), 17-21.

Onyancha, I., Keizer, J., Anibaldi, S. & Katz, S. (2001). A Dublin Core Application Profile in the Agricultural Domain. V International Conference on Dublin Core and Metadata Applications. Tokyo: National Institute of Informatics. Pridobljeno 15. 10. 2010 s spletne strani: www.fao.org/agris/AgMES/Conferences/DC-2001/Dc-2001x.ppt.

Sini, M., Lauser, B., Salokhe, G., Keizer, J., Katz, S. (2008). The AGROVOC Concept Server: rationale, goals and usage. Library Review, 57 (3), 200-212.

Subirats, I., Onyancha, I., Salokhe, G., Kaloyanova, S., Anibaldi, S., Keizer, J. (2008). Towards an architecture for open archive networks in agricultural sciences and technology. Online Information Review, 32 (4), 478-487.

WEBAGRIS Information Management System for Description, Processing and Dissemination of Agricultural Bibliographic Information (2006). Version 2.0. User Guide. Rome: FAO. Library and Documentation Systems Division. Pridobljeno 15. 10. 2010 s spletne strani: ftp://ext-ftp.fao.org/GI/Reserved/Agris/Software/WebAgris/version20/WebAgris2.pdf.

NOVI PRISTOPI K IZDAJANJU ZNANSTVENE LITERATURE - DIGITALNA KNJIŽNICA PEDAGOŠKEGA INŠTITUTA: OBJAVLJAMO - TUDI NESUBVENCIONIRANE ZNANSTVENE KNJIGE

dr. Jonatan Vinkler

Pedagoški inštitut

e-naslov: jonatan.vinkler@gmail.com

UDK: 001.816:655.41

Ključne besede: znanost, e-založništvo, digitalne knjižnice, prost dostop

Slovenski humanistični in družboslovni raziskovalci - tisti seveda, ki kljub vse hujšemu pritisku po objavljanju v katerem od „obče razumljivih" jezikov, npr. v angleščini, še vztrajajo pri pisanju svojih del v materinščini - se v zadnjem desetletju in pol praviloma vsako leto oz. z vsakim novim razpisom spoprijemajo z isto neprijetnostjo. Z do brezumja institucionaliziranimi ter instrumentaliziranimi, toda realno vse manjšimi možnostmi, da bi lahko svoje raziskave publicirali v tiskani monografski izdaji in v isti sapi še ob pomoči državne subvencije; če se seveda ne ponašajo z bolj ali manj efemernim mestom v tem ali onem znanstveno strukturnem in posledično izdajateljskem klanu, omrežju ali kar je temu podobnega. Vzrokov za to stanje je več.

• Permanentna neumeščenost izvirne znanstvene publicistike v slovenskem jeziku v ključne politične in razvojne dokumente slovenske države (nacionalni kulturni program) in tozadevna neopredeljenost proračunskega vira in obsega stalnega financiranja.

• Neobstoj konsistentnih in kolikor moči trajnih (tudi nespreminjanih oz. takih, ki ne bi bili menjani čez noč, nasilno in brez tehtnih razlogov) kriterijev za dodeljevanje pomoči, ki bi bili konsenzualno določeni znotraj znanosti, ne pa tiholazniško ex cathedra vsiljeni s strani samozvane znanstvene birokracije na ARRS.

• Miselno izhodišče, da je dolžnost vsakega raziskovalca in univerzitetnega učitelja -publiciranje - itak del njegove redne raziskovalne ali univerzitetne dejavnosti in zato ne potrebuje posebne finančne odmene.

• Načelo, po katerem se iz državnega proračuna ne subvencionirajo avtorski honorarji, temveč do 70 % stroškov lekture, oblikovanja, preloma, tiska ali razmnoževanja digitalnega nosilca, kar založnike po inerciji navaja na dvoje: na omejitev ter nato na dokončno ukinitev avtorskega honorarja in na vztrajanje pri do okostenelosti zastarelih oblikah založniške organizacije in produkcije (Tako je tudi zaradi ne dovolj velike uredniške in izdajateljske usposobljenosti/spretnosti večine novodobnih slovenskih založnikov in organizacijske strukture procesa, ki je ostala več ali manj nespremenjena od časa izdelave knjige s klasičnim stavkom in tako neprilagojena sodobnim zahtevam in možnostim.)

• Posledično:: povečini ne posebej pobuden, zagotovo pa le z redkimi izjemami uspešen spoprijem slovenskih založnikov z zahtevami sodobnega znanstvenega izdajateljstva na eni ter z zmožnostmi modernega namiznega založništva na drugi.

• Zato:: draga produkcija in vse prej kot široka ter učinkovita distribucija, kar kajpak ne omogoča ravno znatnejše recepcije napisanega. - In tako:: nesmotrna poraba

davkoplačevalskega denarja, ki, namesto da bi spodbujal številna nova izvirna dela, polni žepe posameznih podeželskih izdajateljskih „tajkunov", ki se želijo tako ali drugače vrniti v anale slovenskega znanstvenega izdajateljstva in se kajpak ponavadi precej samosilniško odločajo, kdo da bo objavil in kaj; oz.: če ni subvencije, ki gre praviloma vsa v založnikov žep, ni objave.

Zavoljo sinergije omenjenega ostaja običajna izdelava tiskane znanstvene knjige v slovenskem jeziku in ob skromni nakladi (vsa dela še zdaleč ne dosežejo statusa znanstvenega bestsellerja, kot ga je npr. prevod Figesove ruske kulturne zgodovine -Natašinega plesa) še vedno precej zapletena in - predvsem - zelo draga operacija. V prehod besedila od rokopisa do tiska je vključenih večje število delovalnikov, ki za svoje delo kajpak pričakujejo tudi plačilo, končni stroški, ki jih ima založba s posamezno znanstveno izdajo, pa ponavadi že pred izidom, tiskovno konferenco in začetkom distribuiranja po knjigarnah in knjižnicah znatno presežejo subvencijo, ki jo je na razpisih založniški hiši priboril avtor.

Z zaključkom tiska, vezave in pakiranja pa se zadrege šele začnejo, kajti kot po pravilu se s sveže natiskanimi znanstvenimi knjigami v slovenskem jeziku v fazi distribucije dogaja, kot se je z umetniškimi deli, ki so jih po celi tedanji Evropi agenti ruske carice Katarine II. (tudi na ne najbolj transparenten način) »zbirali« za svojo vladarico: Katarina je namreč o slikah in kipih, ki so bili pripeljani v St. Peterburg, menda dejala, da jih bodo odslej gledali ona in - miši. Lete si namesto bralcev ponavadi ogledujejo tudi slovenske znanstvene knjige, ki se še leta po natisu grmadijo v depojih posameznih založb. Naklada tako v večini primerov še dolgo po izidu sameva nerazprodana, kajti založba ima s tiskanimi knjigami kajpak legitimen ekonomski interes - vsaj povrniti produkcijske stroške, če ne že zaslužiti -, le-tega pa ni mogoče realizirati brez razvejanih distribucijskih in prodajnih poti knjigarnam, knjižnicam in zasebnikom.

Kot odgovor na zgoraj ubesedeno in kot zelo verjeten izhod iz te, za avtorja in založbo zagotovo nezavidljive situacije, predvsem pa kot prostor poudarjene objavljalne svobode, je bila kot izvirni avtorski, toda s strani ARRS ali JAKRS nefinancirani (!) projekt zasnovana digitalna, netiskana uredniško-izdajateljska platforma Digitalna knjižnica. Platforma torej, kjer morejo iziti tudi dela, ki niso nujno zaukazana v palačah prav po kafkovsko romaneskno perfidne znanstvene administracije - ključna pogoja sta zgolj in samo znanstvena tehtnost ter tekstovna odličnost.

Gonilo Digitalne knjižnice je obsežno splošno in posebno vedenje o uredniški in izdajateljski teoriji, še zlasti pa praksi ter poseben (avtorsko zaščiten tehnološki) postopkovnik, ki omogoča hitro (povprečni čas od prevzema besedila do končne objave je 14 dni) in kar najbolj ceneno inkubacijo besedila od rokopisa preko urejanja, opremljanja, oblikovanja in preloma do digitalizacije v obliki knjige in nazadnje posredovanja le-te bralcu v formi flipbook in pdf datotek(e). Distribucija slednje pa ni le množična, kar so sanje vsakega založnika, temveč globalna, planetarna in cenena, kajti temeljni distribucijski kanal za izdaje Digitalne knjižnice je svetovni splet. Skratka: pri Digitalni knjižnici gre za založbo oz. njen strukturni del za ustvarjanje celovitih digitalnih izdaj znanstvene literature, katerih distribucija je svetovna in tako za založnika kot za bralca praktično brezplačna. Izdaje izhajajo v obliki, ki je identična tiskani knjigi, le da je elektronska. Vsebujejo vse knjižne, knjigarske, bibliotekarske in druge

elemente (definiran stalni format, popolna knjižna struktura - predlist, naslovni list, kolofon z vsemi potrebnimi podatki, splošno kazalo, uvod, besedilo, povzetki, viri in literatura, imenski indeks -, tipografija, oprema, ustaljena oblika izdaje in zbirke, barvna sprednja in zadnja platnica z logotipi in črtno kodo) ter za raziskovalce predstavljajo popolni elektronski ekvivalent tiskani izdaji ob dodatnih možnostih, ki jih omogoča elektronski medij (navzkrižne reference, e-iskanje, kopiranje oz. izvažanje teksta in opreme ...). Vsako besedilo je pred sprejemom v objavo ustrezno recenzirano s strani kompetentnega raziskovalca/raziskovalke zadevnega področja; recenzenta sta v kolofonu tudi navedena. Tako izdaje tudi v individualnih bibliografijah raziskovalcev (SICRISS) zavzemajo enako težo kot tiski, v kolikor gre za strukturno analogno besedilo.

Vsaka izdaja je bralcem dostopna v integralni podobi, in sicer na dva načina: a) v butični nakladi do 100 brezplačnih izvodov za avtorja, zainteresirano javnost in knjižnice (na CD/DVD nosilcu) ter b) v obliki flipbooka in pdf datotek(e), ki sta identična izdaji za knjižnice ter sta dostopna na spletni strani http://www.pei.si/Sifranti/StaticPage.aspx?id=27. Vsak flipbook vsebuje celotno, neokrnjeno izdajo in možnost izvoza pdf datoteke v bralčev računalnik, zaradi zaščite avtorskih pravic pa besedila in slikovne opreme iz datoteke ni mogoče izvažati ali kopirati. Vse izdaje so prosto dostopne znotraj pogojev slovenske licence Creative Commons 2.5 (priznanje avtorstva, nekomercialno, brez predelav).

Digitalna knjižnica ni repozitorij niti nima namena to postati, je pa s svojimi izdajami v ključena v Digitalno knjižnico Slovenije (dLib) ter v SIStory na Inštitutu za novejško zgodovino.

Digitalna knjižnica deluje od julija 2009, javnosti je bila predstavljena maja 2010, trenutno obsega 13 izdaj (10 znanstvenih in 1 strokovno monografijo, 1 univerzitetni učbenik ter 1 priročnik), v pripravi pa jih je še 7 (2 znanstvenokritični ediciji, 5 znanstvenih monografij), katerih izid je planiran do konca koledarskega leta 2010.

Iznajdba, editološka zasnova, razvoj Digitalne knjižnice, urejanje posameznih izdaj, oblikovanje, prelom in digitalizacija so delo doc. dr. Jonatana Vinklerja, ki je tudi ustvarjalec in edini ter izključni lastnik editorskega in tehnološkega vedenja, ki omogoča obstoj in delovanje Digitalne knjižnice.

Platforma Digitalna knjižnica obsega štiri zbirke:

1) Dissertationes kot urednik vodi red. prof. dr. Igor Ž. Žagar, namenjena pa je izdajanju novih in ponatisu že izdanih eno- in večavtorskih monografij s področja humanistike in družboslovja.

2) Zbirka Clavis litterarum slovenicarum nastaja pod uredniško taktirko doc. dr. Jonatana Vinklerja, sicer tudi glavnega urednika Zbranih delih Primoža Trubarja in editorja drugih izdaj (Educa, Nova revija, Rokus, SIGIC, Društvo slovenskih skladateljev, Slovenska filharmonija ...); v njej bodo kot znanstveno-kritične edicije objavljana dela slovenskega slovstva med 1550 in 1918.

3) Zbirko Compendia uredniško vodi doc. dr. Janja Žmavc, v njej pa bodo objavljeni predvsem univerzitetni učbeniki za posamezne predmete na fakultetah štirih slovenskih univerz ali zasebnih visokih šol.

4) Documenta: zbirka bo prinašala besedila, ki so »miscelanea« raziskovalnega procesa

(članek, nenatisnjeno javno predavanje, poročilo); zbirko uredniško vodi dr. Alenka Gril. 5) Digitalna knjižnica bo od jeseni 2010 vključevala tudi Zbrana dela Primoža Trubarja 6-(glavni urednik: doc. dr. Jonatan Vinkler), ki bodo k obstoječi digitalni platformi pričlenjena kot »corpus separatum«.

Uredniški odbor Digitalne knjižnice::

red. prof. dr. Igor Ž. Žagar, glavni in odgovorni urednik

doc. dr. Jonatan Vinkler, pomočnik glavnega in odgovornega urednika

doc. dr. Janja Žmavc in dr. Alenka Gril, članici uredniškega odbora

Dostop: http://www.pei.si/Sifranti/StaticPage.aspx?id=27

Informacija:

http://sl.wikipedia.org/wiki/Digitalna_knjižnica_Pedagoškega_inštituta_v_Ljubljani

Digitalna knjižnica informacije o novih izdajah sproti objavlja na socialnih omrežjih Facebook in Twitter, ažurno pa preko elektronske pošte obvešča tudi zainteresirane javnosti (šole, vrtci, raziskovalne ustanove, knjižnice ...)

EBOOKS ON DEMAND FROM EUROPEAN LIBRARIES

Alenka BLATNIK

Narodna in univerzitetna knjižnica, Bibliotekarski raziskovalni center e-naslov: alenka.blatnik@nuk.uni-lj.si

Matija BRUMEN

Narodna in univerzitetna knjižnica, Bibliotekarski raziskovalni center e-naslov: alenka.blatnik@nuk.uni-lj.si

UDK: 655.4:004.9

Izvleček

Programi množične digitalizacije knjižnih zbirk v knjižnicah so bili v zadnjem desetletju uvedeni z namenom vzpostavitve digitalnih spletnih arhivov. Partnerstvo med Googlom in knjižnico Univerze Michigan je leta 2008 proizvedlo milijon digitaliziranih knjig.Storitev E-knjige po naročilu (EOD) je projekt digitalizacije Evropskih knjižnic, ki ga sofinancira Evropska komisija (EK) v okviru programa Kultura 2007 - 2013 in prispeva k evropski digitalni knjižnici -portalu Europeana. EOD je trenutno na voljo v več kot tridesetih knjižnicah v dvanajstih državah. Storitev uporabnikom omogoča digitalizacijo knjig, ki niso več pod zaščito avtorskega prava, izdanih med leti 1500 in 1900 v obliki PDF (Portable Document Files). Proces digitalizacije vključuje različne tehnologije skeniranja, združene z ustrezno programsko opremo za manipulacijo podobe ter zajemanje metapodatkov. E-knjige so naročnikom dostavljene prek mreže EOD ter shranjene za dolgoročno hrambo v digitalne repozitorije. EOD rešitve tako ne le spodbujajo uporabe e-knjig, temveč hkrati tudi pomagajo ohranjati kulturno dediščino.

Ključne besede: siva literatura, delovna gradiva, ekonomija, bančništvo, Slovenija, prost dostop, spletišča, avtorske pravice, citiranje

Abstract

Library mass digitization programs for book collections have been introduced in the past decade with the aim to establish digital web archives. Partnership between Google and the University of Michigan Library has produced the millionth digitized volume in the year 2008. eBooks on Demand (EOD) is European libraries digitization service co-financed by the European Commission (EC) under the Culture 2007 - 2013 programme, which contributes to the European Digital Library - Europeana portal. EOD is currently available in more than thirty libraries in twelve countries. The service enables customers to order public domain books published between the years 1500 and 1900 as Portable Document Files (PDF). Digitization process includes different scanner technologies accompanied with suitable image manipulation software. eBooks are delivered to the customer via the EOD network and saved in the digital repository for long-term preservation. EOD solutions not only encourages the use of eBooks, but also helps preserve the cultural heritage.

Key words: mass digitization; eBooks; scanner technologies; digital library service; on demand publishing

1 Introduction

The term digitization generally describes a technical process which produces a digital file format copy of an original content in analogical form. Mass library digitization workflow basically includes the use of two dimensional or 3D scanning technology, accompanied with suitable image manipulation and OCR software. Individual library provides archiving for long-term document preservation purposes in its repository. Indexing and archiving digitized documents allows them to be accessed locally or at remote location, while preserving the original books, manuscripts, or incunabula by minimizing their handling. Digital image files can be included and manipulated in the advanced digitization features using multimedia animation or avatar virtualization which are also used for digitization of museums art collections.

2 EOD & library digitization

According to experts' estimates, around one million book titles were produced in Europe between 1500 and 1800 period. Often an individual researcher has only traditional options at his disposal, and cannot avoid a trip to the library to be able to use these materials. In view of the difficulties experienced by a researcher when searching for a very specific work the idea came up to develop a Digitization on Demand service. Some libraries already offer similar services within the context of their reprography departments and digitize individual book pages on request. The EOD service, however, wanted to go one step further. The target was to develop a comprehensive standardized procedure for ordering books and for delivering digitized books. Furthermore, the target solution was to be implemented within the framework of a network of libraries, reducing the workload of individual libraries and guaranteeing the user a dependable ordering system as well as consistent delivery quality. Also, the service was not only to be generally offered on the library's website, but to be equally integrated in the libraries' catalogues.[1]

2.1 EOD Network

For this reason, thirteen libraries under the leadership of the University and State Library of Tyrol presented and approved a project entitled Digitization on demand in the European Commission's eTEN programme. The initial consortium included the following libraries: Bavarian State Library, National Library of Estonia, Royal Library of Denmark, National Library of Portugal, National and University Library of Slovenia, University Library of Bratislava, University Library of Graz, University Library of Greifswald, Humboldt University Library of Berlin, University and Regional Library of Tyrol, University Library of Regensburg, Vienna University Library and the national Szechenyi in Hungary. The project lasted from October 2006 to June 2008. [1] The service has been continued by the partners since 1 July 2008 in the form of the EOD network. Over the coming years, the network will continue to be expanded with new partners and new on demand services will be added. Figure 3 on page 3 shows the number finished orders for the 2009 period.

Figure 3: Number of EOD network finished and paid for orders in 2009 2.2 EOD Service

A network with a central web-based database, the Order Data Manager (ODM), has been put up to assist al the EOD network orders processing. The digital image files are placed on the central EOD server via File Transfer Protocol (FTP) and processed there by the central service. A Digital Object Generator (DOG) which is a web service and also a part of the ODM automatically generates full text by means of Optical Character Recognition (OCR). Finally, a single PDF file, the eBook is created, which in addition also includes a standard cover and explanatory text about the EOD service. When the order is placed the customer receives an automated e-mail with the link to his customer page. There the customer is able to track the status of his order, make the payment, by credit card or other payment services, and then directly access the eBook and load it on his computer. In Slovenia the EOD service portal is accessed through the digital library dLib.si.

3

Discussion

To improve the quality of the two dimensional eBook and to make the product more user friendly and visible on the eBook market, the PDF files should be multimedia supported and integrated within the animated page turners. The EOD eBooks will soon be accessed with the use of eBook readers such as Amazon Kindle and other handy devices, while the corrected full text will be offered in the various eBook reader formats. The EOD network target reach is to include even more new consortium members and integrate the digitization service within the other public institutions, mainly museums and public archives. The EOD network would eventually like to develop of a special service for the blind and visually impaired.

4 Conclusions

It is most likely that the network coordinator responsible for the overall management -University and Regional Library of Tyrol will reach the estimated goal of 40 - 60 EOD library members of the consortium by the end of 2013. With the use of Web 2.0 and on demand technologies the EOD service is being further developed and focussed on the needs of the different eBook end users. Some of the consortium members, including NUK are also a part of other EC digitization related projects, dealing with the OCR improvements with the use of software developed collaborative tools based on document and image analysis (project Impact) and indentifying and clearing the copyright property issues for orphan and out of print books (project Arrow). With this mutual project cooperation the further developments of the European Digital Library - Europeana portal are to be achieved.

The digitalization process involves a diverse and multidisciplinary field of expertise and is still in its development stages, when compared to the printing industry ISO standards. The digitization industry standards still haven't been set or implemented yet, mainly because the libraries are primarily focusing on the quantity of the mass digitization and because an average customer usually does not question the quality of the digital image files. Uniformity will however soon be significant to the governments, public sectors and the publishing industry. The Europeana consortium, scanner manufactures and software developers should soon make it a priority to address this question.

Bibliography

[1] MÜHLBERGER, G., GSTREIN, S. eBooks on Demand (EOD): a European digitization service [online], updated 15.12.2009 [cited 06.01.2010]. Available from: http://www.ifla.org/en/ifla-publications.html.

[2] KLASINC. J., SVOLJŠAK. S., KAVČIČ-ČOLIČ, A. Nova storitev v NUK - digitalizacija knjig po naročilu (EOD eBooks on Demand), Knjižnice za prihodnost: napredek in sodelovanje: Zbornik posvetovanja ZBDS, ZBDS, 978-961-6683-01-2, Ljubljana, (2007), pp. 357 - 363

SLOVENSKI BIOGRAFSKI LEKSIKON - OZNAČEVANJE BIOGRAFSKIH PODATKOV Z OZNAKAMI TEI

Mojca Mlinar Strgar

Slovenska akademija znanosti in umetnosti, Biblioteka e-naslov: mojca.mlinar-strgar@zrc-sazu.si.

Simona Frankl

Slovenska akademija znanosti in umetnosti, Biblioteka e-naslov: simona.frankl-strgar@zrc-sazu.si.

UDK: 929(497.4):655.411:004.65

Izvleček

Pri strukturnem označevanju Slovenskega biografskega leksikona smo upoštevali smernice TEI, zlasti modul o biografskih in prozopografskih podatkih. Prispevek podaja nekatere probleme in rešitve označevanja posameznih vrst podatkov. Pojasnjeni so temeljni principi označevanja osebnih podatkov, kakor so imena in priimki ter njihove variantne oblike, generacijske oznake, cerkveni in plemiški nazivi ter pomembnejši družbeni položaj, datum in kraj rojstva in smrti, poklici in dejavnosti oseb ter obdobje delovanja. S podrobnim označevanjem biografskih podatkov na podlagi doslednega upoštevanja smernic TEI smo postavili temelj za mednarodno primerljivo delo na področju priprave slovenskih elektronskih biografskih virov.

Ključne besede: Slovenski biografski leksikon, digitalizacija

SLOVENIAN BIOGRAPHICAL LEXICON: PERSON-DATA ENCODING WITH TEI GUIDELINES

Abstract

In the process of encoding the Slovenian Biographical Lexicon we followed the TEI guidelines, in particular the module on biographical and prosopographical data. The article concentrates on some of the problems and solutions of particular person-data encoding. The basic principles of encoding are explained on different levels: names and surnames and their variants, generation and nobility titles and important social roles, date and place of birth and death, professions and activities as well as periods of activities. By detailed encoding of biographical data on the basis of strict adherence to TEI guidelines we set the basis for internationally comparable work in the area of Slovenian digital biographical recources.

Key words: Slovenian Biographical Lexicon, digitisation

Uvod

Pri pripravi spletne izdaje Slovenskega biografskega leksikona (SBL) smo se naslonili na odprtokodno programje in mednarodno sprejete standarde, za označevanje podatkov pa smo sledili smernicam Text Encoding Initiative (TEI), ki predstavljajo dejanski standard za strukturno označevanje podatkov v elektronskih besedilih na področju humanistike in

družboslovja. Za podrobno označevanje posameznih biografskih podatkov smo upoštevali zlasti modul TEI, ki je posvečen označevanju biografskih in prozopografskih podatkov.

Podrobno označevanje podatkov je potekalo na ravneh: priimka in imena, datuma rojstva, kraja rojstva, datuma smrti, kraja smrti, obdobja delovanja in poklica. Znotraj posameznih vrst podatkov smo nadalje označili še podrobnejše podatke, npr.: znotraj priimka in imena smo označili imenska določila, nazive oz. družbeni položaj; znotraj kraja rojstva ali smrti smo označili naselja, četrti, regije in države, kjer je bilo potrebno, tudi večjezične variante teh imen. Pri vseh podatkih, kjer je v izvirnem tiskanem besedilu nakazano, da podatek ni povsem zanesljiv ali da je domneven, smo stopnjo gotovosti podrobneje označili, kakor tudi vir podatkov, če jih nismo vzeli le iz SBL, marveč iz kakšnega drugega vira, npr. iz Primorskega slovenskega biografskega leksikona (PSBL).

V nadaljevanju so opisani nekateri postopki, dileme in rešitve označevanja posameznih vrst biografskih podatkov v SBL.

Ime in priimek - <persName>

Imena in priimke smo označili z elementom <persName>, znotraj katerega smo podrobneje označili obe ravni - ime in priimek z elementoma <forename> in <surname>. V primerih, ko je imela oseba tudi variantna imena, smo v prvem elementu <persName> predstavili samo geselsko iztočnico, vsi naslednji elementi <persName> pa označujejo variantna imena. Z atributom @type smo označili različne tipe variantnih imen, npr.: @type="abbr" za okrajšave, @type="pseudo" za psevdonime, @type="artistic" za umetniška imena, @type="nickname" za vzdevke, @type="married" za imena po poroki, @type="monastic" za redovna imena, @type="operosorum" za imena med operozi itn.

Z atributom @n smo podrobneje označili tudi vir podatka, npr. @n="psbl" pomeni, da je bil podatek o variantnem imenu najden v Primorskem slovenskem biografskem leksikonu. Kadar je geselska iztočnica vsebovala zgolj osebno ime brez priimka, smo ta podatek označili z elementom <name>. Nekatere osebe, večinoma rojene v obdobju med 14. in 18. st., so bile poznane samo po osebnem imenu in kraju, od koder so izšle. V tem primeru smo del imena, ki je povezan s krajem, označili z elementom <placeName>.

Z elementom <genName> smo označili imenska določila in s tem razločevali soimenjake različnih generacij (mlajši, starejši) ter vladarska in cerkvena imena (Maksimiljan II., Pij II.).

<person xml:id="sbs306695" n="sbl01310">

<name n="psbl" type="incorrect">Racolski</name>

Slika 1: Prikaz geselske iztočnice in treh variantnih imen: krajšave in dveh psevdonimov, od katerih je zadnji napačen; vse variante so navedene v Primorskem slovenskem biografskem leskikonu (PSBL).

Z elementom <roleName> smo označili nazive posamezne osebe, ki kažejo na določeno vlogo oziroma položaj te osebe v družbi.

Podrobneje smo <roleName> opredelili z atributom @type, in sicer:

- @type="eccl" za cerkvene nazive, npr.: škof, nadškof, papež, kardinal, oče, pater, fra itn.

- @type="nobility" za plemstvo: v vsebino tega elementa smo navedli plemiški ali vladarski naziv (vitez, baron, grof, knez, vojvoda, markiz, kralj itd.) ali plemiški predikat (plemeniti Trsteniški, von Tannenberg) obravnavane osebe. Če se je plemiški predikat nanašal na določen kraj, smo znotraj elementa <roleName type="nobility"> dodali še element <placeName>.

Z elementom <roleName> smo opredelili tudi osebe, ki so pripadale dvema znanstvenima združenjema, in sicer:

- @type="sasa" za člane Slovenske akademije znanosti in umetnosti

- @type="operosorum" za člane Academie operosorum Labacensis

Plemiško poreklo nekaterih oseb je bilo pogosto razvidno tudi iz povezovalne fraze med imenom in priimkom, npr.: „von", „de", „of" itn., kar smo označili z elementom <nameLink>, razen kadar so te bile del plemiškega predikata. Prav tako smo plemiške osebe ali rodbine dodatno označili še z bolj splošnim elementom <trait> in atributom @type="noble".

<roleNaiiie type="nobility">von Pichelstein</roleNaiiie> <roleNaiiie type="ope roso rum ">operoz</roleNarie>

<roleNaiiie type="nobility">pleiiieniti Pichelstein</roleNaiiie>

Slika 2: Prikaz oznak <roleName> za plemiški predikat in za članstvo v Academii operosorum.

Kraj rojstva ali smrti - <placeName>

Podatke o kraju rojstva ali smrti smo označili z elementom <placeName>. Za podrobnejšo opredelitev naselij smo uporabili element <settlement>, za določene predele naselja ali zaselek pa <district>. Z atributom za jezik @lang smo označevali jezikovne različice določenega kraja predvsem na dvojezičnem območju v Sloveniji, npr. v Slovenskem Primorju ali Prekmurju, ali pa v zamejstvu oz. drugih državah. Nekatera krajevna imena so se skozi čas

tudi spreminjala. V biografskih podatkih smo vedno navajali posodobljeno, trenutno veljavno ime naselja, obenem pa tudi historično obliko, ki smo jo označili z atributom @type="historic", da bi poizvedovalni sistem lahko našel eno ali drugo. Z elementom <region> smo označili zemljepisna imena za regije, pokrajine, občine in druge upravno-teritorialne enote, ki so večje od naselja in manjše od države. V ta element smo uvrstili tudi posamezne zvezne države ZDA. Istoimenska naselja smo razločili s podatkom o občini, kamor to naselje sodi. V ta namen smo izbrali element <region>, ki smo ga dodatno opredelili z atributom @type"municipal". V večini primerov so krajevni podatki vezani na državo Slovenijo in v teh primerih države nismo posebej označili. Kadar pa je šlo za krajevna imena iz drugih držav, smo jih dodatno opredelili z elementom <country>, kjer smo navedli ime države v slovenščini. Države smo navedli v danes obstoječih mejah, torej tudi za kraje, ki so bili v različnih časovnih obdobjih deli drugih držav. V primerih, ko je bilo kot kraj rojstva ali smrti znano samo geografsko območje izven naselij (gore, reke, doline), smo podatek označili z elementom <geogName>.

<placeName>

oettlement type="historic">Šmarten na Dholici</settlement> <settlement>Šmartin</settlement>

<region type="municipal">Teholica ob Vrbskem jezeru</region> <settlement xml:lang="ger">St. Martin am Techelsberg</settlement> <region type="municipal" xml:lang="ger">Techelsberg am Wörther See</region> <region>Koroška</region> <country>Avstrija</country> </placeName>

Slika 3: Primer oznak za historično obliko naselja, za sodobno obliko in občino v obeh jezikih ter za pokrajino in državo. Ker so vse te oznake gnezdene znotraj

Datum rojstva ali smrti - <date>

Podatke o datumu rojstva ali smrti smo označili z elementom <date> in atributom @when znotraj elementov <birth> ali <death>. Kadar je bil naveden le datum krsta, smo to označili z atributom @type="bapt". Tudi tu je, podobno kakor v drugih primerih, za uspešno nadaljnje procesiranje podatkov določen podatek izrecno povezan z drugim z gnezdenjem elementov, saj je vložen vanj, kakor na sliki spodaj.

<birth>

<date type="bapt" when="1641-05-28">krščen 28. maja 1641</date> <placeName>

<settlement>Lj ubij ana</settlement> </placeName> </birth>

Slika 4: Primer oznake <date type="bapt">za datum krsta.

Poklic - <occupation>, obdobje delovanja - <floruit> in opomba o delovanju - <note>

Podatke o poklicu oziroma delovanju neke osebe smo označili z elementom <occupation> oz. z več elementi <occupation> za več poklicev iste osebe. Vsebino elementov <occupation> smo izluščili in izdelali hierarhično razvrstitev - t.i. taksonomijo poklicev - ki v iskalnem sistemu omogoča, da prikličemo tudi hiponimne oblike istega poklica. Tako bo denimo poizvedba „glasbenik" priklicala tudi vse pianiste ali glasbenice. S pomočjo taksonomije bomo premostili nekatere težave, zlasti različna poimenovanja istih poklicev ali dejavnosti zaradi razlikovanja med moško in žensko obliko, med historično in sodobno obliko ipd. Kadar podatek o datumu in kraju rojstva ali smrti ni bil naveden (znan) ali pa so bili ti podatki pomanjkljivi, smo z elementom <floruit> ter z atributi @when ali @notBefore/@notAfter označili obdobje, lahko pa tudi kraj delovanja. Za označevanje kraja delovanja smo dodali potrebne krajevne elemente: <placeName>, <settlement>, <region>, <country>, <geogName>.

Pri nekaterih osebah njihov poklic ni igral pomembnejše vloge in so bili uvrščeni v SBL zaradi drugih razlogov, denimo zaradi določenih dejanj ali vloge, ki so jo imeli v svojem času, kot npr. „Prešernov prijatelj", „kmečki upornik" ipd., kakor denimo na sliki 5.

<noruit notAfter='''1600|' notBefore="1500">

Slika 5: Z elementom <floruit> smo označili obdobje in regijo delovanja, z <note> pa bistveno lastnost osebe.

Sklep

Upoštevaje smernice TEI, zlasti njihov modul za označevanje biografskih in prozopografskih podatkov, smo veliko količino raznovrstnih biografskih podatkov, ki so bili poprej v besedilu implicitni in dostopni le ob pozornem branju, s podrobnim označevanjem izpostavili ter jih naredili eksplicitne, da lahko poizvedovalni sistem nad njimi opravlja tudi kompleksne poizvedbe. S tem, ko smo biografske podatke označili z oznakami XML/TEI, smo pravzaprav vnašali v naš biografski korpus dodatne, strukturne informacije. Ob tem smo podatke v SBL s pomočjo drugih virov tudi preverili, dopolnili, precizirali. S to bogato informacijsko strukturo oznak TEI in biografskih podatkov smo v Slovenskem biografskem leksikonu postavili temelje za pripravo podobnih elektronskih biografskih virov, ki so mednarodno primerljivi, saj upoštevajo standarde in omogočajo izmenljivost in trajnost podatkov, hkrati pa so zaradi bogastva ekspliciranih podatkov tudi aktualni in uporabni.

NET AS A RESOURCE OF INFORMATION

mag. Milena Bojadziska

University »St. Cyril and Methodius«, Faculty of Technology and Metallurgy, Library, Skopje, Republic of Macedonia

UDK: 025.328

Izvleček

V članku so predstavljeni rezultati analize del, navedenih v referencah diplomskih in magisterskih del in doktorskih dizertacij, izdelanih v zadnjih petih letih (2005-2009) in deponiranih v knjižnici Tehnološko-metalurške fakultete Univerze Sv. Cirila in Metoda v Skopju, Republika Makedonija. Dela, citirana v referencah, so razdeljena v štiri kategorije: knjige, članki iz znanstvenih in strokovnih revij, drugo (poročila s konferenc, simpozijev, del za objavo, komunikacije, patenti, zakoni, navodila za uporabo aparature in programi) in računalnik (podatki sneti iz intererneta, zgoščenke). Za pisanje diplomskih nalog se največkrat uporabljajo knjige v makedonskem jeziku, katerih avtorji so fakultetni učitelji. Splet se uporablja prav tako pogosto kot znanstvene in strokovne revije. Študenti na podiplomskem študiju najpogosteje uporabljajo članke iz znanstvenih in strokovnih revij za pisanje magisterskih del in doktorskih dizertacij, medtem ko le redko koristijo splet in druge vire.

Ključne besede: visokošolski študij, citati, literatura, splet, Abstract

This paper treats of the results of an analysis of the citations in references in undergraduate theses, master's theses and dissertation for a period of 2005 to 2009. These works are placed at the library of the University "St. Cyril and Methodius", Faculty of Technology and Metallurgy, Skopje, Republic of Macedonia. The works that are cited were categorized in four categories: books, papers in scientific journals, other (proceedings of the conferences, works to be published, communications, patents, laws, manuals for hardware and software) and net (data that are downloaded from net, CDs). Books written in Macedonian from the staff that is teaching at this faculty are the most used for writing undergraduate theses. Net is used so frequently as scientific journals for writing undergraduate theses also. The postgraduate students use mostly scientific journals for writing their master's and doctoral theses whereas net and other are seldom used.

Key words: higher education, citations, references

Introduction

The library of the Faculty of Technology and Metallurgy, University "St. Cyril and Methodius" Skopje, Republic of Macedonia got computers in the frame of TEMPUS project in the 2005. The students could use them for getting information of any kind. The aim of this paper is to make a picture what kinds of resource of information (hard copy or electronic resource) were used for the last five years (from 2005 to 2009) in the frame of this faculty. For this

purpose, an analysis_is made of the citations in the references of the undergraduate theses, master's theses and dissertations written in this period. The undergraduate theses, master's theses and dissertations that were analyzed are placed at the library of this faculty.

Methodology

The total number of the undergraduate theses, master's theses and dissertations that are written in the period from 2005 to 2009 is determined. The name of their authors reveals their sex (gender). An analysis was made of the citations in the references at the end of these works. They were counted and no attention was paid to the frequency of one cited work. The cited works_are divided in four categories: books, journals (articles in scientific journals), other (proceedings of the conferences, works to be published, communications, patents, laws, manuals for hardware and software) and net (information that is downloaded from net, CDs). The language of the cited work is determined also. All results are shown in tables and figures at the end of this paper.

Results and discusion

The total number of the undergraduate theses, master's theses and dissertations that are written in the period from 2005 to 2009 is 612. 573 are undergraduate theses (or 93.6% of the total registered works), 27 master's theses (or 4.4% of the total works) and 12 dissertations (or 2% of the total works).

Table T. 1 shows the sex (gender) of the authors of the undergraduate theseis, master's theses and dissertations. The most authors are female (66%). This means that about 2/3 of all students at this faculty are women. The study at this faculty needs working in laboratory and for this work women are suitable.

The total number of the works that are cited in references of these works is 9175. 4729 works are cited in undergraduate theses (or 51.5% of the total number of the cited works), 2488 works are cited in master's theses (or 27.1% of the total number of the cited works) and 1958 works are cited in dissertations (or 21.3% of the total number of the cited works). These numbers are big because no attention was paid to the frequency of one cited work. It is not shown in this paper, but it was registered that in the undergraduate theses the most works that are cited are repeated more than once, and that is why their number is big. The most cited works are cited in the undergraduate theses. They make of the total number of the cited works. This can be easy understand if we assume that 93.6% of the total theses that are written in period 2005 to 2009 and that are placed at the library are undergraduate theses. About V^ of the works that are cited in the references are cited in master's theses and the other V are cited in dissertations.

Works, that are cited, are divided in four categories: books, journals (papers in scientific journals), other (proceedings of the conferences, works to be published, communications, patents, laws, manuals for hardware and software) and net (information that is downloaded from net, CDs).

Data on Table T. 2 show the total number (No.) of the undergraduate theses, master's theses and dissertations written for a period from 2005 to 2009 (the second column), the total number of the works that are cited in references of these works (ref.) (the third column), and the total number of books, journals, other and net that are cited (4-7 columns). The plots on figures from F. 1 to F. 3 show what part of the total number (in percentage) has each category for undergraduate theses, master's theses and dissertations.

F. 4 show what part of the total number of works that are cited for a period of five years has each category (in percentage). In period from 2005 to 2009 the most cited works are papers in scientific journals (43% of the total number of cited works), then books (36% of the total number of cited works), other (10% of the total number of cited works) and net (10% of the total number of cited works).

The most cited works in the undergraduate theses are books (51%). The authors of the most of these books are professors that teach at this faculty. 20%, of all works that are cited, are papers in scientific journals and 17% is information that is got from electronic resource (the most cited are data downloaded from net) and 12% is other. In category other, law is the most cited, especially for the themes like ecology and food technology. This show that net is used so oft as papers in scientific journals for writing undergraduate theses. Probably this is a result of Open Access to the scientific papers on net. This is more evidently for the last two years (not shown). (F. 1)

The most cited works in the master's theses and dissertations are papers in scientific journals (61,8% in master's thesis and 75,9% in dissertations). Information that is got from electronic resource like net, CD is used seldom. Master's theses and dissertations are works in which one presents the results of his original scientific research. To do this one needs data from other original results within the same scientific discipline, and they are given in scientific journals that are confirmed from experts. In these theses patents are cited very often, also (not shown). (F. 2 and F. 3).

Data on Table T. 3 and plots on figures from F. 5 to F. 7 show what languages are used for the works that are cited in undergraduate theses, master's theses and dissertations. In total (F. 8) there are more than three languages and the most used languages are English (74%), Macedonian (17%) and Serbian (9%). English (56%) and Macedonian (30%) are the most used language for the works that are cited in undergraduate theses. There the most cited works are books that are written from the teachers at the faculty and that is the reason why the Macedonian language is the most used. English is the most used language for works that are cited in master's theses and dissertations (about 90%). That is so because English is an official language for communication in the scientific world.

Conclusion

This paper shows the results of an analysis of the citations in references in undergraduate theses, master's theses and dissertation for a period of 2005 to 2009. These works are placed at the library of the Faculty of Technology and Metallurgy, Skopje. The results are:

About 2/3 of all authors (so the students at this faculty) are women. The study at this faculty needs working in laboratory and the most women like to work in laboratory. Books written in_ Macedonian from the staff that is teaching at this faculty are the most used for writing undergraduate theses.

Papers in scientific journals written in English are the most used for writing master's theses and dissertations in the last five years (2005 to 2009). Books, electronic resources like net, CDs and proceedings of the conferences, and works to be published, and communications, and patents, and laws, and manuals for hardware and software are also used, but they are used not so frequently like scientific journals. Master's theses and dissertations are works in which one presents the results of his original scientific research. To do this, one needs data from other original results within the same scientific discipline, and they are given in scientific journals that are confirmed from experts.

PODPORNIK POSVETOVANJA MINISTRSTVO ZA KULTURO RS

5

r^-publi-fa^b^-pnija ■mInlvtrvtvQfi ku|tuip

SOORGANIZATOR POSVETOVANJA INŠTITUT ZA NOVEJŠO ZGODOVINO

lllllllll

Inštitut za novejšo zgodovino

POKROVITELJ POSVETOVANJA JAVNA AGENCIJA ZA RAZISKOVALNO DEJAVNOST RS

ZLATI SPONZOR

eifl

knowledge without boundaries

ZLATI SPONZOR

EBSCO

Periodika
• Elektronske revije ^^^^
• Zbirke elektronskih revij
• Elektronske knjige
• Podatkovne zbirke
• Orodja za integracijo

ebsco.com

ZLATI SPONZOR

SREBRNI SPONZOR

SREBRNI SPONZOR

Leading the way

research

Emerald Management eJournals

Etmnrn MBnagemeTit eJoumd BOHBdmn prnvuie icantril m»«* polnl Cor rlQemiJBjnd rtiewant pew-revlflwed rHurdi ti bia ItsM vT lHHln9<u ud tnBRiQeflHnit.

DOHfow UiwyneHl...

- Accbi b a miaa^B Dotecthxi ofattJaltn nm Inn Z2S Moti qu4ir tHirtv» ml mgimaemBil ^uiiralsT'

■ ReiesEti-boni the «Btil^ baling hHlncH Divd

^■imemBit iHibU-iS'Sirt aHinecta'lieiHy pncUtal

- mttEUDllj^ pecf mtnHlatlda1tna|>ibCihEfBttti cffa jBiM^-eq^rtatD-T

■ Fleiftfe-iiurEtiDiliiniipttaRi inilaiiin[)ecf;;3d»3»li>iilt KDiir btijjet?

If ynu Jwie iiuauHl ^^E^-ki BvurUmeaKstton, jfoir ■aaiy itEdd s^ab^ to EnwiBhl Mv^^rvnt tJcFj-ngb!

Fotiikhc IrärniBtton pf^aee oonäd: e m ir BU@ afTHratd I nsl^ Hnn

Wim. SÜDS FS I d I n B^it eon

J

Rissearch ^hi can use

SREBRNI SPONZOR

SREBRNI SPONZOR

0 Wolters Kluwer

Health

Ovid

SREBRNI SPONZOR

BRONASTI SPONZOR

Zelinka d.o.o.

DRUGI SPONZORJI

®

 
Izvedba, lastnina in pravice: NUK 2005-2014    |    pogoji uporabe    |    napišite svoje mnenje    |    na vrh