vzpostavitev repozitorijev slovenskih univerz in nacionalnega portala odprte znanosti Establishment of the Slovenian Universities' Repositories and of the National Open Science Portal Milan Ojstersek, Mojca Kotar, Marko Ferme, Goran Hrovat, Mladen Borovic, Albin Bregant, Jan Bezget, Janez Brezovnik Oddano: 26. 6. 2014 - Sprejeto: 19. 8. 2014 1.01 Izvirni znanstveni članek 1.01 Original scientific article UDK 021.61:004.9: 378.4(497.4) Izvleček V prispevku so predstavljeni pravni, organizacijski in tehnični vidiki vzpostavitve slovenske nacionalne infrastrukture odprtega dostopa do zaključnih del študija ter objav raziskovalcev, ki je sestavljena iz štirih institucionalnih repozitorijev slovenskih univerz in nacionalnega portala. Slednji agregira vsebine iz univerzitetnih repozitorijev in drugih slovenskih zbirk za potrebe skupnega iskalnika, priporočilnega sistema in detektorja podobnih vsebin. Razvita je bila programska oprema, ki je povezana z informacijskimi in avtentikacijskimi sistemi univerz ter s sistemom COBISS.SI. V okviru projekta so bile definirane pravne podlage, implementirani procesi za oddajo zaključnih del študija in objav zaposlenih, proces prenosa podatkov v nacionalni portal ter procesi izmenjave podatkov o priporočanju sorodnih del in primerjave podobnih vsebin. Uporabnikom z vsega sveta so na voljo dvojezične spletne in mobilne aplikacije, priporočilni sistem ter funkcionalnosti za uporabnike s posebnimi potrebami. Repozitoriji so učinkovito promocijsko orodje za univerze in njihove raziskovalce. Pričakovati je, da bodo izboljšali prepoznavnost slovenskih univerz v svetu. Kompleksno zasnovana nacionalna infrastruktura odprtega dostopa z detektorjem podobnih vsebin in s povezanimi zunanjimi sistemi bo omogočila hranjenje skoraj osemdesetih odstotkov recenziranih znanstvenih del, ki jih na leto objavijo slovenski raziskovalci. Prav tako bo dostopna večina zaključnih del študija, ki vsako leto nastanejo na slovenskih visokošolskih zavodih. Ključne besede: odprti dostop, nacionalne infrastrukture, institucionalni repozitoriji, preverjanje podobnosti vsebin, priporočilni sistemi Abstract The paper presents the legal, organisational and technical perspectives regarding the implementation of the Slovenian national open access infrastructure for electronic theses and dissertations as well as for research publications. The infrastructure consists of four institutional repositories and a national portal that aggregates content from the university repositories and other Slovenian archives in order to provide a common search engine, recommendation of similar publications, and similar text detection. We have developed the software which is integrated with the universities' information and authentication systems and with the COBISS.SI. During the project the necessary legal background was defined and processes for mandatory submission of electronic theses and dissertations as well as of research publications were designed. The processes for data exchange between the institutional repositories and the national portal, and the processes for similar text detection and recommendation system were established. Bilingual web and mobile applications, a recommendation system and the interface suitable for persons with disabilities are provided to the users from around the world. The repositories are an effective promotion tool for universities and their researchers. It is expected that they will improve the recognition of Slovenian universities in the world. The complex national open access infrastructure with similar text detection support and integration with other systems will enable the storage of almost eighty percent of peer-reviewed scientific papers, annually published by Slovenian researchers. The majority of electronic theses and dissertations yearly produced at the Slovenian higher education institutions will also be accessible. Keywords: open access, national infrastructures, institutional repositories, similar text detection, recommender systems 1 Uvod Z razvojem interneta so se zelo izboljšale možnosti objavljanja rezultatov raziskav. Spletni iskalniki v manj kot sekundi najdejo povezave do najbolj zanimivih publikacij z želenega raziskovalnega področja, zato so raziskovalne organizacije po svetu že na začetku osemdesetih let prejšnjega stoletja ugotovile, da lahko s pomočjo interneta povečajo svojo prepoznavnost in odmevnost del svojih raziskovalcev. Najprej je večina organizacij zaključna dela študija, članke in tehnična poročila objavljala na svojih spletnih straneh ali strežnikih FTP, kasneje pa so ugotovili, da potrebujejo institucionalni repozitorij, ki bo omogočil iskanje in brskanje ter samoshranjevanje teh publikacij (Kim, 2011). Institucionalni repozitorij je digitalna zbirka, ki vsebuje intelektualno produkcijo ustanove, ki ga vzpostavi. Ker so publikacije iz repozitorija dostopne večjemu številu uporabnikov, se lahko znanost hitreje razvija, zato znanje ni več monopol premožnih (Suber, 2012). Tudi slovenske univerze so zainteresirani javnosti doma in v tujini želele omogočiti odprt dostop do svoje intelektualne produkcije. V okviru projekta Pilotna vzpostavitev nacionalne infrastrukture odprtega dostopa do zaključnih del študija in objav raziskovalcev, ki sta ga sofinancirala Evropska unija (iz Evropskega sklada za regionalni razvoj) ter Ministrstvo za izobraževanje, znanost in šport, so bili vzpostavljeni nacionalni portal ter štirje institucionalni repozitoriji, ki omogočajo dostop do zaključnih del študija in publikacij raziskovalcev ter raziskovalnih podatkov. Uporabniški vmesnik omogoča prikaz vsebin v slovenskem in angleškem jeziku prek spletnih brskalnikov, prenosnih naprav ter mobilnih telefonov. Nacionalni portal agregira vsebine iz štirih univerzitetnih repozitorijev in drugih slovenskih zbirk za potrebe skupnega iskalnika, priporočilnega sistema ter detektorja plagiatov. V članku je predstavljen pregled teoretičnih in praktičnih izhodišč glede odprtega dostopa, institucionalnih repozitorijev, nacionalnih infrastruktur odprtega dostopa v Evropski uniji, preverjanja podobnih vsebin in priporočanja podobnih vsebin. Izhodišča so skupaj z analizo stanja odprtega dostopa v Sloveniji pred izvedbo projekta služila za pripravo zasnove projekta. V rezultatih projekta so predstavljeni vzpostavljeni repozitoriji z začetnim uvozom metapodatkov in gradiv, nacionalni portal, preverjanje podobnosti vsebine in priporočanje podobnih vsebin. V razpravi so navedene prednosti vzpostavljene infrastrukture v primerjavi s tujimi sistemi. Na koncu prispevka pa je nekaj zaključnih misli in napotkov za nadaljnje delo. 2 Pregled teoretičnih in praktičnih izhodišč 2.1 Odprti dostop v Evropski uniji Javna sredstva za financiranje raziskav v evropskem raziskovalnem prostoru zagotavlja okvirni program Evropske komisije za raziskave in inovacije ter nacionalnega financiranja. Za celoten evropski raziskovalni prostor je bila sprejeta odločitev o odprtem dostopu do rezultatov javno financiranih raziskav (A reinforced, 2012). V okvirnem programu Obzorje 2020 je nujna odprta dostopnost vseh recenziranih znanstvenih objav iz sofinanciranih projektov, financer tudi spodbuja odprto dostopnost raziskovalnih podatkov (Towards, 2012). Projekti sedmih področij znanosti bodo sodelovali v pilotu odprtih raziskovalnih podatkov. V okviru prijavne vloge bodo morali predstaviti svojo politiko ravnanja z raziskovalnimi podatki, v šestih mesecih po začetku projekta oddati načrt ravnanja z raziskovalnimi podatki in v ustreznem času zagotoviti odprti dostop do njih. Evropska komisija od držav članic EU pričakuje, da bodo nacionalno politiko in določila o odprtem dostopu uskladile z določili, ki veljajo v programu Obzorje 2020 (Commission, 2012). Metapodatki o objavah in raziskovalnih podatkih iz projektov, sofinanciranih z evropskimi ali nacionalnimi javnimi sredstvi, se zbirajo na evropskem portalu OpenAIRE.1 Slovenski nacionalni financerji raziskovalne dejavnosti in raziskovalne organizacije v času pisanja tega članka še niso sprejeli politik odprtega dostopa do recenziranih objav ter raziskovalnih podatkov. 2.2 Institucionalni repozitoriji O izkušnjah, ki so jih pridobili pri vzpostavitvi institucionalnih repozitorijev, poroča več avtorjev. Bevan je opisal svoje izkušnje pri vzpostavitvi repozitorija in procesa oddaje zaključnih del študija na univerzi v Cranfieldu (Bevan, 2005). Westellova je definirala kazalnike, s katerimi lahko merimo uspešnost vzpostavitve institucionalnih repozitorijev (Westell, 2006). Barwickova je opisala, kako so se lotili vzpostavitve institucionalnega repozitorija na Univerzi v Loughboroughu (Barwick, 2007). Doctor in Ramachandran sta se osredotočila na prednosti, ki jih ima zajemanje intelektualnega kapitala, deljenje ter upravljanje znanja v visokošolskih in raziskovalnih organizacijah, ki imajo vzpostavljene institucionalne repozitorije (Doctor in Ramachandran, 2008). Kim je predstavil predvsem prednosti samoshranjevanja publikacij v institucionalnih repozitorijih (Kim, 2011). Aalyon je skupaj s soavtorji prikazal, kako lahko vzpostavitev institucionalnega repozitorija in odprt dostop do publikacij vplivata na odmevnost raziskovalnega dela organizacije v svetu (Alayon et al., 2013). 2.3 Nacionalne infrastrukture odprtega dostopa v Evropski uniji V Evropski uniji je do objav raziskovalcev in zaključnih del študija vzpostavljenih nekaj nacionalnih infrastruktur odprtega dostopa. To so nizozemska infrastruktura NARCIS,2 irska RIAN,3 norveška NORA,4 nemška OA-Netzwerk,5 grška openarchives.gr,6 italijanska PLEIADI,7 poljska Poland Digital Libraries Federation,8 portugalska RCAPP,9 španska Glej OpenAIRE na spletni strani: https://www.openaire.eu/ Glej NARCIS: the gateway to scholarly information in The Netherlands na: http://www.narcis.nl/ Glej RIAN: pathways to Irish research na: http://rian.ie/ Glej NORA: Norwegian Open Research Archives na: http://www.ub.uio.no/nora/search.html?siteLanguage=eng Glej OA-Netzwerk na: http://oansuche.open-access.net/oansearch/ Glej Openarchives.gr: Greek open access infrastructure na: http://www.openarchives.gr/ Glej PLEIADI: Portale per la Letteratura scientifica Elettronica Italiana su Archivi aperti e Depositi Istituzionali na: http://www.openarchives.it/pleiadi/ Glej Poland Digital Libraries Federation - Federacja bibliotek cyfrowych na: http://fbc.pionier.net.pl/owoc Glej RCAAP: Repositorio Cientifico de Acesso Aberto de Portugal na: http://www.rcaap.pt/ RECOLECTA10 in švedska DiVA.11 Leta 2008 so takšno infrastrukturo začeli vzpostavljati na Madžarskem (Karacsony, 2013), vendar še niso zgradili nacionalnega agregatorja vsebin. Osnovne funkcionalnosti evropskih nacionalnih infrastruktur odprtega dostopa so: • vse agregirajo in hranijo metapodatke o različnih vrstah publikacij iz institucionalnih ter tematskih repozitorijev. Nekatere hranijo tudi celotna besedila. Metapodatke in celotna besedila uporabljajo pri enostavnem in naprednem združevalnem iskanju; • nekatere infrastrukture (npr. nemška in grška) omogočajo brskanje po publikacijah, ki so urejene po določeni taksonomiji; • nekatere infrastrukture (npr. nizozemska) agregirajo povezave na raziskovalne podatke; • nekatere infrastrukture (npr. nizozemska) hranijo tudi obogatene publikacije (angl. enhanced publications); • nekatere infrastrukture (nizozemska in grška) ponujajo formatiranje metapodat-kov v različnih formatih (APA, Harvard, stil citiranja IEEE, BIBTEX ...) in njihov izvoz v programe za upravljanje referenc (Zotero, EndNote, Refman, RefWork ...); • nemška nacionalna infrastruktura OA-Netzwerk je edina, ki omogoča preverjanje podobnosti vsebine. Izdelali so javno storitev, s pomočjo katere lahko kdorkoli oddane dokumente primerja z bazo dokumentov, ki jo hranijo nemški repozitoriji, vključeni v to infrastrukturo; • nekatere infrastrukture prikazujejo skupno statistiko dostopa in podatke o številu publikacij (npr. irska); • repozitoriji v vseh infrastrukturah omogočajo izvoz metapodatkov v imenike odprtega dostopa (OpenDOAR, ROAR, BASE, DART-Europe ...) in strežniku OpenAIRE12 dajejo na voljo metapodatke o publikacijah ter raziskovalnih podatkih. 2.4 Preverjanje podobnosti vsebine V zadnjem obdobju se je precej povečal pojav prepisovanja del drugih avtorjev brez ustreznega citiranja. Problem se povečuje z večjo ponudbo elektronskih virov na internetu. Vzrok za necitiranje del drugih avtorjev je lahko neznanje, lahko pa je v ozadju namerno prepisovanje posameznih stavkov ali celo poglavij iz del drugih avtorjev brez navedbe ustreznega vira (Alzahrani et al., 2012). 10 Glej RECOLECTA: Recolector de Ciencia Abierta na: http://www.recolecta.net/ 11 Glej DiVA:Digitala Vetenskapliga Arkivet na: http://www.diva-portal.org/smash/search.jsf 12 Glej OpenAIRE na: https://www.openaire.eu/ Knjižnica, 58 (2014) 3 V tem prispevku se vsebinsko ločita preverjanje podobnosti vsebine in preverjanje pla-giatorstva. Ustrezne programske opreme določijo stopnjo podobnosti vsebin. O plagi-atorstvu odloča človek na osnovi stopnje podobnosti in drugih meril. 2.5 Priporočanje podobnih vsebin Sistemi priporočanja so uveljavljeni predvsem na spletnih straneh, ki se ukvarjajo s prodajo izdelkov ali reklam. Vedno bolj pa se uveljavljajo tudi v institucionalnih repo-zitorijih. Glavni cilj teh sistemov je uporabnikom ponuditi vsebine, ki bi jih zanimale. Obstaja več pristopov k priporočanju, ki se delijo v dve skupini. Prvo skupino predstavljajo pristopi, ki delujejo izključno nad uporabniškimi aktivnostmi (Su in Khoshgof-taar, 2009). Raziskovalci, ki razvijajo algoritme, katerih vhod so uporabniške aktivnosti, analizirajo verjetnost, da bo uporabnik izbral neko vsebino, če so jo izbrali tudi drugi uporabniki, ki jih zanimajo podobne stvari. Najbolj razširjeni algoritmi so vezani na sodelovalno filtriranje (angl. collaborative filtering), pristope z binarnimi vektorji in algoritem SlopeOne. Druga skupina pristopov priporočanja deluje zgolj nad vsebino, uporabniške aktivnosti so postranskega pomena in se lahko uporabljajo za dodatne uteži pri razvrščanju rezultatov. Primeri algoritmov za priporočanje sorodnih vsebin so BM25, k najbližjih sosedov, latentna pomenska analiza (LSA) in drugi, ki so bili izpeljani iz podobnih predpostavk. Poleg tega se pristopi razlikujejo tudi glede na to, ali se priporočanje izvaja v realnem času (angl. memory based recommendation) ali pa so rezultati vnaprej pripravljeni in se enkrat ali večkrat na dan na novo izračunajo (angl. model based recommendation); lahko pa je uporabljen hibridni pristop (Bobadilla et al., 2013). 2.6 Stanje odprtega dostopa v Sloveniji pred izvedbo projekta Stanje v Sloveniji do vključno leta 2010 je razvidno iz zbornika 4. skupnega strokovnega posvetovanja sekcij za specialne in visokošolske knjižnice Zveze bibliotekarskih društev Slovenije (Božič in Zemljič, 2010). Na slovenskih univerzah je bilo do leta 2012 vzpostavljenih nekaj repozitorijev in digitalnih zbirk, ki so se večinoma polnile z obvezno oddajo visokošolskih del, ne pa tudi s končnimi različicami objav raziskovalcev. Gradiva so v večini primerov shranjevali knjižničarji, in ne avtorji publikacij. Slovenski odprtodostopni repozitoriji in portali, ki so delovali pred vzpostavitvijo nacionalne infrastrukture odprtega dostopa, so Digitalna knjižnica Slovenije (dLib.si),13 Digitalna knjižnica Univerze v Mariboru 13 Glej Digitalna knjižnica Slovenije na: http://www.dlib.si/ 20 (DKUM),14 PeFprints,15 ePrints.FRI,16 Digitalni repozitorij UL FGG (DRUGG),17 VideoLectu-res.NET18 in Digitalna knjižnica Ministrstva za obrambo (DKMORS).19 Arhiv družboslovnih podatkov20 zbira raziskovalne podatke s področja družboslovja. Dve večji zbirki del Univerze v Ljubljani sta bili še Dela Ekonomske Fakultete in Dela Fakultete za družbene vede. Prav tako so na Univerzi v Ljubljani obstajale digitalne zbirke publikacij na Fakulteti za upravo, Fakulteti za šport, Biotehniški fakulteti, Fakulteti za farmacijo in Filozofski fakulteti. Na Univerzi na Primorskem sta obstajali zbirki na Fakulteti za management in Fakulteti za humanistične študije. Prav tako je tudi že bila vzpostavljena zbirka del na Univerzi v Novi Gorici. Navedeni repozitoriji in zbirke niso bili povezani v nacionalno infrastrukturo, ki bi omogočala iskanje ter prikaz rezultatov na skupni spletni strani ali v skupni mobilni aplikaciji. 3 Zasnova projekta 3.1 Metodologija Na začetku projekta je bil določen način dela, definirala se je organizacijska struktura projekta in izbrala metoda razvoja celotnega sistema. V fazi analize stanja, zahtev in možnosti so bili analizirani obstoječi podatkovni viri del univerz/članic, obstoječi visokošolski ter kadrovski informacijski sistemi univerz/članic, obstoječi procesi oddaje zaključnih in drugih del na univerzah/članicah ter pravne podlage za digitalno distribucijo del. Pregledane so bile zahteve glede omejevanja dostopa do del in zahteve univerz/članic v zvezi s podporo postopka oddaje del za študente ter zaposlene. Opravljena je bila analiza možnosti podpore za mobilne naprave in dokumente, ki opisujejo vzpostavitev kompatibilnosti s portalom OpenAIRE. Definirane so bile oblikovne podobe repozitorijev univerz in načrtovane izvedbe nadgradnje programske opreme DKUM, skupnega portala ter baze dokumentov z metapodatki za potrebe pri- 14 Glej Digitalna knjižnica Univerze v Mariboru na: http://dkum.uni-mb.si/ 15 Glej PeFprints - repozitorij Pedagoške fakultete Univerze v Ljubljani na: http://pefprints.pef.uni-lj.si/ 16 Glej ePrints.FRI - repozitorij Fakultete za računalništvo in informatiko, Univerze v Ljubljani na: http://eprints. fri.uni-lj.si/ 17 Glej DRUGG - repozitorij Fakultete za gradbeništvo in geodezijo Univerze v Ljubljani na: http://drugg.fgg. uni-lj.si/ 18 Glej VideoLectures.NET na: http://videolectures.net/ 19 Glej DKMORS - digitalna knjižnica Ministrstva za obrambo na: http://dk.mors.si/ 20 Glej Arhiv družboslovnih podatkov na: http://www.adp.fdv.uni-lj.si/ Knjižnica, 58 (2014) 3 poročanja, preverjanja podobnosti vsebin in iskanja. V fazi implementacije so bili izvedeni kodiranje, testiranje in čiščenje napak programske opreme ter njeno testiranje pri ključnih končnih uporabnikih. Implementirani so bili adaptacija programske opreme DKUM, skupni portal in baza dokumentov z metapodatki ter predstavitveni portali re-pozitorijev in skupne storitve v posameznih repozitorijih. Izvedena je bila integracija repozitorija Univerze v Ljubljani z dokumentnim sistemom te univerze in implementirana oblikovna podoba posameznega repozitorija ter testirane implementirane rešitve. Nameščena je bila strojna in programska oprema. V zaključnih aktivnostih je bilo analizirano doseganje rezultatov in ciljev projekta, pripravljena sta bila zaključno ter finančno poročilo, omogočen spletni in mobilni dostop do repozitorijev ter do nacionalnega portala, s čimer so bile seznanjene različne javnosti. 3.2 Omejitve projekta Vzpostavljena nacionalna infrastruktura odprtega dostopa je zajela približno osemdeset odstotkov recenziranih objav slovenskih raziskovalcev (tistih, ki so zaposleni na univerzah) in skoraj vsa zaključna dela študija, ki vsako leto nastanejo na slovenskih visokošolskih zavodih. Za shranjevanje in odprt spletni dostop do celotnih vsebin objav drugih raziskovalcev (iz inštitutov, samostojnih raziskovalcev ...) bo treba vzpostaviti dodaten skupni repozitorij. Za sodelavce projekta je bila največja omejitev kratek čas za izvedbo zelo obsežno zasnovanega projekta (šest mesecev). Velika raznovrstnost organiziranosti univerz in zasnove njihovih informacijskih sistemov je povzročila dodatno delo s prilagajanjem izvedb funkcionalnosti. 4 Rezultati Najpomembnejši rezultati projekta »Pilotna vzpostavitev nacionalne infrastrukture odprtega dostopa« so: • definirane so pravne podlage za shranjevanje publikacij v institucionalne repozitorije; • vzpostavljeni so procesi za vstavljanje zaključnih del študija in publikacij raziskovalcev; • vzpostavljeni so nacionalni portal in institucionalni repozitoriji slovenskih univerz; • vzpostavljen je sistem za priporočanje publikacij; • vzpostavljen je sistem za preverjanje podobnosti vsebine. 4.1 Pravne podlage za shranjevanje publikacij v institucionalne repozitorije V okviru projekta so bili analizirani avtorskopravni vidiki shranjevanja zaključnih del študija v repozitorije univerz in njihove odprte dostopnosti ter podani predlogi ustrezne dopolnitve aktov univerz. Na Univerzi v Ljubljani je bil 127. člen Statuta Univerze dopolnjen glede oddaje elektronske oblike zaključnega dela študija (Dopolnitev, 2013). Dopolnitve določajo, da mora študent ob predložitvi zaključnega dela študija s pisno izjavo potrditi, da je zaključno delo rezultat njegovega samostojnega dela, da je tiskani izvod identičen z elektronskim in da na univerzo neodplačno, neizključno, prostorsko ter časovno neomejeno prenaša pravico shranitve avtorskega dela v elektronski obliki in reproduciranja ter pravico omogočanja javnega dostopa do avtorskega dela na svetovnem spletu prek Repozitorija Univerze v Ljubljani. Senat Univerze določi pogoje, ob katerih se objava zaključnega dela na svetovnem spletu za določen čas zadrži. Univerza v Novi Gorici je določila glede obvezne oddaje zaključnih del študija vključila v pravilnike o zaključnih delih študija. V tovrstne pravilnike o pripravi in zagovoru zaključnih del študija so določila vključena tudi na Univerzi v Mariboru. Obvezna oddaja elektronskih oblik objav zaposlenih je priporočena v pravilniku o obveznem izvodu publikacij te univerze. Avtorskopravni vidik shranjevanja znanstvenih in strokovnih objav v repozitorije je določen v pogodbah, ki jih avtorji in založniki sklenejo ob sprejemu recenziranega rokopisa v objavo. 4.2 Nacionalni portal odprte znanosti Nacionalni portal odprte znanosti21 agregira metapodatke in vsebine iz institucionalnih repozitorijev univerz ter del vsebin iz dLib.si, DKMORS in VideoLectures.NET. Shema slovenske nacionalne infrastrukture odprtega dostopa je prikazana na Sliki 1. Nacionalni portal uporablja agregirane metapodatke in vsebine za potrebe združevalnega iskanja, priporočanja gradiv in preverjanja podobnosti vsebin. 21 Glej Nacionalni portal odprte znanosti na: http://openscience.si/ ePrints.FRI PeFprints I DRUGG I ADP Slika 1: Shema slovenske nacionalne infrastrukture odprtega dostopa Institucionalni repozitoriji univerz v Ljubljani,22 Mariboru,23 na Primorskem24 in v Novi Gorici25 hranijo celotna besedila zaključnih del študija in objav raziskovalcev ter drugo intelektualno produkcijo univerz (učna gradiva, poročila o projektih, elaborate, elektronske publikacije in monografije, raziskovalne podatke ...). Repozitorij Univerze v Ljubljani poleg celotnih besedil članic univerze, ki nimajo svojega repozitorija, hrani tudi metapodatke in celotna besedila publikacij iz ePrints.FRI, PeFprints in DRUGG ter metapodatke o raziskovalnih podatkih, ki jih zbira Arhiv družboslovnih podatkov. 4.3 Institucionalni repozitoriji slovenskih univerz Na Sliki 2 je prikazana podrobnejša shema povezav posameznega institucionalnega repozitorija z drugimi sistemi. 22 Glej Repozitorij Univerze v Ljubljani na: https://repozitorij.uni-lj.si 23 Glej Digitalna knjižnica Univerze v Mariboru na: http://dkum.uni-mb.si/ 24 Glej Repozitorij Univerze na Primorskem na: http://www.odun.univerza.si/ 25 Glej Repozitorij Univerze v Novi Gorici na: http://repozitorij.ung.si/ "ftp Dokumentni sistem Univerze v Ljubljani ARNES AAI ali avtentikacijski Univerzitetni informacijski sistem EPrints repozitoriji spletna storitev Open Science Slovenia Videoiectures. NET OpenAIRE, DART-Europe, BASE, ROAR, OpenDOAR si. «ran XML, spletne storitve, OAI-PMH Ostali viri Slika 2: Shema povezav Institucionalnega repozitorija z drugimi sistemi Nacionalna infrastruktura odprtega dostopa je povezana s slovenskim bibliografskim sistemom COBISS.SI (Seljak in Seljak, 2002),26 ki ponuja kakovosten nabor metapodat-kov publikacij, te pa se hranijo v institucionalnih repozitorijih univerz. Nacionalni portal in institucionalni repozitoriji izvajajo izmenjavo metapodatkov iz sistema COBISS.SI prek protokola SRU/SRW. Programska oprema za institucionalne repozitorije temelji na programski opremi, ki jo uporablja Digitalna knjižnica Univerze v Mariboru in jo je razvila Univerza v Mariboru (Brezovnik in Ojsteršek, 2011). Zaradi vzpostavitve različnih procesov, po katerih študenti in zaposleni na univerzah oddajajo publikacije, je bila bistveno dopolnjena ter nadgrajena z novimi funkcionalnostmi. Zaradi procesov oddaje, hranjenja in katalogizacije publikacij je vsak institucionalni repozitorij povezan z avtentikacijskim sistemom univerze, univerzitetnim visokošol- 26 Glej tudi COBISS.SI - Slovenian Cooperative Online Bibliographic System and Services na: http://www. cobiss.si/ skim informacijskim sistemom in sistemom COBISS.SI (Slika 2). Na Univerzi v Ljubljani se po shranitvi v repozitorij elektronske publikacije shranijo še v dokumentni sistem univerze. Za sekundarno hranjenje publikacij in njihovih metapodatkov se uporablja nacionalni portal. Institucionalni repozitoriji pošiljajo v nacionalni portal metapodatke in elektronske različice publikacij takoj po izvedeni katalogizaciji v COBISS.SI. Iz nacionalnega portala pa repozitorij Univerze v Ljubljani pridobiva metapodatke in elektronske različice publikacij iz zbirk ePrints.FRI, DRUGG, PeFprints in ADP. Prav tako institucionalni repozitorij iz nacionalnega portala pridobi dodatne podatke o raziskovalcih in raziskovalnih organizacijah, ki jih slednji črpa iz SICRIS-a. Nacionalni portal izvaja priporočanje gradiv. Ob kliku na dokument v institucionalnem repozitoriju se iz nacionalnega portala v institucionalni repozitorij pošlje seznam podobnih dokumentov. Priporočilo je sestavljeno iz naslovov dokumentov znotraj institucionalnega repozitorija in naslovov dokumentov v drugih univerzitetnih repozitori-jih, dLib.si, VideoLectures.NET in DKMORS. Institucionalni repozitoriji omogočajo funkcionalnost, ki je namenjena skrbnikom, in funkcionalnost, ki je namenjena uporabnikom. Skrbniški del uporabljajo referenti v študijskih referatih, knjižničarji in skrbniki sistema in je različno zasnovan za potrebe posamezne univerze. Referenti izvajajo pregled in zaklepanje zaključnih del študentov. Knjižničarji pregledujejo publikacije študentov in zaposlenih, jih katalogizirajo v COBISS-u ter njihove metapodatke iz COBISS.SI prenesejo v institucionalni repozitorij. V skrbniškem delu lahko knjižničar metapodatke o publikaciji uvozi iz lokalne baze COBISS.SI in jim doda elektronsko različico publikacije. Na tak način je mogoče v repozitorij shraniti tudi publikacije, ki so že katalogizirane v COBISS.SI in zanje obstajajo elektronske različice ter ima univerza zanje ustrezno urejene avtorske pravice. Uporabniški del institucionalnega repozitorija je razdeljen na del, ki je namenjen zainteresirani javnosti, in del, ki je namenjen prijavljenim uporabnikom (študentom in zaposlenim na univerzah; različna zasnova za posamezne univerze). Študenti in zaposleni na univerzah lahko po prijavi oddajo svoja dela v repozitorij ter pregledujejo svoje vsebine (metapodatke in podobna dela, ki jih je našel detektor podobnih vsebin). Del, ki je dostopen zainteresirani javnosti, je dvojezičen (slovenski in angleški uporabniški vmesnik) ter je dostopen na spletu in na mobilnih platformah (Android, iPhone in Windows Phone). Spletna različica je prijazna do uporabnikov s posebnimi potrebami in vsebuje glavne značilnosti spletnih aplikacij, ki ustrezajo specifikaciji WAI.27 Spletni vmesnik omogoča uporabo invalidom z zmanjšano gibalno sposobnostjo in osebam, ki vidijo nekoliko slabše (npr. starejši in slabovidni). 27 Glej Web Accessibility Iniciative na: http://www.w3.org/WAI/ 26 Programska oprema omogoča enostavno in napredno iskanje ter brskanje. Članica univerze lahko prikaz vključi na svojo spletno stran tako, da kliče ustrezen JavaScript program ali uporabi JavaScript API28 za dostop do enostavnega ali naprednega iskanja ter brskanja po institucionalnem repozitoriju. Enak API uporabljajo tudi mobilne aplikacije. Članicam univerz in zaposlenim na univerzah je omogočen tudi izvoz metapo-datkov o njihovih publikacijah v obliki RSS, JSON in RDF. Institucionalni repozitorij prikazuje različne statistike, iz katerih je za vsako članico univerze razvidno, kakšno je celotno število njenih publikacij v repozitoriju, koliko jih je bilo shranjenih v zadnjem obdobju ter število vpogledov ali prenosov posamezne publikacije. Za članice univerze so zanimive statistike, ki poročajo o številu ogledov in prenosov gradiv članice univerze za pretekla leta na letni ravni. Statistike mentorjev zaključnih del študija kažejo, s katerimi somentorji slednji sodelujejo in katera zaključna dela študija so študenti izdelali pod njihovim mentorstvom. Zanimiva je tudi statistika, ki na podlagi ključnih besed publikacij mentorja posredno prikaže, s katerimi raziskovalnimi področji se ta ukvarja in kako se je skozi časovno obdobje spreminjalo njegovo raziskovalno področje. 4.3.1 Shranjevanje zaključnih del študija Študenti univerz v Mariboru in Novi Gorici zaključno delo študija oddajo na vmesniku repozitorija, študenti univerz v Ljubljani in na Primorskem pa v študijski informatiki članice oziroma univerze. Ko študent odda zaključno delo v institucionalni repozitorij Univerze v Mariboru ali univerze v Novi Gorici, institucionalni repozitorij pokliče storitev, ki za vse oddane dokumente preveri podobnost z drugimi deli. Storitev pokaže povezavo na spletno stran, kjer lahko mentor, študent ali uslužbenec referata preverijo, v kolikšni meri je delo podobno drugim. Prav tako si lahko natisnejo poročilo o podobnosti z drugimi deli. Ko je mentor na univerzi v Mariboru ali v Novi Gorici zadovoljen s končno različico zaključnega dela, lahko študent zaključi oddajo elektronske oblike zaključnega dela v institucionalni repozitorij, tiskano različico pa odda v študijski referat. Slednji preveri istovetnost tiskane in elektronske različice zaključnega dela ter izjave, ki sta jih podpisala študent in mentor. To so izjave o vsebinski in oblikovni ustreznosti oz. istovetnosti tiskane ter elektronske različice dela, o neizključnem prenosu materialnih avtorskih pravic in o določitvi embarga za prikaz dela na svetovnem spletu. 28 Glej Dokumentacija spletnega API-ja digitalne knjižnice na: http://repozitorij.uni-lj.si/pomoc.php?id= Knjižnica, 58 (2014) 3 webapi Po oddaji dela na vmesniku študijske informatike članice Univerze v Ljubljani se na nacionalnem portalu preveri podobnost zaključnega dela študija z drugimi deli. Visokošolski informacijski sistem pokliče spletno storitev na nacionalnem portalu, katere vhod je gradivo, rezultat pa poročilo o podobnosti gradiva z drugimi gradivi, ki ga nato visokošolski informacijski sistem shrani. Delo po preverjanju podobnosti vsebine ostane v korpusu detektorja podobnih vsebin. Ta vsebina ni javno vidna, dokler ni javno objavljena v repozitoriju Univerze v Ljubljani. Po zagovoru zaključnega dela knjižničar dobi tiskano različico publikacije in delo kata-logizira v sistem COBISS.SI. Na Univerzi v Ljubljani se po uspešno izvedeni katalogizaciji v COBISS.SI zaključno delo študija shrani še v dokumentni sistem univerze. 4.3.2 Shranjevanje objav raziskovalcev Na vseh štirih univerzah je za potrebe shranjevanja publikacij raziskovalcev vzpostavljen enak proces. Raziskovalec lahko v institucionalni repozitorij shranjuje članke, poglavja ali sestavke v monografiji, prispevke s konference, monografije, visokošolske učbenike ali drugo učno gradivo, patente, raziskovalne podatke in druge vrste publikacij. Vrste publikacij so prilagojene tipologiji dokumentov za vodenje bibliografij v sistemu COBISS.SI. Del metapodatkov je različen za različne vrste publikacij. Raziskovalec se prijavi v institucionalni repozitorij, vpiše metapodatke in odda elektronsko različico gradiva ali uporabi metapodatke o katalogiziranem gradivu iz sistema COBISS.SI. Programska oprema institucionalnega repozitorija omogoča avtorjem gradiv tudi povezavo s portalom SHERPA/RoMEO,29 na katerem preverijo, kakšno vrsto dostopa do elektronske različice članka v reviji lahko uporabijo glede na pogodbo o prenosu avtorskih pravic, ki so jo sklenili z založnikom. Prav tako vnašalcu metapodatkov ob vnosu imen in priimkov avtorjev programska oprema ponudi predloge avtorjev v bazi CONOR.SI. Avtor lahko za svoja dela vpiše nosilca avtorskih pravic in vrsto dostopa do celotnega besedila (takojšnja dostopnost na svetovnem spletu, odlog objave do poteka datuma embarga ali zaprt dostop) ter vpiše datum embarga. Metapodatki so skladni z navodili OpenAIRE, ki omogočajo, da strežnik OAI-PMH v institucionalnih repozi-torijih vrača OpenAIRE kompatibilen XML, tako da lahko strežniki portala OpenAIRE zajemajo metapodatke o slovenskih publikacijah, ki so bile financirane s sredstvi EU ali drugih javnih financerjev. 29 Glej SHERPA/RoMEO na:http://www.sherpa.ac.uk/romeo/ 4.3.3 Začetni uvoz metapodatkov in gradiv Začetni uvoz metapodatkov in gradiv v nacionalno infrastrukturo odprtega dostopa je bil omejen na gradiva univerz, ki so bila dostopna na svetovnem spletu ter so bila na strežnikih univerz, v dLib.si, DKMORS in VideoLectures.NET. Gradiva so bila najprej uvožena v nacionalni portal in z nacionalnega portala prenesena v institucionalne repozitorije univerz, iz katerih so njihovi avtorji. Gradiva iz dLib.si, DKMORS in VideoLectures.NET so uporabljena samo za potrebe iskanja v nacionalnem portalu in za priporočanje vsebin v institucionalnih repozitorijih. Po končanem uvozu gradiv so bili iz vzajemnega kataloga COBIB.SI uvoženi metapo-datki o elektronskih gradivih, ki so v metapodatkih o naslovu URL vsebovala ustrezno domeno glede na uvožene vire. Če so imela gradiva v metapodatkih enak naslov URL do gradiva ali enak COBISS.SI-ID, so bili metapodatki iz zbirk članic univerze in iz COBIB.SI združeni. Prednost so imeli metapodatki iz sistema COBIB.SI, ki so v primeru podvajanja istih metapodatkov (npr. naslova publikacije) prekrili metapodatke, pridobljene iz preostalih virov. 4.4 Preverjanje podobnosti vsebine Ugotavljanje podobnosti med dokumenti se v detektorju podobnih vsebin na nacionalnem portalu odprte znanosti izvaja v dveh korakih. V prvem koraku, imenovanem »ugotavljanje grobe podobnosti« (angl. fingerprinting), programska oprema za preverjanje podobnosti določi dokumente, ki so po vsebini najbolj podobni dokumentu, ki se ga želi preveriti. Za ta namen se uporabljajo algoritmi, ki za celotno vsebino dokumenta ali za posamezne odseke dokumenta (poglavje, odstavek, stavek, določeno število besed) izračunajo značilke (Stein, 2007; Alzahrani et al., 2012; Brezovnik in Ojsteršek, 2011a). V tem koraku program tudi določi, katere dokumente bo uporabil za nadaljnjo obdelavo. Programska rešitev izračuna značilke iz posameznih povedi. V drugem koraku, imenovanem »ugotavljanje znakovne podobnosti« (angl. pairwise feature-based exhaustive analysis), se vsak dokument preveri z vsakim z ugotavljanjem najdaljših skupnih podnizov znakov (Navarro, 2001). Ta primerjava se izvede samo za dokumente, pridobljene s prvim korakom. Zaznavanje podobnosti vsebin (plagiatorstva) se v nacionalni infrastrukturi odprtega dostopa izvaja na nacionalnem portalu. Rezultate podobnosti lahko ob ustrezni avten-tikaciji in avtorizaciji v institucionalnem repozitoriju ali v akademskem informacijskem sistemu univerze pogledajo pooblaščene osebe. Študent ali zaposleni na univerzi lahko vidi samo dela, ki jih je napisal ali je pri njih sodeloval kot soavtor ali mentor. Program za preverjanje podobnosti izvede primerjavo podobnosti za vsako delo, shranjeno v repozitorije univerz. Program ne preverja podobnosti slik. Poročilo primerjave povedi Levi dokument: Seminarska_naloga.docx Desni dokument: SPLETNI PORTALI ZA ELEKTRONSKO POSLOVANJE MED PODJETJI Pokritost v levem: 1,59 % Pokritost v desnem 0,39 % Ko poveže globlja občutenja ljudi z razlogi obstoja podjetja, utrjuje občutek smiselnosti dela in notranjega zadovoljstva ob njem (130 znakov) Postavi temelje za strateške načrte in scenarije, s katerimi podjetje predvidi Doti. do katerih io bo uresničevalo vzDuja zaupanje v podjetje. oasno poslanstvo je lanko A pomembno orodje vodenja in načrtovanja. Ko poveže globlja občutenja ljudi z razlogi obstoja podjetja, utrjuje občutek smiselnosti dela in notranjega zadovoljstva ob njem. Jasen občutek poslanstva je najbolj učinkovit, kadar ga spremlja tako jasno razumevanje temeljnih vrednot podjetja kot tudi privlačna vizija prihodnosti. Poslanstvo, ki ga ne dopolnjuje močna, privlačna in uresničljiva vizija, lahko vodi v togost. Krčevito oklepanje trenutnega (in morda zastarelega) razumevanja podjetja pa hromi njegove ustvarjalne in razvojne potenciale (prav tam). Poslanstvo se nekako opredeljuje s tremi ključnimi vprašanji (Musek, 2014c): Zakaj obstaja podjetje, katere potrebe zadovoljuje (cilji, nameni, uporabniki)? zaupanje v podjetje, jasno poslanstvo je lahko pomembno orodje vodenja in načrtovanja. Ko poveže globlja občutenja ljudi z razlogi obstoja podjetja, utrjuje občutek smiselnosti dela in notranjega zadovoljstva ob njem. sn občutek poslanstva je najbolj učinkovit, kadar ga spremlja tako jasno razumevanje temeljnih vrednost podjetja kot tudi vizija prihodnosti. Poslanstvo, ki ga ne dopolnjuje Slika 3: Primer izpisa podobnosti besedil po primerjavi povedi med dvema besediloma (ugotavljanje grobe podobnosti med dvema besediloma) Program, ki preverja podobnost povedi med besedili (Slika 3), v obeh besedilih odkrije podobne povedi, ki so daljše od štiridesetih znakov. Meja štiridesetih znakov je nastavljena na podlagi izkušenj, pridobljenih od leta 2008 z detekcijo podobnih vsebin na nivoju povedi. Krajše povedi namreč navadno predstavljajo fraze ali ustaljeno strokovno terminologijo. Program zazna podobne povedi v besedilih, čeprav je v njih zamenjan vrstni red uporabljenih besed ali so uporabljena mašila ter zelo pogoste besede (npr. torej, pa, in, ali ...) ali pa so v besedah tipkarske napake. Program, ki izvaja znakovno primerjavo podobnosti med besedili (Slika 4), išče najdaljše skupne podnize med dvema besediloma. Omejen je na skupne podnize znakov, ki so daljši od 14 znakov. Ko dobi najdaljše skupne podnize znakov med posameznimi dokumenti, izloči podnize, ki so krajši od 30 znakov in se nahajajo v istem dokumentu več kot 350 znakov od drugih skupnih podnizov znakov. Tudi zgoraj omenjene dolžine podnizov in razdalj med podnizi so določene na podlagi študije velikega števila podobnih dokumentov, ki so bili ročno pregledani od leta 2008. Poročilo fine primerjave Levi dokument: Seminarska_naloga.docx Desni dokument: SPLETNI PORTALI ZA ELEKTRONSKO POSLOVANJE MED PODJETJI Pokritost v levem: 11.04 % Pokritost v desnem: 2.87 % Jasen občutek poslanstva motivira zaposlene h kakovostnemu delu. menedžerje h kakovostnemu in učinkovitemu vodenju, uporabnikom in širši skupnosti pa vzbuja zaupanje v podjetje Jasno poslanstvo je la (373 znakov) Pri viziji ne gre le za opis, kam se bo bodietie usmerilo v Drihodnosti. Jasen občutek poslanstva motivira zaposlene h kakovostnemu delu, menedžerje h kakovostnemu in učinkovitemu vodenju, uporabnikom in širši skupnosti pa vzbuja zaupanje v podjetje. Jasno poslanstvo je lahko pomembno orodje vodenja in načrtovanja. Ko poveže globlja občutenja ljudi z razlogi obstoja podjetja, utrjuje občutek smiselnosti dela in notranjega zadovoljstva ob njem. Jasen občutek poslanstva je najbolj učinkovit, kadar ga spremlja tako jasno razumevanje temeljnih vrednot podjetja kot tudi privlačna vizija prihodnosti. Poslanstvo, ki ga ne dopolnjuje močna, privlačna in uresničljiva vizija, lahko vodi v togost. Krčevito oklepanje trenutnega (in morda zastarelega) razumevanja podjetja pa hromi njegove ustvarjalne in razvojne potenciale (prav tam). Poslanstvo se nekako opredeljuje s tremi ključnimi vprašanji (Musek, 2014c): Zakai obstaja podjetje, katere potrebe zadovoljuje idiiKU pomeiuuiiu uruuje vuueiija 111 nacn-uvdnjd. ru puvei,t globlja občutenja ljudi z razlogi obstoja podjetja, utrjuje občutek smiselnosti dela in notranjega zadovoljstva ob Jasen občutek poslanstva je najbolj \ spremlja tako jasno razumevanje temeljnih vrednost podjetja kot tudi vizija prihodnosti. Poslanstvo, ki ga ne dopolnjuje močna, privlačna in uresničljiva vizija, lahko vodi v togost. Krčevito oklepanje morda zastarelega razumevanja podjetja pa ohromi njegove ustvarjalne in razvojne potenciale. Slika 4: Primer izpisa podobnosti po izvedbi znakovne primerjave med dvema besediloma Pri nekaterih gradivih je lahko razlika med izračunom podobnosti povedi in podobnosti, ki se pokaže po znakovni primerjavi podobnosti, velika. To velja predvsem za gradiva, ki so si na nivoju podobnih povedi zelo različna (npr. nobena cela poved ni enaka v obeh dokumentih). V teh primerih so avtorji vzeli določene povedi iz drugih dokumentov in jih delno spremenili, zato jih program za ugotavljanje podobnosti povedi ni zaznal. Programska rešitev, ki v prvem koraku vrne dokumente za znakovno primerjavo, je bila zato dopolnjena še z iskanjem dokumentov, ki se uporabljajo pri priporočanju vsebin. Dokumenti, ki so med seboj v povedih podobni za več kot 1 odstotek, so kandidati za ugotavljanje znakovne podobnosti. Če je teh kandidatov manj kot 50, potem program vzame še druge najbolj podobne dokumente, ki jih dobi po primerjavi s pomočjo algoritma BM25 (Robertson et al., 2004). Programska rešitev prav tako generira skupno poročilo o podobnosti med ocenjevanim dokumentom in izbranimi dokumenti ali med vsemi dokumenti, ki jih je program izbral kot kandidate za izvedbo znakovne primerjave podobnosti. 4.5 Priporočanje podobnih vsebin Priporočilni sistem v institucionalnih repozitorijih omogoča, da ima uporabnik ob prikazu metapodatkov izbranega dokumenta na voljo tudi informacije o dokumentih, ki so po vsebini podobni izbranemu dokumentu, pri čemer se izločijo vsi dokumenti, ki so delni duplikati izbranega dokumenta. Delni duplikati se določijo tako, da se uporabijo rezultati primerjave podobnih povedi in znakovne primerjave, ki sta opisani v prejšnjem poglavju. V programski opremi je bilo uporabljeno vsebinsko priporočanje dokumentov, ki deluje po algoritmu izračuna vrednosti BM25 (Robertson et al., 2004) in uporablja še dodatne uteži (Borovič, 2012), ki so pridobljene iz metapodatkov dokumentov in opazovanjem uporabnikovih aktivnosti. Vsebinsko priporočanje se v nacionalni infrastrukturi odprtega dostopa izvaja na nacionalnem portalu. Ob kliku na dokument v institucionalnem repozitoriju se z nacionalnega portala v institucionalni repozitorij pošlje seznam podobnih dokumentov. Priporočilo je sestavljeno iz naslovov dokumentov znotraj institucionalnega repozitorija in naslovov dokumentov v drugih digitalnih zbirkah (dLib.si, VideoLectures.NET in DKMORS). 5 Razprava 5.1 Repozitoriji univerz Štiri univerze so z upoštevanjem najnovejših dosežkov pri gradnji institucionalnih repozitorijev in primerov dobre prakse pri vzpostavljanju evropskih nacionalnih infrastruktur zgradile slovensko nacionalno infrastrukturo odprtega dostopa do zaključnih del študija ter objav raziskovalcev. Repozitoriji so integrirani z visokošolskimi informacijskimi sistemi ter avtentikacijskimi sistemi univerz, COBISS.SI, SICRIS in federacijo ARNES AAI. O tovrstnem povezovanju in izrabi visokošolskih, raziskovalnih ter knjižničnih informacijskih sistemov tuje univerze v povezavi z repozitoriji ne poročajo. Prednost slovenske nacionalne infrastrukture bi lahko bila tudi, da vsi repozitoriji uporabljajo isto programsko opremo. Omogočena je tudi shranitev manjših datotek z raziskovalnimi podatki (do največ 1 GB). Repozitoriji univerz so vpisani v imenike odprtega dostopa (OpenDOAR, ROAR, BASE, DART-Europe ...). Preverjanje podobnosti vsebine se na nacionalnem portalu izvede za vsako delo, shranjeno v enega od repozitorijev univerz (od evropskih samo nemška infrastruktura odprtega dostopa omogoča preverjanje podobnosti vsebine), kar bo po predvidevanjih bistveno zmanjšalo možnosti za plagiatorstvo v zaključnih delih študija. Izkušnje Univerze v Mariboru, ki uporablja sistem za ugotavljanje podobnih del od leta 2008, kažejo, da se je število plagiatov zaključnih del zmanjšalo, povečalo pa se je število ustrezno citiranih delov besedil v zaključnih delih. Sistem za preverjanje podobnosti v primerjavi s tujimi programi za preverjanje podobnosti vsebine odlikuje obsežen korpus besedil v slovenskem jeziku, ki se sproti dopolnjuje z novimi deli, za katera je bila preverjena podobnost (korpus detektorja podobnih vsebin vsebuje več kot 1,9 milijona besedil v slovenskem jeziku in več kot 7 milijonov besedil v angleškem jeziku). Pri pregledu literature in primerov dobre prakse ni bilo zaslediti, da bi v tujih repozi-torijih priporočali podobne vsebine iz drugih digitalnih zbirk, kot je to mogoče v repozitorijih slovenskih univerz. Nacionalni portal in repozitoriji univerz so dostopni tudi prek mobilnih aplikacij ter drugih prenosnih naprav (Android, iPhone in Windows Phone, vmesnik HTML5), kar v tujih repozitorijih ter na evropskih nacionalnih portalih ni omogočeno. Raziskovalcem slovenskih univerz je z ustreznimi funkcionalnostmi programske opreme omogočeno izpolnjevanje določil pogodb o sofinanciranju z javnimi sredstvi. Repozitoriji univerz so kompatibilni s priporočili OpenAIRE, zato bo Evropska komisija lahko samodejno zajemala metapodatke o objavah iz javno financiranih raziskav in jih prikazovala na portalu OpenAIRE. Vzpostavljena infrastruktura bo odgovornim v slovenski znanstveni politiki omogočila sprejem določil o obvezni odprti dostopnosti rezultatov iz nacionalno financiranih raziskav, kot se pričakuje od države članice EU, ki sodeluje v evropskem raziskovalnem prostoru. Odprta dostopnost objav in raziskovalnih podatkov bo po predvidevanjih povečala vidnost ter vpliv slovenskih raziskovalcev in raziskovalnih organizacij, zaradi česar je pričakovati več možnosti za mednarodno sodelovanje na področju visokega šolstva ter znanosti (Koler-Povh et al., 2014). Uporaba repozitorijev v domenah univerz bo izboljšala statistiko uporabe spletnih strani univerz in s tem izboljšala njihove uvrstitve na lestvici Webometrics (Alayon et al., 2013). Odprto dostopne rezultate javno financiranih raziskav bodo lahko uporabili slovenska in tuja podjetja ter laična javnost. Po pričakovanjih bo zavedanje študentov in mentorjev o prosti dostopnosti celotnih vsebin zaključnih del študija izboljšalo kakovost teh del in s tem vplivalo tudi na kakovost visokošolskega izobraževanja. Izkušnje Univerze v Mariboru kažejo, da večina mentorjev zdaj precej natančneje pregleda zaključno delo kot preden so se začela oddajati v DKUM, zato se je zmanjšalo število slabo citiranih virov, izboljšala se je struktura del in več je upoštevanja predlogov za pripravo zaključnih nalog. 5.2 Nacionalni portal odprte znanosti Nacionalni portal agregira vsebine iz štirih univerzitetnih repozitorijev in drugih slovenskih zbirk za potrebe združevalnega iskalnika, priporočilnega sistema in preverjanja podobnosti vsebin. Na nacionalnem portalu odprte znanosti je tako kot na drugih evropskih nacionalnih portalih odprtega dostopa na voljo enostavno in napredno iskanje. Slovenski nacionalni portal metapodatke in celotna besedila dodatno uporablja za preverjanje podobnosti vsebin ter za priporočanje vsebin. Metapodatke o publikacijah raziskovalcev in zaključnih delih, ki so dostopni v repozitorijih univerz, dLib.si, Videolectures.NET in DKMORS, lahko uporabi vsakdo in so dosegljivi kot odprti podatki ali prek JSON API-ja na spletnem naslovu http://www.openscience.si/opendata. Evropski nacionalni portali omogočajo nekatere funkcije, ki so v prihodnosti načrtovane tudi za slovenski nacionalni portal in institucionalne repozitorije: • brskanje po publikacijah, ki so urejene po določeni taksonomiji (na primer nemški in grški nacionalni portal). Brskanje omogočajo tudi institucionalni repozitoriji slovenskih univerz, nacionalni portal pa še ne; • citiranje v različnih formatih (APA, Harvard, stil citiranja IEEE, BIBTEX ...) in izvoz v programe za upravljanje referenc (Zotero, EndNote, Refman, RefWorks ...; na primer nizozemski in grški nacionalni portal); • prikaz obogatenih publikacij (angl. enhanced publications; na primer nizozemski portal); • dostop tudi do podatkov o projektih, raziskovalcih in raziskovalnih organizacijah (na primer nizozemski nacionalni portal), ko bodo vzpostavljeni univerzitetni sistemi za vodenje evidence raziskovalnega dela. Knjižnica, 58 (2014) 3 6 Zaključki Repozitoriji univerz bodo kot učinkovito promocijsko orodje izboljšali prepoznavnost slovenskih raziskovalcev in univerz v svetu. V primerjavi z vzpostavljanjem večjega števila repozitorijev posameznih članic univerz je bila izvedba s skupnim repozitorijem vsake univerze časovno, finančno in kadrovsko najučinkovitejša rešitev. Vzpostavljene so bile povezave med repozitoriji in visokošolskimi informacijskimi sistemi univerz, zgrajen je bil nacionalni portal ter vzpostavljene ustrezne kompatibilnosti in medob-ratovalnosti za potrebe neposrednega sodelovanja repozitorijev ter nacionalnega portala v mednarodnih pobudah. Dostop do virov je prek mobilnih in spletnih aplikacij zagotovljen najširšemu krogu uporabnikov. Uporaba je omogočena vsem, tudi tistim družbenim skupinam, ki imajo slabše možnosti za vključitev v informacijsko družbo (invalidom, starejši populaciji in drugim družbenim skupinam, ki so zaradi svojih fizičnih ali drugih omejitev ovirane pri dostopu do e-storitev). Določila o obvezni oddaji elektronskih oblik zaključnih del študija v dokumentih univerz omogočajo sistematično zajemanje teh del in večjo uporabo prosto dostopnih celotnih vsebin. Po pričakovanjih se bo s pomočjo sprotnega preverjanja podobnosti vsebin zmanjšal obseg plagiatorstva v zaključnih delih študija, kot se je že izkazalo na Univerzi v Mariboru, ki sistem za preverjanje podobnosti vsebin uporablja od leta 2008. Prav tako je pričakovati, da bo odprta dostopnost objav slovenskih raziskovalcev omogočila njihovo večjo vidnost in odmevnost (merjeno s klasičnimi bibliometrijskimi metodami, kot je citiranost, ali z alternativnimi metodami, razvitimi za spletno okolje - Koler-Povh et al., 2014). S tem se bosta povečali tudi prepoznavnost in odmevnost raziskovalne dejavnosti univerz ter države. Pričakovati je več možnosti za sodelovanje s tujimi univerzami na področju visokošolskega izobraževanja in raziskovalne dejavnosti. Slovenska podjetja bodo s pomočjo nacionalne infrastrukture odprtega dostopa lahko uporabljala rezultate javno financiranih raziskav in rezultate zaključnih del študija, ki so bili pred vzpostavitvijo zaradi razpršene dostopnosti oziroma dostopnosti proti plačilu težko dostopni. Prav tako se predvideva, da bo zaradi odprte dostopnosti rezultatov raziskav in možnosti njihove nadaljnje uporabe izboljšan izkoristek javnega financiranja raziskovalne dejavnosti slovenskih univerz - iz nacionalnih ali tujih virov. Načrti za nadaljnji razvoj nacionalne infrastrukture odprtega dostopa vključujejo: • prenos metapodatkovnih zapisov iz repozitorijev univerz v COBISS.SI; • vključitev digitalnih zbirk, ki še niso del nacionalne infrastrukture; • vzpostavitev sistema za trajno hranjenje publikacij; • delno avtomatsko ekstrakcijo ključnih besed in znanja, klasifikacijo besedil po znanih taksonomijah (CERIF, ARRS, ACM, LCH, UDK, EuroVoc, AGROVOC, MESH ...), objavo lastne ontologije in publikacije RDF v obliki povezanih odprtih podatkov (angl. linked open data) in povezavo z ontologijo DBpedia. Projekt Pilotna vzpostavitev nacionalne infrastrukture odprtega dostopa do zaključnih del študija in objav raziskovalcev sta sofinancirala Evropska unija (iz Evropskega sklada za regionalni razvoj) in Ministrstvo za izobraževanje, znanost in šport. Izvajal se je v okviru Operativnega programa krepitve regionalnih razvojnih potencialov za obdobje 2007-2013, razvojne prioritete: Gospodarsko razvojna infrastruktura; prednostne usmeritve Informacijska družba. Literatura A reinforced European Research Area partnership for excellence and growth. (2012). Bruselj: Evropska komisija. Pridobljeno 4. junija 2014 s spletne strani: http://ec.europa.eu/research/ science-society/document_library/pdf_06/era-communication-partnership-excellence-growth_en.pdf Alayon, S. B. [e tal.] (2013). The development of an institutional repository at the Aquaculture Department of the Southeast Asian Fisheries Development Center, Philippines. Program: electronic library and information systems, 47 (4), 384-398. Alzahrani, S. M., Salim, N. in Abraham, A. (2012). Understanding plagiarism linguistic patterns, textual features, and detection methods. IEEE Transactions on systems, man, and cybernetics, Part C: Applications and Reviews, 42 (2), 133-149. Barwick, J. (2007). Building an institutional repository at Loughborough University: some experiences. Program: electronic library and information systems, 41 (2), 113-123. Bevan, S. J. (2005). Electronic theses development at Cranfield University. Program: electronic library and information systems, 39 (2), 100-111. Bobadilla, J. [e tal.] (2013). Recommender systems survey. Knowledge-based systems, 46 (7), 109-132. Pridobljeno 4. junija 2014 s spletne strani: http://dx.doi.org/10.1016/'. knosys.2013.03.012 Borovič, M. (2012). Sistem priporočanja dokumentov in analiza kvalitete vsebinskega priporočanja pri različnih obdelavah vhodnega besedila. Magistrsko delo. Maribor: Fakulteta za elektrotehniko, računalništvo in informatiko. Pridobljeno 4. junija 2014 s spletne strani: http://dkum.uni-mb.si/IzpisGradiva.php?id=37811 Knjižnica, 58 (2014) 3 Zahvala Božič, M. in Zemljič, I. (ur.). (2010). Prost dostop do dosežkov slovenskih znanstvenikov: zbornik prispevkov 4. skupnega posvetovanja Sekcije za specialne knjižnice in Sekcije za visokošolske knjižnice Zveze bibliotekarskih društev Slovenije. Ljubljana: Zveza bibliotekarskih društev Slovenije. Pridobljeno 8. avgusta 2014 s spletne strani http://www.dlib. si/?URN=URN:NBN:SI:DOC-JGYFFYW7 Brezovnik, J. in Ojsteršek, M. (2011). Advanced features of Digital library of University of Maribor. International journal of education and information technologies, 5 (1), 34-41. Pridobljeno 4. junija 2014 s spletne strani: http://www.naun.org/main/NAUN/ educationinformation/19-520.pdf Brezovnik, J. in Ojsteršek, M. (2011a). TextProc - a natural language processing framework and its use as plagiarism detection system. International journal of education and information technologies, 5 (3), 293-300. Pridobljeno 4. junija 2014 s spletne strani: http://www.naun. org/multimedia/NAUN/educationinformation/19-872.pdf Commission Recommendation of 17. 7. 2012 on access to and preservation of scientific information. (2012). Bruselj: Evropska komisija. Pridobljeno 4. junija 2014 s spletne strani: http://ec.europa.eu/research/science-society/document_library/pdf_06/recommendation-access-and-preservation-scientific-information_en.pdf Doctor, G. in Ramachandran, S. (2008). Considerations for implementing an institutional repository at a business school in India. International journal of information management, 28 (5), 346-354. Pridobljeno 4. junija 2014 s spletne strani: http://dx.doi.org/10.1016/'. ijinfomgt.2007.12.001 Dopolnitev Statuta Univerze v Ljubljani. (2013). Uradni list RS, št. 83. Pridobljeno 8. avgusta 2014 s spletne strani http://www.uradni-list.si/1/content?id=114726#!/Dopolnitev-Statuta-Univerze-v-Ljubljani Ferme, M. in Ojsteršek, M. (2011). Text analysis with sequence matching. International journal of computing, 5 (2), 235-242. Pridobljeno 4. junija 2014 s spletne strani: http://www.naun.org/ main/NAUN/computers/20-234.pdf Karacsony, G. (2013). HUNOR: the collaboration of Hungarian open access repositories. Procedia - Social and Behavioral Sciences, 73, 57-61. Pridobljeno 4. junija 2014 s spletne strani: http:// dx.doi.org/10.1016/j.sbspro.2013.02.019 Kim, J. (2011). Motivations of faculty self-archiving in institutional repositories. Journal of academic librarianship, 37 (3), 246-254. Pridobljeno 4. junija 2014 s spletne strani: http:// dx.doi.org/10.1016/j.acalib.2011.02.017 Koler-Povh, T., Južnič, P. in Turk, G. (2014). Impact of open access on citation of scholarly publications in the field of civil engineering. Scientometrics, 98 (2), 1033-1045. Morsey, M. [e tal.] (2012). DBpedia and the live extraction of structured data from Wikipedia. Program: electronic library and information systems, 46 (2), 157-181. Navarro, G. (2001). A guided tour to approximate string matching. ACM computing surveys, 33 (1), 31-88. Robertson, S., Zaragoza, H. in Taylor, M. (2004). Simple BM25 extension to multiple weighted fields. V Proceedings of the thirteenth ACM international conference on Information and knowledge management. New York: ACM, 42-49. Seljak, M. in Seljak, T. (2002). The development of the COBISS system and services in Slovenia. Program: electronic library and information systems, 36 (2), 89-98. Stein, B. (2007). Principles of hash-based text retrieval. V Proceedings of the 30th annual international ACM SIGIR conference on research and development in information retrieval. New York: ACM, 527-534. Su, X. in Khoshgoftaar, T. M. (2009). A survey of collaborative filtering techniques. Advances in artificial intelligence, Article ID 421425, 19 strani. Pridobljeno 4. junija 2014 s spletne strani: http://dx.doi.org/10.1155/2009/421425 Suber, P. (2012). Open access. Cambridge: MIT Press. Towards better access to scientific information: boosting the benefits of public investments in research (2012). Bruselj: Evropska komisija. Pridobljeno 4. junija 2014 s spletne strani: http:// ec.europa.eu/research/science-society/document_library/pdf_06/era-communication-towards-better-access-to-scientific-information_en.pdf Westell, M. (2006). Institutional repositories: proposed indicators of success. Library Hi Tech, 24 (2), 211-226. Navedene spletne strani Arhiv družboslovnih podatkov. Pridobljeno 4. junija 2014 s spletne strani: http://www.adp.fdv. uni-lj.si/ COBISS.SI - Slovenian Cooperative Online Bibliographic System and Services. Pridobljeno 4. junija 2014 s spletne strani: http://www.cobiss.si/ Digitalna knjižnica Slovenije. Pridobljeno 4. junija 2014 s spletne strani: http://www.dlib.si/ Digitalna knjižnica Univerze v Mariboru. Pridobljeno 4. junija 2014 s spletne strani: http://dkum. uni-mb.si/ DiVA: Digitala Vetenskapliga Arkivet. Pridobljeno 4. junija 2014 s spletne strani: http://www.diva- portal.org/smash/search.jsf DKMORS - digitalna knjižnica Ministrstva za obrambo. Pridobljeno 4. junija 2014 s spletne strani: http://dk.mors.si/ Dokumentacija spletnega API-ja digitalne knjižnice. Pridobljeno 8. avgusta 2014 s spletne strani: http://repozitorij.uni-lj.si/pomoc.php?id=webapi DRUGG - repozitorij Fakultete za gradbeništvo in geodezijo Univerze v Ljubljani. Pridobljeno 4. junija 2014 s spletne strani: http://drugg.fgg.uni-lj.si/ ePrints.FRI - repozitorij Fakultete za računalništvo in informatiko, Univerze v Ljubljani. Pridobljeno 4. junija 2014 s spletne strani: http://eprints.fri.uni-lj.si/ Knjižnica, 58 (2014) 3 Guidelines on Data Management in Horizon 2020. Pridobljeno 4. junija 2014 s spletne strani: http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/ h2020-hi-oa-data-mgt_en.pdf Nacionalni portal odprte znanosti. Pridobljeno 8. avgusta 2014 s spletne strani: http:// openscience.si/ NARCIS: the gateway to scholarly information in The Netherlands. Pridobljeno 4. junija 2014 s spletne strani: http://www.narcis.nl/ NORA: Norwegian Open Research Archives. Pridobljeno 4. junija 2014 s spletne strani: http:// www.ub.uio.no/nora/search.html?siteLanguage=eng OA-Netzwerk. Pridobljeno 4. junija 2014 s spletne strani: http://oansuche.open-access.net/ oansearch/ OpenAIREGuidelines. Pridobljeno 10. junija 2014 s spletne strani https://guidelines.openaire.eu/ wiki/Main_Page OpenAIRE. Pridobljeno 4. junija 2014 s spletne strani: https://www.openaire.eu/ Openarchives.gr: Greek open access infrastructure. Pridobljeno 4. junija 2014 s spletne strani: http://www.openarchives.gr/ PeFprints - repozitorij Pedagoške fakultete Univerze v Ljubljani. Pridobljeno 4. junija 2014 s spletne strani: http://pefprints.pef.uni-lj.si/ PLEIADI: Portale per la Letteratura scientifica Elettronica Italiana su Archivi aperti e Depositi Istituzionali. Pridobljeno 4. junija 2014 s spletne strani: http://www.openarchives.it/pleiadi/ Poland Digital Libraries Federation - Federacja bibliotek cyfrowych. Pridobljeno 4. junija 2014 s spletne strani: http://fbc.pionier.net.pl/owoc RCAAP: Repositorio Cientifico de Acesso Aberto de Portugal. Pridobljeno 4. junija 2014 s spletne strani: http://www.rcaap.pt/ RECOLECTA:Recolectorde CienciaAbierta. Pridobljeno 4. junija 2014 s spletne strani: http://www. recolecta.net/ Repozitorij Univerze na Primorskem. Pridobljeno 8. avgusta 2014 s spletne strani: http://www. odun.univerza.si/ Repozitorij Univerze v Ljubljani. Pridobljeno 8. avgusta 2014 s spletne strani: https://repozitorij. uni-lj.si Repozitorij Univerze v Novi Gorici. Pridobljeno 8. avgusta 2014 s spletne strani: http://repozitorij. ung.si/ RIAN:pathways to Irish research. Pridobljeno 4. junija 2014 s spletne strani: http://rian.ie/ SHERPA/RoMEO. Pridobljeno 4. junija 2014 s spletne strani:http://www.sherpa.ac.uk/romeo/ VideoLectures.NET. Pridobljeno 4. junija 2014 s spletne strani: http://videolectures.net/ Web Accessibility Iniciative. Pridobljeno 4. junija 2014 s spletne strani: http://www.w3.org/WAI/ dr. Milan Ojsteršek Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko, Smetanova 17, 2000 Maribor e-pošta: milan.ojstersek@um.si dr. Mojca Kotar Univerza v Ljubljani, Univerzitetna služba za knjižnično dejavnost, Kongresni trg 12, 1000 Ljubljana e-pošta: mojca.kotar@uni-lj.si Marko Ferme Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko, Smetanova 17, 2000 Maribor e-pošta: marko.ferme@um.si Goran Hrovat Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko, Smetanova 17, 2000 Maribor e-pošta: goran.hrovat@um.si Mladen Borovič Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko, Smetanova 17, 2000 Maribor e-pošta: mladen.borovic@um.si mag. Albin Bregant Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko, Smetanova 17, 2000 Maribor e-pošta: albin.bregant@um.si Jan Bezget Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko, Smetanova 17, 2000 Maribor e-pošta: jan.bezget@um.si mag. Janez Brezovnik Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko, Smetanova 17, 2000 Maribor e-pošta: janez.brezovnik@um.si