PRIPRAVA RAZISKOVALNIH PODATKOV ZA ODPRTI DOSTOP Priročnik za raziskovalce Janez Štebe, Sonja Bezjak, Irena Vipavc Brvar PRIPRAVA RAZISKOVALNIH PODATKOV ZA ODPRTI DOSTOP Priročnik za raziskovalce Janez Štebe, Sonja Bezjak, Irena Vipavc Brvar Arhiv družboslovnih podatkov Janez Štebe, Sonja Bezjak, Irena Vipavc Brvar Priprava raziskovalnih podatkov za odprti dostop Priročnik za raziskovalce Izdajatelj in založnik: Fakulteta za družbene vede, Založba FDV Ljubljana, 2015 Copyright © To delo avtorjev Janez Štebe, Sonja Bezjak, Irena Vipavc Brvar je ponujeno pod Creative Commons Attribution 4.0 International. Pripravil: Arhiv družboslovnih podatkov Jezikovni pregled: dr. Tina Lengar Verovnik Oblikovanje: Medium Žirovnica Način dostopa (URL): http://knjigarna.fdv.si URN:NBN:SI:doc-06SLBVXX CIP - Kataložni zapis o publikaciji Narodna in univerzitetna knjižnica, Ljubljana 001.891:004.6(0.034.2) ŠTEBE, Janez Priprava raziskovalnih podatkov za odprti dostop [Elektronski vir] : priročnik za raziskovalce / Janez Štebe, Sonja Bezjak, Irena Vipavc Brvar. - El. knjiga. - Ljubljana : Fakulteta za družbene vede, Založba FDV, 2015 ISBN 978-961-235-721-4 (pdf) 1. Bezjak, Sonja 2. Vipavc Brvar, Irena Izid priročnika je finančno podprl projekt Foster. KAZALO 1 Razlogi za odprti dostop 1 1.1 Načela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Koristi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2 2 Kako sodelujem pri odprtem dostopu 3 2.1 Ravnanje z raziskovalnimi podatki v fazi načrtovanja in ustvarjanja . . . . . . . . . . . . . . . . . . . . 3 2.1.1 Kakovost raziskave . . . . . . . . . . . . . . . . . . . . . . . 4 2.1.2 Etične obveznosti . . . . . . . . . . . . . . . . . . . . . . .4 2.1.3 Digitalno skrbništvo. . . . . . . . . . . . . . . . . . . . . . 6 2.1.4 Pomoč, podpora pri načrtovanju ravnanja z raziskovalnimi podatki . . . . . . . . . . . . . . . . 7 2.2 Izročitev podatkov v hrambo v podatkovno središče . . .8 2.2.1 KAM: izbor podatkovnega središča . . . . . . . . . . . . 8 2.2.2 ZAKAJ v ADP . . . . . . . . . . . . . . . . . . . . . . . . . .9 2.2.3 KAKO predati raziskovalne podatke v ADP. . . . . . 10 2.2.4 Faza sprejema raziskovalnih podatkov . . . . . . . . 11 2.3 Podatkovna objava . . . . . . . . . . . . . . . . . . . . . . . . 12 2.3.1 Dostop do raziskovalnih podatkov . . . . . . . . . . . 12 2.3.2 Prednosti obravnave podatkov kot znanstvene objave . . . . . . . . . . . . . . . . . . . . . . 13 2.3.3 Kako lahko sodelujemo pri promociji uporabe podatkov . . . . . . . . . . . . . . . . . . 15 3 Nadaljnja podpora 16 Priloga: Smernice DSA 2014-2015 17 1 Izjemoma, kadar je potrebno, so določeni posebni pogoji. 2 Štebe, Janez, Sonja Bezjak in Sanja Lužar (2013): Odprti podatki. Načrt za vzpostavitev sistema odprtega dostopa do raziskovalnih podatkov v Sloveniji. Ljubljana: Fakulteta za družbene vede, Založba FDV. [http://www.adp.fdv.uni-lj. si/o_arhivu/publikacije/odprti_podatki_ zakljucno_porocilo/], str. 20. 3 Težko je natančno napovedati možne prihodnje rabe podatkov. Upoštevaje tudi celotni spekter možnih raziskovalnih problemov, sega uporaba od uporabnega praktičnega raziskovanja do teoretično ali poljubno drugače navdihnjenega raziskovanja. 1 RAZLOGI ZA ODPRTI DOSTOP 1 1 Načela Odprti dostop do raziskovalnih podatkov pomeni načeloma1 enake pogoje dostopa v okviru posameznih kategorij zainteresiranih uporabnikov, kot so raziskovalci, pedagogi, študentje in običajni državljani. Raziskovalni podatki predstavljajo osnovno podlago za znanstveno raziskovanje in z analizo omogočajo izpeljavo teoretično ali uporabno naravnanih zaključkov. Odprto dostopni podatki morajo biti pripravljeni v takšni obliki, da se uporabniki, ki so jim namenjeni, z njimi lahko seznanijo in jih uporabljajo za različne druge namene.2 Razlogi, zakaj se ukvarjamo s spodbujanjem odprtega dostopa do podatkov, so povezani s koristmi, se pravi z vprašanjem, ali imajo podatki vrednost še za koga drugega kot za ustvarjalca. Vrednost podatkov in s tem njiho • Ali so podatki enkratni, neponovljivi, predstavljajo evidenco o pojavu v času, vo pomembnost lahko med druki je že minil, ter jih ni mogoče ponovno zbirati in reproducirati, npr. imajo gim ocenjujemo s presojanjem zgodovinsko ali kulturno vrednost? naslednjega: • Ali so z ustvarjanjem podatkov povezani razmeroma visoki stroški, velika poraba časa ter uporaba postopkov, znanja in instrumentov, ki so omejeni ter zagotavljajo njihovo redkost in večjo uporabnost za raziskovanje? • Ali podatki spremljajo objave ugotovitev in so pomembni zaradi možnosti njihovega preverjanja in večje preglednosti? Ugotavljanje, ali so podatki uporabni še za koga, pomeni ocenjevanje tega, ali si lahko s podatki kdo pomaga pri reševanju določenega problema. To prepoznavanje uporabnosti podatkov za reševanje problemov pa predstavlja tudi praktični temelj informacijske pismenosti, pri čemer se sprašujemo naslednje: • Ali obstaja potencialni nabor problemov, ki so rešljivi s pomočjo raziskovalnih podatkov, se pravi, da obstaja prihodnje povpraševanje? 3 • Ali je podatke mogoče najti in do njih dostopati na način, da bo določen problem rešljiv? • Ali so podatki ustrezno dokumentirani, da se je o njih mogoče podrobno informirati in jih tako uporabljati na način, ki ni zavajajoč? • Ali so podatki shranjeni na način, da je v določenem časovnem obdobju, lahko tudi za daljše obdobje, mogoče uporabljati orodja za branje podatkov in delo z njimi? 1 2 Koristi Koristi od odprtega dostopa do podatkov lahko razdelimo na koristi za samega ustvarjalca podatkov, koristi za znanstveno skupnost in koristi za javnost. Koristi za • neposredno so povezane z možnostjo, da bo podatke v prihodnje potreboval on sam in jih bo, če ustvarjalca: bodo ustrezno shranjeni in dokumentirani, imel možnost ponovno uporabiti; • pomembne so tudi posredne koristi za njegov ugled in kariero, če se na podlagi dostopnih podatkov poveča citiranost in odmevnost njegovega dela ter so podatki ovrednoteni in vpisani v znanstveno bibliografijo in s tem deležni točkovanja. • pomembne so možnosti izboljšanja življenja, ki izhajajo iz ugotovitev raziskav, v družboslovju pa je pomemben tudi učinek pri izboljšanju samorazumevanja skupnosti, gradnji kolektivne identitete in odpravljanju predsodkov, diskriminacije, neenakosti ipd.; Koristi za znanstveno skupnost: • nova spoznanja, do katerih je mogoče priti samo z uporabo in kombinacijo podatkov iz več virov, npr. raziskave trendov ali mednarodne primerjalne raziskave, raziskave redkih in majhnih popu- lacij, metaanalitične študije ipd.; • bolj zanesljiva spoznanja in njihova kumulativnost, kar je rezultat možnosti preverjanja ugotovi- tev in analiz na podlagi objavi priloženih podatkov; • povečevanje števila spoznanj z večanjem števila uporabnikov istih podatkov, katerih sicer zaradi pomanjkanja sredstev in časa ne bi mogli zbrati sami; • usposabljanje bodočih znanstvenikov, uporaba raziskovalnih podatkov za študijske namene. Koristi za javnost: • korist pa je tudi v prihranku javnih sredstev, ki so namenjena raziskovanju in izobraževanju. Vedno večje število financerjev znanosti, predstavnikov znanstvene skupnosti in javnosti prepoznava pomen in koristi odprtega dostopa do podatkov. Skupno jim je pojmovanje raziskovalnih podatkov, ki izhajajo iz javno financiranih raziskav, kot javnega dobra.4 Ko razmišljamo o predaji podatkov v odprti dostop, upoštevamo različne zgoraj naštete vidike koristi, obenem pa je pomembno odgovoriti tudi na vprašanje, ali odprti dostop od nas zahteva financer5 oz. ali je to povezano z etičnimi obveznostmi, kodeksi, pravili ustanove, zahtevo revije6 ipd. 4 OECD (2007): OECD Principles and Guidelines for Access to Research Data from Public Funding. [http://www.oecd.org/sti/scienceandtechnologypolicy/ oecdprinciplesandguidelinesforaccesstoresearchdatafrompublicfunding. htm]. Research Councils UK: RCUK Common Principles on Data Policy. [http://www.rcuk.ac.uk/research/ datapolicy/, 21. 1. 2015]. LERU Research Data Working Group (2013): LERU Roadmap for Research Data. Advice paper, št. 14. [http://www.leru.org/files/publications/ AP14_LERU_Roadmap_for_ Research_data_final.pdf]. Science Europe: Working Group on Research Data. [http://www. scienceeurope.org/policy/working- groups/Research-Data, 21. 1. 2015 ]. 5 Običajno je ena od spodbud tudi upoštevanje določil politik financerja: npr. obvezno ponuditi podatke, zagotoviti dostopnost. 6 Nekatere znanstvene revije zahtevajo dostop do podatkov v povezavi s publikacijo (ima vrednost kot verzija podatkov, ki jo citira članek – za namene preverjanja ali ponovitve rezultatov). 7 Corti, Louise (2012): Evaluating Research Data. Na: Managing the Material: Tackling Visual Arts as Research Data. [http://www.data- archive.ac.uk/media/369163/managing_ research_data14sept2012b. pdf]. 2 KAKO SODELUJEM PRI ODPRTEM DOSTOPU Kadar imamo namen zagotoviti odprti dostop, je osnovna strategija pri načrtovanju in zastavitvi dela s podatki, da že v času trajanja projekta aktivno skrbimo za zagotavljanje in povečevanje uporabnosti podatkov za name- ne projekta in za kasnejšo rabo, za uporabnost za širši nabor namenov in možnih uporabnikov. Raziskava je lahko visoke kakovosti, pa ima majhen potencial za nadaljnjo uporabo.7 Pri kvantitativnih podatkih je tak primer, kadar je v datoteki zelo omejeno število spremenljivk, s čimer se zmanjša teoretični nabor možnih analiz. Npr. večtematske raziskave z bolj široko zastavljeno konceptualizacijo in s poudarjeno visoko kakovostjo izvedbe imajo večjo vrednost za več uporabnikov. Pri uresničevanju zadanega cilja – to je širši skupnosti zagotoviti dostop do kakovostnih podatkov – je potrebno poskrbeti za ustrezno ravnanje z raziskovalnimi podatki že v fazi načrtovanja in ustvarjanja. To obsega skrb za kakovost pri konceptualizaciji, vzorčenju in izdelavi protokola za zbiranje podatkov, skrb za kakovost pri zbiranju oziroma ustvarjanju in pripravi podatkov za analizo, skrb za sprotno in zaključno dokumentacijo podatkov in pripravo metapodatkov za izročanje v podatkovno središče, načrtovanje in izpolnjevanje etičnih obveznosti, izbor trajno pomembnih podatkov ter zagotovitev kakovostnega digitalnega skrbništva. Rezultat tega je v podatkovnem središču dostopna podatkovna objava, ki jo drugi ob nadaljnji uporabi navajajo kot znanstveno referenco v svojih člankih in drugih publikacijah. 2 1 Ravnanje z raziskovalnimi podatki v fazi načrtovanja in ustvarjanja Načrtovanje in izvajanje ustvarjanja raziskovalnih podatkov ob upoštevanju področnih standardov in dobrih praks ter etičnih in zakonskih podlag je osnovno zagotovilo njihove kakovosti ter s tem povezane nadaljnje uporabnosti. Ustvarjalec raziskovalnih podatkov se mora vprašati, kaj lahko naredim, da zagotovim, da bodo podatki uporabni tudi po koncu trajanja projekta. 2.1.1 Kakovost raziskave V celotnem procesu raziskovanja moramo skrbeti za čim višjo stopnjo kakovosti ustvarjenih podatkov,8 kar obsega naslednje vidike priprave in izvajanja raziskovanja: Skrb za kakovost pri zbiranju oziroma ustvarjanju in pripravi podatkov za analizo Uporaba postopkov za zbiranje podatkov, sledeč navodilom in obrazcem, npr. računalniško vodeno anketiranje z nadzorom nad preskoki, obsegom vrednosti in logično skladnostjo; pregledovanje podatkov in čiščenje, popravljanje napak, opremljanje podatkov z opisi spremenljivk in kategorij, skladno z vprašalnikom, preverjanje napak pri prepisih intervjujev ipd.; beleženje in nadzor nad potekom dela na terenu, zbiranje informacij o razlogih nesodelovanja pri raziskavi, izračun stopenj sodelovanja, zbiranje parapodatkov. 10 Skrb za kakovost pri konceptualizaciji, vzorčenju in izdelavi vprašalnika oz. protokola za zbiranje podatkov Skrb za sprotno in zaključno dokumentacijo podatkov ter pripravo metapodatkov za izročanje Uporaba uveljavljenih konceptov z referencami v literaturi, standardnih načinov merjenja posameznih konceptov, večje število indikatorjev, širok nabor socio-demografskih vprašanj; velikost vzorca, slučajno vzorčenje, pokrivanje populacije, načrt za doseganje visokih stopenj sodelovanja; uporaba obstoječih anketnih vprašanj, standardnih klasifikacij, preizkus vprašalnika.9 Priprava metapodatkov v standardu DDI11 ali ustreznih informacij v obliki dokumentacije, ki omogoča prenos v DDI kodirno knjigo, ki vključuje opis raziskave, spremenljivk, datotek in povezanih gradiv, kot so vprašalniki oz. protokoli intervjujev, vnašalniki, šifranti, poročila o izvedbi ipd. 8 Glej npr. Arnež, Marta in drugi (2012): Smernice za zagotavljanje kakovosti. Metodološki priročniki, št. 2. Ljubljana: Statistični urad Republike Slovenije. [http://www.stat.si/doc/ pub/Smernice.pdf]. 9 Hoffmeyer-Zlotnik, Jürgen H. P. in Uwe Warner (2012): Demographic Standards for Surveys and Polls in Germany and Poland: National and European Dimension. Köln: GESIS - Leibniz- Institut für Sozialwissenschaften. [urn:nbn: de:0168-ssoar-371202]. 10 UKDA: Create and Manage Data: Formatting Your Data: Quality assurance. [http:// www.data-archive.ac.uk/create-manage/format/ quality, 20. 1. 2015]. DASISH: Publications and presentations. [http://dasish.eu/publications/presentations/, 20. 1. 2015]. 11 DDI je metapodatkovna specifikacija za družboslovje. Glej: DDI Alliance. [http://www. ddialliance.org/, 20. 1. 2015]. 12 Zakon o varstvu osebnih podatkov (ZVOP-1UPB1). Uradni list RS, št. 94/2007. [http://www. uradni-list.si/1/content?id=82668]. 13 Univerza v Ljubljani (2014): Etični kodeks za raziskovalce Univerze v Ljubljani. [http://www. uni-lj.si/mma/Etični kodeks za_raziskovalce UL/20141211104120/]. 2.1.2 Etične obveznosti V družboslovju imamo največkrat opravka s podatki o posameznikih ali drugimi občutljivimi podatki. O zaščiti zasebnosti, k čemur nas zavezuje tako Zakon o varstvu osebnih podatkov12 kot etični kodeksi raziskovalne skupnosti,13 moramo razmišljati že pred zbiranjem podatkov, med njim in pri pripravi končne podatkovne datoteke. Etični kodeksi priporočajo, da sodelujoče zavarujemo pred nepotrebno škodo in zagotovimo sodelovanje ob pristanku s seznanitvijo ter da pri raziskovanju upoštevamo področne metodološke standarde. Evropska znanstvena fundacija, ALLEA (2011): Evropski kodeks ravnanja za ohranjanje raziskovalne poštenosti. [http://www.arrs.gov.si/sl/ analize/publ/inc/Evropski_kodeks_raziskovalne_ postenosti.pdf]. Slovensko sociološko društvo (1992): Kodeks profesionalne etike SSD. [http://www.sociolosko- drustvo.si/wp-content/uploads/2012/09/ Kodeks_profesionalne_etike_SSD-19921.pdf]. Statistično društvo Slovenije (1991): Deklaracija poklicne etike Statističnega društva Slovenije. [http://www.stat-d.si/images/files/etika.doc]. 5Že pred začetkom raziskovanja moramo dobro razmisliti o naslednjem: kako bomo pridobljene podatke uporabili, kako jih bomo predstavili v obliki rezultatov, kdo poleg nas bo imel dostop do njih, kako se bo z raziskovalnimi podatki ravnalo po koncu projekta. Udeleženec raziskave mora potrditi, da se strinja s sodelovanjem v projektu. Pristanek o sodelovanju je lahko podan v ustni ali pisni obliki. Seznanjanje s podrobnostmi glede sodelovanja pri projektu je posebej pomembno takrat, ko bomo izvajali intervjuje, ustvarjali avdio- in videovsebine ter raziskovali posebej občutljive vsebine in skupine (otroci, medicinske raziskave, kriminaliteta, raziskave na delovnem mestu). Udeleženca v raziskavi je potrebno najprej seznaniti z: informacijami o projektu, dejstvom, da je sodelovanje prostovoljno, in možnostjo, da ga lahko kadarkoli prekine, postopki glede zaupnosti (uporaba imena, psevdonimi, anonimizacija podatkov itd.), načini uporabe pridobljenih podatkov. Pri slednjem je z vidika odprtega dostopa do podatkov pomembno, da udeleženca seznanimo s predvideno nadaljnjo rabo.14 Uporabimo ubeseditve kot: Strinjam se, da so posredovani podatki shranjeni v Arhivu družboslovnih podatkov. Razumem, da lahko drugi uporabniki podatke analizirajo in rezultate analiz brez možnosti razkritja posameznika objavijo v svojih poročilih. Učinkovite in skrbno pripravljene informacije o tem, da bomo s posredovanimi podatki ravnali odgovorno v celotnem življenjskem krogu podatkov, lahko še povečajo zaupanje udeležencev v resnost raziskovanja in jih dodatno motivirajo za sodelovanje. V splošnem za zmanjšanje tveganja razkritja posameznika ukrepamo tako, da iz podatkov: odstranimo neposredne identifikatorje (imena, naslove, poštne številke, telefonske številke in druge osebne identifikatorje – kot sta davčna in matična številka) ter statistično zaščitimo posredne identifikatorje (podrobna geografska lokacija, podroben opis delovnega mesta in organizacije, v kateri nekdo dela, natančni datumi). 14 ICPSR: Recommended Informed Consent Language for Data Sha5Že pred začetkom raziskovanja moramo dobro razmisliti o naslednjem: kako bomo pridobljene podatke uporabili, kako jih bomo predstavili v obliki rezultatov, kdo poleg nas bo imel dostop do njih, kako se bo z raziskovalnimi podatki ravnalo po koncu projekta. Udeleženec raziskave mora potrditi, da se strinja s sodelovanjem v projektu. Pristanek o sodelovanju je lahko podan v ustni ali pisni obliki. Seznanjanje s podrobnostmi glede sodelovanja pri projektu je posebej pomembno takrat, ko bomo izvajali intervjuje, ustvarjali avdio- in videovsebine ter raziskovali posebej občutljive vsebine in skupine (otroci, medicinske raziskave, kriminaliteta, raziskave na delovnem mestu). Udeleženca v raziskavi je potrebno najprej seznaniti z: informacijami o projektu, dejstvom, da je sodelovanje prostovoljno, in možnostjo, da ga lahko kadarkoli prekine, postopki glede zaupnosti (uporaba imena, psevdonimi, anonimizacija podatkov itd.), načini uporabe pridobljenih podatkov. Pri slednjem je z vidika odprtega dostopa do podatkov pomembno, da udeleženca seznanimo s predvideno nadaljnjo rabo.14 Uporabimo ubeseditve kot: Strinjam se, da so posredovani podatki shranjeni v Arhivu družboslovnih podatkov. Razumem, da lahko drugi uporabniki podatke analizirajo in rezultate analiz brez možnosti razkritja posameznika objavijo v svojih poročilih. Učinkovite in skrbno pripravljene informacije o tem, da bomo s posredovanimi podatki ravnali odgovorno v celotnem življenjskem krogu podatkov, lahko še povečajo zaupanje udeležencev v resnost raziskovanja in jih dodatno motivirajo za sodelovanje. V splošnem za zmanjšanje tveganja razkritja posameznika ukrepamo tako, da iz podatkov: odstranimo neposredne identifikatorje (imena, naslove, poštne številke, telefonske številke in druge osebne identifikatorje – kot sta davčna in matična številka) ter statistično zaščitimo posredne identifikatorje (podrobna geografska lokacija, podroben opis delovnega mesta in organizacije, v kateri nekdo dela, natančni datumi). 14 ICPSR: Recommended Informed Consent Language for Data Sharing. [http://www.icpsr.umich.edu/ icpsrweb/content/datamanagement/ confientiality/conf-language. html, 21. 1. 2015]. 6Podatki so s tem praktično anonimizirani, še vedno pa so uporabni za večino raziskovalnih namenov. Lahko tudi pripravimo dve podatkovni datoteki: eno za bolj zahtevne znanstvenoraziskovalne namene z manjšo stopnjo zaščite, kjer bo dostop omejen samo na registrirane raziskovalce ob strožjih pogojih uporabe, in drugo, bolj zaščiteno, primerno za širši krog uporabnikov. 2.1.3 Digitalno skrbništvo Digitalno skrbništvo predstavlja izziv ustvarjalcem podatkov, da v času trajanja projekta in po njegovem zaključku zagotovijo sledljivost nastanka in sprememb različic raziskovalnih podatkov, tako da sta zagotovljeni njihova trajna uporabnost in preglednost. Spodaj je prikazanih nekaj osnovnih praktičnih priporočil za skrbno ravnanje v času trajanja projekta. Razmislimo o ustrezni organizaciji gradiv: smiselno poimenovanje datotek in spremenljivk, formati datotek in uporaba programske opreme (ali je potrebno shraniti tudi programsko orodje?), prenos podatkov, skupna uporaba in nadzor nad verzijami datotek. Ravnanje: poskrbimo za varnostne kopije, pripravimo dokumentacijo in metapodatke, poskrbimo za pravila glede dostopa do gradiv in poskrbimo za varnost pred nepooblaščenim dostopom.15 15 UK Data Service (2014): Benefits of managing and sharing research data. Colchester: University of Essex. [http://ukdataservice.ac.uk/ media/440285/whysharedata.pdf]. 6Podatki so s tem praktično anonimizirani, še vedno pa so uporabni za večino raziskovalnih namenov. Lahko tudi pripravimo dve podatkovni datoteki: eno za bolj zahtevne znanstvenoraziskovalne namene z manjšo stopnjo zaščite, kjer bo dostop omejen samo na registrirane raziskovalce ob strožjih pogojih uporabe, in drugo, bolj zaščiteno, primerno za širši krog uporabnikov. 2.1.3 Digitalno skrbništvo Digitalno skrbništvo predstavlja izziv ustvarjalcem podatkov, da v času trajanja projekta in po njegovem zaključku zagotovijo sledljivost nastanka in sprememb različic raziskovalnih podatkov, tako da sta zagotovljeni njihova trajna uporabnost in preglednost. Spodaj je prikazanih nekaj osnovnih praktičnih priporočil za skrbno ravnanje v času trajanja projekta. Razmislimo o ustrezni organizaciji gradiv: smiselno poimenovanje datotek in spremenljivk, formati datotek in uporaba programske opreme (ali je potrebno shraniti tudi programsko orodje?), prenos podatkov, skupna uporaba in nadzor nad verzijami datotek. Ravnanje: poskrbimo za varnostne kopije, pripravimo dokumentacijo in metapodatke, poskrbimo za pravila glede dostopa do gradiv in poskrbimo za varnost pred nepooblaščenim dostopom.15 15 UK Data Service (2014): Benefits of managing and sharing research data. Colchester: University of Essex. [http://ukdataservice.ac.uk/ media/440285/whysharedata.pdf]. 16 DCC: Overview of funders' data policies. [http://www.dcc. ac.uk/resources/policy-and-legal/ overview-funders-data-policies, 21. 1. 2015]. European Commision (2013): Guidelines on Data Management in Horizon 2020. [http://ec.europa. eu/research/participants/ data/ref/h2020/grants_manual/ hi/oa_pilot/h2020-hi-oa-data- mgt_en.pdf]. 2.1.4 Pomoč, podpora pri načrtovanju ravnanja z raziskovalnimi podatki Načrtovanje ravnanja z raziskovalnimi podatki, ki upošteva zahteve in postopke predaje raziskovalnih podatkov v temu posvečeno podatkovno središče, obsega napore za doseganje določene kakovosti podatkov, izpolnjevanje etičnih zahtev in ustreznega digitalnega skrbništva. Namen vse bolj uveljavljenega pristopa formalne izdelave »Načrta ravnanja z raziskovalnimi podatki« (NRRP) je ravno zagotoviti ustrezno ravnanje s podatki med izvajanjem projekta in po možnosti predajo v odprti dostop po tem, ko je projekt končan. Za oblikovanje NRRP in kasnejše izvajanje zastavljenih ciljev ter končno izročitev raziskovalnih podatkov so raziskovalcu na voljo podporne storitve. Pomembno je, da je raziskovalec deležen spodbude s strani različnih nosilcev. Poleg podatkovnega središča lahko ustrezno podporo in spodbudo nudijo: Raziskovalna • skrbi za notranjo politiko odprtega dostopa ter oblikuje postopke za pomoč raziskovalnim projekustanova: tom pri pripravi in izvajanju NRRP; • skrbi za strokovno usposabljanje raziskovalcev in podpornega osebja; • zagotovi infrastrukturo: tehnološke in svetovalne storitve za zagotovitev digitalnega skrbništva nad podatki skozi celotni življenjski krog (raziskovalne pisarne, knjižnice, OSIC, SICRIS, delujoče področno podatkovno središče in storitvena omrežja); • nudi skupne storitve in orodja, da razbremeni raziskovalne skupine. Knjižnica: • informira o razpoložljivosti obstoječih podatkovnih virov; • informira o možnostih predaje podatkov v podatkovno središče, svetuje pri izboru ustreznega, priporočenega podatkovnega središča; • informira o pogojih za odprti dostop in prednostih odprtega dostopa; • podpira pripravo NRRP; • nudi podporo pri izpolnjevanju osnovnih metapodatkov o raziskavi in pri pripravi ostale dokumentacije, avtorskih pravic ter pri razlagi drugih pogojev pri izročanju. Financer: • skrbi za nacionalne/področne politike, kjer obvezuje pripravo NRRP kot sestavnega dela dokumentacije prijav raziskovalnih projektov, pri čemer izhaja iz načelnega odprtega dostopa do raziskovalnih podatkov, financiranih z javnimi sredstvi, kot javnega dobra;16 • upošteva/priznava stroške priprave podatkov in zagotavlja sredstva za pokrivanje stroškov; • izvaja nadzor nad izpolnjevanjem obveznosti iz odprtega dostopa. 82 2 Izročitev podatkov v hrambo v podatkovno središče 2.2.1 KAM: izbor podatkovnega središča Odločitev o mestu predaje in načinu dostopa do raziskovalnih podatkov je najbolje sprejeti že pri načrtovanju. Smiselno se je že na začetku obrniti na podatkovno središče in se vnaprej uskladiti glede določenih zahtev za sprejem. Formalni obrazci NRRP, ki jih zahtevajo nekateri financerji, vsebujejo postavko glede opredelitve mesta predaje. Nekateri področni financerji že v svojih politikah določijo priporočeno mesto, kamor naj raziskovalci predajo podatke financiranih projektov. Običajno je to nacionalno področno podatkovno središče.17 Tudi Obzorje 2020 udeležencem Usmerjevalnega programa odprtega dostopa do raziskovalnih podatkov (Open data Pilot)18 priporoča, da raziskovalne podatke ponudijo v raziskovalno podatkovno središče.19 Pri izboru podatkovnega središča za predajo raziskovalnih podatkov je potrebno preveriti, kakšne so zahteve pri sprejemu podatkov s strani ponudnika storitev in kakšne so prednosti, ki jih ponuja predaja podatkov na določeno mesto. Pri tem smo lahko pozorni na naslednje podrobnosti: • Kako je opredeljeno poslanstvo podatkovnega središča? Kdo so njegovi ciljni uporabniki? • Katere vrste podatkov sprejema? • Ali aktivno skrbi za trajno digitalno obstojnost in dostopnost podatkov ciljnim uporabnikom? • Kakšna so merila in kako je opredeljen postopek izbora in sprejema podatkov, kakšne so zahteve glede tehničnih karakteristik? • Kako je poskrbljeno za etične in zakonske zahteve glede varovanja zasebnosti in avtorskih pravic? 17 Npr. ESRC iz Velike Britanije priporoča UK DS, ki je partnerska organizacija slovenskemu ADP. Economic & Social Research Council (2013): ESRC Research Data Policy. [http://www.esrc.ac.uk/_images/ Research_Data_Policy_2010_tcm84595. pdf], str. 6. 18 European Commision (2013): Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020. [http://ec.europa. eu/research/participants/data/ref/ h2020/grants_manual/hi/oa_pilot/ h2020-hi-oa-pilot-guide_en.pdf], str. 8. 19 V pomoč sta npr. kataloga podatkovnih središč: Registry of Research Data Repositories [http:// www.re3data.org/, 21. 1. 2015] in Databib [http://databib.org/, 21. 1. 2015]. 82 2 Izročitev podatkov v hrambo v podatkovno središče 2.2.1 KAM: izbor podatkovnega središča Odločitev o mestu predaje in načinu dostopa do raziskovalnih podatkov je najbolje sprejeti že pri načrtovanju. Smiselno se je že na začetku obrniti na podatkovno središče in se vnaprej uskladiti glede določenih zahtev za sprejem. Formalni obrazci NRRP, ki jih zahtevajo nekateri financerji, vsebujejo postavko glede opredelitve mesta predaje. Nekateri področni financerji že v svojih politikah določijo priporočeno mesto, kamor naj raziskovalci predajo podatke financiranih projektov. Običajno je to nacionalno področno podatkovno središče.17 Tudi Obzorje 2020 udeležencem Usmerjevalnega programa odprtega dostopa do raziskovalnih podatkov (Open data Pilot)18 priporoča, da raziskovalne podatke ponudijo v raziskovalno podatkovno središče.19 Pri izboru podatkovnega središča za predajo raziskovalnih podatkov je potrebno preveriti, kakšne so zahteve pri sprejemu podatkov s strani ponudnika storitev in kakšne so prednosti, ki jih ponuja predaja podatkov na določeno mesto. Pri tem smo lahko pozorni na naslednje podrobnosti: • Kako je opredeljeno poslanstvo podatkovnega središča? Kdo so njegovi ciljni uporabniki? • Katere vrste podatkov sprejema? • Ali aktivno skrbi za trajno digitalno obstojnost in dostopnost podatkov ciljnim uporabnikom? • Kakšna so merila in kako je opredeljen postopek izbora in sprejema podatkov, kakšne so zahteve glede tehničnih karakteristik? • Kako je poskrbljeno za etične in zakonske zahteve glede varovanja zasebnosti in avtorskih pravic? 17 Npr. ESRC iz Velike Britanije priporoča UK DS, ki je partnerska organizacija slovenskemu ADP. Economic & Social Research Council (2013): ESRC Research Data Policy. [http://www.esrc.ac.uk/_images/ Research_Data_Policy_2010_tcm84595. pdf], str. 6. 18 European Commision (2013): Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020. [http://ec.europa. eu/research/participants/data/ref/ h2020/grants_manual/hi/oa_pilot/ h2020-hi-oa-pilot-guide_en.pdf], str. 8. 19 V pomoč sta npr. kataloga podatkovnih središč: Registry of Research Data Repositories [http:// www.re3data.org/, 21. 1. 2015] in Databib [http://databib.org/, 21. 1. 2015]. 2.2.2 ZAKAJ v ADP V Sloveniji storitev podatkovnega središča za družboslovje opravlja Arhiv družboslovnih podatkov (ADP). Prednosti izročanja podatkov v ADP so med drugim naslednje: ADP preveri in ovrednoti pomen Sprejeti podatki štejejo kot znanstvena objava in predstavljajo podlago za raziskovalnih podatkov za znanost bibliografsko vrednotenje po merilih ARRS.20 in njihovo dolgoročno uporabnost. Uveljavlja pristop digitalnega skrbništva. ADP sledi pristopom podatkovnih središč na področju dolgotrajnega ohranjanja podatkov, skladno z zahtevami mednarodnega referenčnega modela OAIS21 in smernicami DSA.22 Omogoča dostop do podatkov, ADP nudi svetovanje, izobraževanje in usposabljanje uporabnikov. V katalogu iskanje in pregledovanje opisov dostopni podatki so osnova za bibliografsko navajanje v seznamih uporablje podatkov. ne literature, s čimer se uporabniki seznanijo ob sprejemu podatkov. Nudi podporo pri načrtovanju in izvajanju priprave podatkov za odprti dostop. ADP na mednarodni in nacionalni ravni aktivno sodeluje na področju odpiranja raziskovalnih podatkov. Na podlagi svojih izkušenj in zahtev lahko raziskovalcem ustrezno svetuje glede načrtovanja in priprave podatkov za odprti dostop. 20 ARRS (2014): Pravilnik o spremembah in dopolnitvah Pravilnika o postopkih (so)financiranja, ocenjevanja in spremljanju izvajanja raziskovalne dejavnosti. [http://www.arrs.gov.si/sl/akti/ Sprem-prav-sof-ocen-sprem-razisk- dej-dec14.asp]. 21 OAIS je ISO-standard, ki nudi funkcionalni okvir za ohranjanje digitalnih objektov v podatkovnih središčih. Glej: OAIS-Based Processes [http://www.icpsr.umich. edu/icpsrweb/content/datamanagement/ lifecycle/oais.html, 21. 1. 2015]. 22 Data Seal of Approval: The Guidelines 2014 – 2015. [http://www. datasealofapproval.org/en/information/ guidelines/, 21. 1. 2015]. 2.2.3 KAKO predati raziskovalne podatke v ADP Predaja podatkov v ADP ni nujno enkratno dejanje, temveč je običajno proces, v katerem se dajalec in arhiv medsebojno informirata in posvetujeta glede podrobnosti, potrebnih za izpolnitev pogojev za sprejem podatkov. ADP nudi svetovanje, navodila in orodja, ki olajšajo pripravo in izročanje podatkov. Raziskovalec, ki želi svoje raziskovalne podatke hraniti v ADP, naj sledi naslednjim korakom: 1) Preveri, ali podatki • Oceniti je potrebno vsebinsko bogastvo podatkov v smislu ustreznosti konceptualizacije ustrezajo merilom za in tematskega dopolnjevanja zbirke ADP, zanimivosti za uporabo. sprejem v arhiv.23 • Pomembno je zagotoviti izpopolnjenost uporabljenih metod, celovitost in ustreznost podatkov in dokumentacije za nadaljnje analize. • Potrditi je potrebno, da dajalec avtorsko razpolaga s podatki in je pripravljen podatke izročiti arhivu za razširjanje. 2) Predlog za predajo lahko raziskovalec pošlje preko »Obrazca za evidentiranje«.24 Obrazec je namenjen kratkemu opisu osnovnih vsebinskih in metodoloških značilnosti podatkov raziskave in njihove dokumentacije. Omogoča grobo oceno kakovosti raziskave in njene primernosti za sprejem. 23 ADP: Klasifikacija raziskav ADP po pomembnosti. [http://www. adp.fdv.uni-lj.si/za_uporabnike/o_ arhiviranju/klasifikacija_adp_pomembnosti/, 21. 1. 2015]. 24 ADP: Evidentiranje raziskav s podatki. [http://www.adp.fdv.uni-lj. si/evidentiranje, 21. 1. 2015]. 25 ADP: Izjava o izročitvi raziskovalnih podatkov. [http://www.adp. fdv.uni-lj.si/za_dajalce/izjava_o_izrocitvi/, 21. 1. 2015]. 3) Dajalec izpolni »Izjavo o izročitvi«,25 v kateri podrobneje opiše predana gradiva in pogoje dostopa. • Raziskovalec, ki razpolaga s podatki, v svojem imenu in v imenu svojih sodelavcev Arhivu preda podatke in povezano gradivo, dovoli prihodnje skrbno ravnanje in njihovo nadaljnje razširjanje. • Potrdi skladnost podatkov in pravno ustreznost (razpolaganje z avtorskimi pravicami, varovanje zasebnosti). • V ADP lahko dajalec izbere med licencama Creative Commons Priznanje avtorstva + Nekomercialno (CC BY-NC) ali Creative Commons Priznanje avtorstva (CC BY). • Dajalec določi izjeme glede dostopa (določeni raziskovalni podatki imajo lahko omejen dostop, primer so dostopi do občutljivih podatkov; omejitev dostopa za razumno obdobje). 4) Raziskovalec izpolni »Obrazec za opis raziskave«.26 Podamo informacije o nastanku podatkov in izvajalcu, o številki projekta s strani financerja ali o naročniku ter podroben opis raziskovanja skupaj z opisom metodologije (vzorec, populacija, čas zbiranja podatkov, stopnja sodelovanja ipd.). 26 Opis raziskave lahko raziskovalec pripravi v običajnem urejevalniku besedil ali pa za to uporabi posebno orodje. V ADP v ta namen predlagamo uporabo orodja Nesstar Publisher in uporabo naše predloge. ADP: Obrazec za opis raziskave. [http://www.adp.fdv.uni-lj.si/o_arhivu/ interaktivno/obrazec_opis_ raziskave/, 21. 1. 2015]. Nesstar Publisher [http://www. nesstar.com/software/publisher. html, 21. 1. 2015]. ADP: ADP predloga za Nesstar Publisher. Usposabljanje. [http:// www.adp.fdv.uni-lj.si/za_uporabnike/ usposabljanje/, 21. 1. 2015]. 115) Raziskovalec pripravi ustrezno urejene in dokumentirane podatke ter ostalo gradivo za predajo v Arhiv. • Podatki naj bodo v računalniški obliki, opremljeni s spremljajočim opisom (velikost datoteke, format, število spremenljivk in enot, pomen šifer).27 • Gradivo naj bo pripravljeno, upoštevaje navodila in priporočila glede formatov. • Raziskovalec mora zagotoviti skrb za varstvo pred razkritjem osebnih podatkov, s katerimi razpolaga. Odstranjeni naj bodo vsi neposredni identifikatorji. • Priložen naj bo vprašalnik v izvorni obliki, poleg tiskane tudi elektronska kopija. • Priloženo naj bo tudi gradivo, ki pomaga razumeti in preveriti vsebino podatkov: npr. kodirna knjiga, izpis frekvenc, navodila za anketarje, podatki o izvedbi raziskave, povezave do raziskovalnih poročil oz. kopije, če ta niso dostopna. 2.2.4 Faza sprejema raziskovalnih podatkov ADP na podlagi podanih informacij in pregleda ponujenih gradiv ta ovrednoti in presodi o primernosti podatkov za sprejem. Pri tem stopi v ospredje ocena njihove znanstvene vrednosti in prihodnje uporabnosti za različne namene in uporabnike. Odločilnega pomena so: • vsebinski nabor in število spremenljivk, celovitost podatkov, večje število spremenljivk, kakovost metodologije; • vključevanje v serije, mednarodna primerljivost, povezljivost podatkov in obstoj harmoniziranih standardnih demografskih spremenljivk; • za kvalitativne podatke dodatno še poglobljenost in izčrpnost intervjujev. Ni odločilen le en kriterij. Ključna je ocena zanimivosti za nadaljnjo uporabo, ki se vrednoti tudi glede na redkost podatkov določene vrste ali tematike v dosedanji zbirki podatkovnega središča. Formalna merila, kot so formati, izčrpna dokumentacija podatkov ipd., so seveda predpogoj, da se z njimi sploh ukvarjamo, saj brez tega podatki niso uporabni za druge uporabnike. Za sklenjeno digitalno skrbništvo, ki ga prevzame arhiv od dajalca, sta pomembni tudi celovitost podatkov in spremljajoče dokumentacije ter sledljivost nastanka in sprememb.28 V primeru pozitivne ocene se ADP z dajalcem dogovori za sprejem in pripravi vse potrebno za dostop: uredi dokumentacijo in podatke skladno z mednarodnimi standardi, pripravi končno verzijo podatkovne datoteke in opisa raziskovanja. Pred objavo podatkov v katalogu arhiva njihovo vsebino potrdi še raziskovalec. 27 Lužar, Sanja, Maja Ojsteršek in Irena Vipavc Brvar (2012): Priporočila za urejanje podatkovne datoteke. ADP. [http://www.adp. fdv.uni-lj.si/blog/wp-content/ uploads/2012/11/PriporocilaZaPodatkovnoDatoteko2. pdf]. 28 Primerjaj z: NERC Data Value Checklist. [http://www.nerc.ac.uk/ research/sites/data/policy/data-value- checklist.pdf, 21. 1. 2015]. 115) Raziskovalec pripravi ustrezno urejene in dokumentirane podatke ter ostalo gradivo za predajo v Arhiv. • Podatki naj bodo v računalniški obliki, opremljeni s spremljajočim opisom (velikost datoteke, format, število spremenljivk in enot, pomen šifer).27 • Gradivo naj bo pripravljeno, upoštevaje navodila in priporočila glede formatov. • Raziskovalec mora zagotoviti skrb za varstvo pred razkritjem osebnih podatkov, s katerimi razpolaga. Odstranjeni naj bodo vsi neposredni identifikatorji. • Priložen naj bo vprašalnik v izvorni obliki, poleg tiskane tudi elektronska kopija. • Priloženo naj bo tudi gradivo, ki pomaga razumeti in preveriti vsebino podatkov: npr. kodirna knjiga, izpis frekvenc, navodila za anketarje, podatki o izvedbi raziskave, povezave do raziskovalnih poročil oz. kopije, če ta niso dostopna. 2.2.4 Faza sprejema raziskovalnih podatkov ADP na podlagi podanih informacij in pregleda ponujenih gradiv ta ovrednoti in presodi o primernosti podatkov za sprejem. Pri tem stopi v ospredje ocena njihove znanstvene vrednosti in prihodnje uporabnosti za različne namene in uporabnike. Odločilnega pomena so: • vsebinski nabor in število spremenljivk, celovitost podatkov, večje število spremenljivk, kakovost metodologije; • vključevanje v serije, mednarodna primerljivost, povezljivost podatkov in obstoj harmoniziranih standardnih demografskih spremenljivk; • za kvalitativne podatke dodatno še poglobljenost in izčrpnost intervjujev. Ni odločilen le en kriterij. Ključna je ocena zanimivosti za nadaljnjo uporabo, ki se vrednoti tudi glede na redkost podatkov določene vrste ali tematike v dosedanji zbirki podatkovnega središča. Formalna merila, kot so formati, izčrpna dokumentacija podatkov ipd., so seveda predpogoj, da se z njimi sploh ukvarjamo, saj brez tega podatki niso uporabni za druge uporabnike. Za sklenjeno digitalno skrbništvo, ki ga prevzame arhiv od dajalca, sta pomembni tudi celovitost podatkov in spremljajoče dokumentacije ter sledljivost nastanka in sprememb.28 V primeru pozitivne ocene se ADP z dajalcem dogovori za sprejem in pripravi vse potrebno za dostop: uredi dokumentacijo in podatke skladno z mednarodnimi standardi, pripravi končno verzijo podatkovne datoteke in opisa raziskovanja. Pred objavo podatkov v katalogu arhiva njihovo vsebino potrdi še raziskovalec. 27 Lužar, Sanja, Maja Ojsteršek in Irena Vipavc Brvar (2012): Priporočila za urejanje podatkovne datoteke. ADP. [http://www.adp. fdv.uni-lj.si/blog/wp-content/ uploads/2012/11/PriporocilaZaPodatkovnoDatoteko2. pdf]. 28 Primerjaj z: NERC Data Value Checklist. [http://www.nerc.ac.uk/ research/sites/data/policy/data-value- checklist.pdf, 21. 1. 2015]. 122 3 Podatkovna objava 2.3.1 Dostop do raziskovalnih podatkov Podatkovno središče sprejete raziskovalne podatke uredi, pripravi za dolgotrajno hrambo ter jih skupaj z metapodatki in spremnimi dokumenti objavi v katalogu in tako naredi dostopne. Raziskovalci in drugi uporabniki se lahko seznanijo z vsebino podatkov in njihovim nastankom preko dokumenta »Opis raziskave«, ki spremlja podatkovno objavo. Seznanijo se tudi s pogoji in načini dostopa, določenimi ob predaji podatkov. Pri dostopu do podatkov so uporabnikom na voljo naslednje storitve: Možnost iskanja in seznanjanja ADP podatke objavi v seznamu raziskav29 na svoji spletni strani, kjer so na voljo: • pregledovanje po vsebinskih področjih, serijah, avtorjih ipd., • seznanjanje s krajšimi opisi raziskav, podatkovnih datotek, besedilom vprašanj ter dostopom do povezanih gradiv in • povezava na dostop do podatkov. Vzporedno z objavo na spletni strani so informacije o podatkih in sami podatki dostopni v Nesstar katalogu Arhiva družboslovnih podatkov, ki dodatno nudi: • polni opis raziskave po poljih standarda DDI; • enostavno in bolj kompleksno iskanje po posameznih poljih opisa raziskave, vključno z besedili vprašanj in iskanjem primerjav med raziskavami za potrebe longitudinalnega raziskovanja; • spletne analize podatkov; • dostop do samih podatkov, ki jih registrirani uporabniki lahko pretočijo k sebi za potrebe nadaljnjih analiz. Metapodatki o raziskavi so zajeti v združevalnih katalogih: • Informacija o objavi podatkov se lahko uvrsti tudi v vzajemne bibliografsko-kataložne baze podatkov knjižnic – COBIB.SI in na Nacionalni portal odprte znanosti.30 • Ko je raziskava vnesena v sistem COBISS.SI, se prikaže med raziskovalčevo bibliografijo in se točkuje kot podatkovna znanstvena objava. • Iskanje je možno tudi preko kataloga CESSDA, skupnega kataloga evropskih podatkovnih središč s področja družboslovja.31 29 ADP: Seznam raziskav po šifri raziskave. [http://www.adp.fdv.uni-lj. si/opisi/, 21. 1. 2015]. 30 Nacionalni portal odprte znanosti. [http://openscience.si/, 21. 1. 2015] . 31 CESSDA: The CESSDA Catalogue. [http://www.cessda.net/catalogue/, 21. 1. 2015]. 122 3 Podatkovna objava 2.3.1 Dostop do raziskovalnih podatkov Podatkovno središče sprejete raziskovalne podatke uredi, pripravi za dolgotrajno hrambo ter jih skupaj z metapodatki in spremnimi dokumenti objavi v katalogu in tako naredi dostopne. Raziskovalci in drugi uporabniki se lahko seznanijo z vsebino podatkov in njihovim nastankom preko dokumenta »Opis raziskave«, ki spremlja podatkovno objavo. Seznanijo se tudi s pogoji in načini dostopa, določenimi ob predaji podatkov. Pri dostopu do podatkov so uporabnikom na voljo naslednje storitve: Možnost iskanja in seznanjanja ADP podatke objavi v seznamu raziskav29 na svoji spletni strani, kjer so na voljo: • pregledovanje po vsebinskih področjih, serijah, avtorjih ipd., • seznanjanje s krajšimi opisi raziskav, podatkovnih datotek, besedilom vprašanj ter dostopom do povezanih gradiv in • povezava na dostop do podatkov. Vzporedno z objavo na spletni strani so informacije o podatkih in sami podatki dostopni v Nesstar katalogu Arhiva družboslovnih podatkov, ki dodatno nudi: • polni opis raziskave po poljih standarda DDI; • enostavno in bolj kompleksno iskanje po posameznih poljih opisa raziskave, vključno z besedili vprašanj in iskanjem primerjav med raziskavami za potrebe longitudinalnega raziskovanja; • spletne analize podatkov; • dostop do samih podatkov, ki jih registrirani uporabniki lahko pretočijo k sebi za potrebe nadaljnjih analiz. Metapodatki o raziskavi so zajeti v združevalnih katalogih: • Informacija o objavi podatkov se lahko uvrsti tudi v vzajemne bibliografsko-kataložne baze podatkov knjižnic – COBIB.SI in na Nacionalni portal odprte znanosti.30 • Ko je raziskava vnesena v sistem COBISS.SI, se prikaže med raziskovalčevo bibliografijo in se točkuje kot podatkovna znanstvena objava. • Iskanje je možno tudi preko kataloga CESSDA, skupnega kataloga evropskih podatkovnih središč s področja družboslovja.31 29 ADP: Seznam raziskav po šifri raziskave. [http://www.adp.fdv.uni-lj. si/opisi/, 21. 1. 2015]. 30 Nacionalni portal odprte znanosti. [http://openscience.si/, 21. 1. 2015] . 31 CESSDA: The CESSDA Catalogue. [http://www.cessda.net/catalogue/, 21. 1. 2015]. Upoštevanje pogojev glede dostopa Za dostop do podatkov se je potrebno registrirati in opredeliti namen uporabe: • Ločimo uporabo podatkov v akademske in splošne (lahko tudi komercialne) namene. • Dodatno ločujemo še med raziskovalci s statusom (glede na podatke SICRIS) in ostalimi uporabniki s področja izobraževanja. • Dostopi so lahko dodatno omejeni upoštevaje izjeme, ki jih dajalec določi ob predaji podatkov v ADP (npr. dostop s posebnim režimom zaupnosti, za določeno obdobje samo s privoljenjem avtorja). Upoštevanje pogojev glede dostopa Za dostop do podatkov se je potrebno registrirati in opredeliti namen uporabe: • Ločimo uporabo podatkov v akademske in splošne (lahko tudi komercialne) namene. • Dodatno ločujemo še med raziskovalci s statusom (glede na podatke SICRIS) in ostalimi uporabniki s področja izobraževanja. • Dostopi so lahko dodatno omejeni upoštevaje izjeme, ki jih dajalec določi ob predaji podatkov v ADP (npr. dostop s posebnim režimom zaupnosti, za določeno obdobje samo s privoljenjem avtorja). 32 Wynholds, Laura (2011): Linking to Scientific Data: Identity Problems of Unruly and Poorly Bounded Digital Objects. V: The International Journal of Digital Curation, 6 (1). Los Angeles: University of California. [doi:10.2218/ ijdc.v6i1.183]. 33 Ball, Alex in Monica Duke (2012): How to Cite Datasets and Link to Publications. Edinburgh: DCC. [http:// www.dcc.ac.uk/sites/default/files/ documents/publications/reports/ guides/How_to_Cite_Link.pdf]. 34 ADP: Predavanja in predstavitve ADP. [http://www.adp.fdv.uni-lj.si/ Spremljanje uporabe podatkov in poročanje Podatkovna središča vodijo • obiske spletnih strani, statistike dostopa za potrebe • dostope do metapodatkov in povezanih gradiv, poročanja in za načrtovanje • sprotno uporabo in pretakanje podatkov raziskav. promocijskih in izobraževalnih dejavnosti: 2.3.2 Prednosti obravnave podatkov kot znanstvene objave Objavljene podatke obravnavamo na enak način kot vsako drugo znanstveno objavo. Predstavljajo prvovrsten objekt znanstvenega informiranja, iz česar izhajajo naslednje prednosti:32 Objava ima svojo isto- Objavljeni podatki in vse njihove različice imajo v katalogu enolično oznako, določeno s strani vetnost podatkovnega središča. Na mednarodni ravni se podobno kot za običajne monografske publikacije in članke v revijah tudi za podatke uveljavljajo različne oblike stalnih identifikatorjev, kot so DOI,33 URN ipd. S stalnimi identifikatorji je ob ustreznem navajanju vzpostavljena povezava med podatki in objavo, nastalo na podlagi uporabljenih podatkov. Navajanje uporabljenih podatkov Vsi uporabniki so dolžni ustrezno citirati podatke raziskav in pripadajočih gradiv, s čimer se seznanijo ob registraciji in iz opisov raziskav ter na delavnicah o načinu uporabe raziskovalnih podatkov.34 Priporočeno je, da se v seznamu uporabljene literature podatke navaja s polno navedbo avtorja oz. avtorjev, naslova, mesta dostopa do podatkov in stalnega identifikatorja, skladno z oblikovnimi zahtevami znanstvene revije. publikacije_adp/predavanja/, 21. 1. 2015]. Podatki so kot publika- Na podlagi objave podatkov v ADP lahko avtor ali skupina avtorjev dobi bibliografske točke. V cija ovrednoteni in evi- ADP predani podatki, ki imajo visok pomen za znanost in so zanimivi za nadaljnjo uporabo, so dentirani v bibliografiji po objavi v katalogu ADP lahko vpisani v sistem COBISS.SI35 in s tem prispevajo pri točkovnem raziskovalca, ustanove ocenjevanju uspešnosti projektov. Poveča se citiranost ostalih publikacij, povezanih z objavljenimi podatki Objava podatkov v odprtem dostopu poveča citiranost in odmevnost člankov izvornih avtorjev raziskave.36 Ob podatkovni objavi dajalci navedejo svoje lastne objave in s tem povečajo verjetnost, da jih bodo drugi uporabniki upoštevali pri izhodiščih svojih analiz. Obenem je članek, v katerem avtor v seznamu literature navede uporabljene podatke in dostop do njih, bolj verodostojen, saj omogoča preverjanje, hkrati pa vabi k nadaljnjim analizam istih podatkov. Citatni indeksi Navajanje uporabljenih podatkov v seznamu literature povečuje sledljivost uporabe obstoječih podatkovnih virov. Po analogiji s citatnimi indeksi za publikacije bo z uveljavitvijo standardnih načinov navajanja uporabljenih raziskovalnih podatkov (z uporabo stalnih identifikatorjev) postala evidenca podatkovnih citatnih indeksov pomembno merilo uspešnosti in ugleda raziskovalca in ustanove. Navajanje podatkov v seznamih literature v publikacijah predstavlja tudi možnost dolgoročnega preverjanja pomena podatkov za znanost.37 35 Zapis se uvrsti pod tip dokumenta »2.20 Zaključena znanstvena zbirka podatkov ali korpus«, ki je opredeljen kot: »Elektronska zbirka podatkov, katere znanstvena pomembnost se kaže v uporabnosti za raziskovanje širokega nabora aplikativnih ali teoretsko osmišljenih problemov. Zbirka podatkov mora biti rezultat zaključene raziskave in ustrezati visokim kriterijem kakovosti, ki se jo ocenjuje na podlagi izčrpne spremljajoče dokumentacije. Zbirka podatkov mora biti javno dostopna v nacionalnem ali mednarodnem znanstvenem podatkovnem arhivu. Zbirka podatkov mora biti dokumentirana in dostopna v takšni obliki, da omogoča ponovitev objavljenih znanstvenih ugotovitev, izvedenih na njeni podlagi.« Glej: IZUM (2013): Tipologija dokumentov/ del za vodenje bibliografij v sistemu COBISS. Maribor: IZUM. [http:// home.izum.si/COBISS/bibliografije/ Tipologija_slv.pdf]. 36 Costas, Rodrigo, Ingeborg Meijer, Zohreh Zahedi in Paul Wouters (2013): The Value of Research Data - Metrics for datasets from a cultural and technical point of view. Copenhagen: Knowledge Exchange. [www.knowledge-exchange.info/ datametrics]. 37 Glej razpravo o pomenu merjenja citiranosti podatkov za ocenjevanje pomena podatkov: Whyte, Angus in Andrew Wilson (2010): How to Appraise and Select Research Data for Curation. DCC. [http://www.dcc.ac.uk/ resources/how-guides/appraise-select- data#sthash.4WjHGwZ1.dpuf]. 2.3.3 Kako lahko sodelujemo pri promociji uporabe podatkov Poleg podatkovnega središča pri spodbujanju in izkoriščanju dostopa do raziskovalnih podatkov sodelujejo tudi naslednji deležniki: Raziskovalec: • vključi informacijo o podatkovni objavi v lastna bibliografska poročila in sezname kot sestavni del znanstvene produkcije; • pri objavah navaja lastne podatke s polno navedbo v seznamu literature; • sodeluje pri promociji podatkov in pri usposabljanju uporabnikov, kadar gre za kompleksne podatke (organizacija delavnic ali konferenc na temo soočanja s podatki). Raziskovalna ustanova: • vodi lastne statistike podatkov, dostopnih v podatkovnih središčih, in njihove rabe;38 • nudi podporo pri delu s podatki, nagrajuje izročanje podatkov pri napredovanju; • spodbuja ponovno rabo podatkov. Knjižnica: • seznanja z možnostjo in izvaja vpis zbirke podatkov v bibliografski sistem za namen znanstvenega vrednotenja; • svetuje pri citiranju podatkov; • informira uporabnike o podatkovnih zbirkah, načinih dostopa in možnostih uporabe; • informira o povezavah med podatki in publikacijami ter raziskovalnimi projekti. 38 LERU Research Data Working Financer: • preveri, ali so podatki dostopni, kakor je določeno s pogodbo, in v primeru neizvajanja opozori na možne posledice; • v okviru državnega sistema znanstvenega vrednotenja zagotavlja upoštevanje prispevka k znanosti na ustrezen način objavljenih raziskovalnih podatkov; • nagrajuje ustvarjanje kakovostnih podatkov in njihovo izročanje v odprti dostop ter sankcionira omejevanje dostopnosti; • zagotavlja vzdržno delovanje podatkovne infrastrukture; • v svojih politikah promovira drugo rabo podatkov. Group (2013): LERU Roadmap for Research Data. Advice paper, št. 14. Skupna [http://www.leru.org/files/publicati naloga: ons/AP14_LERU_Roadmap_for_Research_ data_final.pdf], str. 21. 39 Isto. 40 FOSTER [https://www.fosteropenscience. eu/, 21. 1. 2015]. • skrb za koordiniran razvoj podporne infrastrukture in storitev, tako da so raziskovalci čim manj obremenjeni z dodatnimi zahtevami;39 • skrb za usposabljanje sedanjih in bodočih raziskovalcev ter podpornega osebja, podatkovnih knjižničarjev, podatkovnih znanstvenikov ipd.40 3 NADALJNJA PODPORA Ravnanje z raziskovalnimi podatki zahteva seznanjenost s širokim naborom standardov in dobrih praks. Novost pri tem je formalni načrt ravnanja z raziskovalnimi podatki, ki ga je treba pripraviti na zahtevo financerjev projektov. V podporo pri na • številni vodiči in pripomočki s strani specializiranih ustanov, npr. DCC-jevi,41 črtovanju in delu s • spletna orodja, kot sta DMPonline42 ali DMP Editor,43 podatki so na voljo: • seminarji za poučevanje o ravnanju z raziskovalnimi podatki, npr. MANTRA.44 Podatkovna središča nudijo svetovanje glede: • metodologije – izkoriščanje obstoječih podatkov, standardni načini zbiranja podatkov; • tehničnih vidikov – formati, dokumentiranje, verziranje, digitalno skrbništvo; • pravnih vidikov – soglasja, varovanje zasebnosti, avtorske pravice in licence, etika. ADP na svoji spletni strani v rubriki »O arhiviranju«45 nudi nekaj priporočil glede postopkov shranjevanja. Predlagamo tudi uporabo priročnikov sorodnih podatkovnih središč.46 Za med različnimi nosilci usklajeno skrbno ravnanje z raziskovalnimi podatki v teku celotnega življenjskega kroga – od načrtovanja in ustvarjanja, digitalnega skrbništva, dostopa v podatkovnem središču vse do končne uporabe – priporočamo seznanitev s smernicami standarda DSA.47 41 Digital Curation Center: Resources for digital curators. [ http://www.dcc.ac.uk/resources, 20. 1. 2015]. 42 Digital Curation Center: DMPonline. [https://dmponline.dcc.ac.uk/, 20. 1. 2015]. 43 OpenMetadata.org: Data Management Plan (DMP) Editor. [http://www.openmetadata. org/site/?page_id=373, 21. 1. 2015]. 44 EDINA (2014): MANTRA – Research Data Management Training. The University of Edinburgh. [http://datalib.edina.ac.uk/ mantra/]. 45 ADP: O arhiviranju. [http://www.adp.fdv. uni-lj.si/za_uporabnike/o_arhiviranju/, 21. 1. 2015]. 46 UK Data Service: Prepare and manage data. [http://ukdataservice.ac.uk/manage- data.aspx, 21. 1. 2015]. ICPSR: Data Management & Curation. [http://www.icpsr.umich.edu/icpsrweb/content/ datamanagement/index.html, 21. 1. 2015]. Tjalsma, Heiko in Jeroen Rombouts (2011): Selection of research data, Guidelines for appraising and selecting research data. Haag in Delft: Stichting SURF, Data Archiving and Networked Services (DANS), 3TU.Datacentrum. [http://act.dans.knaw.nl/nl/over/ organisatie-beleid/Publicaties/DANSselectionofresearchdata. pdf]. ICPSR in DANS (2010): Preparing data for sharing; Guide to social science data archiving. Amsterdam: Pallas Publications. [http://act.dans.knaw.nl/nl/over/organisatie- beleid/Publicaties/DANSpreparingdataforsharing. pdf]. 47 Data Seal of Approval: The Guidelines 2014 – 2015. [http://www.datasealofapproval. org/en/information/guidelines/, 21. 1. 2015]. 48 Data Seal of Approval: The Guidelines 2014 – 2015. [http://www.datasealofapproval. org/en/information/ guidelines/, 21. 1. 2015]. Priloga: Smernice DSA 2014-2015 Smernice za ustvarjalce podatkov 1. Ustvarjalec naj preda podatke v podatkovno središče skupaj s spremljajočimi informacijami, namenjenimi drugim za presojo kakovosti in oceno skladnosti s področnimi in etičnimi normami. 2. Ustvarjalec naj podatke pripravi v formatih, priporočenih s strani podatkovnega središča. 3. Ustvarjalec naj podatke opremi z metapodatki, ustrezno zahtevam podatkovnega središča. Smernice za podatkovna središča 4. Podatkovno središče mora imeti jasno opredeljeno poslanstvo na področju digitalnega skrbništva in mora dokazovati njegovo uveljavljanje. 5. Podatkovno središče mora upoštevati pravne in pogodbene obveznosti, vključno, kadar to pride v poštev, z obveznostmi s področja varovanja posameznikov. 6. Podatkovno središče izvaja ustrezno dokumentirane postopke pri ravnanju s podatki za namen njihovega ohranjanja. 7. Podatkovno središče ima načrt za dolgotrajno hrambo svojih digitalnih gradiv. 8. Postopek arhiviranja poteka po vnaprej določenih korakih znotraj življenjskega kroga podatkov. 9. Podatkovno središče namesto ustvarjalcev podatkov prevzame odgovornost za zagotavljanje dostopa do digitalnih objektov in za njihovo razpoložljivost. 10.Podatkovno središče uporabnikom omogoča iskanje in uporabo podatkov ter njihovo ustaljeno poenoteno navajanje ob uporabi. 11. Podatkovno središče zagotavlja celovitost digitalnih objektov in metapodatkov. 12. Podatkovno središče zagotavlja sledljivost izvora in sprememb digitalnih objektov in metapodatkov. 13. Tehnična infrastruktura mora ustrezno podpirati opravljanje nalog in delovanje, skladno z mednarodno sprejetimi arhivskimi standardi (npr. OAIS). Smernice za uporabnike podatkov 14. Uporabnik podatkov mora spoštovati pravila dostopa, določena s strani podatkovnega središča. 15. Uporabnik podatkov mora sprejemati in ravnati skladno s splošno sprejetimi področnimi kodeksi, ki veljajo za izmenjavo in ustrezno rabo znanja in informacij. 16. Uporabnik podatkov mora spoštovati ustrezne licence podatkovnega središča glede uporabe podatkov.48 IZROČANJE RAZISKOVALNIH PODATKOV V ADP V ADP sodijo visokokakovostni raziskovalni podatki, ki so zanimivi in primerno pripravljeni za nadaljnje analize. Postopek izročanja raziskovalnih podatkov v ADP gre po naslednjih korakih: 1. preverimo merila za sprejem podatkov v ADP, 2. izpolnimo obrazec za evidentiranje raziskave, 3. izpolnimo obrazec za opis raziskave, 4. uredimo in dokumentiramo podatke, pripravimo ostalo spremljajoče gradivo, 5. izpolnimo in podpišemo izjavo o izročitvi. IZROČANJE RAZISKOVALNIH PODATKOV V ADP V ADP sodijo visokokakovostni raziskovalni podatki, ki so zanimivi in primerno pripravljeni za nadaljnje analize. Postopek izročanja raziskovalnih podatkov v ADP gre po naslednjih korakih: 1. preverimo merila za sprejem podatkov v ADP, 2. izpolnimo obrazec za evidentiranje raziskave, 3. izpolnimo obrazec za opis raziskave, 4. uredimo in dokumentiramo podatke, pripravimo ostalo spremljajoče gradivo, 5. izpolnimo in podpišemo izjavo o izročitvi. www.adp.fdv.uni-lj.si/za_dajalce/ Storitve, ki jih ADP nudi dajalcem podatkov v ADP: • podpora pri načrtovanju in izvajanju priprave podatkov za odprti dostop; • preverjanje in ovrednotenje pomena raziskovalnih podatkov za znanost in njihove dolgoročne uporabnosti; • uveljavljanje pristopa digitalnega skrbništva; • omogočanje dostopa do podatkov, iskanje in pregledovanje opisov podatkov; • spodbujanje uporabe podatkov in usposabljanje za delo s podatki. KONTAKT: Univerza v Ljubljani Fakulteta za družbene vede Arhiv družboslovnih podatkov Kardeljeva ploščad 5 1000 Ljubljana www.adp.fdv.uni-lj.si arhiv.podatkov@fdv.uni-lj.si Arhiv.Druzboslovnih.Podatkov @ArhivPodatkov