Narodna in univerzitetna knjižnica,
Enota za razvoj in upravljanje digitalne knjižnice Ljubljana, marec 2010
SMERNICE ZA DIGITALIZACIJO KNJIŽNIČNEGA
GRADIVA
1. UVOD
Projekti digitalizacije so namenjeni povečanju dostopnosti in ohranitvi oziroma zaščiti gradiva. Pri digitalizaciji
knjižničnega gradiva je to npr.: digitalizacija zbirk, zlasti s področja domoznanstva, priprava informacijskih
vsebin na podlagi digitaliziranega knjižničnega gradiva; knjige in serijske publikacije, kartografsko gradivo,
razglednice, stari rokopisi ipd. Projekti digitalizacije vključujejo predvsem: vsebinski okvir za izbor gradiva
(dodana vsebinska vrednost), pregled in izbor gradiva za digitalizacijo, izbor metode in tehnologije, analizo
izvedljivosti, izbor potencialnega izvajalca, digitalizacijo gradiva, vsebinsko obdelavo digitaliziranega gradiva ter
pripravo pogojev za aktivno uporabo digitaliziranega gradiva. Bistveni element pogojev za aktivno uporabo
digitaliziranega gradiva je tudi določitev naslova, kjer bodo rezultati projekta javno dostopni.
Podobno kot pri ostalih projektih, je potrebno tudi pri projektih digitalizacije opraviti ustrezne predhodne
analize, s katerimi se odpravijo morebitne dileme in/ali razrešijo odprta vprašanja. Priprava projekta mora
vključevati natančno opredelitev rezultatov projekta. Finančni načrt mora vključevati vse stroške. V predlogu
projekta morajo biti jasno opredeljeni in točno specificirani cilji, namen, pričakovani učinki, finančni, kadrovski,
tehnični in drugi viri, načrtovane dejavnosti, dinamika ter morebitne druge aktivnosti in sredstva.
Verodostojne digitalne reprodukcije so optimalno formatirani digitalni objekti, pri izdelavi katerih se poudarja
kakovost (funkcionalnost in uporabna vrednost), dolgotrajnost (možnost dolgotrajnega dostopa) in
interoperabilnost (npr. prehodnost med računalniškimi platformami in programi). Z digitalizacijo lahko
pridobimo dve vrsti digitalnih reprodukcij:
• originale
: optimizirane za dolgotrajno ohranjanje (arhivske kopije) in nadaljnjo produkcijo operativnih
kopij;
• operativne kopije : optimizirane za uporabo.
Originalni digitalni objekt je navadno izdelan v najvišji kvaliteti in je namenjen arhiviranju in reproduciranju.
Operativne kopije digitalnega objekta so narejene v nižji kvaliteti in/ali ločljivosti od originalnega digitalnega
objekta in so namenjene dostopanju preko zaslona in uporabi.
2. VSEBINA
2.1 Parametri za digitalizacijo
2.2 Navodila za ravnanje s knjižničnim gradivom med procesom digitalizacije
2.3 Mediji arhiviranja digitalnih objektov
2.4. Primer tehnične dokumentacije
2.1. PARAMETRI ZA DIGITALIZACIJO
Tekstovno tiskano gradivo (monografsko gradivo, serijske publikacije)
ČRNO‐ BELO STORITVE PARAMETRI
ločljivost skeniranja 300‐ 600 dpi
Primarni arhiv
barvna globina 1 bit
ločljivost hranjenja 300‐ 600 dpi
Format TIFF, JPG, JPEG2000
Operativna kopija
Ločljivost 72‐120 dpi
Format TIFF, PDF
Optična prepoznava
Format HTML, TXT, PDF, XML, METS/ALTO, MPEG21
SIVINSKO STORITVE PARAMETRI
ločljivost skeniranja 300‐ 600 dpi
Primarni arhiv
barvna globina 8 bitov
ločljivost hranjenja 300‐ 600 dpi
Format TIFF, JPG, JPEG2000
Operativna kopija
Ločljivost 72‐120 dpi
barvna globina 8 bitov
format JPG, PDF
Optična prepoznava
Format HTML, TXT, PDF, XML, METS/ALTO, MPEG21
BARVNO STORITVE PARAMETRI
ločljivost skeniranja 300‐ 600 dpi
Primarni arhiv
barvna globina 24 bitov
ločljivost hranjenja 300‐ 600 dpi
Format TIFF, JPG, JPEG2000
Operativna kopija
ločljivost 72‐120 dpi
barvna globina 24 bitov
format JPG, PDF
Optična prepoznava
Format HTML, TXT, PDF, XML, METS/ALTO, MPEG21
Kartografsko gradivo
STORITVE PARAMETRI
ločljivost skeniranja 300‐ 600 dpi
Primarni arhiv
barvna globina 24 bitov
ločljivost hranjenja 300‐ 600 dpi
Format TIFF, JPG, JPEG2000
Operativna kopija
ločljivost 72‐300 dpi
barvna globina 24 bitov
Format SID (MrSID), JPG
Slikovno gradivo
STORITVE PARAMETRI
ločljivost skeniranja 300‐ 600 dpi
Primarni arhiv
barvna globina 24 bitov
ločljivost hranjenja 300‐ 600 dpi
format TIFF, JPG, JPEG2000
Operativna kopija
ločljivost 72‐120 dpi
barvna globina 24 bitov
format JPG, JPEG2000, PDF
Avdio gradivo
Primarni arhiv
format WAVE 16‐bit stereo zvok, 48/96 KHz
podformat MPEG‐1 3. zvočna plast v HiVBR (High Variable Bit Rate)
Operativna kopija
format MPEG‐1 3. zvočna plast v HiVBR (High Variable Bit Rate), Real Audio
Video gradivo
Primarni arhiv
format RAW AVI/MPEG ‐2/MPEG‐4
podformat RAW AVI/MPEG ‐2/MPEG‐4
barvna globina 24‐32 bitov
Operativna kopija
Format RAW AVI/MPEG ‐2/MPEG‐4
Rokopisno gradivo
STORITVE PARAMETRI
ločljivost skeniranja 300‐ 600 dpi
Primarni arhiv
ločljivost hranjenja 300‐ 600 dpi
barvna globina 24 bitov
format TIFF, JPG, JPEG2000
Operativna kopija
ločljivost 72‐120 dpi
barvna globina 8‐24 bitov
format JPG, JPEG2000, PDF
2.2. NAVODILA ZA RAVNANJE S KNJIŽNIČNIM GRADIVOM MED PROCESOM DIGITALIZACIJE
• Dokumenti, ki potrebujejo konservatorsko ‐restavratorske posege pred digitalizacijo:
zgubani dokumenti, ki jih je potrebno ravnati ali popraviti (krpati);
dokumenti z velikimi raztrganinami;
knjige, ki se ne odpirajo do kota 90º;
zlepljeni dokumenti;
dokumenti z lepilnimi trakovi;
krhki dokumenti;
knjige s poškodovanimi vezavami.
• Kriteriji za izbiro primerne opreme za digitalizacijo knjižnič nega gradiva
Knjižnično gradivo, ki ga digitaliziramo na plošč atem skenerju:
dobro ohranjene fotografije;
nevezane dokumente iz papirja v dobrem stanju (izjeme so krhki dokumenti, dokumenti,
porisani s pasteli, akvareli, dokumenti na pergamentu, dokumenti s pečati);
dokumente, ki so zaščiteni s poliestrskimi materiali (npr. Mylar), ker lahko z njimi varno
rokujemo;
letaki, brošure v dobrem stanju, ki se lahko odpirajo pod kotom 180°.
Knjižnično gradivo, ki ga digitaliziramo s kamero ali digitalnim fotoaparatom:
knjige, ki morajo biti podprte s knjižnimi naslonili;
fotografije, ki so nalepljene na kartonaste podloge;
gradivo, ki ga ne moremo pritisniti na ravno površino brez poškodb;
dokumente velikega formata (pri katerih je zaradi velikosti oteženo rokovanje);
gradivo, ki je večje od dimenzij ravnega skenerja.
• Rokovanje s knjižničnim gradivom v procesu digitalizacije
Splošno:
z gradivom se rokuje le s čistimi rokami ali (rokopisi, dragoceno knjižno gradivo ) z rokavicami;
na gradivo se ne sme naslanjati;
gradiva se ne sme puščati na neposredno osončenem mestu;
gradiva se ne sme označevati;
v prostoru z gradivom se ne sme jesti, piti ali kaditi;
z gradivom se rokuje le na čistih površinah;
gradivo se prenaša v zaprtih plastičnih zabojnikih, ki se jih založi s peno, gumo, plastiko, da se
gradivo med transportom ne premika.
Vezano gradivo:
knjižno gradivo naj se odpira le do kota 120º (knjige s tesno vezavo le do kota 90º);
gradiva po uporabi ne puščamo odprtega;
večje in težje knjižno gradivo podpremo z oporo ‐ knjižnim naslonilom iz penaste gume;
posamezni listi knjižnega gradiva so lahko obteženi s pomočjo obtežilnih trakov.
Nevezano gradivo:
pri delu z gradivom izjemnih velikosti uporabljamo obe roki;
gradivo moramo primerno podpreti;
viseči pečati, ki jih po uporabi shranimo v zaščitno embalažo (mape, tulce, škatle …) morajo biti
dobro podprti.
Magnetni nosilci:
rokovanje zmanjšamo na minimum;
izogibamo se dotiku površine traku ‐ če je to nujno potrebno nosimo gladke rokavice brez
puhastih vlaken;
takoj po uporabi shranimo trakove v njihovo embalažo;
na magnetne nosilce ne pripenjamo ali lepimo listkov z opombami in ne uporabljamo lepilnega
traku;
po predvajanju poškodovanega traku uporabimo čistilno kaseto;
trakove predvajamo le na vzdrževani opremi za predvajanje;
traku ne puščamo odvitega na sredini ‐ vedno ga odvrtimo na začetek;
trakov ne smemo odlagati v bližini magnetnih polj ali na ohišje električne opreme.
Optični nosilci:
nosilcev ne smemo upogibati in se jih dotikati z ostrimi predmeti;
nosilcev ne smemo puščati v CD napravi;
za rokovanje uporabljamo gladke bombažne rokavice brez puhastih vlaken;
za označevanje ne uporabljamo nalepk;
takoj po uporabi jih pospravimo v zaščitno embalažo.
Plošče (gramofonske – šelak in vinilne, CD; enak način ravnanja velja tudi zaDVD):
izogibamo se dotikanju plošč e z rokami (plošče se lahko dotikamo na njeni sredini, kjer je
nalepka);
za rokovanje uporabljamo gladke bombažne rokavice brez puhastih vlaken;
ne puščamo jih v bližini virov toplote ali svetlobe;
na plošče ne postavljamo težkih predmetov ali jih nalagamo eno na drugo;
pred uporabo odstranimo prašne delce z mehko krpo;
po uporabi jih shranimo v ovoj.
Fotografsko gradivo:
pri rokovanju s fotografskim gradivom uporabljamo čiste, gladke bombažne rokavice brez
puhastih vlaken;
ne smemo se dotikati emulzijske strani fotografskega gradiva.
Filmsko gradivo:
gradiva ne smemo opraskati, odrgniti, nagubati;
pri rokovanju z acetatnim filmom moramo nositi neoprenske rokavice, masko, skrbeti moramo
za dobro prezrač enost prostora, ne smemo nositi kontaktnih leč;
dotikamo se le robov filma; pri uporabi nosimo čiste, gladke bombažne rokavice brez puhastih
vlaken;
po uporabi gradivo takoj shranimo v zaščitne ovoje.
2.3. MEDIJI ARHIVIRANJA DIGITALNIH OBJEKTOV
• Oblike in vrste medijev za arhiviranje digitalnih objektov:
CD‐R;
DVD‐R;
trdi disk, magnetni trakovi.
Mediji arhiviranja za primarni arhiv digitalnih objektov :
prva kopija : optični nosilci;
druga kopija : trdi diski ali magnetni trakovi.
Mediji arhiviranja za operativno kopijo digitalnih objektov :
optični nosilec.
Skladiščenje medijev arhiviranja:
CD‐R, DVD‐R: konstantna temperatura med 15 in 20ºC; konstantna relativna vlažnost 30‐40 %;
odsotnost prahu, hranjenje v temi (ne smemo izpostavljati sončni svetlobi), dobro prezračevani
prostori.
• Rokovanje in hramba medijev arhiviranja
Označevanje
CD in DVD
:
Ploščkov ne označujemo, lepimo. Označujemo le embalažo – zaščitni ovoj (npr. plastično
škatlico)
magnetni trakovi :
ne označ ujemo na traku in ne uporabljamo samolepilnih nalepk;
oznako vstavimo v za to namenjeno odprtino (režo) na magnetnem traku.
Zaščitni ovoji
Optične in magnetne nosilce moramo hraniti v primernih ovojih . Če je le mogoče, jih hranimo v ovojih arhivske
kvalitete (iz inertnega poliestra, ki ne sprošča plinov, ki bi škodili nosilcu zapisa).
Optične in magnetne nosilce hranimo individualno (vsakega v svojem ovitku). Za dolgotrajno zaščito škatle s
CD‐ji ali DVD‐ji v notranjosti ne smejo vsebovati papirja (ali knjižice), saj papir absorbira vlago in tako povzroči
večjo vsebnost vlage v ovitku. Arhivski izvod naj ima na zunanji strani ovoja nalepljeno papirno srajčko, v katero
vložimo napis.
Ovoji naj bodo enotne dimenzije (za dodajanje srajčk ipd. je verjetno bolje, da je štirikotna) ter da vsebujejo
nosilec za CD ali DVD (običajna škatlica za CD‐je). Ne priporoča se uporabe albumov ali srajč k, ker ne omogočajo
dobre mehanske zaščite, prav tako pa lahko (ker niso pritrjeni) diski padejo iz albumov. Priporoč ajo se
»rigidne«, trdne škatlice (»jewel case« so običajne originalne akrilne škatlice za CD‐je in »amaray case« za DVD‐
je), saj nudijo nosilcu boljšo mehansko zaščito.
Rokovanje
Med rokovanjem s CD‐jem, DVD‐jem ali magnetnim trakom se ne dotikamo področij, kjer se nahaja zapis
informacije. CD ali DVD lahko prijemamo le na zunanjem robu ali na centralni luknji.
Po uporabi CD, DVD ali magnetni trak takoj shranimo v zaščitne ovoje.
Nosilci zapisa ne smejo biti v stiku s tekočinami, prahom, dimom in ne smejo biti izpostavljeni sončni svetlobi. V
skladišč u je potrebno imeti dobro prezračevanje.
Nosilce je potrebno redno pregledovati (priporoča se pregled vsakih 6 mesecev). Vizualno pregledamo, če so
na nosilcih znaki poškodb, na naključno izbranih nosilcih preverimo berljivost zapisa. Občasno (priporočeno je
na leto dni) zavrtimo trakove naprej in nazaj.
Pred uporabo magnetnih trakov moramo trak previti naprej in nazaj, da se napetost na traku enakomerno
porazdeli; po postopku zapisovanja trak previjemo na začetek.
Magnetne nosilce zapisov kopiramo vsakih 3‐5 let. Optične nosilce zapisov kopiramo vsakih 5 let.
Hranimo jih ločeno od potencialnih virov magnetnega sevanja in ločeno od električne opreme.
Trakovi ne smejo biti izpostavljeni hitrim temperaturnim spremembam. Č e je razlika v temperaturi skladišč nega
prostora in delovnega prostora večja od 8 °C, moramo trakove pustiti v delovnem prostoru, da se aklimatizirajo
(4 h na vsakih 10 °C razlike).
Čitalce zapisov je potrebno redno vzdrževati, čistiti. Za reprodukcijo uporabljamo le visoko kvalitetne čitalce
zapisov.
Paziti moramo, da trakovi ne padejo na tla, ne izpostavljamo jih šokom.
2.4. PRIMER SPLOŠNE TEHNIČNE DOKUMENTACIJE ZA DIGITALIZACIJO TISKANEGA KNJIŽNIČNEGA
GRADIVA
Dokument vsebuje:
1. Podatki o tiskani publikaciji
2. Parametri digitalizacije serijske publikacije
3. Ravnanje z gradivom
1. PODATKI O TISKANI PUBLIKACIJI:
Naslov Št.
letnikov Št. strani/št.
skenogramov Višina Opombe
Problemi: revija za
kulturo in družbena
vprašanja 30 26.545 22‐30 cm besedilo je v slovenskem jeziku (posamezne
besede v francoskem, angleškem in
nemškem jeziku), pisano v latinici;
besedilo poteka v dveh ali treh stolpcih;
v nekaterih zvezkih je besedilo tiskano v
nasprotni smeri;
oblikovanje besedila je neenotno;
vsebuje različ no slikovno gradivo, ki ne
presega velikosti formata;
zaporedno številč enje strani se nadaljuje v
naslednji številki v vsakem letniku;
rumeno rjav papir;
enostranski tisk na posameznih straneh;
strgani in zmeč kani listi;
posamezne številke v zvezkih obratno
vezane;
pri nekaterih številkah knjižni blok odstopa
od platnice;
izpadanje listov.
Seznam gradiva
Leto izida Letnik Številke Število strani
1962/1963 1 1 100
2 100
3 100
4 100
5 100
6 100
7 100
8 111
9/10 163
11 149
12 133
1964 2 13 132
14 147
15 100
16/17 195
18/19 163
20/21 179
22 131
23 147
24 117
2. PARAMETRI DIGITALIZACIJE SERIJSKE PUBLIKACIJE
Storitev
2.1 Digitalizacija serijske publikacije
2.2 Optična prepoznava besedila (OCR)
2.3 Strukturiranje posameznih številk, povezovanje datotek, skenogramov in poimenovanje datotek
2.4 Metapodatki za serijsko publikacijo Problemi (glavni seznam)
2.1 Digitalizacija serijske publikacije
Parametri digitalizacije
Primarni arhiv
Barvno
ločljivost skeniranja 300 dpi
barvna globina 24 bitov
format JPG
Ogledna kopija
ločljivost 72‐120 dpi
barvna globina 24 bitov
format JPG, PDF
Ogledna kopija:
Skenograme primarnega arhiva naj se pretvori v ogledno kopijo z resolucijo 72‐120 dpi in shrani v pdf formatu
datotek enake resolucije. Datoteke pdf formata morajo biti v berljivi kvaliteti ‐ velikost znakov, kontrast in
format fizičnega nosilca so parametri, ki vplivajo na to, kako bo vsebina berljiva. S poskusnim kreiranjem se
določi ločljivost iz nabora 72‐120, ki ustreza zahtevanim merilom berljivosti. Nad tako pripravljenimi pdf
datotekami naj bo izvedena optična prepoznava besedila (OCR). Rezultat je pdf datoteka, po kateri je mogoče
iskati po celotnem besedilu.
Formati datotek
jpg datoteke Skenogrami naj bodo v ločljivosti, določeni s parametri digitalizacije .
Ime jpg scan datoteke je lahko enako imenu .pdf datoteke. Enako ime mora biti tudi v xml
shemi. Datoteke morajo biti:
‐ obrezane (crop);
‐ velike enotno število slikovnih pik;
‐ poravnane.
pdf datoteke Datoteke naj bodo v ogledni resoluciji med 72 in 120 dpi (prilagojeno izvirniku). Ohranijo
naj enotno velikost formata. Pdf datoteke (multipage) naj se tvorijo za bibliografsko enoto
‐ celotno številko publikacije.
html Besedilo mora biti brez oblikovanja. Dovoljene »zastavice« so , , ,
,
in
njihove zaključitve.
Kodiranje: UTF – 8
txt Kodiranje: UTF – 8
xml Kodiranje: UTF – 8
Vsaka številka serijske publikacije je ena pdf datoteka. Izvajalec naj posamezno številko shrani tudi v html in txt
formatu, ter predloži tudi skenograme posameznih strani publikacije v jpg formatu ločljivosti 300 dpi.
2.2 Optična prepoznava besedila (OCR)
Optična prepoznava (OCR)
Format HTML, TXT, PDF, XML
2.3 Strukturiranje posameznih številk, povezovanje datotek, skenogramov in poimenovanje datotek
Strukturiranje posameznih številk
Vsaka pdf, txt, html in xml datoteka mora ustrezati posamezni številki.
Povezovanje datotek (jpg, pdf, txt, html) z metapodatki
Datoteke publikacije se primarno poimenujejo s COBISS ID te publikacije , letom izida in številko . V posebnem
polju baze se tako zahteva zapis 13608448_1962_1.pdf , ki je identifikator zapisa hkrati pa informacija o tem,
kako so poimenovane ostale datoteke.
Poimenovanje datotek
Datoteke naj bodo poimenovane po naslednjem sistemu in upoštevajo č ISO9960 standard:
a. Poimenovanje datotek strukturiranih po številkah :
13608448_1962_1 .pdf (PRVA številka)
13608448_1962_1.html
13608448_1962_1.txt
b. Poimenovanje skenogramov strani :
13608448_1962_1_001 .jpg (skenogram PRVE strani prve številke)
13608448_1962_1_002 .jpg (skenogram DRUGE strani prve številke)
13608448_1962_1_00… .jpg
Imena datotek ne smejo vsebovati presledkov. Namesto presledkov uporabite spodnji vezaj.
2.4 Metapodatki za serijsko publikacijo Problemi (glavni seznam)
Izvajalec naj kreira metapodatke za serijsko publikacijo iz glavnega seznama po priloženi xml metapodatkovni
shemi:
Splošna metapodatkovna shema:
Polje v XML shemi Opis in opombe