untitled
31 Hudomalj, E. Odkrivanje novih informacij v bibliografskih zbirkah podatkov mnogo specializiranih zbirk podatkov z različnih medicinskih in sorodnih po- dročij, kot so farmacija, genetika in biologija. V Sloveniji je bila po principih Medlars v sedemdesetih letih vzpostavljena na- cionalna bibliografska zbirka podatkov Biomedicina Slovenica (BS), ki vsebuje podatke o publikacijah naših avtorjev doma in v tujini, o publikacijah tujih av- torjev pri nas ter podatke o citiranosti teh publikacij. Je največja specializirana bibliografska zbirka podatkov v Sloveniji. Od leta 1996 se BS uporablja tudi za podporo pri ocenjevanju uspešnosti raziskovalnega in razvojnega dela v sloven- ski medicini - projekt SPORUM (Adamič et al., 1996; Hristovski et al, 1996). Današnji sistemi za iskanje podatkov po bibliografskih zbirkah najpogosteje omogočajo iskanje množice vsebovanih zapisov, in sicer z Boolovimi modeli po avtorju, vsebini, reviji ipd. V velikih bibliografskih zbirkah podatkov pa lahko iščemo tudi informacije, ki jih ne moremo predstaviti zgolj z množico zapisov v zbirki. Naj navedemo primere iskanja porazdelitev, s katerimi se ukvarja področje bibliometrije: število objavljenih publikacij in dobljenih citatov glede na število sodelujočih avtorjev, časovni poteki števila citatov glede na leto objave ter števi- lo objavljenih publikacij glede na število avtorjev (Buckland, 1999; Egghe, 2000; Godin, 2003). Znan je tudi primer, ko je iz bibliografske zbirke odkrita informa- cija omogočila uspešno zdravljenje bolezni z novim pristopom (Swanson, 1986), kar je nekoliko podrobneje opisano v naslednjem poglavju. Pri obdelavi velikih količin podatkov se v zadnjih desetih letih vedno bolj upo- rabljajo pristopi, ki jih skupno imenujemo odkrivanje zakonitosti iz zbirk po- datkov. Gre za uporabo znanj s področij skladišč podatkov, sprotne analitske obdelave podatkov, podatkovnega rudarjenja itd. Ti pristopi so na mnogih po- dročjih že uveljavljen način obdelave podatkov, npr. v trgovini, zavarovalništvu, bančništvu, medicini in telekomunikacijah (Hormozi in Giles, 2004). Med primeri uporabe najdemo iskanje potencialnih kupcev za nove izdelke in povečanje pro- daje, iskanje vzorcev pri poslovanju s kreditnimi karticami, ki morda pomenijo prevare, in napovedovanje gibanj poslovnih kazalcev v podjetju. Dodatni primeri so navedeni v posebnem razdelku o podatkovnem rudarjenju. Bibliografske zbirke podatkov se od ostalih pogosto razlikujejo v mnogih pod- robnostih, npr. da stari zapisi ostajajo pomemben del zbirke, da začetki izgrad- nje segajo dlje nazaj v čas, da je pred leti njihova obdelava potekala s posebnimi sistemi za obdelavo besedilnih podatkov in da so bile v svojem razvoju te zbirke velikokrat reorganizirane. Morda so nekatere od teh značilnosti vzrok, da omen- jenih novejših pristopov v praksi še ne srečamo pogosto. V nadaljevanju bomo najprej opisali razvoj bibliografskih zbirk podatkov z neka- terimi zgodnjimi poskusi uporabe novejših pristopov za odkrivanje zakonitosti iz zbirk podatkov. Sledil bo opis razlik med operativnimi zbirkami, kamor spadajo
RkJQdWJsaXNoZXIy