untitled
Knjižnica 49(2005)4, 29-49 34 značilno strjevanje krvi, da se strjevanje krvi zdravi z uživanjem ribjega olja in da uporaba ribjega olja še ni bila objavljena v povezavi z Raynaudovo boleznijo. Iz tega je sklepal, da je morda ribje olje zdravilo za Raynaudovo bolezen, kar so kasnejši klinični poskusi tudi potrdili (Swanson, 1986). Kasneje je avtor te postopke razvijal naprej, jih skušal čim bolj avtomatizirati in jih narediti primerne za druga področja (Swanson in Smalheiser, 1997, 1999), delo pa nada- ljujejo tudi drugi (Hristovski et al, 2000, 2001). Podobne tehnike se uporabljajo tudi pri obdelavi tekstovnega gradiva (Hearts, 1999; Losiewicz et al., 2000) in pri obdelavi bibliografske zbirke SCI (Qin in Norton, 1999). V Veliki Britaniji so leta 1993 pričeli s projektom BESST (Bibliometric of Secto- rial Scientific Trends) z naslednjimi cilji (Katz in Hicks, 1997): omogočil naj bi bibliografski pregled njihovega znanstvenega dela, zlasti primerjavo znanstvenih področjih s svetovno produkcijo, pregled sodelovanja s tujino, pregled sprememb po panogah v Veliki Britaniji in pregled podatkov za potrebe financerjev. V drugi fazi, ki se je pričela leta 1995, so vključili še razvoj grafičnega vmesnika in bib- liografskih podatkov iz industrije. Eden od namenov projekta je bil pokazati primernost osebnih računalnikov in cenene programske opreme za potrebe ob- delave obsežnih bibliografskih podatkov, kasneje pa so aplikacijo zaradi težav z računalniškim pomnilnikom in hitrostjo razširili na bolj zmogljive sisteme. Kot vir podatkov jim je služila zbirka SCI od leta 1981 do leta 1994, iz katere so za- jeli približno 8 odstotkov vseh podatkov oziroma 500.000 člankov. Obdelave so potekale s preglednico MS Excel, z nekomercialno programsko opremo (Linux, Perl, Emacs) in s posebej razvitim orodjem za obdelavo tekstovnih zbirk podatk- ov (Desktop Scientometrics ToolKit). Pri delu so raziskovalci naleteli na mnogo težav. Ena od njih je bilo število mogočih prikazanih podatkov v obliki tabel in grafov (približno 2.000). Rešitev so videli v tem, da naj bi uporabniki sami pregledovali podatke in iskali zani- mive informacije. Težava je bila tudi pri kodiranju imen institucij, saj so se v zbirki pojavljale v različnih oblikah, kar je zahtevalo veliko ročnega dela pri čiščenju podatkov. Omenjajo tudi, da so podatki zbrani v redundantni obliki (nenormalizirani) in da so bili odzivni časi za zapletene poizvedbe od 30 minut do nekaj ur. Avtorji so nameravali nadaljevati delo z izboljšanjem uporabniške- ga vmesnika in z vgrajevanjem metod podatkovnega rudarjenja. V tem delu lahko zasledimo zametke gradnje področnega skladišča podatkov in sprotne analitske obdelave bibliografskih podatkov, in sicer s posebej razvitimi programskimi orodji. V projektu MOBIS-Prosoft (Sotolongo-Aguilar et al., 2000) je bila razvita meto- dologija za obdelavo malih in srednje velikih bibliografskih zbirk podatkov in uporabljena na delu bibliografske zbirke PubMed. Eden od glavnih ciljev projek- ta je bila uporaba standardne komercialne programske opreme (ProCite, MS Excel, Statistica), ki so jo povezali z lastno programsko opremo. Uporabili so tudi me- tode podatkovnega rudarjenja, zlasti združevanje v skupine in nevronske mreže.
RkJQdWJsaXNoZXIy