untitled
Knjižnica 49(2005)4, 29-49 30 Review article UDC 004.65:025.321.4 Abstract Databases contain information that can usually not be revealed by standard query systems. For that purpose, the methods for knowledge discovery from databases can be applied, which enable the user to browse aggregated data, discover trends, pro- duce online reports, explore possible new associations within the data etc. Such meth- ods are successfully employed in various fields, such as banking, insurance and tele- communications, while they are seldom used in libraries. The article reviews the de- velopment of query systems for bibliographic databases, including some early attempts to apply modern knowledge discovery methods. Analytical databases are described in more detail, since they usually serve as the basis for knowledge discovery. Data mining approaches are presented, since they are a central step in the knowledge dis- covery process. The key role of librarians who can play a key part in developing sys- tems for finding new information in existing bibliographic databases is stressed. Key words: bibliographic databases, analytical databases, data warehouses, data mi- ning 1 Uvod Bibliografske zbirke podatkov so pomembno orodje sodobne družbe. Razisko- valci, študentje, strokovnjaki in drugi jih uporabljajo za iskanje literature s svo- jega področja. Knjižničarjem predstavljajo osnovo za shranjevanje podatkov, ki jih potrebujejo pri svojem delu, npr. o lokaciji gradiva in stanju zalog. Te zbirke uporabljajo tudi vladne in druge ustanove pri spremljanju razvoja, usmerjanju financ in primerjavi rezultatov raziskovalnega dela. Po Nortonu (Norton, 1999) spadajo bibliografske zbirke podatkov med sekundarne zbirke (reference databases), ki uporabniku pomagajo poiskati informacijo in ga nato usmerijo na drug vir, npr. na članek na internetu, na revijo, knjižnico, osebo ali orga- nizacijo. Po Mohoriču (Mohorič, 1995, str. 18) so bibliografske zbirke podatkov kom- binacija sekundarnih zbirk (ki jih imenuje referenčne zbirke) in sistemov za obdela- vo besedil. Bibliografske zbirke podatkov se danes pogosto povezujejo s primarni- mi oz. izvornimi zbirkami podatkov (source databases), ki vsebujejo izvorne po- datke, npr. članke v polnem tekstu, statistične podatke in podatke o genih. Med prvimi področji, ki so vzpostavila lastne specializirane bibliografske zbirke podatkov, je bila medicina. Najbolj znana zbirka med njimi je Medlars, ki je od šestdesetih let na razpolago v računalniški obliki pod imenom Medline (http:// www.nlm.nih.gov/pubs/factsheets/medline.html ). Poleg te obstaja danes še
RkJQdWJsaXNoZXIy