vilar.pdf

KRNJENJE KOT OSNOVA NEKATERIH NEKONVENCIONALNIH METOD POIZVEDOVANJA 1 Polona Vilar Jure Dimec Oddano: 26.10.2000 - Sprejeto: 05.12.2000 Izvirni znanstveni članek UDK 004.021 :001.891.5 Izvleček V prispevku so predstavljeni postopki krnjenja in utemeljeni kot najpomembnejša faza priprave besedila za vključevanje v zbirke polnih dokumentov, še posebno take, ki uporabljajo ne-Boolove iskalne modele. Krnjenje je postopek obdelave besedil z algoritmi za krnjenje, s katerim avtomatsko določamo indeksne izraze,-primerne za opisovanje vsebine dokumentov. Predstavljen je statistični pristop h krnjenju, morfološki in semantični vidiki krnjenja ter različne vrste algoritmov za krnjenje. Avtorja govorita tudi o kriterijih za evalvacijo algoritmov in njihovi jezikovni odvisnosti. Na koncu podrobneje predstavita nekatere algoritme, ki so bili razviti za posamezne jezike: angleščino, slovenščino, francoščino, japonščino in arabščino. Ključne besede: informacijska znanost, indeksiranje, avtomatsko indeksiranje, avtomatsko krnjenje, algoritmi 1 Prevod angleškega termina Information retrieval, za katerega se v slovenskem prostoru pojavljajo različna poimenovanja, npr. iskanje informacij, iskanje in priklic informacij, itd. Gre za sistematično preiskovanje indeksiranih informacijskih virov z odkrivanjem, izbiranjem in pridobivanjem podatkov, zapisov iz njih. V širšem, v svetu najbolj uveljavljenem pomenu, Information retrieval pomensko vključuje tudi predhodne postopke gradnje zbirke dokumentov, še posebej postopke opisovanja njihove vsebine. VILAR, Polona; Jure, DIMEC: Stemming as a basis for some non-conventional methods of information retrieval. Knjižnica, Ljubljana, 44(2000)4, 7-31 7

RkJQdWJsaXNoZXIy