URN_NBN_SI_doc-CKREDCV0
117 1. Begin. STEM = word; 2. Search for the STEM in LEGAL_STEMS and in OTHER_STEMS list; 3. If found go to 11; 4. If MOVING_ALLOWED move cursor in STEM one character to the left else go to 11; 5. Search in the CV_ENDINGS list for the STEM’s ending beginning at the cursor; 6. If found cut it off the STEM else go to 4; 7. Iteratively process the STEM consonant pairs with the use of CONS_PAIRS list; 8. Process the STEM with rules from the RECOD_RULES list; 9. Search for the STEM in LEGAL_STEMS and OTHER_STEMS list; 10.If found go to 11 else go to 4 11.End Pass the STEM to next indexing steps. Legenda: LEGAL_STEMS – seznam veljavnih krnov OTHER_STEMS – seznam drugih krnov MOVING ALLOWED – pravila o najkrajšem dovoljenem krnu CV-ENDINGS – VH]QDP NRQþQLF NL FHSLMR EHVHGR QD VWLNX VRJOD snik- samoglasnik CONS-PAIRS – seznam parov soglasnikov RECOD-RULES – pravila za popravljanje krnov Slika 1: Delovanje Optimalnega algoritma (Dimec et al., 1999) Srce algoritma so torej trije koraki (5-8), ki se izvedejo za vsak premik kazalca. Krnjenje ni možno na vsakem premiku, kadar pa je uspešno opravljeno, algo- ritem poskuša najti izdelani krn v seznamih veljavnih in drugih krnov. Če ga najde, se postopek konča, sicer se ponovi za naslednji premik kazalca. Konč- nim pogojem je zadoščeno, ko je krn najden v enem izmed seznamov, ali pa naslednji premik kazalca ni mogoč zaradi pravil o najkrajšem možnem krnu (Dimec et al., 1999). Krn, ki ga izdela algoritem, in rezultati vseh vmesnih stopenj krnjenja se za- pišejo v seznam novih krnov. Administrator sistema nato ob pregledu sezna- ma krne označi z eno izmed treh možnih oznak: - krn je lahko optimalen – takrat dobi oznako “v” (iz angl. valid); - lahko izvira iz kratice, geografskega ali osebnega imena – takrat dobi ozna- ko “n” (iz angl. name); - ali pa izvira iz napačno zapisane ali iz kateregakoli drugačnega razloga nesprejemljive besede – takrat dobi oznako “b” (iz angl. bad). Z uporabo posebnega programa, ki so ga avtorji poimenovali “Program za čiščenje”, in ki vse spremembe takoj odslika v indeksni datoteki zbirke doku Vilar, P.; Maver, J. Krnjenje slovenskih besedil s področja bibliotekarstva
RkJQdWJsaXNoZXIy