URN_NBN_SI_doc-CKREDCV0
Knjižnica 46(2002)1-2, 111-136 122 Zapis iz datoteke novih krnov: zadel/5472/zadelo,zadel zadet/891/zadeti,zadet zadetk/3691/zadetkov,zadetk Zapis iz izvorne datoteke: 5472/zadel/zadelo, 891/zadet/zadeti, 3691/zadetk/zadetke,zadetki,zadetkih,zadetkov, 3.3.1.2 Čiščenje seznama novih krnov Po opravljenem označevanju smo seznam novih krnov vsakič obdelali s pro- gramom za “čiščenje”. Program deluje tako, da krne označene z “v” preslika v seznam veljavnih krnov (Valid_stems), z “n” v seznam imenskih krnov (Name_stems), tiste z “b” pa zavrže. Enako se zgodi z izvornimi besedami za vsak posamezen krn. Datoteka z besedami, iz katerih izvirajo novi krni, se po opravljenem čiščenju krnov iz datoteke novih krnov razdeli glede na oznako, ki smo jo dodelili posameznemu krnu. Nastaneta torej dve novi datoteki: iz- vorna datoteka veljavnih krnov (Valid_stem_origins) in izvorna datoteka imen- skih krnov (Name_stem_origins), ki pripadata ustreznima datotekama z ve- ljavnimi in imenskimi krni. Poleg tega je rezultat procesiranja vsakič tudi da- toteka s poročilom o postopku in naraščanju števila krnov v vseh seznamih. Oba seznama smo občasno tudi kontrolirali oz. popravljali morebitne napake administratorke (npr. napačno uvrščene besede). 3.3.1.3 Dopolnjevanje seznamov končnic in blokiranih besed Na podlagi rezultatov krnjenja in opaženih napak smo po potrebi dopolnjeva- li tudi seznama končnic (moje_koncnice in sogl_koncnice), kot prikazuje naslednji primer: Zapis iz datoteke novih krnov: arhiv/5386/arhivskega,arhivskeg,arkivsk,arhiv arhivir/5947/arhiviranje,arhiviranj,arhivir Zapis iz izvorne datoteke: 5386/arhiv/arhiv,arhivih,arhivskega,arhivskem, arhivski,arhivskih,arhivu, 5947/arhivir/arhiviranje,
RkJQdWJsaXNoZXIy