URN_NBN_SI_doc-CKREDCV0
Knjižnica 46(2002)1-2, 111-136 124 ob menjavi vira besedila (spec1, nuk0, dipl0). Še posebej pa je zanimiv trend ob obdelavi besedil diplomskih nalog, kjer nekajkrat opazimo vidno poveča- nje števila krnov. Sklepamo lahko, da gre za vsebinsko izrazito heterogen kor- pus. Grafikon 2: Učenje bibliotekarskega podjezika Slika 2 vsebuje grafični prikaz mehanizma delovanja algoritma v fazi učenja. Učenje poteka v iteracijah, torej se ponovi za vsak segment s 15.000 besedami. Slika 2: Mehanizem delovanja optimalnega algoritma v fazi učenja 0 200 400 600 800 1000 1200 1400 knj0 knj2 knj4 knj6 knj8 knj10 knj12 spec0 spec2 spec4 nuk0 dipl1 dipl3 dipl5 dipl7 dipl9 dipl11 dipl13 dipl15 dipl17 dipl19 dipl21 dipl23 dipl25 dipl27 dipl29 dipl31 Segment Število krnov Veljavni krni Imenski krni Vsi sprejemljivi krni
RkJQdWJsaXNoZXIy