URN_NBN_SI_doc-CKREDCV0

131 T v 01x1130,5 7 01x3867,6 7 01x4543,5 7 n v 702.6 702.6 301.6 T v – vsota rangov v posameznem vzorcu n v – število enot v posameznem vzorcu Izračunana vrednost H = 930,4835 Zaradi velikega števila skupnih rangov se odločimo tudi za korekcijo. Izraču- namo korekcijski koeficient k C , s katerim delimo izračunano vrednost H . k C = 0,5288 H C = 1759,6 Kritična vrednost hi-kvadrat pri 1% tveganju in dveh stopinjah prostosti je χ 2 = 9,21. Dobljena vrednost H C je znatno večja kot kritična vrednost. Ničelno hipotezo H 0 zavrnemo in sprejmemo osnovno hipotezo H 1 , ki trdi, da rezultati krnjenja niso enaki, oz. da se število ekvivalenčnih razredov, ki jih proizvedejo algoritmi za en referenčni razred, značilno razlikuje. V primerjavi z referenčnim rezultatom, ki obsega 6.209 krnov, jih Optimalni izdela 7.642, Popovičev 7.860 in Generični 15.930. Izračunamo še povprečno število ekvivalenčnih razredov za referenčni razred in standardno deviacijo. Rezultate prikazuje tabela 2. Tabela 2: Povprečno število in standardne deviacije ekvivalenčnih razredov na referenčni razred metiroglA x δ inlamitpO 7032,1 1835,0 ve~ivopoP 9562,1 5996,0 in~ireneG 6565,2 4409,2 Iz izračuna povprečnega števila in standardnih deviacij je očitno, da Generič- ni algoritem izrazito odstopa od Popovičevega in Optimalnega, medtem ko sta si slednja dva glede na rezultate dokaj blizu. Zato smo izvedli še primerjavo Popovičevega in Optimalnega algoritma. 4.3.2 Primerjava Optimalnega algoritma s Popovičevim Ničelna hipoteza H 0 tokrat trdi, da se algoritma glede na število ekvivalenčnih razredov ne razlikujeta. Preverimo jo s Kruskal-Wallisovim testom. Vilar, P.; Maver, J. Krnjenje slovenskih besedil s področja bibliotekarstva

RkJQdWJsaXNoZXIy