POGOSTOSTNI SLOVAR RUSKEGA JEZIKA* Pogostostni slovar ruskega jezika je sestavljen na podlagi izbora 1 056 382 be- sednih rab in obsega 39 268 besed iz besedil izbora. To je doslej najpopolnejši tovrstni slovar ruskega jezika; posvečen je spominu B. A. Larina. I zda jan je prvih pogostostnih slovarjev sega v drugo polovico preteklega stoletja, ko sta nastala angleški in nemški slovar z namenom, olajšati tiskarsko tehniko in sistem stenografije, izpopolniti pravopis in metode pri poučevanju b ran ja slepih1. Prvi »šolski« slovar pa je nastal šele 1. 19112. Prvi pogostostni slovar ruskega jezika je sestavil F. Malir, sledili so slovarji II. II. Josselsona, È. A. Stejnfel 'dtove, N. P. Vakar ja — in obravnavani. Temeljna naloga pogostostnih slovarjev je seznanjanje bralcev s stopnjo rabljenosti besed v jeziku. Ti slovarji so rezultat statističnih raziskav določenega besednega gradiva ter kažejo pogostost besed in količino besedil, iz katerih so besede vzete. Obravnavani slovar je rezultat dognanj, do katerih je prišla sov- jetska leksikostatistika, tesno povezana s slovaropisjem in avtomatizacijo. Pri nas ta jan ju slovarja je sodelovalo okrog 100 ljudi s Filološke fakultete leningrajske univerze in iz Laboratori ja za semiotiko Znanstvenoraziskovalnega inštituta za uporabno matematiko in kibernetiko gorkovske univerze. Pobudnik in vodja dela je bila L. N. Zasorina, ki je tudi obdelala teoretične osnove in prakt ična navodila za obdelavo besednega gradiva. Zasorina je napisala tudi načrt slovarja. Analitično slovnico in Uvod. Obdelavo gradiva na elektronskih računalnikih sta vodila V. A. Agraev in V. V. Borodin. Načrt za odpravo napak glosarja na elektronskih računalnikih sta napravila V. V. Borodin in V. M. Mu- ratova. Poglavje Statistični parametr i slovarja je napisal È. V. Tisenko. Slovar ima štiri dele: 1. Poročilo sestavijalcev; 2. Uvod; 3. Pogostostni slovar in 4. Dodatek. Y P o r o č i l u se seznanimo s številnim timom znanstvenikov rusistov, ma- tematikov in inženirjev, ki so sodelovali pri nas ta jan ju slovarja. Prva dva dela U v o d a govorita o namenu slovarja, njegovih virih, izboru računske enote in obdelavi besedil. Pomembna je ugotovitev, da v besedoslovju do danes ni rešeno vprašanje razmejitve živega besednega sestava sodobnega ruskega jezika. Slovar je bil narejen zato, da se določijo meje aktivnega slovar- skega sestava žive besedne rabe sodobnega izobraženca. Glavni namen slovarja je, dati zadovoljive podatke o sodobnem besedju glede na zvrstnostno razloče- vanje. Slovar zajema štiri vrste besedilnih virov: umetnostno prozo, dramatiko, znanstvena in publicistična, časopisna in revialna besedila ter kaže na različna področja, k je r bi ga lahko s pridom uporabili . Ta pogostostni slovar prvič na široko zajema znanstveno-publicistični in poslovni jezik, tako značilna za po- dročje množičnega občevanja, sicer pa se ravna po normah besednega sestava ruskega jezika, kakor jih je obdelal leksikolog B. A. Larin. Na podlagi njegove razdelitve na štiri samostojna področja besedne rabe3 obsega slovar za vsako * Cas to tnyj slovar' russkogo jazyka. Sestavljalci V. A. Agraev, V. V. Boro- din, L. N. Zasorina. V. M. Muratova, Z. V. Tisenko. Moskva, Russkij jazyk, 1977. 935 str. 1 Inostrannye jazyki v škole, 1967, št. 3. - R. C. Fldridge, Six Thousand Common English Words, Niagara Falls, 1911. 3 Umetnostni, praktično sporočevalni, znanstveni in časnikarski jezik ter poslovni jezik. skupino po 1/4, t j . 250 000 besednih rab. Ker uvtorji nimajo dovolj zupisov i/. praktičnega sporazumevalnega občevalnega jezika, so za obdelavo vzeli gradivo sodobne realistične dramatike in besedila javnega obveščanja, v katerih so pri- sotne tudi prvine občevalnega jezika. Poudar ja jo , du poleg leposlovnega v občeval- ni jezik prodira tudi znanstveni slovar. Zato so v kartoteko virov vključili vidne sovjetske znanstvenike s področju fizike, kemije, biologije, mineralogije in zgo- dovine. Zajeli so tudi članke in govore Lenina, Kalinina in kongresno gradivo KPSZ, nenehno prisotno v tisku, sestavke pisateljev časnikarjev iz obdobja dru- ge svetovne vojne (npr. A.N. Tolstoj, Leonov, Šolohov), od povojnih publicistov so zajeli članke N. M. Gribačeva. Viri za obdelavo časnikarskega jezika so bili časopisi Pravda, Izvestija, Sovetskaja Rossija (izdaja enega dne) idr.; vsak časopis so izpisali v celoti. Med revialnim tiskom so zajeli revije: Vokrug sveta, Nauka i žizn', Novoe vremja, Novyj mir in Junost ' . Pri izpisovanju niso zajeli leposlovne proze, obdelali pa so reportaže. Slovar ni zajel jezika poezije in eksaktnih ved, zajema pa obdobje od Lenina in Gorkega do 60. let 20. stoletja. V vsaki izmed štirih funkci jskih zvrsti jezika je zajeto od 11 do 15 avtorjev. Tretj i del Uvoda ima naslov Enote besedila in prvine slovarja. Sledi Analitična slovnica slovarja. V nji so podana pravila za analizo samo- stalnikov, pridevnikov, števnikov, zaimkov, glagolov, prislovov, predlogov, vez- nikov, členkov in medmetov. Na koncu Uvoda so navedeni viri slovurja. Na j omenimo samo neka j imen iz sodobne ruske besedne umetnosti: Antropov S. P.. Gajdur A. P., Ovečkin V. V., Paustovskij K. G., Prišvin M. M., Sobolev L. S., Fedin K. A., Šolohov M. A., Arbuzov A. N., Bulgakov M. A., Lavrenev B. A., Rozov V. S., Simonov K. M., Štejn A. P. idr. Tret j i del obravnavanega slovarja, P o g o s t o s t n i s l o v a r , je sestav- ljen iz treh enot. Abecedno pogostostni glosar je najvažnejši in najobsežnejši njegov del. V njem je 39 268 različnih besed. Vsaka leksikalna enota glosarja ima naslednje količinske oznake: 1. pogostost: a) splošno pogostost glede na ves izbor; b) po- gostost glede na število rab besede v vsaki izmed štirih funkci jskih skupin besedil (časopisno-revialna, dramska, znastvena in publicistična, umetniško- proznu) ; 2. količino besedil glede na omenjene štiri skupine, v katerih je pri- sotna posamezna beseda. Pogostostni glosar ima besede s pogostostjo 10 in več, vsega skupa j 9044 enot, razvrščenih glede na upadanje pogostosti. Najbol j pogost je o (oo) — 42 854, sledijo i — 36 266, ne — 19 228, na — 17 262, ja 13 839, bijf — 13 307, čto — 13 185, on — 13 143, s (so) — 12 975, a — 10 719, kak — 7425, èto — 6940 idr. Pogostost 100 imajo vozrast, gromko, dijm, želanie, zabota idr., največjo pogostost 10, imajo abscissa, bes, varen'e, denek idr. Pogostost npr. 178 imajo desjatok, krov', otdel'nyj, pozdno, svoboda, xvatat', čut'. V pogostostnem glo- surju niso nuvedene besede s pogostostjo 1, skupa j 13 379 enot. Tuke besede so npr. avtozavodec, balkanskij, vkleit', gazetčik-professional, darmoed, židovski j, zavod-avtomat idr. Besed s pogostnostjo 1 je kar precej, preseneča pa, da so omenjene in še druge podobne v sodobnem ruskem jeziku tako redke. V poglavju Statistična s t ruktura slovarja je tabela s sedmimi kolonami. Na jp re j je zaporedno število stopnje, sledijo pa kolone absolutna pogostost, število besed z dano pogostostjo, nakopičena absolutna pogostost, nakopičeno število besed (dva dela: absolutno in relativno število besed), relativne pogo- stosti in nakopičena relativna pogostost. Iz navedenih števil se dajo razbrati statistične informacije o vrstnem redu skupin besed z določeno pogostostjo, vsoto pogostosti posameznih besednih skupin idr. V zadnjem delu D o d a t e k imamo seznama homografov, slovarskih in slov- ničnih homonimov, popis nekaterih besed, ki niso zajete v slovarjih, npr. zubator, in vir, od kod je beseda vzeta. Iz Dodatka povzemamo, da je izbira besed dovolj reprezentativna in izraža lastnosti celote, tj . ruskega jezika. V tem delu imamo naveden tudi koeficient besedne raznolikosti slovarja. Količnik določa razmerje števila različnih besed (V) in števila vseh besednih rab (N): „ V 39 268 , , C = - = = O. 0371. N 1 056 382 Iz podatkov se vidi, da je veličina C odvisna od dveh faktor jev: od obsež- nosti izbire besed in obsežnosti različnih besed, na katere vpl ivajo funkci jske in avtorske posebnosti izbranih besedil. Zaključni del nava ja še štiri preglednice in pet diagramov. Iz 3. preglednice npr. razberemo pogostostne podatke za ne- k a j besed iz različnih funkcijskih zvrsti jezika: tako ima glagol byt' splošno pogostost 13 307, v časopisno-revialnih besedilih 2521, v dramatiki 5178, v znan- stvenopublicističnih 2480 in v umetnostni prozi 3128. Tabela 4 govori npr. o po- gostosti besednih vrst. Največjo pogostost ima samostalnik 26,65 — sledi glagol s 17,12 na jmanjšo samostalniško rabljeni pridevniki — 0,053. Na podlagi obravnavanega slovarja so ruski jezikoslovci določili, katere besede se v vseh jezikovnih skupinah besedil uporabl ja jo največkrat . Število takih besed je 6440, kar predstavlja 868 577 besednih rab. Njihovo razporeditev po slovničnih kategori jah pr ikazuje tabela 6. Zanimiv je podatek, da pred- stavl jajo besede s frekvenco 10 in več 92% vseh besednih rab. Diagram 2 kaže npr. količino različnih besed v odstotkih. Največ je besed z začetno črko P, na jman j pa na E in JU. Dodatek tudi govori o gradivu, ki ni zajeto v slovarju, a je že narejeno, tako: 1. abecedno pogostostna glosarja: znanstveno-publici- stični in časopisno-revialni; 2. abecedno-pogostostni glosarji iz različnih bese- dil dramat ike in proze; 3. abecedno-pogostostni glosar splošno rabljenih besed vseh štirih skupin besedil in 4. odzadnji slovar vsega zbranega gradiva. Obravnavani slovar je pomemben zlasti zato, ker omogoča določevati rabo osnovnega ruskega besed ja glede na različne vidike sodobnega slovaropisja. Prav bo prišel sestavljalcem učbenikov in slovarjev minimumov, s pridom ga bodo rabili pri strojnem prevajanju , transkripcij i , prečrkovanju, avtomatičnem lisku, b ran ju črkovnih besedil in še drugje. Morebiti je pomanjklj ivost slovarja v tem, da besed ne razlaga, ne nava ja naglasa, ne razločuje besed kot enot frazeološke in nefrazeološke rabe, kar pa je vse najt i v 17-tomnem Slovarju sodobnega ruskega knjižnega jezika, ki ima 150 000 leksemov v najrazličnejši besedno-stilistični rabi. Pogostostni slovar ruskega jezika je nedvomno velik dosežek sodobne rusistike. Jurij Kojs Pedagoška akademija v Mariboru