Gerhard Neweklowsky Slavistični inštitut Univerze v Celovcu POGOSTNOST GRAMATIČNIH KATEGORIJ V SLOVENSKIH ČASOPISNIH BESEDILIH Pričujoča raziskava pogostnosti v slovenskih časopisnih besedilih si postavlja za nalogo ugotoviti razporeditev gramaučnih kategorij, kot so besedna vrsta, sklanjatev, število, spol, sklon, čas, oseba in drugo. Poleg tega prinaša (s pridržkom) tudi podatke o frekvenci naj-pogostnejših leksemov in besednih oblik. Teoretični in praktični pomen frekvenčnih raziskav splošne narave ali na opusu kakega pisatelja je potrjen v mnogih knjigah in člankih s tega področja, ki so izšU v zadnjih letih.^ Spodbuda za naše delo izvira iz želje, da bi povećah učinkovitost pouka slovenščine kot tujega jezika, saj ni vseeno, ali mora učenec pri začetnem učenju obremenjevati svoj spomin z relativno redko nastopajočimi gramaučnimi kategorijami ah ne. Uporabna vrednost te raziskave^ bo še večja, ko bodo vanjo vključene druge besedilne zvrsti, kot na primer beletristična proza, dramatika, znanstvena besedila, intervju, vsakdanji sporazumevalni jezik. Beseda in besedna oblika Pod »besedo« razumemo tu vse besedne oblike, ki spadajo v paradigmo. To pomeni, da besedne obUke, kot na primer biti, sem, si, sta, bil je, bila sta, bili so in tako dalje, sestavljajo paradigmo besede »biü«. Oblike je ali so pri tem ne štejejo za posebne besede, ampak so sestavni del oblik bil je, bili so. Prav tako ne velja za posebno besedo refleksivni se pri glagolih, oblike bom, boš in tako dalje pri prihodnjiku in drugje. V nasprotju z drugimi frekvenčnimi raziskavami torej besede niso dehnirane kot zaporedje črk med dvema spaci-jema (tako v citiranih delih Suhadolnika in Suhadolnika/Janežičeve). Obseg gradiva Raziskovano gradivo obsega 10.654 besednih oblik, med katerimi je 5.143 različnih. To pomeni, da se vsakabesedna oblika v povprečju pojavi dvakrat. Besedne oblike pripadajo 2.886 različnim besedam (geslom, leksemom, slovarskim vneskom). Pri njihovi obravnavi se je strogo pazilo na ločevanje tako leksikalne kot tudi gramatične homonimije; nasprotno se pod stolpcem »leksemi« ni dalo ločiti homonimov, tako da so na primer oblike glagola »biti« (sein) in »biti« (schlagen) seštete. Takšne primere lahko kljub temu zaenkrat zanemarimo, saj rezultatov ne spreminjajo močno. Pogostnost nastopanja glagola 6)7/ (bi-jem) nasproti glagolu biti (sem) je zanemarljivo majhna. Ob zanemarjanju leksikalne homonimije se vsak leksem v raziskovanem gradivu pojavi 3,7-krat 50 število grafičnih besed (to pomeni natiskanih zaporednih črk med dvema spacijema ali med spacijem in stavčnim znakom) znaša 11.717 ali za 10 % več kot število zgoraj definiranih besednih oblik. Besedne kategorije Vsaka klasifikacija gramatičnih kategorij je tudi teorija besednih vrst Znano je, da v gra-matični teoriji ni enotnosti glede na število besednih vrst Medtem ko so v ruski gramatiki uvajalne besede (wodnye slova; Schaltwörter) jasno definirana besedna vrsta," v slovenski slovnici ta oznaka ni običajna.' Najti je mogoče tekoče prehode med prislovi, »wodnye slova« in členki, med prislovi in povedkovniki, priložnostno tudi med zaimki in števniki. ' Raziskavo je finančno podprla Komisija za raziskovanje pri Univerzi za izobraževalne znanosti v Celovcu. Hva- ; ležnost dolgujem dr. W. Steiningerju (Slavistični inštitut Univerze v Gradcu) in dipL ing. H. Maierju (računalniški | center Univerze v Celovcu) za prepustitev oziroma izdelavo računalniškega programa, s katerim sem izvajal raz- ' iskavo. Podatki so bili obdelani na VAX napravi Univerze v Celovcu, kakor tudi na napravi UNIVAC 1100 raču- ', nalniškega centra Univerze v Gradcu. Nadalje se zahvaljujem profesorju S. Suhadolniku (SAZU v Ljubljani), da mi i je dal na vpogled nenatisnjeni frekvenčni slovar SAZU in končno se zahvaljujem tudi magistri F. Kobenter, magistru i J. Blajsu in študentu St Schellandru za sodelovanje pri ekscerpiranju besedil. i 2 Primerjaj poročilo pri M. Lončariču, »O čestotnim rječnicima i čestotniku hrvatskoga književnog jezika«, Suvremena lingvistika, 15/16 (Zagreb 1977), 39-48. Pritegnili bi še Castolnyj slovar' russkogo jazyka, pod red. L. N. Zaso-rinoj, Moskva 1977 (Izd. »Russkij jazyk«). Prim. tudi G. Wytrzens, Der Wortschatz des »Krysolov«, v: Marina Cve-taeva, Krysolov - Der Ratlenlänger, izd. M.-L. Bott (Wiener slawistischer Almanach, Sonderband 7, 1982), Str. 267-324 z literaturo. Za slovenščino glej: St Suhadolnik in M. Janežič, »Plasti in pogostnost leksike«. Jezik in slovstvo, 8(1962-63), 73-79, St. Suhadolnik, »Frekvenčna analiza besedišča v Tavčarjevi povesti Cvetje v jeseni«. Slavistična revija, 22 (1974), 31-40. ' Ekscerpirana je bila sobotna številka časopisa Delo, 3. oktober 1981, pri čemer so bili obravnavani naslednji članki (v oklepajih število natisnjenih besednih oblik): (474) Dobro delo naj odloča o kandidatih za funkcije i (301) Bombe padle na Kuvajt i (311) Večja pomoč namesto »soodvisnosti« ] ( 98) Vreme danes i (408) Slovenija si mora čimveč energije zagotoviti doma i (167) Sladkorno peso bodo pobirah tudi ročno ¦'. (350) ZIS o odnosih s tujino i (846) Leteči radarji so razcepili Washington i (572) Manj beguncev v Somaliji .1 (500) Srečanje fizikov v tržaškem centru 1 (825) Variante zgodovine v delih Slovenske matice (397) Živa mladost na odru (421) Gledljiva glasba i (333) Zdaj je čas za nakup zimske opreme za avto 1 (407) Trupeice prekril sneg (443) Šah (545) Posvojil je kar 30.903 otroke (309) Razčlenitev ugrabitve letala (277) Oktobrski tabor proti paktu (307) Južnotirolsko vprašanje se vnovič razgreva (354) Živeti le v okviru tistega, kar ustvarimo (775) Olimpijske igre še v naslednjem stoletju (563) Koliko časa zares delamo (552) Tudi Sonce vpliva na človekov živčni sistem (656) Korak bhže k istemu cilju: zdravemu otroku (526) Človek se bo lahko branil pred virusi kar s tobakom 1 11.717 i Prim. npr A, V. Isačenko, Die russische Sprache der Gegenwart, Halle (Saale) 1968 (Niemeyer), 614-620, zur all- \ gemeinen Problematik der Wortarten, str. 10-19. ' Prim. J. Toporišič, Slovenska slovnica, Maribor 1976 (Obzorja), 192 f. (9 besednih vrst: samostalnik, pridevnik, gla- ; gol, prislov, predikativ, predlog, veznik, členek, medmet). i 51^ morebiti tudi med drugimi besednimi vrstami. Navsezadnje obstajajo tudi prehodi med drugače jasno definiranimi besednimi vrstami, kot sta samostalnik in pridevnik; pridevnik se uporablja samostalniško na primer pri imenih dežel tipa Koroška, Madžarska, Finska. Da bi se pri relativno majhnem korpusu izognih prevelikemu diferenciranju, se omejujem na naslednje besedne vrste: samostainik, pridevnik, glagol, prislov, zaimek, števnik, predlog, veznik. Medmeti se v časopisnih besedilih niso pojavljah. Razvrstitev besednih vrst Najpogostnejše besedne oblike Zgornja tabela omogoča naslednje sklepe: najpogostnejše besedne obUke so enozložne aU nezložne, z izjemo »tudi«, ki pa se pogovorno prav tako realizira enozložno. Z izjemo je 52 in so vse besedne oblike spadajo med nesklonljive. Skupna pogostnost prvih 20 besednih oblik znaša 2.306, to pomeni 21,65 % vseh nastopajočih besednih oblik. Najpogostnejše besede * Opomba: med 317 oblikami glagola biti ena pripada glagolu biti (schlagen), bijem; obliki s in z sta pravzaprav fonetični varianti ene besede. Skupna pogostnost prvih 20 besed znaša 2.816, to je 26,43 % celotnega gradiva. Prvo mesto zdaj zavzema predlog v (veže se s tožilnikom in mestnikom), sledijo mu in ter oblike glagola biti. Prvi samostalnik se pojavi na 17. mestu (delo: gotovo ga pogojuje časopisna zvrst). Nadaljnje pregibne besede so ta (kazalni zaimek), on (osebni zaimek) in ves (nedoločni zaimek). Za primerjavo 10 najpogostnejših besed v raziskavi Suhadolnika in Ja-nežičeve, str. 73: 1. in 6. v 2. biti 7. da 3. se 8. pa 4. ne 9. na 5. on 10. s V Suhadolnikovi raziskavi Tavčarjevega besedila Cvetje v jeseni (str 33) je vrstni red naslednji: 1. se 6. da 2. in 7. on 3. biti 8. jaz 4. ne 9. na 5. v 10. ta Vrstni red v frekvenčnem slovarju Slovenske akademije znanosti in umetnosti v Ljubljani je tale: in, biti, se, v, ne, on, da, na, ta, jaz. Najbolj opazna posebnost je tukaj nastopanje osebnega zaimka jaz, ki se v časopisnih besedilih praktično ne pojavlja. Refleksivni se v naši raziskavi ne velja za leksem. Z didaktičnega vidika je zanimiva ugotovitev, da je s prvimi dvajsetimi besednimi oblikami, pa tudi s prvimi dvajsetimi besedami, ki v povprečju znašajo 21,65 oziroma 26,43 % nekega slovenskega časopisnega besedila, nemogoče tvoriti kakršenkoh stavek. 53 Razporeditev gramatičnih kategorii 1. SAMOSTALNIK (vključno z lastnimi imeni) a) Sklanjatve besedne oblike besedne oblike skupno različne Najpogostejša je sklanjatev samostalnikov moškega spola. K njim se prištevajo tudi tri oblike ajevske sklanjatve, ki po naravnem spolu spadajo med maskulina (kolega, starešina). Oblike historične ojevske sklanjatve (m. in sr. sp.) obsegajo skoraj 60 % vseh nastopajočih samostalniških oblik. Obe sklanjatvi samostalnikov ž. sp. obsegata skupaj dobrih 40 % gradiva. Edninske oblike nastopajo v razmerju do množinskih več kot dvakrat pogosteje, medtem ko dvojinske oblike tvorijo zanemarljivo majhen del gradiva, pri čemer velja pripomniti še to, da vrsta dvojinskih oblik oblikovno sovpada z množinskimi. Med sklonskimi oblikami so najpogostejše: rodilnik, imenovalnik in tožilnik. Pogostnost rodilnika je v časopisnih besedilih moč pojasniti po eni strani z zanikanim rodilnikom (kar je splošno-slovensko), po drugi pa s pogostnimi rodilniškimi prilastki v časopisni in poljudnoznanstveni zvrsti. Pogostnost imenovalnika kot subjektnega sklona in povedkovega določila je razumljiva. Tožilnik je sklon direktnega predmeta in številnih predložnih zvez. Dajal-nik je kot sklon indirektnega predmeta in relativno maloštevilnih predložnih zvez najbolj redek. 54 i Najpogostnejše samostalniške oblike frekvenca 21 16 16 16 13 12 12 11 leksem delo razvoj otrok država dolar leto delo organizacija nastopajoča oblika dela razvoju otrok držav dolarjev leta delo organizacije kategorija sr. sp., rod., ed. m. sp., mest, ed. m. sp., rod., mn. a-ž. sp., rod., mn. m. sp., rod., mn. sr. sp., rod., ed. sr. sp., im., ed. a-ž. sp., rod., ed. Najpogostnejši samostalniki skupno Najpogostnejši samostalniki v ednini 51 delo 26 razvoj 20 leto 19 čas 18 politika 17 terapija 16 sonce 16 organizacija 14 položaj v množini 1. 35 država 2. 23 leto 3. 21 otrok 4. 16 begunec 5. 15 igra 6. 13 težava 6. 13 dolar 6. 13 človek 9. 12 razmera 9. 12 dan Prva samostalniška oblika nastopa na 38. mestu pogostnostnega zaporedja. Izbor najpogostnejših samostalnikov je pač bistveno odvisen od zvrsti besedila. Vrstni red najpogostnejših samostalnikov v nenatisnjenem frekvenčnem slovarju SAZU je, za primerjavo, naslednji: človek, srce, leto, oko, dan, svet (Welt), mati, narod, oče, misel. Le trije samostabiiki so skupni, namreč človek, leto in dan; verjetno so precej neodvisni od zvrsti besedila. Preostale besede zavisijo od vsebine časopisnih objav in člankov. Nekateri leksemi nastopajo v eni sami besedni oblUci, tako na primer »dolarjev« (samo rod. mn.), drugi pretežno 55 i v eni obliki, npr. mest. ed. besede razvoj, ki je pogojen z besedno zvezo država v razvoju. Nekateri drugi leksemi so spet zgoščeni v enem samem članku,- tako na primer 16 oblik besede sonce v ed. izvira pretežno iz nekega astronomskega prispevka, 16 oblik leksema begunec v mn. iz članka o problemu beguncev v Somaliji in 15 oblik.besede igra iz članka o olimpijskih igrah. 2. PRIDEVNIK Razporeditev števil in spolov pri pridevniku se ne sklada popolnoma z razporeditvijo ustreznih kategorij pri samostalniku. Na 2,46 samostalnika pride v povprečju en pridevnik. Opazno je daleč večje število različnih pridevniških oblik v primerjavi s samostalniškimi. Pri pridevniku znaša razmerje števila vseh oblik nasproti številu razUčnih oblik 1,18, pri samostalniku pa 1,55. Najpogostnejši pridevniki Relativno majhno število pridevniških oblik se kaže tudi v tem, danajpogostnejša pridevniška oblika nastopa le dvakrat Najpogostnejši pridevniki (leksemi) so naslednji: 56 j z izjemo pridevnikov velik in nov brez dvoma vse ostale določa časopisna zvrst in vsebina poročil oziroma poljudna znanstvenost članka. 3. GLAGOL c) Osebe j V časopisnih besedilih je treba pričakovati precejšnje prevladovanje 3. osebe v razmerju do obeh preostalih. To tudi drži. Nekaj pogostnejša je tudi prva oseba množine, ki pa se j skoraj v vseh primerih uporablja za opisovanje splošno veljavnih situacij. Vseh drugih j primerov je zanemarljivo malo. j d) Spoli (brez deležnikov) 571 e) Razporeditev spolov pri deležnikih Med njimi 9 oblik glagola združiti in združeno delo. f) Preostale glagolske oblike Razmerje med ednino in množino se značilno razhkuje od ustega pri samostalniku; mno-žinske oblike so relativno pogostnejše. Pri glagolu je opazno spremenjeno razmerje med skupnim številom besednih obhk in številom različnih besednih obUk, še posebej v se-danjiku. To je pogojeno s številnimi oblikami glagola biti (sem). Pri spolu je mogoče ugotoviti precejšnje prevladovanje moškega spola nad ženskim in srednjim. To bi lahko po-jasnih tako, da v novicah nastopajo predvsem moške osebe. Najpogostnejše glagolske oblike Prvih 8 besednih oblik znaša skoraj 17 odstotkov vseh besednih obUk. Najpogostnejši glagoli (leksemi) ' Med njimi 1 oblika glagola bid/bijem. 58 Oblike prvih devetih leksemov (456) znašajo okoh 29 % celotnega fonda glagolskih oblik (samo »biti« okoli 20 %!). Za razliko od samostalnika se zdi, da gre pri najpogostnejših glagolih za lekseme, na katere le relativno malo vpliva vrsta besedila; med navedenimi sta taka predvsem nameravati in razviti. Skupno se v gradivu pojavlja 639 različnih glagolskih leksemov. 4, PRISLOV Skupno število prislovov je 1.061, od tega je 297 različnih. V tem številu sta vsebovana 202 (129 različnih) iz pridevnikov izpeljana in 4 (4) iz glagolskih deležnikov izpeljani prislovi. Najpogostnejše prislovne oblike Prvih 15 prislovov znaša okoli 42 % vseh prislovnih oblik: med njimi so izključno iz drugih besednih vrst neizpeljani prislovi. 5. ZAIMEK a) Spoli V nasprotju s samostalnikom je treba ugotoviti izrazito prevladovanje moškega spola nasproti ženskemu (prim., kar je bilo poprej povedano ob glagolu). Iz skupnega števila 837 zaimkov (med katerimi je 281 različnih oblik) izhaja, da znaša vsota zaimenskih oblik, ki ne razlikujejo spola, 236 (25 različnih), vsota tistih, ki ne razlikujejo števila, pa 171 (6 različnih). 59 Najpogostnejše zaimenske oblike Deset najpogostnejših obhk znaša 36,6 % celotnega fonda. Najpogostnejši zaimki (leksemi! 6. ŠTEVNIK Število števniških obUk je majhno (0,96 %). Najpogostnejši števniki (leksemi) so: 7. PREDLOGI Razporeditev glede na sklon 60 j v povprečju nastopa vsak predlog 28,5 krat Omeniti je treba, da h/k in s/z štejeta kot dva predloga. Najpogostnejši predlogi: Deset (če štejemo z/s za en predlog: devet) najpogostnejših predlogov pomeni več kot tri četrtine fonda predlogov. 8. VEZNIK Najpogostnejši vezniki Opazna je velika pogostnost prvih petih veznikov, ki jih vse lahko najdemo na listi 20 najpogostnejših besednih obhk. Predstavljajo 83,94 % vseh veznikov. SKLEP V tem delu so prvikrat predstavljene statistične vrednosti glede na razporeditev gramaučnih kategorij v slovenščini. Rezultate smo dobih iz časopisnih besedil in so zato relevantni le za ustrezne zvrsti. Nadaljnje raziskave bodo pokazale stilno odvisnost ali neodvisnost gramatičnih kategorij. Čisto očitno je na primer razporeditev oseb pri glagolu odvisna od besedila (v časopisnih besedihh se skoraj izključno pojavlja tretja oseba). Neodvisna ah v manjši stopnji odvisna je raba predlogov, veznikov, sklonskih oblik itd. Podatke o pogostnosti za posamezne be- 61 sedne oblike in lekseme je zaradi majhnega obsega gradiva treba razumeti s pridržkom. Kaže pa se, da so najbolj zastopane oblike vendarle stilno neodvisne, saj so zastopane tudi v drugih raziskavah (Suhadolnik in Janežič). Samostalnik in glagol se v tem pogledu obnašata različno. Medtem ko so najbolj zastopani samostalniki močno odvisni od teme, naj to za glagole ne bi veljalo. Predloženi rezultati opozarjajo tudi na praktično uporabnost pri poučevanju slovenščine kot tujega jezika, na primer pri tečaju »slovenščina pasivno«, ki se opira na branje časopisov in poljudnoznanstvenega berila. Prevedla Marija Smolić