Besedišče slovenskega jezika z oblikoslovnimi podatki (predstavitev) Ivanka Šircelj-Žnidaršič Konec leta 1998 je pri založbi ZRC v Ljubljani izšla zajetna knjiga (1009 strani) z naslovom Besedišče1 slovenskega jezika z oblikoslovnimi podatki in podnaslovom Po gradivu za slovar sodobnega knjižnega jezika zbrane besede, ki niso bile sprejete v Slovar slovenskega knjižnega jezika (SSKJ - njegov zadnji, 5. zvezek je izšel leta 1991). Kakor se torej razbere že iz podnaslova, je to zbirka besed, ki je ostala kot neobdelano gradivo za slovar sodobnega knjižnega jezika v kartoteki Inštituta za slovenski jezik, v pričujočem delu pa so te besede onaglašene in oblikoslovno obdelane. Vseh skupaj je 178.457 gesel ali iztočnic. V zadnjem delu knjige pa je še 12 precej povednih tabel ali preglednic, ki prikazujejo statistična razmerja med besednimi vrstami ter med oblikoslovnimi in naglasnimi pojavi. Inštitut za slovenski jezik je za interno uporabo že leta 1987 izdal v SSKJ nezajeto besedje v dveh knjigah z naslovom Besedišče slovenskega jezika.2 Tega je bilo kar 182.976 enot, torej precej več kot v SSKJ, kijih vsebuje približno 107.000 (93.152 gesel in 13.888 podgesel), se pravi, le dobro tretjino vseh v inštitutski kartoteki zbranih besed. Besedišče je v javnosti vzbudilo precejšnje zanimanje, ob vse večji možnosti računalniške obdelave pa se je začelo razmišljati tudi o nadaljnjih predstavitvah slovenskega besedja kot celote (med drugim še nimamo npr. lemati-zacijskega slovarja), zato seje Inštitut odločil za novo, izpopolnjeno izdajo, ki naj bi bila uporabnejša in primernejša za nadaljnjo obdelavo. Tako je bilo to gradivo leta 1994 preneseno v računalniško obliko (poskenirano) z domačim programom EVA (Primoža Jakopina), dodano pa mu je bilo še na novo zbrano gradivo iz let 1987-91, žal pa je v končni tehnični obdelavi ponagajal tiskarski škrat in je prav to izpadlo. Gre za približno 6000 besed. Objavljene bodo v nadaljevanju Besedišča, ko bo popisano in obdelano novo nabrano gradivo. Približno 500 besed iz prvotnega Besedišča z večjo pogostnostjo rabe je bilo pred izidom zadnjega zvezka SSKJ sprejetih v Dodatke SSKJ, ki so objavljeni na koncu 5. zvezka. Vse besede je bilo treba ponovno pregledati. Nezanesljive oziroma nejasno izpisane so bile izločene, vendar takih kljub vsemu ni bilo veliko, saj je bil osnovni namen obdelave ohraniti gradivo tako, kot je bilo zapisano. 1 Izraz besedišče je že uveljavljena beseda - prim. Prešernovo besedišče v Prešernovem slovarju (Gradivo za Prešernov slovar, Stane Suhadolnik, ZRC SAZU, Ljubljana 1985) idr. 2 V prvi nakladi je izšlo 250 izvodov, v ponatisu istega leta pa še 300. Ivanka Šircelj-Žnidaršič: Besedišče slovenskega jezika z oblikoslovnimi podatki Najprej je bilo treba preveriti pravilnost prepisa - vnosa v računalnik. Že pri w izpisovanju gradiva za kartoteko je sem in tja ostala kaka napaka - npr. zanaščen ^ pri geslu zamastiti (prav zamaščen), nato še pri prepisovanju oziroma sestavljanju geslovnika. Tam so nastale npr. napake: zapogub - prav zapogib, uspulun za ^ uspulin, uzrezati za verjetno urezati, vcveteti najbrž za vzcveteti ipd. Če je bila O ugotovljena taka napaka, je bila beseda navadno izločena, saj je v pravilni obliki že bila upoštevana v SSKJ, če pa je šlo za očitno tipkarsko napako, smo jo odpravili -tr* npr. pri pridevniku krožčast, kije bil prvotno zapisan kot krozčast (te oblike v SP O ni, tam je samo zapis z -ž-, torej krožčast). ^ Pri zapisovanju besed seje ponujala skušnjava, da bi bile besede prikazane z ^ vseh plati, tudi homonimno, seveda če ne bi upoštevali naglasov - npr.: visôkoin-^ dustrij ski (visôkoindustrijska dežela = izraža stopnjo) proti visokoindustrij ski (vi-sokoindustrijski izdelki = izdelki visoke industrije)3 - tako kot sta npr. navedena IN oba izraza velebitke - naglašena na i pomeni 'cigareta', kot vèlebitka pa 'velika > bitka', vendar sta ta dva bila izkazana v gradivu, prva dva pa ne oba. Upoštevano je ■t3 bilo namreč le, kar je bilo dejansko kje zapisano. Žal to načelo ni veljalo za besede, ki so formalno že bile registrirane v SSKJ, a ^ so kot homonimi imele v gradivu še čisto drug pomen. Te v Besedišče niso bile spreje-P% te, da ne bi vnesle zmede in nezaupanja v prikazano gradivo, jih je pa po svoje škoda. Če bi bila gesla opremljena tudi z razlagami, bi jih bilo mogoče normalno navesti. Gesla, ki so v enakem pomenu navedena tudi v Slovenskem pravopisu ali v u% Pleteršnikovem Slovensko-nemškem slovarju, imajo na koncu oznako S oziroma P # (ali oboje, če gre za oba).4 Zbrano gradivo obsega vsa področja, od splošno rabljenega ali manj pogo-^ sto rabljenega sodobnega knjižnega izrazja, narejenega po ustaljenih jezikovnih ^ obrazcih, ki pa zaradi omejenega obsega SSKJ vanj ni bilo zajeto,5 do izrazov iz "° vseh drugih jezikovnih zvrsti, tudi neknjižnih (narečja, žargoni, sleng, ...), zato je včasih kateri izraz videti prav eksotičen. Veliko je malo rabljenih ali znanih poimenovanj stvari ali pojmov, starinskih in zastarelih, pa strokovnih izrazov, ki so se še ohranili ali že povsem opustili, in tudi takih, ki se ponovno oživljajo oziroma dobivajo še nove pomene in širijo svojo družino. Nekaj zelo nenavadnih besedje bilo opuščenih (izločenih) - npr. antiresanten za interesanten, antičeš-kancelar (enkratna Levstikova šaljiva skovanka). Izpuščeni so bili tudi medmeti, ki so take ali drugačne daljše razširitve tistih iz SSKJ, nekatere že skoraj nesmiselne, npr. hmhmhmhm, brrrrrrr ipd. Lastnih imen, tujih rekel in daljših (tujih) citatov, kratic in simbolov v Besedišču ni. Nekatere besede so le pisne variante navedenih v SSKJ (forsitija : forzici-ja) ali samo v Besedišču: levstek - levstik, persuazija in persvazija druge z 3 Na tem zgledu se tudi nazorno vidi, kako se v besednozvezni razlagi pokaže pomensko-razločevalna vloga naglasov. 4 V nadaljevanju je Pleteršnikov slovar tudi v tem zapisu označen s P, Slovenski pravopis (1962) pa s SP. 242 5 Podrobno o tem glej v SSKJ I (A-H), Uvod, str. XI, člen 4, Ljubljana 1970. Ivanka Šircelj-Žnidaršič: Besedišče slovenskega jezika z oblikoslovnimi podatki ... 6 Besedišče zaznamuje le mesto in kvantiteto naglasa, tonema pa žal ne, saj bi bilo tovrstno preverjanje zelo težko in izredno zamudno, pa tudi le relativno. 7 Korekture so bile opravljene ločeno od ostalega dela (in delavcev), zato je prišlo tudi do kake prej nedogovorjene spremembe. nepravilnim zapisom glede na slovnična pravila: laufer : lavfar, lesbijski : lezbij-ski; lontavški - lontovški, čiu (medmet). (Zanimiv je zapis besede hf talec -lca z 1 tudi v P, kjer bi pričakovali -vec.) V starem gradivu (v malo primerkih nabrano od Trubarja dalje - Pohlin, Gutsman ...) je bilo tudi nekaj napak, ki jih je odkrilo samo zelo pozorno branje -npr. žlahniček : žlahtniček, ki sta bila v kartoteki vložena na napačnem mestu. Sum, da morda imata kaj skupnega, je pokazal povezavo med njima. Ipd. Po abecedi urejeno preostalo besedje je bilo po razpoložljivih podatkih ja-kostno onaglašeno6 in oblikoslovno sistemizirano, tj. opremljeno z besedno vrstnimi in oblikospreminjevalnimi podatki po sistemu iz SSKJ: samostalniškim in pridevniškim besedam je bil določen spol, sklon (imenovalnik in rodilnik ednine oziroma množine pri množinskih samostalnikih) in število, glagolom pa vrsta vida in osnovna osebna oblika. Druge besede oziroma nepregibne besedne vrste pa imajo samo besednovrstno oznako. Nekaj je pri tem tudi odstopanj ali nedoslednosti -npr. pri tipu alma mater je nesklonljivi del označen le s tildo, kije SSKJ ne uporablja: prim, v Besedišču pater familias -tra ~, light show —a (persona non grata pa je bila pri korekturah izločena, ostal je samo samostalnik persona). Odstopanje od SSKJ je tudi samo oznaka mn. za nesklonljivi samostalnik (prim, v SSKJ npr. shorts z mn. neskl., v Besedišču pa je bilo npr. pri slippers v zadnjih korekturah7 neskl. črtano, torej je samo z mn., kar je nenatančno oziroma ni prav. Podobno je pri samoedninskih tujkah. V Besedišču je (poleg besednovrstne oznake) le oznaka neskl. (prim, noesis), v SSKJ pa, da se rabijo v im. in tož. ed. (prim, nemesis). Večkrat je bilo težko kako besedo že prav zapisati, drugo prav slovnično opredeliti in določiti pravilne oblike, kaj šele prav naglasiti (npr. puba - po obliki sam. ž. sp. je v resnici oblika za poba, to je m. sp.; prim, še velečin - je to vele čin ali kaj drugega?). Kjer seje dalo opreti na družino, ni bilo večjih težav, težko pa je bilo z osamljenimi besedami, kjer se ni bilo mogoče na kaj opreti (prim. npr. cetlica 'planika' /zapis iz 1. 1927/ ali passim, kije pravilno latinski prislov, a je v Besedišču po analogiji prikazan kot samostalnik moškega spola, ker iz prepomanjkljivega gradiva ni bilo mogoče ugotoviti, kaj je, obdelovalci Besedišča pa kot sami nelati-nisti na latinski izvor besede očitno nismo pomislili). Ponekod je gradivo že imelo naglas, čeprav včasih za knjižni jezik nenavaden. V veliki večini je ostal tak, če pa seje ugotovila napaka, je bil popravljen. Pri določanju naglasnega mesta je bil primerjalno v pomoč SSKJ, dodatno pa še Slovenski pravopis 1962, Pleteršnikov slovar in po potrebi tudi še drugi slovarji in priročniki. Včasih pa tudi to ni zadostovalo in so bile potrebne še ustne poizvedbe pri strokovnjakih za posamezna področja, čeprav to ob začetku dela ni bilo predvideno, pa tudi čas je bil zelo omejen. (Zanimiv je bil na primer niz arheo- Ivanka Šircelj-Žnidaršič: Besedišče slovenskega jezika z oblikoslovnimi podatki loških izrazov acheulec, acheuléen, acheulski [ašelski] in variante ašelcen, ki so ^ se prvotno nahajali v različnih skupinah po abecedi urejenega in po določenih kri-^ terijih razdeljenega besedja in prišli skupaj šele ob dokončni abecedni ureditvi.8 Da M ti izrazi sodijo skupaj in kako se prav izgovarjajo in naglašajo, smo se prepričali ^ šele po pogovoru z našim starejšim arheologom, saj mladi tega niso poznali.) O Kjer se naglasov ni dalo preveriti, so lahko tudi napačni9 - npr. kroš 'cikla- ma' je naveden samo v Pleteršnikovem slovarju (Cigale, Medved), a brez naglasa; r* beseda je morda narečna, v Besedišču ima ostrivec). O Tuja naglasna znamenja so ostala (prim, belle époque, pramoustérien,...), sicer pa podatkov o izgovorjavi tujih in prevzetih besed v Besedišču ni. Če je bese-^ da v Besedišču nenaglašena, se izgovarja drugače, kot je zapisana. ^ Pri tem delu se je zelo jasno pokazalo, da je za pravilno naglaševanje treba poznati pomen oziroma sestavo ali izvor besede oziroma da drugačen naglas (z N intonacijo vred!) pokaže drug pomen - prim. npr. senčece (P) < seno 'posušena > trava' : senčece < sence 'del obraza ob strani čela'; bélosten (prim, belostno svita-»V nje) : belostén (prim, belostena hišica); avêr -a m num. 'sprednja stran novca, lice' « in âver -vra m 'vrsta letala' : pilotska kabina trenažnega avra; gospodica 'gospodič-^ na' : gospodica 'gospoda'; pogrâbljati (< grabiti) : pograbljati (< grabljäti). P% Posebno pomembno je poznavanje pomena pri sestavljenkah in zloženkah. Prim, npr. nadméjen 'ki je, se nahaja nad mejo' (ta v gradivu ni bil potrjen!) in nàdméjen 'ki presega določeno mejo, stopnjo'; nènapojèn 'ki ni napojen' : nenapôjen 'ki se m ne da napojiti, nenapojljiv'; črnogled -m 'pesimist' : črnogled - prid. 'pesimističen'. Velika škoda je, da gradivo ni tudi pomensko obdelano. Kakršnakoli pomen-^ ska določitev, čeprav skopa, nepopolna ali samo usmerjevalna (npr. v besedno dru-^ žino ali področje rabe), bi mu dala še posebno sporočilno vrednost in uporabnost, ° hkrati pa bi s tem postalo dostopno tudi širokemu krogu bralcev. Tako bi se dalo ^ sproti preverjati pravilnost navedenega, sicer se bo lahko marsikdo ob kaki besedi, črkovno enaki ali zelo podobni drugi besedi, spraševal, zakaj tako in ne drugače oziroma, katera beseda je mišljena - ali gre zgolj za napako ali je tako prav? Prim, žlompati (voda žlompa v votlinah med skalami) proti žlampati10; brbljin m (< brbljati) 'brblja, brbljač', lahko pa bi bil tudi pridevnik brbljin (< brblja). Razlaga bi tudi takoj pokazala, da npr. pri besedi oliti oznake P ne bi smelo biti. V Besedišču je namreč ta glagol prikazan kot do vršni z obliko za 1. osebo sed. časa olijem (v pomenu 'obliti', npr. obliti torto), v Pleteršnikovem slovarju pa je oliti -im nedo- 8 Dejstvo, daje bilo besedje razdeljeno na več sklopov in se je torej kar nekajkrat začenjalo od začetka abecede ter se združevalo šele v končni fazi obdelave, je zelo otežilo delo - zahtevalo je veliko več popravljanja in ponovnega preverjanja, kar je zavlačevalo delo. Porabljeni čas bi bilo koristneje porabiti za pisanje razlag. 9 Seveda pa se najde tudi kakšen tak, ki ga je zagrešil tiskarski škrat - prim. npr. modrozêle-nočfn, pri katerem bi morala strešica biti na drugem e, a je z njega preskočila na prvi e. 10 Povezava je razvidna iz Pletersnikovega slovarja - prim, žlompotati nedov. 'žlapotati', Jan. (op.: Tuje napaka, saj glagola žlapotati ni v slovarju, je le žlampotatiplätschern 'žuboreti', 'valovati', 'pljuskati'), pri žlampotati pa ima tudi kazalko na žlampati 's 244 šumom in požrešno jesti ali piti'. Ima pa tudi geslo žlapotek 'pokvarjeno jajce' (vzh. Št.). Ivanka Šircelj-Žnidaršič: Besedišče slovenskega jezika z oblikoslovnimi podatki ... 11 Pleteršnikove kračine so v SSKJ lahko tudi na drugem mestu - prim. npr. dvostràn - v SSKJ dvösträn in dvostràn; tako tudi pri belolas, dolgokrak, kratkodlak, zlatoklas idr. vršen in brez naglasa, pomeni pa 'postavljati ôlihe' (vzh. št.), to je 'postavljati količke, stebričke', npr. ob cesti. Torej je oliti iz Besedišča nekaj povsem drugega kot tisto iz Pleteršnikovega slovarja in v takih primerih se oznake P v Besedišču ni dodajalo (prim, še žižniti -em nedov. - v gradivu pomeni 'siliti v koga', v Pleteršnikovem slovarju pa 'tleti'. Zaradi tako različnih pomenov bi oznake P v Besedišču ne smelo biti, kakor je ni npr. pri odöl - v Pleteršnikovem slovarju pomeni 'dolina', v Besedišču pa 'zobna krema'. In ker je izkazan samo ta pomen, beseda ob sebi nima P-ja. Podobne težave so bile s samostalniki, ki so bili ali ženskega ali moškega spola. Npr.: P ima vèd-véda m in véd-i z v istem pomenu'vedenje', gradivo pa izkazuje samo ženski spol. Taki zapleti so zahtevali veliko dodatnega preverjanja. Ker ni razlag, se bo marsikaj koristnega in uporabnega tudi izgubilo in velikansko jezikovno-kulturno bogastvo, ki se skriva za temi besedami, bo ostalo prikrito. Kako naj npr. bralec ve, da se pridevnik virementski nanaša na francosko besedo virement = danes splošno uveljavljeni virman, iz katerega je izpeljan in splošno rabljen pridevnik virmanski (podatek je iz leta 1922)? Pri iskanju pravilnih rešitev so se pokazala tudi odstopanja v rabi med P, SP, SSKJ in sedanjo rabo pri besedah, kjer naglas ni pomensko razločevalen, torej sprememba mesta naglasa ali sprememba kvantitete ne spreminja pomena. Zlasti izstopajoča so pridevniška obrazila na -iv: piskotljiv -iva : nezmotljiv v SSKJ. Sicer pa je pri teh pridevnikih v SSKJ dosledno dolžina in nobenkrat dubleta kakor pri nekaterih drugih.11 V okviru samostalnikov in njihovih izpeljav imamo obrazila -ica, -aj, -ar idr., pri katerih naglaševalna stopnja niha od 0-2, tj. od nenaglašenosti do stalne naglašenosti, z različno kvantiteto in kvaliteto naglašenosti. Npr. v P je pomagačica (tako je ostalo tudi v Besedišču, po pomagački iz SSKJ in današnjem občutku pa bi bil naglas na drugem a-ju). Pleteršnikovo naglašanje tipa pom an j kij aj, pogoltlaj, pojémljaj jez današnjega stališča zelo opazno; prav tako logar (tak naglas je tudi še v SP, in to za oba pomena: 1. 'kdor ima hišo v logu', 2. 'gozdni čuvaj ' ; v SSKJ pa je logar); P cukrovàr je v SSKJ cukrovär; P topničar, topničarski, topničarstvo so v SSKJ (prva dva) in Besedišču (zadnji) naglašeni na prvem zlogu, prav tako tudi topničarica (Besedišče). Vprašanje je, ali bi se v teh primerih smelo navajati P (s pripombo, da naglas ni identičen). Prim, še metlica < mêtla, metlâr (SSKJ metlica tudi metlica); P hitromèr -êra - v SSKJ samo -mer (tlakomér, kislinomér, ve-tromér idr.). Ob delu za Besedišče so se pokazale tudi nedoslednosti pri naglaševanju izpeljank iz predložnih zvez v samem SSKJ. Prim. npr. medgorje, medösje, medplečje, medočje, mednožje, pač pa mèdkrôvje; besede ilegala, ilegalec, ilegalstvo danes izgovarjamo samo z enim naglasom, pri nekaterih drugih besedah pa izgovarjamo dva naglasa, v SSKJ pa je samo eden. Prav tako je npr. pri zloženkah tipa čudapoln, nadepôln, trudapoln proti: grozepöln, mükepöln, upapôln, usôdepôln. V Besedišču imajo tovrstne besede po dva naglasa: bogâpôln, bôjapôln, čustvapoln. Ivanka Šircelj-Žnidaršič: Besedišče slovenskega jezika z oblikoslovnimi podatki Ne glede na pomanjkljivosti pa je Besedišče kljub temu izredno zanimiv in H svojevrsten dokument oblikovanja in obstajanja slovenščine in omogoča dodaten, ^ zanimiv vpogled v slovenski jezikovni laboratorij, zgovoren in pomenljiv za vsako-M gar, ki razmišlja o jeziku.12 Skupaj s svojim odzadnjim slovarjem bo dragoceno ^ dopolnilo k SSKJ tudi za nejezikoslovce. O Pričujoča predstavitev nikakor ni popolna. Njen namen je opozoriti na os- novne probleme oziroma zagate, na katere naletimo pri obdelavi besedišča. Iz tega bi se potem lahko izoblikovala natančnejša izhodiščna merila za vse nadaljnje ob- O delave. 2* N > 246 12 Prim. F. Jakopin, Predgovor k Besedišču slovenskega jezika I, Ljubljana 1987, str. 7.