Posvet o novem slovarju slovenskega jezika, Ministrstvo za kulturo 12. 2. 2014 Kozma Ahačič Inštitut za slovenski jezik Frana Ramovša ZRC SAZU Zgodovinski podatki v slovarju sodobne slovenščine Prispevek kritično opisuje možne vire za zgodovinske podatke v spletni različici slovarja sodobne slovenščine. To so baza Jezikovni viri starejše slovenščine, Korpus knjižnih del 16. stoletja, digitalizirani slovar Maksa Pleteršnika iz let 1894–1895, Besedje slovenskega knjižnega jezika 16. stoletja in Slovar slovenskega knjižnega jezika 16. stoletja. Summary The paper has sought to critically describe the potential sources for historical data in the web- based dictionary of contemporary Slovene language, i.e. Jezikovni viri starejše slovenščine, Korpus knjižnih del 16. stoletja, the digitalised Slovene-German dictionary of Maks Pleteršnik (1894–1895), Besedje slovenskega knjižnega jezika 16. stoletja and Slovar slovenskega knjižnega jezika 16. stoletja. Ključne besede: zgodovinski slovar, 16. stoletje, Maks Pleteršnik Keywords: historical dictionary, 16th century, Maks Pleteršnik Slovenščina še nima zgodovinskega slovarja, kakor ga lahko najdemo pri večini drugih evropskih narodov (prim. npr. Grimmov slovar za nemščino [http://dwb.uni-trier.de/], ki je nastajal celo stoletje). Izdelava takšnega slovarja je namreč glede na izdelavo slovarjev sodobnega jezika specifična zaradi neenotnosti in s tem težje obvladljivosti korpusa (Bennett et al. 2013). To prinaša pred sestavljavca koncepta slovarja v digitalnem okolju, ki omogoča večjo povezljivost različnih virov, precejšen izziv, saj se težko ravna po rešitvah v spletnih slovarjih nekaterih drugih jezikov. V prispevku bomo zato opozorili na nekaj virov, iz katerih bi v spletni različici slovarja vendarle lahko črpali nekatere podatke. Ob tem si bomo ogledali tudi njihove prednosti in slabosti. Posvet o novem slovarju slovenskega jezika, Ministrstvo za kulturo 12. 2. 2014 1 Jezikovni viri starejše slovenščine Korpus, ki je nastal v okviru projekta Jezikovni viri starejše slovenščine (http://nl.ijs.si/imp/, Erjavec 2012, Erjavec in Jelovšek 2013), prinaša tudi podatke s približki pomenov nekaterih besed in njihovimi pojavitvami. Vendar ta korpus za rabo v slovarju še ni primeren, saj za obdobje do 19. stoletja ni relevanten, z njim pridobljeni podatki pa bi uporabnika bolj zavajali kot informirali tako glede pomena kakor tudi glede pojavitev in pisnih različic posameznih besed. Temeljni problem korpusa je zaenkrat v njegovi neuravnoteženosti glede števila besedil iz 16., 17. in 18. stoletja v primerjavi s številom besedil iz 19. stoletja. Za 16. stoletje vsebuje namreč le vzorčno število strani iz Biblije Jurija Dalmatina (1584), za 17. stoletje vzorčno število strani iz dela Sacrum promptuarium Janeza Svetokriškega (1695), iz 2. polovice 18. stoletja pa vsebuje le 14 del (od skupaj 658 del). Del iz 1. polovice 18. stoletja ne vsebuje. V prihodnje bi bilo tako treba ta korpus dopolniti z gradivom iz 16., 17. in 18. stoletja ter ga za 19. stoletje še nekoliko zvrstno uravnotežiti. Treba bo premisliti tudi, kaj storiti s homonimi, ki izkazujejo različne slovnične značilnosti (npr. glagolski vid). Če omenimo le značilno dilemo: glagol pasti je obdelan v treh razdelkih kot dvovidski, nedovršni in dovršni, čeprav ob ločevanju dovršnih in nedovršnih glagolov kategorija dvovidskosti ni potrebna; poleg tega so pod razdelek dovršni napačno uvrščeni tudi nedovršni primeri. Drugi izziv za prihodnje delo je Besedišče, ki je nastalo v okviru tega projekta. Za bodočo slovarsko (oziroma slovaropisno) rabo ga bo treba konceptualno še precej dopolniti. Osnovni princip izdelave Besedišča je bil namreč naslednji: na podlagi ročno označenega korpusa so bile določene besede, ki imajo različen zapis kot današnje in/ali ki so danes »zastarele«: tem je pripisana tudi »sodobna ustreznica ali razlaga«. Tak koncept nam žal ne omogoča sledenja pomenskim premikom pri besedah, ki jih rabimo še danes, pri »zastarelih« besedah pa nam ne daje informacije, ki bi bila primerna za vdelavo v slovar. Pomenski približki so namreč napaberkovani iz najrazličnejših virov (SSKJ, Pleteršnik, Latinsko-slovenski slovar itd.) in sežejo različno globoko v pomen. Za slovaropisca bi bila nasprotno uporabna baza, ki bi opremila pojavitve posameznih besed po natančno določenih pomenskih kriterijih. Sinonimni približki bi morali imeti vsaj oznako številke pomena v priročniku, s pomočjo katerega so bili narejeni. Zaenkrat bi se bilo najbolje omejiti samo na SSKJ, Pleteršnika ter na lastno analizo preostalih besed. Označiti bi bilo treba vse besede, ne samo tistih, ki jih je izdelovalec Besedišča ocenil za zastarele. Posvet o novem slovarju slovenskega jezika, Ministrstvo za kulturo 12. 2. 2014 Tudi kvaliteta opisov je zaenkrat še nezadostna in najverjetneje izhaja iz pomanjkljivega koncepta ali iz tega, da so besedje označevali manj izkušeni, neizkušeni ali podizobraženi izvajalci. Tako naletimo na vrsto nedoslednosti. Naj navedem le nekaj tipičnih primerov iz paberkovalnega pregleda prvih gesel črke B: bagor ima sinonimno ustreznico 'škrlat', bagur pa 'purpur', čeprav imata besedi isti pomen; balena ima po latinsko-slovenskem slovarju sinonimno ustreznico 'kit', čeprav je iz primerjave z Luthrovo predlogo in z drugimi pojavitvami razvidno, da je bil pomen še nedoločen, torej 'velika morska riba'; barantišče je bilo na podlagi konteksta označeno kot 'borza', čeprav je iz konteksta razvidno, da se pomen 'borza' lahko nanaša zgolj na besedno zvezo dnarno barantišče: »Za nas sicer, ki ne hodimo v dunajsko dnarno barantišče, kjer se vsaki dan cena obligacij in druzega papirnatega dnarja /.../«; pri samostalniku bart ni jasen kriterij za razmejitev med moškim in ženskim spolom; pri pridevniku bel stoji razlaga pojavitve ('najbolj bel'), namesto da bi bila razložena iztočnica ('bel'); pri glagolu beliti ne stoji sinonimna ustreznica, ampak razlaga iz SSKJ: 'dodajati jedem maščobo'; istovrstni iztočnici belja in beloba sta razloženi različno: 'belilo' in '(svinčena) bel', čeprav gre za povsem vzporedne primere, npr.: »drobno semletega mešajo s svinčeno beljo« – »iz Celovca je v razstavo djal raznih sort svinčene belobe in jekla«; pri obeh primerih gre seveda za terminološko besedno zvezo, ki označuje 'iz svinca pridobljen prah za oljnato umazano belo barvo'; poleg tega beseda bel v razlagi '(svinčena) bel' ni sodobna ustreznica; iztočnici besedovati je dodan sinonimni približek 'govoriti', čeprav sta jasno izkazana tudi pomena 'zagovarjati, zastopati (koga)' [»Veliko beſedi s' dvojnim s. Addosser, sadeti na ram, avocasser, beſédvati, bois seau, mérnik, to je, franzoski mernik /.../« ter 'besedičiti' [»Naše čutila in občutki sploh so vsi drugačni, kakor pri sužnjih; nikakor se me z sužnjimi primerjati ne moremo“, beseduje lahkomišljena gospa«]; pod iztočnico blagodaren sta uvrščeni dve različni besedi blagodarjen (s pomenom 'blagoslovljen') in blagodaren (s pomenoma 'radodaren' in 'blagodejen'); za vse naštete pomene so izpričani primeri, kljub temu pa so vsi primeri uvrščeni pod pomen 'blagoslovljen'. Omenjeni korpus ima tako velik potencial, ki pa je zaenkrat še neizkoriščen. 2 Korpus knjižnih del 16. stoletja Na dolgi rok bo predstavljal dobro dopolnitev temu korpusu korpus vseh slovenskih knjižnih besedil 16. stoletja, ki ga pripravljamo na Inštitutu za slovenski jezik in ki bo, ko bo končan, takoj in v polni meri odprto dostopen. Posvet o novem slovarju slovenskega jezika, Ministrstvo za kulturo 12. 2. 2014 V korpusu bodo na voljo v obliki xml prepisana naslednja besedila (po kronološkem vrstnem redu): Trubar, Primož, 1550: Catechiſmus. Schwäbisch Hall. Trubar, Primož, 1550: Abecedarium vnd der klein Catechiſmus. Schwäbisch Hall. Trubar, Primož, 1555: ABECEDARIVM. Tübingen. Trubar, Primož, 1555: CATECHISMVS. Tübingen. Trubar, Primož, 1555: TA EVANGELI SVETIGA MATEVSHA. Tübingen. Trubar, Primož, 1555: ENA MOLITOV TIH KERSzhenikou. Tübingen. Trubar, Primož, 1557: TA PERVI DEIL TIGA NOVIGA TESTAMENTA. Tübingen. Trubar, Primož, 1557: TA SLOVENSKI KOLENDAR. Tübingen. Trubar, Primož, 1558: EN REGISHTER. Tübingen. Trubar, Primož, 1560: TA DRVGI DEIL TIGA NOVIGA TESTAMENTA. Tübingen. Trubar, Primož, 1561: SVETIGA PAVLA TA DVA LISTY. Tübingen. Trubar, Primož, 1562: ARTICVLI OLI DEILI, TE PRAVE STARE VERE KERSZHANSKE. Tübingen. ENE DVHOVNE PEISNI, Tübingen, 1563. Trubar, Primož, 1564: CERKOVNA ORDNINGA. Tübingen. Trubar, Primož, 1566: Ta Celi Pſalter Dauidou. Tübingen. Trubar, Primož, 1566: ABECEDARIVM, OLI TABLIZA. Tübingen. Krelj, Sebastijan, 1566: OTROZHIA BIBLIA. Regensburg. Trubar, Primož, 1567: TA CELI CATEHISMVS. Tübingen. Trubar, Primož, 1567: SVETIGA PAVLA LYSTVVI. Tübingen. Trubar, Primož, 1567: ENA DVHOVSKA PEISSEN SVBPER TVRKE. Tübingen. Trubar, Primož, 1567: ENI PSALMI, TA CELI CATEhiſmus. Tübingen. Krelj, Sebastijan, 1567: POSTILLA SLOVENSKA. Regensburg. Trubar, Primož, 1574: TA CELI CATEHISMVS. Tübingen. Trubar, Primož, 1575: Try Duhouske peiſsni. Tübingen. Trubar, Primož, 1575: CATEHISMVS SDVEIMA ISLAGAMA. Tübingen. Dalmatin, Jurij, 1575: JESVS SIRAH. Ljubljana. Dalmatin, Jurij, 1576: PASSION. Ljubljana. Trubar, Primož, 1577: NOVIGA TESTAMENTA PVSLEDNI DEIL. Tübingen. Juričič, Jurij, 1578: POSTILLA. Ljubljana. Dalmatin, Jurij, 1578: BIBLIE, TV IE, VSIGA SVETIGA PISMA PERVI DEIL. Ljubljana. Tulščak, Janž, 1579: Kerſzhanske LEIPE MOLITVE. Ljubljana. Trubar, Primož, 1579: TA PERVI PSALM SHNEGA TRIIEMI ISLAGAMI. Tübingen. Dalmatin, Jurij, 1579: TA CELI CATEHISMVS. Ljubljana. Dalmatin, Jurij, 1580: PERVE BVQVE MOSESSOVE. Ljubljana. Dalmatin, Jurij, 1580: SALOMONOVE PRIPVVISTI. Ljubljana. Dalmatin, Jurij, 1580: CATEHISMVS. Ljubljana. Trubar, Primož, 1581–82: TA CELI NOVI TESTAMENT. Tübingen. Posvet o novem slovarju slovenskega jezika, Ministrstvo za kulturo 12. 2. 2014 Dalmatin, Jurij, 1584: BIBLIA. Wittenberg. Dalmatin, Jurij, 1584: TA CELI CATEHISMVS, ENI PSALMI. Wittenberg. Dalmatin, Jurij, 1584: KARSZANSKE LEPE MOLITVE. Wittenberg. Dalmatin, Jurij, 1585: AGENDA. Wittenberg. Dalmatin, Jurij, 1585: TA KRATKI WIRTEMBERSKI CATECHISMVS. Wittenberg. Trost, Matija, 1588: ENA LEPA INV PRIDNA PREDIGA. Tübingen. Trubar, Primož, 1595: HISHNA POSTILLA. Tübingen. Trubar, Felicijan, 1595: LEPE KARSZHANSKE MOLITVE. Tübingen. Trubar, Felicijan, 1595: TA CELI CATEHISMVS, ENI PSALMI. Tübingen. Znojilšek, Janž, 1595: KATECHISMVS DOCTORIA MARtina Luthra. Tübingen. Kdaj bo korpus dokončan, je predvsem finančno vprašanje, saj delo poteka glede na to, koliko ga uspe financirati inštitut iz lastnih prihrankov ali (zadnji dve leti) s pomočjo Službe za slovenski jezik. Prepisi so izdelani na podlagi skenov, ki jih pošljemo v podjetje CyberData India, tam jih prepišejo po metodi t. i. double keying (dvojnega prepisa): dva prepisovalca prepišeta enako besedilo, tretji pa uskladi mesta, kjer je prepis različen. Nato morajo ta prepis pregledati še slovenski pregledovalci, težja mesta pa rešujemo sproti v sodelovanji s strokovnjaki za slovenski jezik 16. stoletja. Gre za metodo, ki pri digitalizaciji starejših besedil daje trenutno najboljše rezultate (prim. Bartz et al. 2004: 8–15). Primer navodil: Posvet o novem slovarju slovenskega jezika, Ministrstvo za kulturo 12. 2. 2014 Primer prepisa:
SVETIGA PAVLA LYST, PISSAN HTIM GALAtariem, skratkimi ſaſtopnimi Islagami. TA I. CAP.A. Praui de ie on en Ioger, nekar Iogrou Shular oli Mlaishi. Inu de ie od ſamiga Boga Ieſuſa, zhudnu htimu Iogerſtuu Poklyzan, Act. 9. Inu de on ſam letiga lyſtu ne pishe, temuzh tudi drugi Pridigary shnim. Steim on hozhe per tih Galataryh ſebi inu ſuimu Vuku Vero ſturiti, de nega Vuku taku dobru, koker tih Iogrou imaio Verouati. Natu nim proßi Gnado inu Myr, tu ie, odpuſzhane uſeh Grehou inu eno pokoino ueſſelo ueiſt pruti Bogu. Per tim praui ſakai ie Bug puſtil ſuiga Synu Martrati, kai ie nom ſteim Criſtus dobil inu oprauil. B. Sazhne periatliuu ſuariti te Galatarie, kir ſo ſe puſtili od prauiga Euangeliskiga Nauuka na en drugi ſepelati. Natu oſtru ſubper te falsh Vuzhenike gouori, nih Vuk panuie inu Sludiu isdaie. Potle praui, de en Pridigar shnega Pridigo, Bogu nekar uſem ludem ima dopaſti, shno Boshyo zhaſt, nekar ſui nuz terditi. C. Praui, koku ie is fariſeiske Iudouske Vere na kerszhansko preobernen, Inu ſakai ſe ima nega Euangeliu Verouati, Satu kir ga ie od ſamiga Posvet o novem slovarju slovenskega jezika, Ministrstvo za kulturo 12. 2. 2014 Ieſuſa, nekar od ludi pryel, Obtu ta nega Euangeli ie ta praui, risnizhni inu Boshy Vuk.
PAulus en Apoſtol (nekar od ludi, ne