original scientific article DOI 10.19233/ASHS.2016.56 received: 2016-11-10 UPORABNOST KORPUSNE OBDELAVE PODATKOV PRI OBLIKOSLOVNI ANALIZI NAREČNEGA GOVORA: 1. SKLANJATEV SAMOSTALNIKOV MOŠKEGA SPOLA V KOPRIVSKEM GOVORU Klara ŠUMENJAK Univerza na Primorskem, Fakulteta za humanistične študije, Titov trg 5, 6000 Koper e-mail:klara.sumenjak@fhs.upr.si IZVLEČEK V prispevku so prikazane možnosti, omejitve in napake korpusnega pristopa pri oblikoslovni analizi narečnega gradiva. S pomočjo korpusne obdelave podatkov so bile iz zbranega gradiva izluščene oblike za samostalnike 1. moške sklanjatve, ki se pojavljajo v Govornem korpusu Koprive na Krasu (GOKO) in primerjane s slovenskim knjižnim jezikom. Korpusna obdelava podatkov se je kljub nekaterim napakam izkazala za uporabno, saj raziskovalcu znatno olajša analizo zbranega gradiva, vendar jo je treba nadgraditi s tradicionalno metodo raziskovanja in analize narečja. Ključne besede: narečni korpus, kraško narečje, govor Koprive na Krasu, oblikoslovje, 1. moška sklanjatev L'UTILITÄ DELL'ELABORAZIONE DEI DATI DAI CORPORA NELL'ANALISI MORFOLOGICA DELLA PARLATA DIALETTALE: PRIMA DECLINAZIONE DEI SOSTANTIVI MASCHILI NELLA PARLATA DI KOPRIVA SUL CARSO SINTESI Nell'articolo vengono presentate le possibilitä, i limiti e gli errori dell'approccio metodologico dei corpora nell'a-nalisi morfologica del materiale dialettale. Con l'aiuto dell'elaborazione dei dati nei corpora sono state estratte le forme per i sostantivi della prima declinazione maschile presenti nel corpus dialettale di Kopriva sul Carso (GOKO) e comparate con la lingua standard slovena. L'elaborazione dei dati dal corpus si e dimostrata utile nonostante alcuni errori, dato che permette al ricercatore una piu facile elaborazione del materiale raccolto, ma deve essere nel contempo integrata con il metodo tradizionale di ricerca e di analisi del dialetto. Parole chiave: corpus dialettale, dialetto carsico, parlata di Kopriva sul Carso, morfologia, prima declinazione maschile UVOD Korpus GOKO (Govorni korpus Koprive na Krasu), ki je dostopen na spletni strani http://j't.upr.si/GOKO/, je nastal kot eden od ciljev doktorske disertacije Opis govora Koprive na Krasu na osnovi dialektološkega korpusa.^ Gre za realizacijo prvega modela slovenskega dialektološkega korpusa, ki bi z ustrezno nadgraditvijo lahko služil kot izhodišče za gradnjo referenčnega dialektološkega korpusa.2 S pomočjo korpusnega pristopa je bil analiziran govor Koprive na Krasu na vseh jezikovnih ravninah. Tak način (Anderwald in Wagner, 2007; Bolasco, 2005; Kortmann, 2004) je v dialektologiji najprimernejši za oblikoslovno analizo, za ostale jezikovne ravnine pa je pomanjkljiv (Šumenjak, 2013a), vendar pa lahko služi za druge pristope k raziskovanju narečij (Marc Bratina, 2009; Rožac, 2015, 2016a ,2016b in 2017; Vičič in Marc Bratina, 2015). Korpusni pristop v nobenem primeru ne more biti uporabljen samostojno, saj gre dejansko za obdelavo podatkov, ki jo je treba nadgraditi s tradicionalno metodo raziskovanja in analize narečja (prim. Gostenčnik, 2014 in 2016; Horvat, 2016; Jakop, 2006, 2007, 2008, 2009, 2012, 2016a in 2016b; Smole, 2006; Šekli, 2007, 2010 in 2013; Škofic, 2003, 2008a, 2008b, 2011, 2012 in 2016; Zuljan Kumar, 2014 in 2016). V prispevku so na primeru samostalniške besede, natančneje 1. sklanjatve samostalnikov moškega spola, prikazane možnosti, omejitve in napake korpusnega pristopa. Obravnavana je samo 1. moška sklanjatev, ker v korpusu ni primerov ostalih moških sklanjatev. METODA Prednost korpusnega pristopa je predvsem v tem, da na določenih ravninah omogoča avtomatsko pripisovanje nekaterih oznak besedam. Za slovenski jezik so v okviru projekta JOS (Jezikoslovno označevanje slovenščine) razvili označevalni sistem, ki besedam v korpusu avtomatično pripisuje oblikoskladenjske oznake. S projektom so slovenski raziskovalni javnosti želeli zagotoviti »prosto dostopen večnivojsko (oblikoskladenjsko, skladenjsko, semantično) označen milijonski korpus besedil vsakdanje rabe - korpus JOS« (Arhar in Ledinek, 2008, 55). JOS je nastal ob upoštevanju vsaj treh že obstoječih sistemov obli-koskladenjskih oznak za slovenščino, med katerimi so: 1) jezikovnospecifičen nabor oznak Inštituta za slovenski jezik Frana Ramovša ZRC SAZU, ki je nastal za potrebe označevanja korpusa Beseda, 2) za slovenski jezik prilagojeni nabor oznak LC-STAR, ki se rabi za simultano prevajanje govora, 3) nabor Multext-East, ki je izhodiščen za nadgradnjo JOS in v največji meri sledi priporočilom iniciative EAGLES/ISLE, v skladu s katerimi sta označena tudi korpusa FIDA in FidaPLUS. JOS so nadgradili še z nekaterimi tujejezičnimi sistemi, kot so označevalni sistemi Češkega nacionalnega korpusa3 ter sistema Claws4 in Ajka5 (Arhar in Ledinek, 2008, 55-56; Gorjanc in Fišer, 2010). Tudi korpus GOKO je označen v skladu s smernicami JOS (Erjavec et al., 2010), torej je tudi iskanje po njem podobno iskanju po korpusu JOS in iz njega izpeljanih korpusih, kot je korpus GOS. To pomeni, da v poknji-ženi različici »na osnovnem nivoju sistem predvideva klasično besednovrstno uvrstitev obravnavane besede, na drugem nivoju pa se označuje njene nadaljnje lastnosti glede na slovarske ter slovnične kategorije, ki jih posamezni besedni vrsti lahko pripišemo« (Arhar in Ledinek, 2008, 55). Po samostalniški besedni vrsti omogoča korpus GOKO naslednja iskanja: Samostalnik: • vrsta - občno ime - lastno ime • spol - moški - ženski - srednji • število - ednina - dvojina - množina • sklon - imenovalnik - rodilnik - dajalnik - tožilnik - mestnik - orodnik • živost - ne - da Iskanje po korpusu V korpusu GOKO izberemo oznako Iskanje po korpusu GOKO z uporabo jezika CQP, ki omogoča napredno iskanje po besednih vrstah in nadaljnjih podkategorijah. Tam izberemo besedno vrsto (npr. samostalnik), nato izberemo spol (npr. moški) in nato lahko izberemo še sklon, število, vrsto (lastno ali občno) ter živost (da ali ne). Naše iskanje je poljubno: lahko izberemo samo en O korpusu GOKO gl. tudi Šumenjak (2012, 2013a, 2013b) in Šumenjak in Vičič (2012). Za realizacijo modela korpusa je poskrbel strokovnjak za informacijske tehnologije dr. Jernej Vičič. Več na http://www.korpus.cz/kontext_transition.php. Več na http://ucrel.lancs.ac.uk/claws/. Več na http://nlp.fi.muni.cz/projekty/ajka/. niz iskanja (npr. spol), dva (npr. spol in število), tri (npr. spol, število, sklon), več ali kar vse nize iskanja. Na ta način lahko iz korpusa izluščimo npr. vse samostalnike moškega spola v imenovalniku ednine in ugotavljamo, katere končnice so značilne za to slovnično kategorijo v obravnavanem krajevnem govoru. Na podlagi te analize je nato mogoče samostalnike razvrstiti v sklanjatvene vzorce. Ker gre za manjši korpus, vanj niso bile zajete vse oblike leksemov; te so bile pridobljene s pomočjo usmerjene vprašalnice GOKO, vprašalnice NASIK ali vprašalnice za vrt in sadovnjak.7 Za lažji pregled zbranega gradiva so vsi podatki, ki niso bili pridobljeni s pomočjo korpusnega pristopa, označeni s piko (•) nad besedo/besedno zvezo, kot primeri pa so izpisani vsi rezultati, pridobljeni iz korpusa. KORPUSNA ANALIZA 1. SKLANJATVE SAMOSTALNIKOV MOŠKEGA SPOLA KOPRIVSKEGA GOVORA Samostalnik Spol V koprivskem govoru so ohranjeni vsi trije spoli: moški (b'rst 'brat', 'čievsi 'čevelj', 'kamsn 'kamen'), ženski (do'lina 'dolina', drM'žina 'družina', dy'sica 'dušica', 'rieč 'stvar', 'vas 'vas', 'mati 'mati', x'či 'hči', 'cirku 'cerkev') in srednji (tsrp'lenje 'trpljenje', ziu'lenje 'življenje', sou'ra-štvo 'sovraštvo'). Izposojenke navadno ohranjajo enak spol, kot so ga imele v izvirnih besedah (npr. ba'ul m ^ it. baule m 'zaboj', ca'vata ž ^ it. ciabatta ž 'copata', 'cyksr m ^ nem. Zucker m 'sladkor' in it. zucchero m 'sladkor',fa'milje ž ^ nem. Familie 'družina' in it. famiglia ž 'družina', ks'nusn m ^ it. cannone m 'top', 'uaxcet ž 'svatba' ^ Hochzeit ž itd.), obstajajo pa tudi izjeme, kot so st'raca ž 'cunja' ^ straccio m, sts'jusn m 'letni čas' ^ it. staggione ž itd. Število Koprivski govor pozna ednino in množino, medtem ko je dvojina zelo redka. Tjaša Jakop (2010, 77) za dvojino v slovenskih narečjih ugotavlja, da je »v slovenskih narečjih /.../ dvojina najbolj trdna v imeno-valniku/tožilniku samostalnikov moškega spola; izjema so skrajne jugozahodne točke kraškega in istrskega narečja ter skrajni jugovzhod dolenjske narečne skupine.« V korpusu je dvojina samostalnikov uporabljena le trikrat, vsakič ob števniku dva v imenovalniku/tožilniku: dvakrat pri samostalnikih ženskega spola in enkrat pri samostalniku moškega spola: ja blo zap'lačet d'vei 'liri • in sta bla d'va 'varta • 'potlei smo i'mieli d'vei 'uauci. Pogosto je ob števniku dva/dve rabljena množina samostalniškega jedra besedne zveze (so 'paršle 'tat d'vei sest'rične • d'vei s'katle ceya'retou • k'rave smo rau'nali, 'ne, d'vei k'rave). Iz sicer redkih primerov v korpusu je mogoče ugotoviti, da so dvojinske oblike ohranjene pri samostalniku (in glagolu) moškega spola (sta bla d'va 'varta), medtem ko je za ženski spol značilna pluralizacija (so paršle 'tat d'vei sest'rične). Sklon Koprivski govor pozna vseh šest sklonov, samostal-niške izposojenke se sklanjajo enako kot neprevzete besede. PRVA MOŠKA SKLANJATEV V prvo moško sklanjatev so uvrščeni samostalniki moškega spola, ki imajo v imenovalniku ednine najpogosteje končnico -0, v rodilniku pa -a (npr. k'rux k'ruxa 'kruh'), izjemoma -'u (npr. 'miet me'du 'med'). Slovnična kategorija živosti je v tožilniku ednine izražena s končnico -a, ki je enaka končnici rodilnika ednine, medtem ko je kategorija neživosti v tožilniku ednine izražena z ničto končnico -0, ki je enaka končnici imenovalnika ednine.8 Ednina Imenovalnik Imenovalnik ednine koprivskega govora je izražen z ničto končnico. V korpusu so naslednji primeri: 'bot 'krat', b'rat 'brat', čar'vičak 'črviček', 'čieval 'čevelj', d'rek 'drek', iz'let 'izlet', iz'loček 'izloček', kam'jon 'tovornjak', 'kaman 'kamen', kamno'lomčak 'kamnolomček', 'kanc 'kanec', 'konc 'konec', k'rux 'kruh', 'lyx 'lug' , 'malan 'mlin', 'maister 'mojster', 'miet 'med', 'miežnar 'oskrbnik cerkve', m'liečak 'mleček', m'rak 'mrak', 'mulc 'mulec', 'muaš 'mož', oc'totak 'odstotek', od'lomak 'odlomek', 'pain 'panj',pe'pieu 'pepel', 'piesak 'pesek',p'lies 'ples', pok'lic 'poklic', 'poplet 'podplat', pos'tayk 'postanek', p'rax 'prah', p'raznik 'praznik', pra'diel 'predel', raz'voi 'razvoj', s'latkor 'sladkor', 'soset 'sosed', spome'nik 'spomenik', st'rax 'strah', st'ric 'stric', 'suat 'sod', šta'juon 'letni čas', 'tir 'tir', t'rot 'trot', 'vajanc 'vajenec', ve'čir 'večer', 'venc 'venec', 'vart 'vrt', z'bor 'zbor', 'zit 'zid', 'uasu 'osel', 'zieyan 'pokopališče'; 'Edvart 'Edvard', Ro'-dik 'Rodik', 'Rudeš 'Rudež', Vim 'Vim'. Rodilnik Rodilnik ednine koprivskega govora ima za trdimi soglasniki končnico -a, za mehkimi (palatalnimi) pa -e. V korpusu so naslednje rodilniške oblike s končnico -a: ap'rila 'aprila', aš'valta 'asfalta', 'autobusa 'avtobusa', čabaun'jaka 'čebelnjaka', d'nara 'denarja', 'kila 'kilograma', 'junja 'junija', 'kamna 'kamna', k'ruxa 'kruha', 'kuasa 'kvasa', no'vembra 'novembra', po'uka 'pouka', p'raška 6 Preglednice praslovanskih vzorcev so povzete po Babič, 2008. 7 O vprašalnicah glej Šumenjak, 2013a. 8 Primeri so zapisani po abecednem redu, na koncu pa so zapisana lastna imena. Tabela 1: 1. moška sklanjatev - ednina Praslovanska debla6 Koprivske sklanjatve *-o- *-i- *-u- *-n- (brat, sin, gost) (zob) (Jurij) (riž) (zob) (mož) (gost) (sin) (kamen) ž+ ž- ž+ ž- trda trda mehka mehka I *-my -0 -0 -0 -0 R *-a *-a *-i *-u *-men-e -a -a -e -e D *-u *-u *-i *-ou-i *-men-i -i -i -i -i T *-men-t -a -0 -a -0 M *-e2 *-i *-i *-u *-men-e -i -i -i -i O *-o-mb *-e-mb *-t-mb *-t-mb *-men-t- mt -sm -sm -sm -sm 'praška', pres'tuara 'prostora', 'reyrata 'regrata', se'tembra 'septembra', 'šartalna 'šarteljna', 'tateta 'očeta', tu'nela 'tunela', 'varta 'vrta', 'voska 'voska', x'rasta 'hrasta'; 'cykra 'sladkorja'; Ause'nika 'Avsenika', 'Luizata 'Lojzeta' in 'Riepen'tabra 'Repentabra'. Mehka končnica -e je rabljena manj dosledno in se pogosto izmenjuje s trdo - primeri iz GOKO: 'marca in 'marče 'marca', 'miesca 'meseca', 'raiže 'riža', raz'voja 'razvoja', Ba'rojaviča 'Borojeviča', 'Jurje 'Jurija', Kob'dilje 'Kobdilja' in Lau'renca 'Lavrenca'. Pri sklanjanju samostalnikov moškega spola je v koprivskem govoru prevladala psl. o-sklanjatev, ohranjeni so redki ostanki praslovanske M-sklanjatve (v govoru morda tudi zaradi novejšega vpliva knjižnega jezika): 'mieda in me'du 'meda in medu'. Dajalnik Koprivski govor ima v dajalniku ednine končnico -i, ki je najverjetneje nastala po analogiji z mestnikom mehke psl. o-sklanjatve, ki se je posplošila tudi v dajalnik trde sklanjatve. V korpusu koprivskega govora je dajalnik moškega spola ednine uporabljen zgolj dvakrat, in sicer v primerih: 'zieyni 'pokopališču' in 'Milkoti 'Milku'. Tožilnik V tožilniku ednine imajo v koprivskem govoru samostalniki, ki pomenijo živo, končnico -a, tisti, ki pomenijo neživo, pa -0. V korpusu sta le dva primera samostalnikov v tožilniku ednine, ki pomenita živo: b'rata 'brata' in uat'roka 'otroka'. Samostalniki, ki pomenijo neživo, so v korpusu naslednji: 'buykar 'bunker', c'vek 'žebelj', 'čas 'čas', 'dan 'dan', 'dom 'dom', iz'let 'izlet', kamno'lomčak 'kamnolomček', kilo'metar 'kilometer', kle'byk 'klobuk', k'rei 'kraj', k'rux 'kruh', ka'nuan 'top', 'kuas 'kos', 'lux 'lug', 'malen 'mlin', 'most 'most', 'mlet 'med', 'miesc in 'miesac 'mesec', na'čin 'način', nek'tar 'nektar', o'bisk 'obisk', 'pain 'panj',pe'pieu 'pepel',par'šut 'pršut',ple'nir 'plenir, jerbas',pra'diel 'predel', sa'lon 'salon', spome'nik 'spomenik', š'čepac 'ščepec', te'ran 'teran', 'tir 'tir', ve'čir 'večer', 'vart 'vrt', 'varx 'vrh', var'xunc 'vrhunec', z'yun 'zvon', 'yuast 'gost', ua'yon 'vagon', 'zieyan 'pokopališče'; 'Auber 'Avber', 'Tarst 'Trst', 'Tomei 'Tomaj' in S'kuapo 'Skopo' s končnico -o. Mestnik Tako kot dajalniška ima tudi mestniška oblika samostalnikov moškega spola v ednini v koprivskem govoru končnico -i, ki izhaja iz psl. o-debla mehke sklanjatve, ki se je posplošila še v trdo.9 V korpusu so naslednji primeri samostalnikov moškega spola s končnico -i v mestniku ednine: 'caiti 'času', 'kamni 'kamenju', k'raji 'kraju', matar'jali 'materialu', 'riedi 'redu', 'sati 'satu', spo'mini 'spominu', s'vieti 'svetu', u'radi 'uradu', 'varxi 'vrhu', x'ribi 'hribu', xu'diči 'hudiču', z'raki 'zraku'; 'Auberi 'Avberju', Fe'rariti 'Ferarju, 'Kuamni 'Komnu', 'Pepiti 'Pepetu', Sebe'niki in Sibe'niki 'Šibeniku', 'Tarsti 'Trstu', Tar'žiči 'Tržiču'. Orodnik V koprivskem govoru je končnica orodnika ednine samostalnikov moškega spola -am (< psl. *-o-mb). V korpusu koprivskega govora so naslednji samostalniki moškega spola v orodniku ednine: 'cykram 'sladkorjem', kam'jonam 'tovornjakom', ka'nuanam 'topom', m'liečkam 'mlečkom' in ual'tarjam 'oltarjem'. 9 V dveh primerih je isti govorec izgovoril končnico -m (k'raju, 'panju), vendar gre verjetno za prevzemanje iz knjižnega jezika in ne za narečno značilnost. Tabela 2: 1. moška sklanjatev - množina Praslovanska debla Koprivske sklanjatve (prt) (fant) (nož) *-o-(zob) *-o-(mož) *-i-(gost) *-u- (sin) *-n-(kamen) ž+ ž+ ž- trda trda mehka I *-i2 *-i *-ti-e *-ou-e *-men-e -i -je -i R *- t *-ti-t *-ou-t *men-t - ou -ou -su D *-o-mt *-e-mt *-t-mt *-t-mt *men-t-mt -sm -sm -s m T *-y *-i *-y *-men-i -e/-3 -e/-3 -e/-s/-i M *-e2-xt *-i-xt *t-xt *t-xt *-men-t-xt -ix/-3x -ix/-sx -ix/-sx O *-y *-i *-t-mi *-t-mi *-men-t-mi mi/smi/ emi mi/smi/ emi mi/smi/ emi Množina Imenovalnik V koprivskem govoru imajo samostalniki moškega spola v imenovalniku množine končnico -i (iz psl. o-sklanjatve ali -je < psl. i-sklanjatve). V im. mn. so v korpusu naslednji samostalniki s končnico i: c'vekarji 'cvekarji', dsujaki 'divjaki', partizani 'patizani', štrukli 'štruklji', t'roti 'troti', z3'čietki 'začetki', iz'zivi 'izzivi', kdrdbi'nerji 'policaji', 'šuštarji 'čevljarji', uaxce'tarji 'svati', 'Aubarci 'Avberci', Kop'riuci 'Koprivci', 'Niemci 'Nemci' in S'kuapalci 'Skopeljci'. Končnico -je imata v korpusu naslednja koprivska samostalnika moškega spola: fantje 'fantje' in lad'je 'ljudje'. Rodilnik Rodilniška končnica samostalnikov moškega spola v množini je v koprivskem govoru -ou za trdimi oz. -au za mehkimi soglasniki (s podaljšavo osnove iz psl. u-sklanjatve). V korpusu so naslednji samostalniki moškega spola v rodilniku množine s končnico -ou: ce'kinou 'cekinov', ceya'retou 'cigaret',10 d'ni^^/d'nevou*^^ 'dni', 'eurou 'evrov', kamno'sekou, kilo'metrou 'kilometrov', 'kilou 'kil',13 ko'rakou 'korakov', 'metrou 'metrov', 'soudou 'soldov', t'rotou 'trotov', vo'jakou 'vojakov', 'zatkou 'zadkov', zdrau'nikou 'zdravnikov' in ua'rexou 'orehov'. Končnico -au imajo v korpusu naslednji samostalniki: bo'roucau 'borovcev', 'čieulau 'čevljev', 'dielaucau 'delavcev', in 'panjau 'panjev'. Druge oblike so redke, npr. la'di 'ljudi' (iz psl. i-sklanjatve) ali uat'ruk 'otrok' (iz psl. o-sklanjatve). Dajalnik Dajalniška končnica samostalnikov moškega spola množine koprivskega govora je -am. V korpusu je zgolj en tak primer, in sicer uo'jakam 'vojakom'. Tožilnik Tožilniška končnica samostalnikov moškega spola v množini je v koprivskem govoru večinoma -e (< psl. *-§), redko -i ali njuna reducirana različica -a (gre za nedosledno različico izgovora, saj je končnica istega samostalnika lahko taka ali drugačna, npr. v GOKO ua'riexe in ua'riexa 'orehe'). Ostali primeri iz korpusa so še: 'xece 'hece', jančke 'jančke', 'miesce 'mesece', p'liesa 'plese', po'datke 'podatke', par'jatla 'prijatelje', 'sata 'sate', 'satnika 'satnike', št'rukle 'štruklje', va'yuane 'vagone' in 'talca 'talce'. Končnica -i je redka, npr. 'čieuli 'čevlje', 'roji 'roje' -najverjetneje gre za ostanek praslovanske trde o-jevske sklanjatve (< psl. *-y). V korpusu sta tudi dva primera, ko dva različna informanta namesto tožilnika množine rabita v enem primeru im., v drugem pa tož. ednine14 (ana t'ri 'dan so p'rauli p'rauce in u'se 'tisto; y'liedi ka'piela, 'ku 'tisti 'dan, in 'tam za 'padla 'borca so bli 'neki, ka smo jax pa t'le 'd-elli, 'jas kot 'vajanc sam še 'dielau). Mestnik Mestniška končnica samostalnikov moškega spola v množini je -ix oz. oslabljena -3x. V korpusu GOKO so 10 Knj. cigareta ž > kopr. cigaret im. ed. m. 11 d'ni < psl. db-n-b (n-sklanjatev). 12 Podaljšava osnove po analogiji iz u-sklanjatve. 13 Knj. kila ž > kopr. kil im. ed. m. 14 Glede na to, da gre za samostalnik, ki izraža neživost, ne moremo natančno določiti, za kateri sklon gre, vendar, sklepajoč iz naslednjega primera, gre verjetno za tožilnik množine. naslednji primeri: bo'roucax 'borovcih', 'caitax 'časih', d'nev3x in d'nevix 'dnevih', iZdelkax 'izdelkih', krajix 'krajih', 'satnikax 'satnikih' in u'metnikax 'umetnikih'. Orodnik V koprivskem govoru imajo samostalniki moškega spola v orodniku množine končnice -emi, -ami, -mi (iz psl. i- oz. u-sklanjatve). Primeri iz korpusa: karabinjermi 'policaji', konjemi 'konji', fantami 'fanti', ua'riexami 'orehi' in uat rucmi 'otroci'. Dvojina Dvojina se v koprivskem govoru rabi zelo redko, navadno ob števniku števnikom dva v imenovalniku/ tožilniku (prim. Jakop 2006, 2007, 2008, 2009, 2012); v ostalih sklonih je dvojinska oblika enaka množinski obliki. V korpusu je za moški spol v imenovalniku dvojine zgolj en primer, in sicer s končnico -a (iz psl. o-skla-njatve): sta bla dVa Varta 'sta bila dva vrta'. Z usmerjeno vprašalnico je bil pridobljen naslednji sklanjatveni vzorec za samostalnike moškega spola v dvojini. Tabela 3: 1. moška sklanjatev - dvojina (brat) I b'rata* R b'ratou* D b'ratsm* T b'rata* M b'ratsx* O b'ratmi* Premene Premene v osnovi Nekaterim samostalnikom moškega spola se pri skla-njanju spremeni kvaliteta naglašenega samoglasnika, kar kaže, da je koprivski govor nekoč poznal kvantitetne opozicije, saj so se kratki (tudi naglašeni) samoglasniki reducirali, dolgi naglašeni pa ne. b'rat 'brat' 'fant" 'fant' b'rata 'brata' 'fantje 'fantje' Podaljševanje osnove s -t- Samostalniki, ki se končajo na -e, pri sklanjanju (tako kot v knjižnem jeziku) podaljšujejo osnovo s -t- (iz psl. t-sklanjatve): 'Luizata 'Lojzeta, im. ed. 'Luize\ 'tateta 'očeta, im. ed. 'tate\ V koprivskem govoru osnovo v odvisnih sklonih podaljšujejo s -t- tudi samostalniki s končnico -i in -o v imenovalniku: 'Milkoti 'Milku, im. ed. 'Milko',par'Pepiti 'pri Pepiju, im. ed. 'PepV. Podaljševanje osnove z -j- Samostalniki, ki se v im. ed. končajo na -r, pri pregibanju ponavadi podaljšujejo osnovo z -j-: c'vekarji 'cvekarji', uaxce'tarji 'svatje', karabi'nerji 'policaji'. Izjeme pri podaljševanju osnove z -j- Nekateri samostalniki, ki se v im. ed. končajo na -r, pri pregibanju (tako kot v knjižnem jeziku) ne podaljšujejo osnove z -j-: pre'stuara 'prostora', se'tembra 'septembra', 'Riepen'tabra 'Repentabra', tudi d'nara 'denarja' in 'Auberi^^ 'Avberju'. Premene končnic Premene končnic za mehkimi soglasniki v rodilniku ednine Samostalniki moškega spola, ki se jim osnova konča na mehki soglasnik, imajo v rodilniku ednine končnico -e, vendar je taka raba nedosledna: 'Juri *'Jurij' Kob'dif 'Kobdilj' 'marc' 'marec' 'raif 'riž' 'Jurje 'Jurija' Kob'dilje 'Kobdilja' 'marče 'marca' 'raiže 'riža' Izjeme v GOKO so: Ba'rojaviča 'Borojeviča', 'junja 'junija' in raz'voja 'razvoja, kjer gre verjetno za prevzemanje iz knjižnega jezika. Premene končnic za mehkimi soglasniki v tožilniku Nekateri samostalniki moškega spola, ki se jim osnova konča na mehki soglasnik, imajo v tožilniku množine končnico -i namesto knjižne -e, vendar je raba nedosledna: 'čieval 'čevelj' : 'čieuli 'čevlje' 'roi* 'roj' : 'roji 'roje' V drugačnih primerih iz GOKO (npr. par'jatla 'prijatelje' ali st'rukle 'štruklje') gre morda za prevzemanje iz knjižnega jezika ali prevlado drugačne psl. končnice. Primerjava s slovenskim knjižnim jezikom (SKJ) NAPAKE PRI KORPUSNI ANALIZI 1. SKLANJATVE SAMOSTALNIKOV MOŠKEGA SPOLA Korpus je narejen tako, da avtomatsko oblikoskla-denjsko označi besedila, kar pa lahko privede do številnih napak, ki jih je treba odpraviti ročno. Posebnost narečnega korpusa je (tudi) ta, da poleg knjižnih besed vsebuje tudi narečne. Te so v korpusu GOKO označene z oznako . Nanje moramo biti pozorni pri analizi, saj jih računalnik označi enako kot v knjižnem jeziku, kar pa ni vedno ustrezno: na primer 15 Tu je morda prišlo do asimilacije -ji > -i. računalnik besedo s'tierna, ki je v Koprivi samostalnik ženskega spola, zaradi knjižne ustreznice 'vodnjak', ki je samostalnik moškega spola, označi kot za moški spol, zato take spremembe sporočimo strokovnjaku za IT, ki jih ročno vnese v program. V nadaljevanju so izpostavljene nekatere računalniške napake, ki so nastale pri razvrščanju gradiva za 1. sklanjatev samostalnikov moškega spola. Zamenjava besedne vrste • Pri stavku pojdi si obrat hruške je korpus neustrezno označil obrat kot samostalnik moškega spola v imenovalniku ednine in ne kot glagol. • Pri zvezi stavkov so bili iz semiša, s peto in eden je bil grob je korpus neustrezno označil grob kot samostalnik moškega spola v imenovalniku ednine in ne kot pridevnik. Zamenjava sklona in/ali števila Z imenovalnikom ednine namesto s tožilnikom ednine je korpus označil samostalnike v naslednjih primerih: • Padlim je bilo to, tako da opaziš ta koprivski kamen v dosti krajih • Saj je bilo tudi tako, smo imeli tudi pevski zbor • ko smo prišli spet pod tukaj, pod domačo tisto občino, ne, je šlo pod Jadran Z imenovalnikom ednine namesto z rodilnikom množine je korpus označil samostalnike v naslednjem primeru: • ta oče Jurjev in žena nista imela otrok Z rodilnikom ednine namesto s tožilnikom ednine je korpus označil samostalnike v naslednjih primerih: • me je prišla klicat, da naj grem po enega čebelarja • so pripeljali osla in privezali za mali zvon Zamenjava spola Kot ženski spol v imenovalniku namesto moškega spola v tožilniku je korpus označil naslednji primer: • so izvedeli, kdo je osla pripeljal RAZPRAVA Iz gradiva je razvidno, da je bil večji del rezultatov pridobljen s pomočjo korpusa GOKO, kar raziskovalcu znatno olajša analizo zbranega gradiva. Za analizo 1. sklanjatve samostalnikov moškega spola so bili skoraj vsi rezultati pridobljeni s pomočjo korpusnega pristopa. Pričakovano (zaradi značilnosti koprivskega govora) so manjkali podatki za dvojino, manjkale pa so še nekatere druge oblike, in sicer ena oblika za rodilnik množine (d'nevou*) in šest oblik za osnovno obliko nekaterih samostalnikov Cfdnt' 'fant', 'Juri "Jurij', Kob'dif 'Kobdilj', 'marc* 'marec', 'raif 'riž', 'roi* 'roj'). V primerjavi s slovenskim knjižnim jezikom (Toporišič, 2000, 278-288) najdemo v koprivskem govoru naslednje posebnosti samostalnikov 1. sklanjatve moškega spola: Rodilnik ednine koprivskega govora ima poleg končnice -a za trdimi konzonanti tudi končnico -e za mehkimi (palatalnimi) konzonanti, ki pa ni rabljena dosledno ('marca in 'marče 'marca', 'miesca 'meseca', 'raiže 'riža', r3z'voja 'razvoja', Bs'rojsviča 'Borojeviča', 'Jurje 'Jurija', Kob'dilje 'Kobdilja', Lsu'renca 'Lavrenca'). Dajalnik ednine koprivskega govora ima končnico -i Cžiejni 'pokopališču' in 'Milkoti 'Milku'). Mestnik ednine koprivskega govora ima končnico -i ('caiti 'času', 'kamni 'kamenju', k'raji 'kraju', matsr'jali 'materialu'). Orodnik ednine koprivskega govora ima končnico -3m ('cykram 'sladkorjem', kam'jonam 'tovornjakom', ks'nusnsm 'topom'). Rodilnik množine koprivskega govora ima končnico -ou za trdimi oz. -3u za mehkimi samoglasniki ('dielaucau 'delavcev' ce'kinou 'cekinov'). Dajalnik množine koprivskega govora ima končnico -am (uo'jakam 'vojakom'). Tožilnik množine koprivskega govora ima končnici -e in -i (navadno za mehkimi soglasniki), ki se lahko reducirata v -a (ua'riexe in ua'riexa 'orehe', 'čieuli 'čevlje'). Mestnik množine koprivskega govora ima končnico -ix oz. oslabljeno -ax (bo'roucax 'borovcih', 'caitax 'časih', d'nevax in d'nevix 'dnevih'). Orodnik množine koprivskega govora ima končnice -emi, -ami, -mi ('konjemi 'konji', 'fantami 'fanti', uat'rucmi 'otroci'). Podaljševanje osnove s -t-: v koprivskem govoru osnovo v odvisnih sklonih podaljšujejo s -t- tudi samostalniki, ki imajo v imenovalniku končnico -i in -o ('Milkoti 'Milku, im. ed. 'Milko',par 'Pepiti 'pri Pepiju, im. ed. 'Pepi'). (Ne)podaljševanje osnove z -j-: v koprivskem govoru nekateri samostalniki, ki se v im. ed. končajo na -r (za razliko od slovenskega knjižnega jezika) pri pregibanju podaljšujejo osnovo z -j- (karabi'nerji 'policaji'), v drugih pa je ne podaljšujejo (d'nara 'denarja' in 'Auberi 'Avberju'). SKLEP V članku je prikazana (ne)zmožnost korpusne obdelave podatkov pri oblikoslovni analizi narečnega govora na primeru 1. sklanjatve samostalnikov moškega spola koprivskega govora. Kljub nekaterim izpostavljenim napakam je velika prednost takega pristopa, da uporabniku omogoča enostavno iskanje po besednih vrstah in podrobnejše iskanje po njihovih slovničnih lastnostih. Ker gre za računalniško obdelavo podatkov, so ti statistično bolj preverljivi in natančni, predvsem pa je tako iskanje hitrejše, kot če raziskovalec (ali kak drug uporabnik) sam izpisuje in analizira npr. oblikoslovne značilnosti besedja. Kljub prednostim korpusnega pristopa pa je treba ponovno izpostaviti, da gre zgolj za računalniško podprto metodo, ki (zaenkrat) ne more nadomestiti človeškega znanja. Tabela 4: 1. moška sklanjatev - ednina SKJ Koprivski govor ž+ ž- ž+ ž- ž+ ž- trda trda mehka mehka (korak) (brat) (brat) (zob) (Jurij) (riž) I -0 -0 -0 -0 -0 -0 R -a -a -a -a -e -e D -u -u -i -i -i -i T -a -0 -a -0 -a -0 M -u -u -i -i -i -i O -om -om -sm -sm -sm -sm Tabela 5: 1. moška sklanjatev - množina SKJ Koprivski govor (prt) (zob) (nož) (prt) (zob) (nož) I -i -je -i -i -je -i R -ov -ov -ev -ou -ou -su D -om -om -em -s m -s m -sm T -e -e -e -e/-3 -e/-s -e/-s/-i M -ih -ih -ih -ix/-sx -ix/-sx -ix/-sx O -i -i -i -mi/-smi/emi -mi/-smi/emi -mi/-smi/-emi USEFULNESS OF THE CORPUS APPROACH FOR MORPHOLOGICAL ANALYSIS OF DIALECTS: FIRST DECLENSION OF MASCULINE NOUNS IN THE DIALECT OF KOPRIVA NA KRASU Klara ŠUMENJAK University of Primorska, Faculty of Humanities, Titov trg 5, 6000 Koper, Slovenia e-mail:klara.sumenjak@fhs.upr.si SUMMARY The paper investigates the possibilities, limitations and errors of the corpus approach for the morphological analysis of dialects. It compares themorphological forms for the first declension of masculine nouns in the dialect of Kopriva na Krasu (available in the GOKO corpus) to those in standard Slovene. The analysis shows differences in the use of the dual, in the forms for the genitive, dative and instrumental singular and the genitive, accusative, locative and instrumental plural, as well as in the lengthtening of the stem with -j- and -t-. The texts in the corpus are automatically morphosyntactically tagged, possibly producing errors in the correct identification of part of speech, declensionpattern, number or gender; these must be eliminated manually. Despite these errors, the corpus approach proves to be efficient if combined with traditional research methods in dialectology since it substantially facilitates the analysis of the material. Keywords: dialect corpus, Karst dialect, Kopriva na Krasu, morphology, first declension masculine nouns LITERATURA AJKA (2016): Morphological analyser of Czech. https://nlp.fi.muni.cz/projekty/ajka/ (oktober 2016). Anderwald, L. & S. Wagner (2007): FRED — The Freiburg English Dialect Corpus: Applying Corpus-Linguistic Research Tools to the Analysis of Dialect Data. Creating and Digitizing Language Corpora. Volume 1: Synchronic Databases, 35-53. Arhar Hold, Š. & N. Ledinek (2008): Oblikoskladenj-ske oznake JOS: revizija in nadgradnja nabora oznak za avtomatsko oblikoskladenjsko označevanje slovenščine. V: Erjavec, T. & J. Žganec Gros (ur.): Zbornik Šeste konference Jezikovne tehnologije. Ljubljana, Institut Jožef Stefan, 54-59. Bolasco, S. (2005): Statistica testuale e text mining: alcuni paradigmi applicativi. Quaderni di statistica 7, 17-53. Babič, V. (2008): Učbenik stare cerkvene slovanšči-ne. Ljubljana, Znanstvena založba Filozofske fakultete. CLAWS (2016): CLAWS part-of-speech tagger for English. http://ucrel.lancs.ac.uk/claws/ (oktober 2016). Češki nacionalni korpus (2016): Česky närodn^ korpus. https://www.korpus.cz/ (oktober 2016). Erjavec, T., Fišer, D., Krek, S. & N. Ledinek (2010): The JOS Linguistically Tagged Corpus of Slovene. Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC'10), Malta. Gorjanc, V. & D. Fišer (2010): Korpusna analiza. Ljubljana, Znanstvena založba Filozofske fakultete Univerze v Ljubljani. GOKO (2013): Govorni korpus Koprive - GOKO. http://jt.upr.si/GOKO/ (oktober 2016). Gostenčnik, J. (2014): Govor kraja Banja Loka (SLA T283). Annales Series historia et sociologia 24, 2, 343-355. Gostenčnik, J. (2016): Krajevni govori od Babnega Polja do Bosljive Loke. Slavistična revija: časopis za jezikoslovje in literarne vede 64, 3, 341-363. Horvat, M. (2016): Narečne tvorjenke z vmesnim morfemom -ov-/-ev- iz pomenskega polja kulturne rastline. Annales, Series Historia et Sociologia 26, 4, 663-670. Kortmann, B. (2004): Why dialect grammar matters. http://www2.anglistik.uni-freiburg.de/institut/lskort-mann/literature/Kortmann2004.pdf Jakop, T. (2006): Ohranjenost dvojine v slovenskih narečjih v stiku. Annales Series historia et sociologia 16, 1, 161-168. Jakop, T. (2007): Razlikovanje glagolskih oblik po spolu v sedanjiku dvojine greve. Slavistična revija 55, 4, 601-613. Jakop, T. (2008): Dvojina v slovenskih narečjih. Ljubljana, Založba ZRC, ZRC SAZU. Jakop, T. (2009): The infuence of the grammatical category of number on neuter nouns in Slovene dialects. Dialectologia et geolinguistica 17, 12-31. Jakop, T. (2010): Dvojinske in pluralizirane oblike v slovenskih narečjih. Slavia Centralis 3, 1, 74-87. Jakop, T. (2012): Use of dual in standard Slovene, colloquial Slovene and Slovene dialects. Linguistica 52, 49-362 Jakop, T. (2016a): Tipologija samostalnikov ženskega spola v srednjesavinjskem narečju. V: Jesenšek, M. (ur.): Rojena v narečje: akademikinji prof. dr. Zinki Zorko ob 80-letnici, (Mednarodna knjižna zbirka Zora, 114). Maribor, Mednarodna založba Oddelka za slovanske jezike in književnosti, Filozofska fakulteta, 249-263. Jakop, T. (2016b): Tipologija samostalnikov ženskega spola v srednjesavinjskem narečju. Annales Series Historia et Sociologia 26, 4, 647-654. Marc Bratina, K. (2009): Zasnova narečnega fra-zeološkega slovarja. V: Stabej, M. (ur.): Infrastruktura slovenščine in slovenistike, (Obdobja, Simpozij, = Symposium, 28). Ljubljana, Znanstvena založba Filozofske fakultete, 233-238. Rožac, T. (2015): Besedilne vrste v vsakdanjih narečnih pogovorih. V: Žele, A. (ur.): Družbena funkcijskost jezika: (vidiki, merila, opredelitve). Ljubljana, Znanstvena založba Filozofske fakultete, 351-357. Rožac, T. (2016a): Analiza narečnega diskurza: (s poudarkom na govoru Rakitovca v slovenski Istri). Doktorska disertacija. Maribor. Rožac, T. (2016b): Diskurzni označevalci v različnih besedilnih vrstah vsakdanjih narečnih pogovorov. Študija primera Rakitovca v slovenski Istri. Annales Series Historia et Sociologia 26, 4, 727-740. Rožac, T. (2017): Izbrane metode za oblikovanje korpusa narečnih pogovorov kot predmeta raziskav analize diskurza. Jezikoslovni zapiski. V tisku. Smole, V. (2006): Lingvogeografska obdelava spola v ednini: samostalniki srednjega spola na -o v slovenskih narečjih. V: Vidovič-Muha, A. (ur.): Slovensko jezikoslovje danes - Slavistična revija, 54. Ljubljana, Slavistično društvo Slovenije, 125-136. Šekli, M. (2007): Sklanjatev in naglas samostalnikov a-jevske sklanjatve v govoru vasi Jevšček pri Livku nadiškega narečja slovenščine. Annales Series Historia et Sociologia 17, 1, 175-186. Šekli, M. (2010): Sklanjatev in naglas samostalnikov moške o-jevske sklanjatve v govoru vasi Jevšček pri Livku nadiškega narečja slovenščine. Jezikoslovni zapiski, zbornik Inštituta za slovenski jezik Frana Ramovša 16, 2, 73-90. Šekli, M. (2013): Sklonidba i naglasak imenica srednjega roda o-sklonidbe u slovenskom govoru sela Jevšček kraj Livka (nadiški dialekt slovenskoga jezika). Rasprave Instituta za hrvatski jezik i jezikoslovlje 39, 1, 133-145. Škofic, J. (2003): Riglerjeve Akcentske variante in naglasne različice v moški sklanjatvi kroparskega govora. V: Zorko, Z. & M. Koletnik (ur.): Glasoslovje, besedoslovje in besedotvorje v delih Jakoba Riglerja, (Zora, 25). Maribor, Slavistično društvo, 108-117. Škofic, J. (2008a): Oblikospreminjevalni vzorci glagola v gorenjskem kroparskem govoru. Jezikoslovni zapiski, zbornik Inštituta za slovenski jezik Frana Ramovša 14, 2, 11-38. Škofic, J. (2008b): Med raznolikostjo narečnega gradiva in mejami njegovega prikaza na jezikovni karti. Annales, Series historia et sociologia, 18, 1, 97-104. Škofic, J. (2011): Besedje za pomen ,sinova žena' v slovenskih narečjih in kajkavščini (po gradivu za Slovenski in Hrvaški lingvistični atlas). Rasprave Instituta za hrvatski jezik i jezikoslovlje 37, 2, 513-532. Škofic, J. (2012): Slovensko-hrvaški jezikovni stik, kot se kaže v leksiki SLA. Filologija, 59, 131-151. Škofic, J. (2016): Naglasni tipi ženske a-jevske sklanjatve v krajevnem govoru Krope na Gorenjskem. Annales, Series Historia et Sociologia 26, 4, 655-662. Šumenjak, K. (2012): Zasnova dialektološkega korpusa na primeru govora Koprive na Krasu. Krakar Vogel, B. (ur.): Slavistika v regijah - Koper. Ljubljana, Zveza društev Slavistično društvo Slovenije, Znanstvena založba Filozofske fakultete, 73-78. Šumenjak, K. & J. Vičič (2012): Izzivi pri izdelavi dialektološkega korpusa GOKO. Krakar Vogel, B. (ur.): Slavistika v regijah - Koper. Ljubljana, Zveza društev Slavistično društvo Slovenije, Znanstvena založba Filozofske fakultete, 79-87. Šumenjak, K. (2013a): Opis govora Koprive na Krasu na osnovi dialektološkega korpusa. Doktorska disertacija. Koper, Univerza na Primorskem, Fakulteta za humanistične študije Koper. Dostopno tudi na http:// share.upr.si/fhs/PUBLIC/doktorske/Sumenjak-Klara.pdf. Šumenjak, K. (2013b): Priprava gradiva in standardizacija nivojev zapisa za potrebe dialektološkega korpusa GOKO. Žele, A. (ur.): Družbena funkcijskost jezika (vidiki, merila, opredelitve). Obdobja 32 - metode in zvrsti. Ljubljana, Znanstvena založba Filozofske fakultete, 443-449. Zuljan Kumar, D. (2014): Podredne stavčne strukture v nadiškem in briškem narečju. Annales Series historia et sociologia, 24, 2, 331-342. Zuljan Kumar, D. (2016): Narodna identiteta pri Beneških Slovencih in Furlanih danes. Jezik in slovstvo, 61, 2, 7-18. Toporišič, J. (2000): Slovenska slovnica. Maribor, Obzorja. Vičič, J. & K. Marc Bratina (2015): Narečni frazeo-loški slovar - prvi koraki. V: Smolej, M. (ur.): Slovnica in slovar - aktualni jezikovni opis. Obdobja. Ljubljana, založba Filozofske fakultete, 2. del, 811-818.