Nina Drstven{ek UDK 81’374.81 samostojna leksikografka, Ljubljana nina.drstvensek@guest.arnes.si VLOGA BESEDILNEGA KORPUSA PRI POSTAVITVI GESELSKEGA ^LANKA V ENOJEZI^NEM SLOVARJU ^lanek ponazori uporabo besedilnega korpusa pri postavitvi geselskega ~lanka v enojezi~nem slovarju. V uvodu opi{e, kako korpusi prispevajo h kakovosti leksikografskega dela, v nadaljevanju pa se osredoto~i na kognitivni profil, ki ga izdelamo s pomo~jo analize korpusnih konkordanc. Iz kognitivnega pro- fila je mo~ razbrati predvsem dva tipa podatkov: pomene izto~nice, ki so izpri~ani v korpusu, in slovni~no-pomenske vzorce, ki se ve`ejo na posamezne pomene. ^lanek preveri, kako lahko tako pridobljene podatke uporabimo kot ogrodje za sestavo geselskega ~lanka, in zaklju~uje s predvidevanji o (delni) avtomatizaciji postopka. 1 Uvod Korpusi, zbirke besedil v elektronski obliki, izbranih po jasnih, vnaprej dolo~enih kriterijih predvsem sociolingvisti~ne narave, so se zaradi raziskovalnih mo`nosti, ki jih ponujajo, v zadnjih dveh desetletjih uveljavili v razli~nih jezikoslovnih disciplinah. S korpusi se je jezikoslovje v svojem raziskovalnem pristopu bolj kot kdajkoli prej pribli`alo naravoslovnim znanostim, saj jezikoslovec na jezikovno gradivo, izlu{~eno iz korpusa, gleda kot na znanstvene podatke, ki jih je potrebno analizirati in obdelati, podobno kot bi fizik obdelal vrednosti, ki jih je izmeril pri znanstvenem poskusu. Zagovorniki korpusnega pristopa (npr. Gorjanc 1999: 50–51) trdijo, da le-ta v jezikoslovne raziskave vna{a ve~jo verodostojnost, saj analize jezika ne temeljijo ve~ na intuiciji in jezikovni introspekciji idealnega doma~ega govorca, ampak na empiri~ni analizi velike koli~ine avtenti~nih besedil. Prednost analize velikega {tevila dejanskih vzorcev jezikovne rabe naj bi bila predvsem v tem, da omogo~a izpostavitev v jeziku tipi~nega in globlje razumevanje celotnega delovanja jezika. 2 Korpusi v leksikografiji Kljub uveljavitvi korpusnega pristopa v tako razli~nih jezikoslovnih disciplinah, kot so stilistika, prevodoslovje in metodika pou~evanja tujih jezikov, pa lahko trdimo, Jezik in slovstvo, let. 48 (2003), {t. 5 66 Nina Drstven{ek da so korpusi (vsaj veliki referen~ni ali reprezentativni korpusi, ki jih za jezikoslovne raziskave uporabljamo zadnjih nekaj let) najtesneje povezani z leksikografijo. Pravzaprav so gradnjo vedno ve~jih korpusov, ki bi ~imbolj natan~no odra`ali dejansko stanje v jeziku, spodbujale ravno potrebe moderne (v za~etku predvsem britanske) leksikografije, zlasti spremenjeno razumevanje jezikovne norme (norma postane tisto, kar je v jeziku tipi~no) in s tem pogojene zahteve po jezikovnih virih, ki bi temeljili na `ivem, dejansko uporabljanem jeziku in se ne bi zana{ali na `e uveljavljena spoznanja o jeziku. Slovarske zalo`be so torej finan~no podprle gradnjo slovarskih megakorpusov (Kennedy 1998: 45), gigantov kot sta npr. Bank of English (BoE), ki je ob zadnji objavi januarja 2002 {tel 450 milijonov besed, in British National Corpus (BNC, 100 milijonov besed). Tak korpus je tudi FIDA, korpus slovenskega jezika, v katerem so zbrana sodobna slovenska besedila v skupnem obsegu nekaj nad 100 milijonov besed. Zbirke besedil v leksikografiji niso novost. Ve~ina slovarjev, ki so nastali v predra~unalni{ki dobi, se je opiralo na kartote~ne listke (Krek 1999: 3), zbirke citatov, izpisanih iz besedil. Tudi te ogromne zbirke po abecednem redu urejenih citatov, ki so zrasle po slovarskih delavnicah (pri nas je bil to In{titut za slovenski jezik Frana Ramov{a ZRC SAZU, ki {e vedno hrani listkovno gradivo, uporabljeno pri pripravi SSKJ), so bile neke vrste korpusi in so bile klju~nega pomena pri snovanju slovarjev, v dobi megakorpusov pa se njihova uporaba za slovarske namene zdi vpra{ ljiva. Klasi~ne zbirke citatov se od sodobnih slovarskih korpusov namre~ razlikujejo v dveh klju~nih to~kah. Prva bistvena razlika je v na~inu vklju~evanja citatov oz. besedil v zbirko. Za klasi~ne citate te`ko re~emo, da so bili, vsaj s stali{~a sodobne leksikografije, izbrani po objektivnih merilih. Medtem ko si danes sestavljalci korpusov za cilj postavijo prikaz jezika v vseh njegovih pojavnih oblikah, od zelo pogovornih do literarnih in znanstvenih, so nekdaj izpisovalci citatov ~rpali iz virov, ki so po merilih prevladujo~e jezikoslovne skupnosti veljali za jezikovno ustrezne. Tako pri svojem delu niso zajeli jezika v celoti, ampak le dolo~en, obi~ajno literarni, segment, v slovarju pa so se kot norma lahko pojavile sintagme, ki so bile v jeziku obrobne, izjemne, tiste najbolj obi~ajne, tipi~ne in vsakdanje pa so umanjkale. Nasprotno pa slovarji, ki temeljijo na korpusni analizi, predvsem pedago{ki slovarji za tuje govorce, te`ijo k izpostavitvi v jeziku tipi~nega. Moderni leksikografski korpusi omogo~ajo ravno to, saj zagotavljajo objektivnost na za~etni stopnji raziskovanja, ki ni bila dana pri kartote~nih listkih, tj. objektivnost pri izbiri jezikovnega gradiva za analizo. Osnovna zahteva pri slovarskih megakorpusih je namre~ po uravnote`enosti. Korpus mora kot metonimija za celotno jezikovno produkcijo v dolo~enem ~asovnem obdobju (Stabej 1998: 97) ~imbolj natan~no odra`ati dejansko stanje v dolo~enem jeziku, kar dose`emo tako, da v korpus zajamemo koli~insko in zvrstno ter besedilnovrstno uravnote`ena besedila. Poleg tega je pri raziskovanju celotno jezikovno gradivo, ki je zajeto v korpus, dostopno kot celota. To pomeni, da pri analizi poljubnega leksema iz celotnega korpusnega gradiva ne izberemo le tistih citatov (konkordanc), ki se nam zdijo zanimivi, ampak vse citate, v katerih se ta leksem pojavi. Druga sprememba, ki so jo v leksikografijo prinesli korpusi, pa je obrtni{ke narave, saj je povezana z na~inom dela in orodji za analizo. Ogromna koli~ina jezikovnega Vloga besedilnega korpusa pri postavitvi geselskega ~lanka v enojezi~nem slovarju 67 gradiva, zbranega v korpusu, ne bi bila bistveno bolj koristna in uporabna kot zbirke citatov, ~e korpusi ne bi bili opremljeni z zmogljivimi ra~unalni{kimi orodji za iskanje. V tem je dodatna prednost elektronske oblike pred klasi~no: omogo~a hitrej{e in u~inkovitej{e raziskovanje. Leksikograf ima v vsakem trenutku mo`nost hitrega dostopa do jezikovnih sredstev v korpusnem gradivu. Poleg tega ni omejen le na iskanje po ciljni besedi (kot pri kartote~nih listkih), ampak lahko i{~e po razli~nih kriterijih, npr. po besedah, ki se nahajajo v bli`nji okolici ciljne besede, kar je pri kartote~nih listkih nemogo~e ali vsaj preve~ zamudno, da bi bilo izvedljivo v praksi. Leksikograf tako na relativno lahek na~in pride do razli~nih podatkov o kontekstualnih omejitvah in pomenskih preferencah dolo~enega leksema: ugotovi na primer, katere zveze so pogostej{e in s tem bolj{i kandidati za posebno izpostavitev v geselskem ~lanku. Mogo~e se zdi, da pri delu s korpusom vse naloge opravi ra~unalnik sam. Prva stopnja raziskovanja je res delno avtomatizirana. Ra~unalni{ka orodja »pre~e{ejo« celoten korpus in izlo~ijo ter sortirajo enote, ki ustrezajo danim kriterijem (ki jih je postavil raziskovalec). S tem je, kot `e re~eno, zagotovljena objektivnost pri izbiri jezikovnega gradiva. Na drugi stopnji pa nastopi leksikograf, ki se na te podatke odzove. Pomembno je torej, kako podatke, izlu{~ene iz korpusa, interpretiramo. Korpus kljub svoji neizpodbitni uporabnosti ni nezmotljiv – v~asih tudi zavaja, na primer s korpusnim {umom, »ponavljajo~imi se deli jezika, ki s slovarskega stali{~a neupravi~eno dvigujejo pomembnost dolo~enim lemam, npr. naslovi oddaj v radijskih ali televizijskih programih, rubrik v ~asopisih itd« (Krek 2003: 46). 3 Korpusni pristop Ne da bi se pregloboko spustili v razpravo o korpusnem pristopu, pa moramo vendarle bolj natan~no pojasniti, kako pojem razumemo, preden poka`emo, kako se korpusni pristop uresni~uje v moderni leksikografiji. Korpusni pristop je krovni termin, ki pokriva dva temeljna metodolo{ka principa. To sta delni korpusni pristop (corpus-based approach) in popolni korpusni pristop (corpus-driven approach) (Tognini Bonelli 2000: 1–2). Poglejmo najprej, kak{ne so zna~ilnosti prvega. Delni korpusni pristop korpusa ne uporablja za odkrivanje novih spoznanj o jeziku, temve~ predvsem kot dokazno gradivo, s katerim raziskovalec doka`e `e obstoje~e teorije ali najde primere za vnaprej postavljene jezikovne argumente. V okviru tega pristopa korpus ni sredstvo za postavljanje novih hipotez o jezikovni rabi, temve~ le inventar primerov, iz katerega jezikoslovec pa~ izbere tiste, ki mu ustrezajo in ki njegovo tezo podpirajo, z ostalimi pa se niti ne ukvarja. To pa je lahko zavajajo~e, saj je izbor gradiva subjektiven in ne odra`a nujno dejanskega jezikovnega stanja. Nasprotno pa pri popolnem korpusnem pristopu teorija nastane iz korpusa, se pravi, da je korpusno inducirana. Raziskovalec nima vnaprej postavljene hipoteze in pristopi h korpusu kot celoti ter v svojem opisu zajame vse podatke na dolo~eno temo: Popolni korpusni pristop za razliko od delnega korpusnega pristopa predstavlja metodologijo, ki korpusa ne uporablja zgolj kot izbor primerov za dokazovanje jezikoslovnih argumentov ali vrednotenje teoreti~nih izjav. Raziskovalec pri delu zajame celoto podat 68 Nina Drstven{ek kov, pri opisu korpusnih dokazov na dolo~eno temo pa se trudi biti ~imbolj iz~rpen in ne selektiven. Korpus ni skladi{~e primerov za potrditev vnaprej postavljenih teorij. Teoreti~ne izjave, pa tudi komentarji in priporo~ila, izvirajo neposredno iz korpusnih dokazov in odslikavajo korpusno gradivo (Tognini Bonelli 2000: 2). Hipoteza je torej posledica korpusne analize. Postavimo jo korak za korakom, ne na osnovi analize minimalnega besedilnega gradiva, temve~, kot smo `e omenili, z opazovanjem celotnega korpusnega gradiva, ki ustreza iskalnim pogojem. 4 Vloga korpusa pri slovarski analizi leksema Sestavljalec geselskega ~lanka v enojezi~nem slovarju ima pri slovaropisni analizi leksema pred o~mi jasno za~rtan cilj: identificirati mora pomene izbranega leksema, jih v geselskem ~lanku razvrstiti po dolo~enem zaporedju, sestaviti jasne, nedvoumne definicije in izbrati kar najbolj informativne primere rabe, s katerimi naka`e kontekstualne omejitve ali pomenske preference izto~nice ali/in izpostavi najbolj pogoste zveze. Vsak leksikografski vajenec, ki je `e kdaj posku{al postaviti geselski ~lanek, ve, kako zahtevna, pa vendar skrajno intelektualno stimulativna je taka naloga. Razdeliti pomensko polje leksema, dolo~iti meje med pomeni in jih ukalupiti (tj. napisati definicije), izpostaviti ponavljajo~e se strukture, iz obilja primerov rabe izbrati najbolj ilustrativne – te`a te naloge jezikoslovca navda s poni`nostjo do jezika, hkrati pa ga sili v globinsko analizo jezikovne rabe in odkrivanje prefinjenih jezikovnih mehanizmov. Prvi pogoj za uspe{no slovaropisno analizo leksema je zagotovitev zadostne koli~ine jezikovnega gradiva. V predra~unalni{ki dobi je to pomenilo branje ogromnih koli~in besedil, ro~no izpisovanje citatov in urejanje le-teh po abecedi, kar je bilo gara{ko in izredno zamudno delo. Prvo izdajo OED so npr. pripravljali ve~ kot 70 let (Winchester 1999), od l. 1859, ko so ~lani Londonskega filolo{kega dru{tva na enem svojih rednih sre~anj uradno za~eli s projektom, do l. 1928, ko je iz{el zadnji, 12 zvezek. Monumentalno delo (ki je prvi~ iz{lo {e pod imenom New English Dictionary) je vsebovalo 414 825 definicij in 1 827 306 primerov rabe, s katerimi so sestavljalci `eleli ilustrirati prav vsak pomen in – glede na to, da je bil OED diahroni slovar – pokazati predvsem to, kako so se pomeni skozi stoletja spreminjali. Sestavljalci tega cilja gotovo ne bi mogli uresni~iti brez prave armade nepla~anih prostovoljcev, jezikovnih navdu{encev, ki so po navodilih dolgoletnega glavnega urednika, Jamesa Murrayja, brali angle{ka (in v manj{i meri ameri{ka) literarna dela, ~asopise in revije, izpisovali citate in jih po{iljali v t. i. skriptorij, kjer so listke sortirali po abecedi, besedni vrsti in pomenu in jih tako pripravili za slovarsko analizo. OED in ostala temeljna leksikografska dela (tudi SSKJ), ki so nastajala v podobnih pogojih, so brez dvoma izjemni in za sodobnega leksikografa skorajda nepojmljivi dose`ki. Ravno ob zgodbah, kot je zgodba o nastajanju OED, se pravzaprav najbolje zavemo, kak{no pridobitev za leksikografijo predstavljajo besedilni korpusi. Zajemanje in opisovanje besedi{~a je s pomo~jo ra~unalni{kega korpusa neprimerno la`je in hitrej{e. Korpus je za {tudij besede v okolju naravnost idealen, kar se Vloga besedilnega korpusa pri postavitvi geselskega ~lanka v enojezi~nem slovarju 69 hitro poka`e, ~e pod drobnogled vzamemo eno temeljnih analiti~nih metod, ki so se uveljavile v prakti~nem slovaropisju, to so konkordance, se pravi korpusne pojavitve izbrane besedne oblike. Pri delu najpogosteje uporabljamo konkordan~ne vrstice (KWIC concordances1; npr. McCarthy 1990: 67, Sinclair 1991: 32–33), kjer je za vsako pojavitev opazovanega leksema v korpusu izpisana vrstica besedila, v katerem se ta leksem pojavi, in sicer tako, da je opazovani leksem (izto~nica) izpisan na sredini vrstice, levo in desno od tega leksema pa tako imenovani minimalni kontekst, npr.: he, he, he, ste se vsi izka{ljali? Kaj je? Ste me res odpisali? rob. Zaradi sabota`e se bolje po~utijo: »se izka{ljajo«. Tak{na dejanja so ponavadi spontana in nena~rtovana. je ostal isti. V tistem se je profesorju uspelo izka{ljati, pljunil je v robec, ki ga je dr`al potem sem izka{ljal ~igumi v dlan in ga, ne da bi vedel a~kinih plju~ih. Oku`ena ma~ka ga pogosto izka{lja in se ga tako znebi, vendar so na voljo je bil Rupsi {e `upan, je vedno brez te`av izka{ljal stotaka. Ko so ga za kak praznik prosili za ki so na omenjeno linijo `e poklicali in se izka{ljali. Izkazalo se je, da so bile njihove domneve Konkordan~ne vrstice leksema izka{ljati iz korpusa Fida Konkordan~ne vrstice lahko abecedno urejamo po besedah, ki se pojavljajo levo ali desno od izto~nice. Ta dokaj preprost in hiter postopek nam omogo~a vpogled v frazeolo{ko obna{anje izto~nice. Pri bolj poglobljeni analizi pomenov in rabe izto~nice pa si pomagamo s {ir{im sobesedilom in bolj usmerjenim iskanjem. Konkordance resda ponujajo le minimalni kontekst (kar se izpi{e na ra~unalni{ki monitor), kar vedno ne zadostuje. Ve~ina korpusov (tudi FIDA) ima zato orodja, s katerimi s klikom na izbrano vrstico prikli~emo ve~ sobesedila. To je potrebno predvsem takrat, ko moramo razjasniti razli~ne dvoumnosti (npr. reference, elipse ipd.). Na osnovi konkordanc (ali dalj{ih besedilnih segmentov, kjer je to potrebno) slovaropisec dolo~i pomene izbranega leksema. ^e je zagovornik popolnega korpusnega pristopa, pomene dolo~i, ne da bi prej pogledal, kako so ta leksem obravnavali v `e obstoje~ih slovarjih. Prej omenjene »`e obstoje~e teorije« so v slovaropisju torej slovarske obravnave dolo~enega leksema v obstoje~ih slovarjih, v slovenskem okolju je to predvsem SSKJ. @e v prvem delu ~lanka smo nakazali, da lahko iz korpusa izlu{~imo vrsto zanimivih podatkov. Predvsem britanska leksikografija si je za potrebe EFL slovarjev (pedago{kih slovarjev za tuje govorce) vedno prizadevala najti in v slovarjih izpostaviti tipi~ne zveze, v katerih se leksemi pojavljajo, se pravi kolokacije. Leksikografe je torej `e pred pojavom korpusov zanimalo, kaj se pojavlja neposredno pred in za izto~nico, korpus pa je omogo~il {e globljo analizo tipi~nega ubesediljenja. Korpusna analiza se ne ustavi pri dvo- ali trobesednih segmentih, ampak i{~e dalj{e enote in manj o~itne regularnosti. Raziskovalno polje se torej z dvo- ali trobesedne kolokacije raz{iri na vzorce (Hunston, Francis in Manning 1997). Zna~ilno za vzorce je, da niso popolnoma slovni~ne niti popolnoma pomenske enote, ampak so rezultat prepletanja slovni~nih in pomenskih preferenc dolo~enega pomena, nekak{en slovni~no-leksikalni konglomerat. Hunston, Francis in Manning 1 KWIC je kratica za key word in context, se pravi izto~nica v kontekstu. 70 Nina Drstven{ek (1997), ki so delali s takrat 250 milijonskim BoE, ugotavljajo, da ima vsak leksem enega ali ve~ vzorcev. Za lekseme z ve~ pomeni je tipi~no, da ima vsak pomen svoj vzorec in ga ta vzorec pravzaprav identificira (vzorec slu`i kot indikator pomena). Pomeni leksemov torej vstopajo v zapletena slovni~no-pomenska razmerja, produkti teh procesov pa so ve~delni konstrukti, vzorci, ki jih razumemo kot funkcionalne enote in so kot take na voljo doma~emu govorcu pri procesu verbalizacije. Zato se pri analizi konkordanc ne osredoto~imo le na idiomati~no jedro – kolokacijo – ampak na regularnosti (ponavljajo~e se enote) v {ir{em okolju. Za ilustracijo smo po principu popolnega korpusnega pristopa analizirali konkordance leme izka{ljati iz korpusa FIDA (konkordance so v celoti izpisane v Prilogi) in sestavili kognitivni profil (cognitive profile; Hanks 2000) leksema izka{ljati, delno formaliziran zapis pomenov leksema in vzorcev, ki se ve`ejo na posamezne pomene. 4.1 Korpusno inducirani kognitivni profil leksema izka{ljati2 [tevilo zadetkov za lemo izka{ljati v korpusu Fida (po izlo~itvi enakih): 47 1. ’izlo~iti s ka{ljem’ I. vzorec: izka{ljati se (4 zadetki) . je ostal isti. V tistem se je profesorju uspelo izka{ljati, pljunil je v robec, ki ga je dr`al . anatomske razmere in nesposobnost malih otrok, da bi se izka{ljali in izpraznili nos in `relo. Pogoj za zdrava u{esa . (se lahko v~asih brez vsakega strahu, da me bodo pod pretvezo nevarnosti one~i{~enja avtobusa z bruhanjem izkrcali na kak{ni obskurni postajici), mirno in debelo izka{ljam ter sem pa tja lagodno in globoko rignem. [oferji . otrokovega `ivljenja, ker se tak otrok `e itak slabo izka{lja. Sicer pa velja pravilo, da sku{amo suh ka{elj II. vzorec: izka{ljati + T3 [izlo~ek, sluz, prah, predmet, voda] (17 zadetkov) . Potem sem izka{ljal ~igumi v dlan in ga, ne da bi vedel . in dozori v ma~kinih plju~ih. Oku`ena ma~ka ga pogosto izka{lja in se ga tako znebi, vendar so na voljo (ga = plju~nega ~rva) . izlo~ka, ki postane manj lepljiv in ga je la`je izka{ljati. Pogosto jih uporabljamo v inhalacijah. . ga spremljajo dodatni simptomi, npr. vro~ina ali krvav izka{ljani4 izlo~ek. 2 V kognitivnem profilu so pod~rtani izrazi, ki nakazujejo regularnosti v {ir{em okolju izto~nice; glej poglavje 4.2. 3 Predmet v 4. sklonu. 4 Izka{ljan analiziramo kot pretekli dele`nik, se pravi kot glagolsko obliko, zato ga iz kognitivnega pro- fila ne izlo~imo. Vloga besedilnega korpusa pri postavitvi geselskega ~lanka v enojezi~nem slovarju 71 . (Oku`imo se) z vdihanjem bacilov tuberkuloze, ki jih izka{lja bolnik z aktivno boleznijo. [iri se lahko tudi z . uteko~injenje in sprostitev sluzi, ki jo bolnik tako la`je izka{lja. V huj{ih primerih mora bolnik ostati v bolni{nici, . sapniku ali pa meh~ajo sluz, da jo bolnik la`je izka{lja. Ka{elj praviloma pomirjamo le pono~i, da se bolnik . Otroku prigovarjajte, naj predmet izka{lja. . ^e otrok predmeta ne izka{lja, ga polo`ite ~ez koleno in nekajkrat udarite po predelu . otrok je sposoben sluz, ki mu zaliva dihala, izka{ljati in izpljuniti, dojen~ek pa vso to nesnago po`ira, . ; nato prere`ejo popkovino ter ga o~istijo krvi. Dojen~ek izka{lja vodo, ki se mu je nabrala v plju~ih, . glavo navzdol ter vas udaril po zadnjici, da bi izka{ljali vodo, ki se vam je nabrala v plju~ih. . dojen~ek rodi, mora za~eti tudi dihati. Potem ko izka{lja vodo, ki se mu je nabrala v plju~ih . (Odspotikala se je prek razli~ne ropotije, ki) so jo ljudje odlagali v priro~ni grajski deponiji, in izka{ljala dober kilogram prahu. Knedlina torba in vre~ka s {pecerijo . (potegnil dolg dim iz velikanske cigarete in ga dolgo dolgo dr`al v plju~ih, hote~, da se mi mo`gani do zadnjega atoma napolnijo s tehacejem), se dolgo dolgo zadr`eval, da nisem vse skupaj izka{ljal in potem sem bil do amena zmeden. Konfuzen . (temna megla se dviga dalje in ko pride do grla, se za~nem) daviti in du{iti, ~utim silno potrebo, da bi izka{ljala vse to. Uboga Milena, ki mi sledi . Ko prekri`a noge in se v`ivlja v svojo vlogo, izka{ljata fotelja izpod rjuh veliko prahu. Ko je kon~no le 2. ’izro~iti denar’ I. vzorec: izka{ljati + T (4 zadetki) . je bil Rupsi {e `upan, je vedno brez te`av izka{ljal stotaka. Ko so ga za kak praznik prosili za . (ob~instvo je videti nekam nemo, vendar pa na koncu simpati~en tip v ~rnem, Gogi ga o~itno dobro pozna,) saj mu prijateljsko pravi »gospod profesor«, le izka{lja zahtevano vsoto. Sledi dobrodu{en aplavz, jaz pa se . homoseksualnosti, na koncu zmaga prvi, ki mora zanjo izka{ljati 2000 tolarjev. Cena? Sitnica!« Potem (zanjo = za fotografijo) 72 Nina Drstven{ek . (Rene grozi, da bo javnosti postregel z) umazanimi podrobnostmi iz `ivljenja Jacksonov, ~e Janet ne bo izka{ljala velikodu{ne odpravnine. Rene, ki je bil z Janet II. vzorec: izka{ljati se (1 zadetek) . (In ~e bogati ne sodelujejo v igri), jih ponavadi tako ali druga~e prisilijo, da se izka{ljajo. 3. ’povedati svoje mnenje’ vzorec: izka{ljati se (7 zadetkov) . (dodali so {e zapise mnenj ljudi), ki so na omenjeno linijo `e poklicali in se izka{ljali. Izkazalo se je, da so bile njihove domneve . (si je pridelal veliko izku{enj. Ve, kaj mori) ljudi, ve, kako jih zagrabiti, da se izka{ljajo, zna speljati pozornost na son~nej{e plati sen~nega `ivljenja, . (Pred kar) zavidljivim {tevilom znanih politi~nih osebnosti se je kot prvi govorec izka{ljal politolog Toni Kuzmani. Zadr`al se je pri trendu izginjanja (politike iz javnega `ivljenja) . (Saj sem rekla, da se morata pogovoriti, potem bo) bolje. Grem stavit, da sta se oba dobro izka{ljala. ^e bi eden od njiju od{el od doma, . (Lahko jo nekam po{ljem, in takoj bo ocenila, ali me mora poslati nazaj ali pa naj bo tiho. Je) pravi amortizer. Ko si v krizi, se mora{ izka{ljati. Te`ko je, ~e si prepu{~en samo tujim ljudem . (Gre) za taktiko v slogu: vr`e{ bombico, sindikati se izka{ljajo, vlada preveri javno mnenje, in ~e to ni (ugodno, ukrepom obrusi najostrej{e robove) . kot napake nekoga drugega. V nedeljo se bodo ljudje izka{ljali, potem pa bo `e na prihodnji seji dolo~il le (tiste ob~ine, ki bodo lahko pre`ivele) 4. ’dati informaciije’ vzorec: izka{ljati se (6 zadetkov) . (~e no~e{ nazaj v panamsko keho, od koder si pri{el, in to na podlagi obto`b, da) z neznanci snuje, kar pa~ snuje, se takoj izka{ljaj. . kar pa snuje, se takoj izka{ljaj. ^e se izka{lja{, te ~aka vre~a denarja, ~e pa ne, . Za koga dela? Na dan z imeni! Izka{ljaj se! . do njega. Za{epetal je: Tipa sta se izka{ljala. Rekla sta, da je prodajala svojo pi~ko, (kadar je bila plonk) . v kateri je stanoval. Eden od njih se je izka{ljal policajem, da bi umora ne obesili njim. Vasquez . (in pijan~kom obljubljal, da jih ne bom premikastil, ~e) mi bodo postregli s pravimi imeni. ^e se niso izka{ljali, sem jih aretiral, ~e so se, sem (jih vseeno aretiral) Vloga besedilnega korpusa pri postavitvi geselskega ~lanka v enojezi~nem slovarju 73 5. ’grajati’ vzorec: izka{ljati se + na + T (2 zadetka) . (to je bila prava groza) za Kistiakowskega, na katerega so se zdaj kar po vrsti izka{ljali Oppenheimer, general Groves, Vannevar Bush in tako naprej (po polo`aju) . (Je med igralci pri{lo do nekih trenj in dvakrat zapored smo izgubili. Glavni trener nas) je povabil na ve~erjo. @e dobro nadelani smo se izka{ljali drug na drugega – do dna. Zjutraj smo bili 6. ’izmisliti si’ vzorec: izka{ljati + T (2 zadetka) . zna~ilnosti: njihova imena so pristala v dnevnem ~asopisju in izka{ljali so alibije, ki so jih izlo~ili iz kroga osumljencev . nalo`ila v prej{njem pismu! ^e ne bom zdaj hitro izka{ljala prepri~ljive razlage, mi bo Steve pri{el na sled in (potem se bo usulo) 7. ’s te`avo povedati’ (1 zadetek) . Prosim?! sem izka{ljal in ga debelo gledal. Mislim, iskrenost pa taka 8. Neanalizirano (3 zadetki) . He, he, he, ste se vsi izka{ljali? Kaj je? Ste me res odpisali? . rob. Zaradi sabota`e se bolje po~utijo: »se izka{ljajo«. Tak{na dejanja so pona vadi spontana in nena~rtovana. . od dobre volje. Jasno, z odgovorom sem bil izka{ljal tudi iver. Sre~al sem dva, tri znance in 4.2 Od kognitivnega profila do geselskega ~lanka Na osnovi analize konkordanc leme izka{ljati iz korpusa FIDA (48 zadetkov) smo pomenski prostor glagola izka{ljati razdelili na 7 kategorij. Pogosto lahko `e na osnovi analize minimalnega konteksta preciziramo pomen, ki je izpri~an v konkordanci, npr. Dojen~ek izka{lja vodo, ki se mu je nabrala v plju~ih, kjer je popolnoma jasno, da gre za pomen ’izlo~iti s ka{ljem’. Nekatere konkordance pa so glede interpretacije bolj odprte in v takih primerih potrebujemo ve~ sobesedila. V konkordancah v kognitivnem profilu so deli besedila, ki jih prvotno ni bilo na monitorju in smo jih dodali iz raz{irjenega sobesedila, v oklepaju. Te`ko re~emo, ali je izka{ljati v tem pogledu tipi~en ali izjemen – posplo{evanja bodo mogo~a {ele, ko bo na voljo ve~je {tevilo kognitivnih profilov. Predvidevamo pa, da se ve~ dvoumnosti pojavi pri leksemih, kjer so pomeni slabo lo~ljivi in delno prekrivni. Tipi~en primer dvoumnosti je naslednji segment: … se dolgo dolgo zadr`eval, da nisem vse skupaj izka{ljal in potem sem bil do amena zmeden. Konfuzen. 74 Nina Drstven{ek V gornji konkordanci ni jasno, na kaj se nana{a zaimek vse, zato ne vemo, ali je izka{ljati rabljen v konkretnem pomenu ’izlo~iti s ka{ljem’ ali figurativnem pome- nu ’dati informacije’. Ko imamo na voljo ve~ sobesedila, lahko razve`emo navezovalno razmerje (vse = dim), in ugotovimo, da je izka{ljati rabljen v konkretenem pomenu, torej ’izlo~iti s ka{ljem’. (potegnil dolg dim iz velikanske cigarete in ga dolgo dolgo dr`al v plju~ih, hote~, da se mi mo`gani do zadnjega atoma napolnijo s tehacejem), se dolgo dolgo zadr`eval, da nisem vse skupaj izka{ljal in potem sem bil do amena zmeden. Konfuzen Podobno besedilno ambigviteto najdemo tudi v naslednjem izseku, kjer ne poznamo nana{alnice zaimka ga. ... in dozori v ma~kinih plju~ih. Oku`ena ma~ka ga pogosto izka{lja in se ga tako znebi, vendar so na voljo Ta kratek besedilni segment vsebuje precej signalov, ki ka`ejo na to, da je izka{ljati rabljen v konkretnem pomenu in da se ga nana{a na prena{alca bolezni, vendar je navezovalno razmerje kljub temu smiselno razvezati, saj je lahko nana{alnica kolokator ali pa pomaga zo`iti pomensko polje predmetov, ki se ve`ejo na ta pomen glagola izka{ljati. Od sedmih pomenov leksema izka{ljati, ki smo jih dolo~ili s pomo~jo korpusne analize, je najpogostej{i konkretni pomen ’izlo~iti s ka{ljem’, ostali pa so bolj ali manj metafori~ne izpeljave iz tega osrednjega pomena. Za vsak pomen smo navedli njegove vezljivostne pogoje – pomensko-slovni~ne vzorce, ponavljajo~e se strukture, ki jih opazimo v konkordancah. Pri vsakem vzorcu smo kot ilustrativno gradivo navedli vse konkretne manifestacije tega vzorca iz pregledanih konkordanc. Pojavljata se v glavnem dva vzorca: refleksivna raba izka{ljati se in povezava izka{ljati s predmetom v to`ilniku, in sicer obe v konkretni in figurativni rabi. Posebej velja izpostaviti vzorec izka{ljati se na koga, ki je vezan izklju~no na pomen ’grajati’. Razmerja 1:1 so zelo zanimiva, saj tu oblika slu`i kot indikator pomena. Z natan~nej{o analizo konkordanc pa lahko odkrijemo {e bolj subtilne jezikovne mehanizme. Poglejmo torej, katere vzorce smo odkrili pri posameznih pomenih leksema izka{ljati. Pri prvem pomenu (izlo~iti s ka{ljem) se s precej visoko frekventnostjo pojavljajo izrazi z modalnim nabojem, za katere lahko v grobem re~emo, da spadajo v pomensko polje ’sposobnost’ (modalni izrazi so v kognitivnem profilu pod~rtani). Ti izrazi ka`ejo na to, da mora agens pri izka{ljevanju premagati dolo~eno oviro oz. da za izka{ljevanje porabi energijo. ^e pogledamo, kaj obi~ajno izka{ljamo, se kot predmet v to`ilniku pojavi izlo~ek, bacil, plju~ni ~rv, sluz, prah itd. Tem leksemom te`ko dodelimo status kolokatorja, saj bi bilo za to potrebnih ve~ sopojavitev z jedrom kolokacije (za vsak predmet imamo samo po eno). Lahko pa omejimo pomensko polje – izka{ljamo kaj slabega, kar je obi~ajno povezano z boleznijo. Zanimiva sta predmeta voda (ki se pojavi trikrat) in predmet (ki se pojavi dvakrat). Na prvi pogled se zdi, da sta to najpogostej{a kolokatorja, vendar nas tu korpus Vloga besedilnega korpusa pri postavitvi geselskega ~lanka v enojezi~nem slovarju 75 zavaja. ^e pogledamo distribucijo zveze izka{ljati + voda, vidimo, da so vse tri konkordance, kjer se pojavi voda, iz istega besedila in isto velja za predmet. ^e se zveza ve~krat pojavi v istem besedilu, pa ima kolokacijsko manj{o te`o, saj gre lahko za idiolekt enega avtorja, kot ~e ima {ir{o distribucijo in se pojavlja v razli~nih besedilih razli~nih avtorjev. Zanimivi sta konkordanci 18 in 29, ki predstavljata metafori~ni odmik od vzorca. V 18. konkordanci se metafori~nost ka`e v agensu, ki je netipi~en, ker je ne`iv (fotelj). Tu gre torej za prenos lastnosti `ivega subjekta (sposobnost izka{ljevanja) na ne`ivo naravo. V 29. konkordanci pa predmet, ki ga agens izka{lja, ni nekaj konkretnega (kot v vseh drugih primerih). Ohrani pa negativni naboj, tipi~en za »izka{ljanca« – temna megla, ki davi in du{i, je gotovo nekaj slabega. V 18. in 29. konkordanci imamo torej prenos s konkretnega v bolj abstraktna stanja, kar je v jeziku eden najbolj tipi~nih mehanizmov za ustvarjanje novih pomenov. Zaradi svoje inovativnosti in kreativnosti bi bili 18. in 29. konkordanca slaba primera rabe za ilustracijo pomena izlo~iti s ka{ljem v slovarju, hkrati pa imamo premalo zadetkov za metafori~no rabo, da bi si v slovarju zaslu`ili samostojen pomen in posebno izpostavitev. Pri drugem pomenu (izro~iti denar) se desno od glagola pojavljajo denarni izrazi: stotak, zahtevana vsota, pre`ivnina, 2000 tolarjev. To glede na pomen ni nepri~akovano. Vendar se tudi levo od glagola pojavljajo izrazi, ki konvergirajo v isto pomensko polje: brez te`av, le, morati, pogojni odvisnik v povezavi z gro`njo, izra`eno v prvem delu povedi. Vsi ti izrazi imajo modalni naboj in nakazujejo, da izka{ljanje denarja ne poteka v pretirano prijateljskih okoli{~inah; oseba izka{lja denar, ko jo k temu prisilijo zunanji dejavniki. To hipotezo podpira tudi vzorec II., kjer je element prisile eksplicitno izra`en: jih prisilijo, da se izka{ljajo. Pri tretjem pomenu (povedati svoje mnenje) nismo odkrili nobenega ponavljajo~ega se vzorca. Mogo~e bi se ti pokazali, ~e bi za ta pomen imeli ve~ zadetkov. Zanimiva pa je rahla modifikacija osrednjega pomena, in sicer v naslednjih treh konkordancah: (Saj sem rekla, da se morata pogovoriti, potem bo) bolje. Grem stavit, da sta se oba dobro izka{ljala. ^e bi eden od njiju od{el od doma, (Lahko jo nekam po{ljem, in takoj bo ocenila, ali me mora poslati nazaj ali pa naj bo tiho. Je) pravi amortizer. Ko si v krizi, se mora{ izka{ljati. Te`ko je, ~e si prepu{~en samo tujim ljudem si je pridelal veliko izku{enj. Ve, kaj mori) ljudi, ve, kako jih zagrabiti, da se izka{ljajo, zna speljati pozornost na son~nej{e plati sen~nega `ivljenja, V teh treh primerih izka{ljati se pravzaprav ne izra`a racionalno izra`anje mnenja, ampak je bolj izpostavljen ~ustveni aspekt: nekoga nekaj te`i, potem pa se izka{lja, tj. pove, kaj mu le`i na du{i. Lekseme, ki govorijo v prid tej interpretaciji, smo pod~rtali. Tudi tu zaenkrat {e ne bomo uvedli samostojnega pomena, verjetno pa je tej modifikaciji pomena smiselno prilagoditi definicijo v slovarju ali pa s primeri nakazati odstopanje od osrednjega pomena. ^etrti pomen (dati informacije) je soroden drugemu, saj osebo spet zunanji (obi~ajno ~love{ki) dejavnik prisili k delovanju, v tem primeru posredovanju informacij. 76 Nina Drstven{ek Element prisile je tu izra`en v obliki gro`nje, velelnika ali pogojnega razmerja – ~e se ne izka{lja{, potem se bo zgodilo kaj slabega (glej pod~rtane izraze pri pomenu 4). Pri petem pomenu (grajati) se pojavi nov vzorec (nekdo se izka{lja na nekoga), ki je vezan izklju~no na ta pomen in torej slu`i kot indikator pomena. Pri {estem pomenu (izmisliti si) sta zanimiva oba predmeta, alibije, ki so jih izlo~ili iz kroga osumljencev in prepri~ljive razlage, ki nakazujeta tipi~no situacijo: alibije in prepri~ljive razlage izka{ljamo takrat, ko nam grozi nevarnost in ho~emo odvrniti neprijetne posledice. Za sedmo pomensko kategorijo imamo samo en zadetek, kar odpira zanimivo in aktualno vpra{anje: koliko sopojavitev je potrebnih, da dobimo vzorec? Sinclair (1998: 5) predlaga, da sta potrebni vsaj dve sopojavitvi, kjer je pomembno tudi to, da se citata pojavita neodvisno drug od drugega, se pravi ne v istem besedilu. ^e pa imamo ve~ sopojavitev (mote~e je, da ta ve~ ni preciziran), pa lahko `e govorimo o prototipi~ni povezavi. Sedme kategorije torej ne bomo ustoli~ili kot pomen, ampak bomo nanjo gledali kot na modifikacijo oz. figurativno rabo prvega pomena. V prid tej interpretaciji govori dejstvo, da se vzorca prekrivata: v obeh primerih gre za prehodno rabo glagola izka{ljati. Mogo~e je, da se v slovenskem jeziku oblikuje nov pomen glagola izka{ljati. Dokler ni na voljo obnovljen/raz{irjen korpus FIDA, lahko to preverimo na svetovnem spletu, tako da leksem vtipkamo v enega od brskalnikov. V ~asu pisanja tega prispevka tudi konkordance na svetovnem spletu ne ka`ejo na to, da bi izka{ljati tvoril nov pomen. Tri konkordance smo uvrstili v kategorijo neanalizirano. V to kategorijo spadajo zadetki, kjer imamo premalo sobesedila, da bi lahko dolo~ili pomen klju~ne besede, ali pa so preve~ inovativni/kreativni, da bi bilo mogo~e z zanesljivostjo interpretirati pomen. Iz kognitivnega profila so zato izklju~eni. S pomo~jo korpusne analize smo odkrili vrsto slovni~no-pomenskih lastnosti glagola izka{ljati. Za konec smo preverili, kako uporabni so ti podatki v prakti~ni leksikografiji in na osnovi kognitivnega profila postavili poskusno slovarsko geslo leksema izka{ljati: izka{ljati prehodni glagol 1 izlo~iti s ka{ljem; oku`imo se z vdihanjem bacilov tuberkuloze, ki jih izka{lja bolnik; (refleksivno) nesposobnost malih otrok, da bi se izka{ljali; 2 pog. izro~iti denar, zlasti pod prisilo; na koncu simpati~en tip v ~rnem le izka{lja zahtevano vsoto; 3 pog. (refleksivno) povedati svoje mnenje; zaupati skrbi; ko si v krizi, se mora{ izka{ljati; 4 pog. (refleksivno) posredovati informacije, zlasti pod prisilo; na dan z imeni! Izka{ljaj se!; 5 pog. izmisliti si; ~e ne bom hitro izka{ljala prepri~ljive razlage, mi bo Steve pri{el na sled; 6 pog. (refleksivno) grajati; izka{ljati se na koga Pri postavitvi geselskega ~lanka nas je zanimalo predvsem to, kako lahko rezultate korpusne analize uporabimo pri razdelitvi pomenskega polja leksema (koliko pomenov mu pripi{emo), pri sestavljanju definicij in izboru primerov rabe, zato drugih elementov gesla ~lanek ne navaja. Vedno obstaja ve~ mo`nosti razporejanja pomenov, (ne)lo~evanja konkretnih in abstraktnih pomenov itd. Odlo~itve o tem, katere podatke `elimo v geslu bolj izpostaviti in katere manj, se pravi, kak{en pri Vloga besedilnega korpusa pri postavitvi geselskega ~lanka v enojezi~nem slovarju 77 kaz je optimalen, morajo biti rezultat temeljitega premisleka predvsem o tipu slovarja (za dekodiranje ali enkodiranje) in ciljni publiki (doma~i govorci ali tujci). V geselskem ~lanku smo poskusili opredeliti tudi stilno raven posameznih pomenov. Pomene, za katere menimo, da se pojavljajo v pogovornih zvrsteh jezika, smo opremili s kvalifikatorjem ’pogovorno’ (pog.). Pri dolo~anju stilne ravni smo si pomagali s {ir{im sobesedilom in s podatki o avtorju in mestu objave. V poskusnem geselskem ~lanku pomeni niso razporejeni po pogostosti pojavitve v korpusu, ki je dokaj pogosta in tudi smiselna tehnika razvr{~anja pomenov, ampak je bil kriterij mogo~e bolj ohlapna »osrednjost pomena«, kar pomeni, da kot prvi pomen navedemo najbolj konkretni pomen, potem pa iz njega izpeljane abstraktne pomene. To tehniko razvr{~anja pomenov so npr. dokaj uspe{no uporabili uredniki NODE (Hanks 1998). To je seveda le eden od na~inov razvr{~anja pomenov v slovarskem ~lanku in z njim so povezane dolo~ene te`ave, vendar je problematika preve~ kompleksna, da bi jo lahko obdelali v tem ~lanku. V na{em geslu imamo na prvem mestu najbolj konkreten ’izlo~iti s ka{ljem’, ki je hkrati najpogostej{i pomen, sledi mu ’izro~iti denar’, kjer {e vedno »izlo~imo« nekaj konkretnega, temu pa sledijo ’izlo~anja’ bolj abstraktnih predmetov. Glede na to, da je bil glavni namen na{e korpusne analize odkriti vzorce, ki se ve`ejo na posamezne pomene leksema izka{ljati, se poraja vpra{anje, v kateri element mikrostrukture geselskega ~lanka te podatke najbolj u~inkovito vklju~imo. Najbolj logi~en odgovor bi bil, da v definicijo, in v~asih lahko podatke o tipi~ni situaciji res vpletemo v definicijo, npr. pri 2. in 4. pomenu. Vendar morajo biti definicije kratke, jedrnate in jasne, zato jih obi~ajno ne moremo obremenjevati s podatki o tipi~ni rabi leksema. Za prikaz vzorcev so idealni primeri rabe, ki definicijo dopolnijo in nadgradijo. V poskusnem geslu smo iz na{ega inventarja primerov posku{ali izbrati take primere, ki dobro ilustrirajo pomen in hkrati naka`ejo tipi~no okolje, v katerem se leksem pojavlja. Primere iz korpusa smo spremenili minimal- no (v primeru ~e ne bom zdaj hitro izka{ljala prepri~ljive razlage, mi bo Steve pri{el na sled smo izlo~ili besedo zdaj, ker je redundantna), saj je ena glavnih prednosti slovarja, narejenega po korpusnem pristopu, ravno v tem, da uporabniku ponudi `ive primere rabe, ki ka`ejo, kak{na je dejanska raba jezika. Kakor hitro primere prirejamo ali jih kraj{amo, je to `e kr{enje korpusnega pristopa in vra~anje k introspekciji. ^e so primeri iz korpusa neprimerni kot ilustrativno gradivo za slovar (so predolgi ali prezapleteni), se korpusni jezikoslovec raje kot za posege v primere odlo~i za prikaz tipi~ne strukture, kot smo naredili pri {estem pomenu, oz. si pomaga z drugimi besedilnim viri. 5 Sklep Korpusno inducirani kognitivni profili so u~inkovito sredstvo za odkrivanje zakonitosti jezikovne rabe in dobro izhodi{~e za slovaropisno delo. Kljub temu pa geselskih ~lankov slovenskih-x (x = katerikoli jezik, vklju~no s slovenskim) slovarjev ne gre postavljati samo s pomo~jo kognitivnih profilov. Korpus FIDA je opremljen z orodji za izra~un razli~nih statisti~nih vrednosti, s pomo~jo katerih lahko dobimo 78 Nina Drstven{ek veliko podatkov o skladenjskih vzorcih, kolokatorjih in frazeologiji.5 Poleg tega noben slovar ne ignorira preceden~ne literature, v na{em primeru predvsem SSKJ. Verjetno je, da bi se geselski ~lanki, narejeni s pomo~jo korpusa FIDA, delno prekrivali s ~lanki v SSKJ, kot je tudi zelo verjetno, da bi se s pomo~jo korpusa odkrile posebnosti rabe, ki so se sestavljalcem SSKJ (zaradi »ro~nega« na~ina dela) izmuznile. Korpus FIDA torej ne spodbija avtoritete SSKJ, ampak ga dopolnjuje in nadgrajuje. S tem v zvezi je zanimiva `e primerjava na{ega geselskega ~lanka za izka{ljati in geselski ~lanek istega leksema v SSKJ, ki jo v celoti prepu{~am bralcem. V leksikografski praksi je zanimivo tudi vpra{anje, koliko konkordanc je potrebno analizirati, da lahko na osnovi pregledanega materiala izdelamo kognitivni profil, identificiramo vzorce in v kon~ni fazi postavimo geselski ~lanek. V na{em primeru smo analizirali vse zadetke, vendar ima izka{ljati v korpusu FIDA le 48 zadetkov. So pa tudi leksemi, ki imajo po ve~ tiso~ zadetkov. ^e bi pregledali vse te konkordance, bi se sestavljanje potencialnega slovarja ne potegnilo le na 70 let (kot pri OED), ampak v neskon~nost. V praksi se zato dolo~i meja – pregleda se x {tevilo naklju~no izbranih primerov, ki se vzamejo kot celota. [tevilo x mora biti dovolj veliko, da je vzorec reprezentativen, hkrati pa ne preveliko, da projekt preve~ ne prese`e vnaprej dolo~enega ~asovnega okvira. Po ustnem zagotovilu Patricka Hanksa, glavnega urednika NODE, so pri sestavljanju NODE pri vsaki besedi (tudi pri najbolj pogostih besedah v jeziku) za~eli s 300 konkordancami, kar naj bi pri veliki ve~ini besed zadostovalo. Le za pomensko zelo zapletene lekseme so uredniki analizirali dodatnih 300 konkordanc, v izjemnih primerih pa tudi do tiso~. Dejstvo je, da se vsak slovar dela pod velikim ~asovnim pritiskom in te`ko re~emo, kaj se dejansko dogaja v slovarskih delavnicah, ko bi slovar `e moral biti kon~an, pa {e ni in zalo`niki pritiskajo na urednike. Tristo konkordanc se zdi obvladljiva {tevilka, ~eprav si v slovenskem okolju zelo verjetno ne bi mogli privo{~iti, da bi za vsako geslo analizirali tristo (ali po potrebi ve~) konkordanc. Sama sem za kognitivni profil izka{ljati in poskusno geslo porabila ve~ ~asa, kot ga imajo na voljo uredniki, ki delajo na slovarskih projektih. Po drugi strani pa se zdi, da s pomo~jo kognitivnih profilov postane vidna marsikatera lastnost leksemov, ki je, ~e konkordance le preletimo, `e zaradi omejene zmogljivosti pomnjenja ~love{kih mo`ganov, ne odkrijemo. Treba je torej najti u~inkovito ravnovesje med kakovostjo in hitrostjo dela. Re{itev iz te zagate mogo~e `e obstaja, vsaj v angle{ko govore~em okolju. Angle{ka korpusna leksikografija eno svojih glavnih nalog v 21. stoletju vidi v razvoju programskih orodij, ki bi omogo~ala izkori{~anje celotnega potenciala vedno obse` nej{ih korpusov, se pravi, da bi pri analizi upo{tevala vse pojavitve izto~nice (in ne le naklju~ni izbor konkordanc) in hkrati leksikografu ponudila ve~ podatkov o rabi izto~nice kot le spisek najpomembnej{ih kolokatorjev. Na Univerzi v Brightonu so tako razvili avtomatski postopek (Kilgarriff in Rundell 2002), s katerim lahko diagnosticirajo pomene izto~nice in kolokatorje, ki se ve`ejo na posamezne pomene. V prihodnosti lahko morda pri~akujemo popolnoma avtomatiziran postopek izdelave kognitivnih profilov, kar bi bilo leksikografu predvsem pri pomensko kompleks 5 Statisti~ne metode raziskovanja okolja izto~nice opisujeta npr. Gorjanc in Krek (2001). Vloga besedilnega korpusa pri postavitvi geselskega ~lanka v enojezi~nem slovarju 79 nih geslih v veliko pomo~, saj kognitivni profil, kot smo posku{ali pokazati, predstavlja `e kar ogrodje geselskega ~lanka. Literatura Gorjanc, Vojko, 1999: Korpusi v jezikoslovju in korpus slovenskega jezika FIDA. Kr`i{nik, Erika in Lokar, Meta (ur.): 35. seminar slovenskega jezika, literature in kulture. Ljubljana: Center za sloven{~ino kot drugi/tuji jezik pri Oddelku za slovanske jezike in knji`evnosti Filozofske fakultete. 47–59. Gorjanc, Vojko in Krek, Simon, 2001: A corpus-based dictionary database as the source for compiling Slovene-X dictionaries. 6th Conference on Computational Lexicography and Corpus Research. »Computational Lexicography and New EU Languages. Birmingham: Centre for Corpus Linguistics. 41–47. Hanks, Patrick, 2000: Immediate context analysis: distinguishing meanings by studying usage. Heffer, Chris in Sauntson, Helen (ur.): Words in Context. A Tribute to John Sinclair on his Retirement. University of Birmingham ELR discourse analysis Monograph No. 18. Hunston, Susan, Francis, Gill in Manning, Elizabeth, 1997: Grammar and Vocabulary: Showing the Connections. ELT Journal 51/3. 208–215. Kennedy, Graeme, 1998: An Introduction to Corpus Linguistics. London & New York: Addison Wesley Longman. Kilgarriff, Adam in Rundell, Michael, 2002: Lexical Profiling Software and its Lexicographic Applications – a Case Study. Braasch, Anna in Povlsen, Claus (ur.): Proceedings of the Tenth EURALEX International Congress. Copenhagen: CST. 807–818. Krek, Simon, 1999: Ra~unalni{ki korpusi v slovaropisju. Razgledi 13 (23. junij 1999). 8–9. Krek, Simon, 2003: Sodobna dvojezi~na leksikografija. Jezik in slovstvo XLIII/1. 45–60. McCarthy, Michael, 1990: Vocabulary. Oxford: OUP. Sinclair, John, 1998: The Computer, the Corpus and the Theory of Language. Azzaro, Gabriele in Ulrych, Margherita (ur.): Transiti linguistici e culturali II. XVIII AIA Congress Anglistica: metodi e persorsi comparatistici delle lingue, culture e letterature di origine europea. Trieste: EUT. 1–15. Sinclair, John, 1991: Corpus, Concordance, Collocation. Oxford: OUP. Stabej, Marko, 1998: Besedilnovrstna sestava korpusa FIDA. [trukelj, Inka (ur.): Jezik za danes in jutri. Zbornik referatov na II. kongresu Dru{tva za uporabno jezikoslovje Slovenije. Ljubljana: Dru{tvo za uporabno jezikoslovje Slovenije. 97–106. Tognini Bonelli, Elena, 2000: Functionally Complete Units of Meaning across English and Italian: Towards a Corpus-driven Approach. Granger, Sylviane in Altenberg, Bengt (ur.): Lexis in Contrast. Amsterdam/Philadelphia: Benjamins. 1–15. Winchester, Simon, 1999: The Surgeon of Crowthorne. A Tale of Murder, Madness and the Oxford English Dictionary. Harmondsworth: Penguin Books. 80 Nina Drstven{ek Slovarji NODE – Hanks, Patrick (ur.), 1998: The New Oxford Dictionary of English. Oxford: OUP. OED – 1989. The Oxford English Dictionary. 2. izd. Oxford: Clarendon Press. (OED – Simpson, J. A., Weiner, E. S. C., ured. 1989: The Oxford English Dictionary. 2. izd. Oxford: Clarendon Press.) SSKJ – 1997. Slovar slovenskega knji`nega jezika. 2. ponatis. Ljubljana: In{titut za sloven- ski jezik ZRC SAZU, DZS. Spletne strani BoE – Bank of English BNC – British National Corpus FIDA – Korpus slovenskega jezika Priloga Konkordance leme izka{ljati iz korpusa Fida 1. He, he, he, ste se vsi izka{ljali? Kaj je? Ste me res odpisali? 2. rob. Zaradi sabota`e se bolje po~utijo: »se izka{ljajo«. Tak{na dejanja so ponavadi spontana in nena~rtovana. 3. je ostal isti. V tistem se je profesorju uspelo izka{ljati, pljunil je v robec, ki ga je dr`al 4. Potem sem izka{ljal ~igumi v dlan in ga, ne da bi vedel 5. in dozori v ma~kinih plju~ih. Oku`ena ma~ka ga pogosto izka{lja in se ga tako znebi, vendar so na voljo 6. je bil Rupsi {e `upan, je vedno brez te`av izka{ljal stotaka. Ko so ga za kak praznik prosili za 7. ki so na omenjeno linijo `e poklicali in se izka{ljali. Izkazalo se je, da so bile njihove domneve 8. z neznanci snuje, kar pa~ snuje, se takoj izka{ljaj. ^e se izka{lja{, te aka vre~a denarja, 9. kar pa snuje, se takoj izka{ljaj. ^e se izka{lja{, te ~aka vre~a denarja, ~e pa ne, 10. od dobre volje. Jasno, z odgovorom sem bil izka{ljal tudi iver. Sre~al sem dva, tri znance in 11. izlo~ka, ki postane manj lepljiv in ga je la`je izka{ljati. Pogosto jih uporabljamo v inhalacijah. 12. ga spremljajo dodatni simptomi, npr. vro~ina ali krvav izka{ljani izlo~ek. 13. z vdihanjem bacilov tuberkuloze, ki jih izka{lja bolnik z aktivno boleznijo. [iri se lahko tudi z 14. { uteko~injenje in sprostitev sluzi, ki jo bolnik tako la`je izka{lja. V huj{ih primerih mora bolnik ostati v bolni{nici, 15. so jo ljudje odlagali v priro~ni grajski deponiji, in izka{ljala dober kilogram prahu. Knedlina torba in vre~ka s {pecerijo 16. ljudi, ve, kako jih zagrabiti, da se izka{ljajo, zna speljati pozornost na son~nej{e plati sen~nega `ivljenja, 17. Kistiakowskega, na katerega so se zdaj kar po vrsti izka{ljali Oppenheimer, general Groves, Vannevar Bush in tako naprej Vloga besedilnega korpusa pri postavitvi geselskega ~lanka v enojezi~nem slovarju 81 18. Ko prekri`a noge in se v`ivlja v svojo vlogo, izka{ljata fotelja izpod rjuh veliko prahu. Ko je kon~no le 19. mirno in debelo izka{ljam ter sem pa tja lagodno in globoko rignem. [oferji 20. Prosim?! sem izka{ljal in ga debelo gledal. Mislim, iskrenost pa taka 21. se dolgo dolgo zadr`eval, da nisem vse skupaj izka{ljal in potem sem bil do amena zmeden. Konfuzen. 22. otrok je sposoben sluz, ki mu zaliva dihala, izka{ljati in izpljuniti, dojen~ek pa vso to nesnago po`ira, 23. otrokovega `ivljenja, ker se tak otrok `e itak slabo izka{lja. Sicer pa velja pravilo, da sku{amo suh ka{elj 24. sapniku ali pa meh~ajo sluz, da jo bolnik la`je izka{lja. Ka{elj praviloma pomirjamo le pono~i, da se bolnik 25. zavidljivim {tevilom znanih politi~nih osebnosti se je kot prvi govorec izka{ljal politolog Toni Kuzmani. Zadr`al se je pri trendu izginjanja 26. anatomske razmere in nesposobnost malih otrok, da bi se izka{ljali in izpraznili nos in `relo. Pogoj za zdrava u{esa 27. nalo`ila v prej{njem pismu! ^e ne bom zdaj hitro izka{ljala prepri~ljive razlage, mi bo Steve pri{el na sled in 28. bolje. Grem stavit, da sta se oba dobro izka{ljala. ^e bi eden od njiju od{el od doma, 29. daviti in du{iti, ~utim silno potrebo, da bi izka{ljala vse to. Uboga Milena, ki mi sledi 30. Za koga dela? Na dan z imeni! Izka{ljaj se! 31. pravi amortizer. Ko si v krizi, se mora{ izka{ljati. Te`ko je, ~e si prepu{~en samo tujim ljudem 32. Otroku prigovarjajte, naj predmet izka{lja. 33. ^e otrok predmeta ne izka{lja, ga polo`ite ~ez koleno in nekajkrat udarite po predelu 34. saj mu prijateljsko pravi »gospod profesor«, le izka{lja zahtevano vsoto. Sledi dobrodu{en aplavz, jaz pa se 35. homoseksualnosti, na koncu zmaga prvi, ki mora zanjo izka{ljati 2000 tolarjev. Cena? Sitnica!« Potem 36. za taktiko v slogu: vr`e{ bombico, sindikati se izka{ljajo, vlada preveri javno mnenje, in ~e to ni 37. nato prere`ejo popkovino ter ga o~istijo krvi. Dojen~ek izka{lja vodo, ki se mu je nabrala v plju~ih, 38. glavo navzdol ter vas udaril po zadnjici, da bi izka{ljali vodo, ki se vam je nabrala v plju~ih. 39. dojen~ek rodi, mora za~eti tudi dihati. Potem ko izka{lja vodo, ki se mu je nabrala v plju~ih, 40. umazanimi podrobnostmi iz `ivljenja Jacksonov, ~e Janet ne bo izka{ljala velikodu{ne odpravnine. Rene, ki je bil z Janet 41. je povabil na ve~erjo. @e dobro nadelani smo se izka{ljali drug na drugega – do dna. Zjutraj smo bili 42. do njega. Za{epetal je: Tipa sta se izka{ljala. Rekla sta, da je prodajala svojo pi~ko, 43. zna~ilnosti: njihova imena so pristala v dnevnem ~asopisju in izka{ljali so alibije, ki so jih izlo~ili iz kroga osumljencev 44. v kateri je stanoval. Eden od njih se je izka{ljal policajem, da bi umora ne obesili njim. Vasquez 45. mi bodo postregli s pravimi imeni. ^e se niso izka{ljali, sem jih aretiral, ~e so se, sem 46. jih ponavadi tako ali druga~e prisilijo, da se izka{ljajo. 47. kot napake nekoga drugega. V nedeljo se bodo ljudje izka{ljali, potem pa bo `e na prihodnji seji dolo~il le