Simon Krek UDK 811.111'373:004.42:811.163.6'373 Amebis, d.o.o., Kamnik Institut Jožef Stefan, Ljubljana simon.krek@guest.arnes.si FRAMENET IN SLOVENSCINA FrameNet je računalniški leksikografski projekt, pri katerem iz velikih računalniških korpusov besedil z ročnimi in avtomatskimi postopki izločamo informacije o povezanih pomenskih in skladenjskih lastnostih angleških besed. Prispevek povzema bistvene značilnosti projekta ter na konkretnih zgledih predstavlja, kakšen je videti prenos konceptov projekta FrameNet v slovensko jezikovno okolje. 1 Uvod Zgodovinsko gledano je projekt FrameNet v veliki meri rezultat teoretskih idej Charlesa L. Fillmorja, ameriškega slovničarja, ki se je vrsto let ukvarjal s teorijo povezovanja pomenskih in skladenjskih jezikovnih vidikov, ki jo je poimenoval sklonska slovnica oz. slovnica sklonov (Fillmore 1968). To izhodišče so skupaj z njim v devetdesetih letih dopolnili in preoblikovali raziskovalci s področja računalniškega in korpusnega jezikoslovja ter leksikografski teoretiki in praktiki, predvsem v projektih RISK (Fillmore in Atkins 1992) ter DELIS (Atkins idr. 1995). Nasledek teh projektov je projekt FrameNet, ki še vedno poteka na kalifornijski univerzi v Berkeleyju, ožje na njihovem International Computer Science Institute. Poleg izhodiščnega angleškega obstajajo tudi trije istovetni projekti za španski, japonski in nemški jezik,1 na inštitutu pa so predvsem v dvojezičnem kontekstu podprli tudi obravnavo slovenskega jezika (Lönneker-Rodman 2007a, 2007b ter Lönneker-Rodman idr. 2008). 1 Več o tem: , , . 2 Ideja FrameNeta Osnovna ideja projekta je opis pomena besed s pomočjo pomenskih shem. To so shematične predstavitve konceptualnih struktur in vzorcev verjetij, praks, institucij, predstav itd., ki v neki jezikovni skupnosti zagotavljajo temelj pomenskih interakcij. Pri prepoznavanju in opisu pomenskih shem analiza pomena besed poteka z naslonitvijo na sheme, ki so podlaga pomena, ter z razčlenjevanjem skladenjskih lastnosti besed s pomočjo vprašanja, kako njihove pomenske lastnosti pridobijo skladenjsko obliko. Osnovni enoti leksikalne analize sta shema2 in leksikalna enota. Leksikalno enoto lahko opišemo kot besedo v enem od svojih pomenov, pri čemer tradicionalni različni pomeni besed v splošnem ustrezajo posameznim pomenskim shemam, v katerih lahko sodeluje ta beseda. Če pomen besede temelji na neki pomenski shemi, pravimo, da jo evocira. Tako denimo lahko beseda »sladek« evocira pomensko shemo Čut_kemični-dražljaj_opis3 (»Ponudil mi je sladek čaj in se široko zarežal.«)4 ali shemo Družbena-interakcija_ocena (»Na zunaj je bila sicer še vedno sladka, toda v njej se je začela razraščati prikrita sovražnost.«). 2.1 Elementi sheme Pri procesu prepoznavanja in opisa ene od pomenskih shem pri določeni besedi je začetna raven prepoznavanja pomenska in ne skladenjska. Pri besedi, ki jo obravnavamo, s pomočjo jezikovne intuicije ter obstoječih slovarskih in drugih virov razberemo, kakšna bi bila lahko posamezna pomenska shema. Na začetku procesa leksikograf torej opiše določen scenarij, na podlagi katerega bo raziskal dejansko stanje v jeziku. Če za lažje razumevanje procesu sledimo s konkretnim zgledom, si izberimo leksikalno enoto PRITRDITI in si zamislimo scenarij pomenske sheme, pri katerem »kdo povzroči, da kaj postane fizično povezano s čim drugim«. Ko iz scenarija razberemo shemo, jo formaliziramo in poimenujemo, npr. - če sledimo praksi pri projektu - »fizično_povezati«. Navedimo nekaj glagolov, ki bi lahko pripadali tej shemi: pritrditi, pripeti; privezati, zvezati, povezati, vezati; nalepiti, zlepiti, prilepiti; spojiti, prikleniti; pričvrstiti, zavozlati; fiksirati; zapeti; pribiti, zabiti; zakovati; prišiti, zašiti; zalotati, zvariti, spajkati; zasidrati; 2 Shema kot prevod angleške besede frame je morda nekoliko nenavadna izbira, tudi zato ker se v slovenskem prostoru že pojavlja logičnejši »okvir« (Žele 2001: 67; Perko 2004). Ker pa je v teoriji t. i. frame semantics to najbolj obremenjen pojem, ki tvori celo vrsto zvez in izpeljank, smo se odločili za shemo, ker je po našem mnenju prožnejša in zato uporabnejša za terminološke namene. 3 Način zapisa pomenskih shem je povzet in prirejen po angleškem FrameNetu. O poimenovanju shem, njenih elementih itd. bomo podrobneje govorili v nadaljevanju sestavka. 4 Vsi zgledi so vzeti iz korpusa FidaPLUS. Na tej točki se opiranje na jezikovno intuicijo ter sekundarne jezikovne vire, denimo razlagalne slovarje ali tezavre, preneha. Da bi ugotovili, kateri bi lahko bili shemski elementi, moramo zbrati informacije iz naključno izbranih primerov iz besedilnega korpusa: (1) -- Najljubše recepte in druge koristne podatke pritrdite na notranjo stran vrat omar, tako da si jih lahko hitro ogledate. -(2) -- Gornji rob mrežne konstrukcije pritrdimo na balkon, spodnjega pa zasidramo na terasi s šotorskimi -(3) -- Korita bolj pogosto obešamo na gornji rob balkonske ograje, kadar je balkon obzidan, pa na zidni venec balkona. V obeh primerih moramo korita pritrditi, da bodo stabilna in varna tudi v viharnem vremenu -(4) -- Fallopia je kot učinkovito zaščitno sredstvo priporočal povoščeno platneno vrečko, ki jo je sam izdelal in po lastnih besedah tudi praktično preizkusil, njena uporaba pa je bila sila enostavna. Moški si jo natakne na vzburjeni penis, pritrdi s priloženim usnjenim jermenčkom ter nemoteno in predvsem brez neprijetnih posledic občuje, s komerkoli hoče. -(5) -- pramen ovijemo čez dva prsta, da ga oblikujemo in pritrdimo s sponko. Ko lase posušimo, sponke odstranimo -(6) -- v 30-dnevnem življenjskem obdobju uš izleže tudi do tristo gnid. Te razporedi po lasišču tako, da jih z lepljivo snovjo pritrdi na spodnji del lasu. -(7) -- Prvi puškarji so morali biti zaradi počasnega streljanja lahek plen sabljačev, zakaj še v istem stoletju so jim orožarji izpopolnili vžigalni postopek: najprej so jim v zadnji del cevi zvrtali vžigalno luknjico, nato so jo zaradi priročnosti prestavili na desno stran cevi, nakar so k cevi pritrdili še prašno ponvico s smodnikom. -(8) -- Podnožje merilnika omogoča, da ga pritrdimo neposredno na prtljažnik motocikla ali na ohišje -(9) -- Skalo, umerjeno v njutnih, pritrdimo na tulec, v katerem visi vzmet. -(10) -- Mlade gosenice vrtajo rove v liste, starejše pa grizljajo semena in liste. Nanje tudi pritrdijo hišice, ki jih naredijo iz votlih semen ali -Pri naključno izbranih primerih iz korpusa FidaPLUS lahko opazimo, da je v scenariju pritrjevanja vedno prisoten VRŠILEC. V gornjih primerih je to denimo »moški« (4), »uš« (6), »orožarji« (7), »gosenice« (10), pogosto pa je izražen tudi posredno, npr. z velelnikom (1), modalno strukturo (3) ali kot glagol v prvi osebi množine (2), (3), (5), (8), (9). Poleg vršilca je element sheme PREDMET, ki ga ta pritrdi na nek drug predmet: »najljubše recepte in druge koristne podatke« (1), »gornji rob mrežne konstrukcije« (2), »korita« (3) itd. Drugi predmet, na katerega nekdo nekaj pripne, poimenujmo CILJ. Kot vidimo, je največkrat izražen s predložno zvezo, npr. »na notranjo stran vrat« (1), »na balkon« (2), »k cevi« (7) itd., lahko pa tudi povsem umanjka, če ga je besedilno gledano mogoče razbrati iz sobesedila: »na gornji rob balkonske ograje«, »na zidni venec balkona« (3), »nazaj na isti pramen«, »skupaj« (5). Kot zadnji element sheme se pojavlja VEZ, ki je lahko izražena ali ne, glede na izbiro oz. potrebo tvorca besedila. Navadno je to predložna zveza s predlogom »s/z«, v gornjih zgledih so to npr. »s priloženim usnjenim jermenčkom« (4), »s sponko« (5), »z lepljivo snovjo« (6). Vsi ostali elementi, ki se pojavljajo v okolici pomenske sheme, so t. i. obrobni elementi, navadno so to stavčna določila, ki izražajo čas, prostor, način, vzrok itd. Vsaka shema mora po pravilih FrameNeta dobiti svojo definicijo in po preverjanju gradiva lahko poskusimo: VRŠILEC pritrdi PREDMET na CILJ, navadno s pomočjo VEZI, pri čemer ustvari trdno fizično povezavo med tem PREDMETOM in CILJEM. Svojo definicijo morajo dobiti tudi shemski elementi: VRŠILEC nekaj naredi s PREDMETOM. Navadno označuje živo bitje, lahko je tudi neživ. Najpogosteje je izražen kot stavčni osebek. PREDMET označuje stvar, ki jo VRŠILEC pritrdi na CILJ. Najpogosteje je izražen kot stavčni predmet. CILJ označuje mesto, kamor je pritrjen PREDMET. Navadno je izražen kot predložna zveza. VEZ označuje predmet ali snov, ki tvori povezavo in drži PREDMET in CILJ v nepremični zvezi. Navadno je izražen kot predložna zveza s predlogom »s/z«. Čeprav je nemogoče povsem ločiti zaporedje ravni analize, je navedena pomenska raven torej kronološko prva, in če povzamemo njene bistvene elemente, gre za: a. prepoznavanje pomenske sheme, b. prepoznavanje shemskih elementov, c. formalno definiranje sheme in njenih elementov. Tradicionalni postopek identifikacije pomena poteka na drugačen način: a. pregled primerov rabe določene besede, b. intuitivno prepoznavanje, kateri primeri rabe spadajo pod določen pomen, c. identifikacija skladenjskih vzporednic semantičnim razlikam, d. beleženje opaženih skladenjskih vzporednic, e. izbira primerov rabe, ki kažejo te razlike. Postopek določanja pomenov torej ni prepuščen intuiciji, teorija shemske semantike s pomočjo sistema pomenskih shem zelo eksplicitno povezuje pomene besed s skladenjskimi konteksti, v katerih se beseda pojavlja. 2.2 Jedrnost Ena od zahtevnejših nalog pri tem procesu je razločevanje med jedrnimi in nejedrnimi elementi sheme. Pri tem avtorji ločujejo tri stopnje: jedrni, obrobni ter netematski elementi. Trem bistvenim dodajajo še četrto stopnjo: neizraženi jedrni elementi. Kot nakazuje že samo poimenovanje, so jedrni elementi tisti, ki predstavljajo konceptualno nujni del sheme in na podlagi katerih se posamezna shema sploh razlikuje od drugih. Raziskovalci pri projektu navajajo nekaj načel razločevanja: - če se element vedno eksplicitno pojavlja v shemi, je jedrni, - jedrni elementi sheme morajo biti v funkciji enega od osnovnih stavčnih elementov standardnega (angleškega) stavka - npr. (logični) osebek, (logični) predmet itd., - skladenjska raba jedrnega elementa mora biti obvezna,5 - če je jedrni element izpuščen, ga je kljub temu mogoče eksplicitno interpretirati, - jedrni element mora imeti osrednjo vlogo pri pomenu leksikalne enote.6 Ob podrobnem pogledu vidimo, daje prvi kriterij formalne narave, kjerje odločujoče preprosto pojavljanje ali nepojavljanje določenega besedila/elementa v gradivu. Druga dva kriterija sta skladenjska, pri čemer se prvi bolj opira na tradicionalno stavčno analizo, drugi pa na teorijo vezljivosti. Zadnja dva kriterija sta semantična in po pričakovanjih najbolj podvržena subjektivni presoji. Od vseh kriterijev pa po navedbah avtorjev zadnji pravzaprav sam zadostuje za opredelitev »jedrnosti« elementa. Obrobni elementi so tisti, ki ne opredeljujejo posamezne sheme enoznačno, kar pomeni, da na podlagi njihovega pojavljanja v okolici obravnave besede oz. leksikalne enote ni mogoče ločevati ene sheme od druge. Kot omenjeno, so najbolj značilni pojmi, ki jih opredeljujejo obrobni elementi, čas, prostor, način, stopnja itd. Netematski elementi postavljajo dogodek, ki ga opredeljuje pomenska shema, ob ozadje nekega drugega dogodka oz. evocirajo širšo shemo, v kateri ta dogodek izpolnjuje določeno vlogo. Razlika med jedrnimi/obrobnimi elementi ter netematskimi je v tem, da so jedrni/obrobni elementi dogodki in udeleženci, vključeni v del vzročne verige, ki jo opredeljuje ciljni predikat. Vsi ostali udeleženci 5 S stališča vezljivostne teorije, ki ima pri shemski semantiki pomembno vlogo, so to t. i. obvezna določila, med njimi splošna obvezna določila in obvezna okoliščinska določila (Žele 2001: 18), vendar je koncept obveznih elementov morda malce širši, saj ni vezan le na glagolsko vezljivost. 6 Avtorji na tem mestu dodajajo primer glagola »aretirati«, pri katerem kot jedrne elemente opredeljujejo ORGAN, OSUMLJENCA in OBTOŽBO, saj brez enega od teh elementov pravi akt aretacije ni možen. in dogodki so netematski. To pomeni, da netematski elementi nimajo opredelitve, ki bi bila značilna za posamezno shemo, temveč so enaki v vseh okvirih, v katerih »gostujejo«. Najpomembnejši netematski elementi denimo opredeljujejo trajanje, ponavljanje, frekventnost, dodatne udeležence, vlogo udeležencev itd. 2.3 Nasledstvo Za razumevanje ideje projekta FrameNet je pomemben pojem nasledstva. Ker je izhodišče FrameNeta močno semantično obarvano, kjer je v središču pojmovni besedilni svet, imajo najbolj abstraktne sheme svoje specifičnejše sheme, s katerimi jih povezujejo skupni, a specifičnejši shemski elementi. Tako ima denimo shema »fizično_povezati«, v katero spada leksikalna enota »pritrditi«, svojo nadshemo, ki bi jo lahko poimenovali »namemo_povzročiti«, ki jima je skupen shemski element »vršilec«. Ta segment projekta približuje idejo FrameNeta izhodiščem znamenitega leksikalnega projekta WordNet,'7 po drugi strani pa tudi formalnim ontologijam, ki so postale popularne z razmahom interneta. S tem zadovoljuje potrebe internetne računalniške skupnosti, ki s pomočjo nastajajočega standarda Semantic Web skuša pomensko razčlenjevati tekstovno vsebino spleta.8 Ob tem je potrebno poudariti tudi razlike med navedenimi projekti in FrameNetom. Ta je izrazito usmerjen v semantično in sintagmatsko komponento jezikovnih izrazov, ključna novost pa je ta, da za izhodišče ne vzame besede kot osnovnega gradnika, temveč pomensko shemo, v katero spadajo različne leksikalne enote. Te leksikalne enote imajo prek sheme jasno opredeljivo semantično in sintaktično okolico, kar jih ločuje od ostalih shem. Avtorji tudi poudarjajo, da nasledstveni odnosi med shemami niso strogo formalizirani in tako ni nujno, da nižja shema nujno nasledi prav vse elemente hierarhično višje. Služijo pa kot pomoč pri oblikovanju sheme ter ohranjajo konsistentnost pri poimenovanju ali konceptualiziranju shemskih elementov, ki so v različnih hierarhičnih odnosih enaki. 2.4 Opuščanje Pri FrameNetu upoštevajo tri primere, v katerih je jedrni shemski element (sicer seveda nujen) lahko opuščen. Prvega imenujejo »nedoločna ničta pojavitev« - NNP - (Indefinite Null Instantiation) in pomeni, da tvorec besedila/izjave ne predpostavlja, da ima recipient dostop do informacije o vsebini določenega shemskega elementa. Pri naših zgornjih zgledih je tak element »vez«. V določenih primerih tega shemskega elementa pač ni potrebno izraziti: ' Glej: 8 Prim. npr. (9) -- Skalo, umerjeno v njutnih, pritrdimo na tulec, v katerem visi vzmet. -V primeru »določne ničte pojavitve« - DNP - (Definite Null Instantiation) jedrni element ni eksplicitno izražen, vendar je informacijo o njem mogoče razbrati iz sobesedila. Ta segment predstavlja najbolj jasen most med besediloslovno interpretacijo besedil in skladenjsko analizo. Mnogokrat bo tak element izražen z anaforično referenco ali podobnim sredstvom, ki sega preko meje stavka oz. povedi: (6) -- v 30-dnevnem življenjskem obdobju uš izleže tudi do tristo gnid. Te razporedi po lasišču tako, da jih [jih=gnide] z lepljivo snovjo pritrdi [ona=uš] na spodnji del lasu. -Tretji tip opuščanja, »strukturno dopuščene ničte pojavitve« - SDNP - (Constructionally-licensed Null Instantiation ali Constructional Null Instatiation) je sorazmerno preprost tip opuščanja, saj gre za shemske elemente, ki so skriti v drugih elementih, ker to dopuščajo slovnična sredstva. Najbolj tipičen primer je denimo velelnik, ki vedno vsebuje tudi stavčni subjekt oz. ustrezajoči shemski element. 3 Slovnični del Pri opisu projekta prehajamo iz pretežno semantične na skladenjsko analizo, ki je pri angleškem jeziku in s tem tudi pri projektu FrameNet v precejšnji meri avtomatizirana. Vsak shemski element je s skladenjskega stališča opredeljen z dvema podatkoma na dveh različnih nivojih, glede na vrsto zveze ter skladenjsko funkcijo. Slovnična analiza se zaradi specifičnih ciljev analize do neke mere razlikuje tako od standardnih kategorij, ki jih postavlja denimo referenčna slovnica angleškega jezika,9 še bolj pa od kategorij, ki jih najdemo v slovenskih slovnicah, zato ne bo odveč, če kategorije navedemo v celoti, skupaj z angleškimi zgledi za jasnejšo predstavo. Ob vsaki kategoriji dajemo možen slovenski prevod, zgled ali razlago. 3.1 Vrste besednih zvez 3.1.1 Vrste samostalniških zvez a. standardna samostalniška zveza (Standard Noun Phrase): my neighbor; John; I; the book I found; two girls 9 Quirk, Randolph et al., 1993. A comprehensive grammar of the English language. London, New York: Longman. [SLO: moj sosed; John; jaz; knjiga, ki sem jo našel; dve dekleti] b. nereferencialna samostalniška zveza (Non-referential Noun Phrase): There was a row; It was raining [SLO: 0 - Prišlo je do prepira; Deževalo je] c. svojilna samostalniška zveza (Possessive Noun Phrase): my; John's [SLO: moj, Johnov] d. nedokončana samostalniška zveza (Non-maximal Nominal): [fast food] allergy; [car] manufacturer [SLO: alergija na hitro hrano, proizvajalec avtomobilov] 3.1.2 Vrste predložnih zvez a. predložna zveza s samostalniškim dopolnilom (Prepositional Phrase with NP object): Scrape it back [into the microwave bowl] [SLO: postrgajte jo/ga nazaj v posodo za mikrovalovno pečico] b. predložna zveza brez dopolnila (Prepositional Phrase with no object): I carefully peeled the skin [off] [SLO: 0 - previdno sem olupil kožo ] c. predložna zveza z glagolnikom (Preposition with gerund object): Peter thought [about going home] [SLO: 0 - Peter je razmišljal o odhodu domov] d. predložna zveza z vprašalnim stavkom (Preposition governing a wh-interrogative clause): He taught me not to think [about where I had been and what I had done] [SLO: naučil me je, da ne razmišljam o tem, kje sem bil in kaj sem delal] 3.1.3 Vrste glagolskih zvez a. zveze z osebno glagolsko obliko (Finite Verb Phrasey: Who did she believe [had left]? [SLO: Za koga misli, da je odšel?] b. zveze z neosebno glagolsko obliko (Nonfinite Verb Phrase) i. z golim nedoločnikom (Bare Stem Verb Phrasey: We made him [go to the store again] [SLO: 0 - Prisilili smo ga, da je ponovno šel v trgovino] ii. z nedoločnikom (To-Marked Infinitive Verb Phrasey: What should she do [to test her hypothesis]? [SLO: 0 - Kaj bi morala storiti, če bi hotela preveriti hipotezo?] iii. z deležnikom/deležjem (Participial Verb Phrasey: The twist it included in the storyline had me [tickled] [SLO: 0 - Preobrat, ki ga je vsebovala zgodba, mi je ugajal] iv. z glagolnikom (Gerundive Verb Phrase): Visitors don't enjoy [filling out HTML forms] [SLO: 0 - Obiskovalci neradi izpolnjujejo obrazce vHTML-ju] 3.1.4 Vrste stavčnih zvez a. stavki z osebno glagolsko obliko (Finite Verb Phrase) i. z ali brez »that« (Finite Clause (with or without that)): Last night I learned [that surrealism isn't just a Salvador Dali thing]; [SLO: Sinoči sem spoznal, da nadrealizem ni samo Salvador Dali] ii. z vprašalnico »wh-« (Wh-Clause): Could you tell me [how the Hawaiian Islands formed]? [SLO: Mi lahko poveste, kako so nastali Havajski otoki] iii. z vprašalnico »if/whether« (Whether/if-Clause): She told the BBC she did not know [whether the man who survived 7.2 parts per thousand had set a world record] [SLO: 0 - BBC-jevcem je povedala, da ne ve, če je človeka, ki je preživel 7,2 promila v krvi, postavil svetovni rekord] b. stavki z neosebno glagolsko obliko (Nonfinite Verb Phrase) i. z glagolnikom (Gerundive Clause): My mom doesnt like [me being wiccan]! [SLO: 0 - Materi ni všeč, da sem pristaš wiccanstva] ii. z nedoločnikom (To-Marked Infinitive Verb Phrasey: I'd like [you to say hi to my sister]. [SLO: 0 - Rad bi, da moji sestri rečeš živjo] iii. s nedoločniško strukturo »for-to« (For-to-marked Clause): In 1937, a friend arranged [for Reagan to take a screen test] [SLO: 0 - Leta 1937je prijatelj Reaganu priskrbel poskusno snemanje] iv. z golim nedoločnikom (Bare Stem Clause): Deborah requests [that she be allowed to live in the nearby town]. [SLO: 0 - Deborah hoče dobiti dovoljenje, da bi lahko živela v bližnjem mestu] c. podredni stavki (s podrednim veznikom) (Subordinate Clause (with subordinating conjunction)): [Although Smithers credits Lightnin' Hopkins and Mississippi John Hurt as early influences], he says he's not really a bluesman in the classic sense. [SLO: Čeprav Smithers priznava zgodnji vpliv Lightnin' Hopkinsov in Mississippi Johna Hurta, pravi, da ni pravi bluzmen v klasičnem pomenu besede] 3.1.5 Vrste pridevniških zvez a. standardna pridevniška zveza (Standard Adjective Phrasey: Philip has [bright green] eyes; The light turned [red]. [SLO: Phillip ima svetle zelene oči; Svetloba je postala rdeča] b. nedokončana pridevniška zveza (Non-maximal Adjective): [economic] policy; [educational] excellence [SLO: ekonomska politika; odličnost v izobraževanju] 3.1.6 Prislovne zveze All items at [greatly] reduced prices!; I've been doing that all night and, [quite frankly], my jaw aches. [SLO: Vsi izdelki po zelo znižanih cenah!; to sem počel vso noč in odkrito povedano me boli čeljust] 3.1.7 Števniške zveze I have [two] bottles of correction fluid on the stand beside my favorite seat. [SLO: Na stojalu ob svojem najljubšem sedežu imam dve_ steklenici korekturne tekočine] 3.1.8 Premi govor [»Could his performance tonight make or break the campaign?«] exhaled John Gibson of Fox News Channel. [SLO: »Mar njegova drevišnjapredstava lahko reši ali uniči kampanjo,« je dahnil John Gibson s televizije Fox News Channel] Iz navedene liste je mogoče jasno videti, da je prvi cilj slovnične analize pripisati zgradbo predvsem posameznemu shemskemu elementu, nivoja stavka in besedne zveze sta namreč združena pod eno kategorijo: če v vlogi shemskega elementa nastopa stavčna struktura, ima s stališča analize to podobno vrednost, kot če bi se na tem mestu pojavila denimo samostalniška besedna zveza. Analiza na ravni besednozveznih struktur je sorazmerno rudimentarna in v precejšnji meri vezana na angleški jezik z revno morfologijo in trdnim stavčnim redom. To kažejo tudi slovnične kategorije, uporabljene pri projektih, ki ideje FrameNeta prenašajo na druge jezike, denimo španščino.10 Zdi se, da so kategorije v precejšnji meri odvisne tudi od slovničnega analizatorja (parser), ki je na voljo za stavčno analizo, in po vsej verjetnosti je enak potek mogoče predvideti tudi pri možni slovenski slovnični analizi po modelu FrameNet. Prim. . 10 3.2 Vrste skladenjskih funkcij Skladenjske funkcije pri projektu FrameNet opisujejo, kako sestavni deli besedila izpolnjujejo abstraktne skladenjske potrebe ciljne besede oz. leksikalne enote, kar jih v precejšnji meri približuje vezljivostnim kategorijam. Skladenjsko opredelitev dobijo le tiste enote, ki so opredeljene kot shemski elementi. FrameNetovske slovnične oznake ne opredeljujejo površinskih sintaktičnih mest posameznih elementov, temveč so, kot rečeno, nekakšen hibrid med stavčnimi členi in vezljivostnimi elementi. Tako je denimo v stavku Korito, ki ga boste pritrdili na ograjo, mora biti čvrsto in mora imeti močno dno, saj bo s spodnje strani slabo podprto. element »korito« površinsko gledano osebek, vendar bi bilo po sistemu FN opredeljeno z oznako »zunanje določilo« ciljne besede »pritrditi«, ker zapolnjuje vezljivostno mesto glagola »pritrditi« izven odvisnega stavka, kjer se pojavlja glagol. Shemo »pritrjevanja«, ki je skrita v tem stavku, je namreč mogoče parazfrazirati: (vi) boste pritrdili korito na ograjo. Čeprav ta element najpogosteje zavzema mesto osebka v stavku, so se zaradi podobnih situacij avtorji odločili za poimenovanje, ki ustreza njihovim potrebam. Pri shemskih elementih, kjer je izhodišče specifična besedna vrsta, se tako pojavljajo naslednje kategorije: 3.2.1 pri glagolih kot izhodiščnih shemskih elementih a. zunanje določilo (External Argument): [The physician] performed the surgery; [The doctor] tried to cure me.; They persuaded [the doctor] to treat me.; They gestured to [us] to leave.; [The physician's] decision to perform the surgery... [SLO: Kirurg je izvedel operacijo; Zdravnik me je skušal pozdraviti; Skušali so prepričati zdravnika, naj me zdravi; Namignili so nam, naj odidemo; Zdravnikova odločitev, da izvede operacijo ...] b. predmet (Object): Voters approved [the stadium measure]; [What] did you cook for dinner?; [Artichokes] are hard to eat; The boat weighs [12 tons]; My husband flew [United] last night and was served warm nuts as a snack. [SLO: Volilci so odobrili mere stadiona; Kaj si skuhal/a za večerjo?; Artičoke je težko jesti; Ladja tehta 12 ton; Moj mož je sinoči priletel z Unitedom in za malico so mu postregli s pogretimi oreški] c. odvisnik (Dependent) i. predložni (PP Dependents): I ordered a »steak« [in a St. Petersburg restaurant].; [In 1790], New York City was considered the largest city in the United States with a population of33000.; Bill sold the house [in order to finance a concert].; Give the gun [to the officer].; Pat spoke [to me]. [SLO: V neki peterburški restavraciji sem naročil »steak«; Leta 1790je s 33.000 prebivalci New York veljal za največje mesto v Združenih državah; Bill je prodal hišo, da bi financiral koncert; Daj pištolo policistu; Pat je govorila z mano] ii. samostalniški (NP Dependents): I run [ten miles] every day; Come [this way]!; I expect your papers [the moment you walk into class]. [SLO: Vsak danpretečem deset milj; Pridi sem; Vaše spise pričakujem takoj, ko bom stopil/a v razred] iii. glagolski in stavčni (Verbal and Clausal Complements): They want [to stay home].; I believe [thatyou are the winner].; They think [you are the president]. [SLO: Hočejo ostati doma; Mislim, da si ti zmagovalec; Mislijo, da si ti predsednik] 3.2.2 pri pridevnikih kot izhodiščnih shemskih elementih a. zunanje določilo {External Argument): [The chair] is red.; [My sister] seems more interesting than yours.; We consider [Pat] very intelligent.; The problem seems to affect [people] sensitive to primulas. [SLO: Stol je rdeč; Zdi se, da je moja sestra bolj zanimiva od tvoje; Menimo, da je Pat zelo inteligentna; Ta težava prizadene ljudi, ki so občutljivi na jeglič] b. jedrni samostalnik z atributivnim pridevnikom (Head noun modified by attributive adjective):: the small [children] [SLO: majhni otroci] c. odvisnik (Dependent): The [very] beautiful girl left the office.; Smithers is not aware [of his bad behavior]; Bilger is interested [in the footwear of the Yeti] [SLO: Tisto zelo lepo dekle je pustilo službo; Smithers se ne zaveda svojega slabega obnašanja; Bilgerja zanima jetijeva obutev] 3.2.3 pri samostalnikih kot izhodiščnih shemskih elementih a. zunanje določilo (External Argument): [He] made a statement to the press.; [I] took a bath for the first time in months.; [My] attempt at an agreement with Pat failed. [SLO: Podal je izjavo za tisk; Skopal sem se prvič po nekaj mesecih; moj poskus pobotanja s Pat je propadel.] b. svojilni prilastek (Genitive Determiner): [your] book; [your work's] influence on the field [SLO: tvoja knjiga; vpliv tvojega dela na tem področju] c. odvisnik (Dependent): the fact [that cats have fur]; our arrival [at the station]; [allergy] treatment; The letter was [to the President].; The attempt was [to scare you]. [SLO: dejstvo, da imajo mačke dlako; naš prihod na postajo; zdravljenje alergije; pismo je bilo namenjeno predsedniku; poskus je bil mišljen, da te prestraši] d. pristavek (Appositive): Actor Robert Downey Jr. will walk down the aisle next year with girlfriend [Susan Levin]. [SLO: Igralec Robert Downey mlajši se bo prihodnje leto poročil s svojim dekletom Susan Levin] 3.2.4 pri predlogih kot izhodiščnih shemskih elementih a. zunanje določilo (External Argument): [the day] before yesterday; [the trail] to our campsite [SLO: dan pred včerajšnjim; pot do našega prostora za kampiranje] b. predmet (Objecty: We had a glass of wine before [the meal].; Wash your hands before [returning to work]. [SLO: Pred obrokom smo spili kozarec vina; Preden se vrnete na delo, si umijte roke] 3.2.5 pri prislovih kot izhodiščnih shemskih elementih a. jedro (Head): [That's] quite honestly [a mistake on our part]. [SLO: Pošteno rečeno je to naša napaka] b. odvisnik (Dependent):: That's [quite] honestly a mistake on our part. [SLO: 0 - Pošteno rečeno je to naša napaka] Vidimo lahko, da so se avtorji omejili na osnovne skladenjske elemente, od katerih sta ostala (širše gledano) osebek in predmet, ter na skladenjske odnose predvsem jedrnosti in odvisnosti, kamor spada tudi skladenjsko odvisni pristavek. Tak pristop ni nepričakovan, saj FrameNet poskuša predvsem združiti pomensko in skladenjsko plat jezikovnih izrazov s pomočjo (glagolske) vezljivosti, zato se osredotoča na skladenjske elemente, ki izpostavljajo vezljivost, in zanemarja elemente, ki se lahko poljubno pojavljajo v skladenjskih strukturah. 3.3 Vezljivost Vezljivost pri posamezni leksikalni enoti je v FrameNetu izražena na treh stopnjah: kot vezljivostna skupina, vezljivostni vzorec in vezljivostni opis. Če vzamemo npr. primer leksikalne enote »pritrditi«, lahko idenficiramo naslednje vezljivostne skupine: 1. skupina 2. skupina 3. skupina 4. skupina shemski element VRŠILEC PREDMET CILJ VEZ besedna zveza sam. zv. sam. zv. predl. zv. (na) predl. zv. (s/z) skladenjska funkcija zun. dol. predmet odvisnik odvisnik V posameznih stolpcih se nahajajo vezljivostne skupine, ki skupaj tvorijo vezljivostni vzorec: [Vršilec/sam. zv/zun. dol.] »PRITRDITI« [Predmet/sam. zv/predmet] [Cilj/predl. zv. (na)/odvisnik] [Vez/predl. zv. (s/z)/odvisnik] Vezljivostni opis pa so vsi vezljivostni vzorci, ki jih obsega ena leksikalna enota (beseda v enem od svojih pomenov oz. v eni od pomenskih shem). 4 Elektronska baza podatkov FrameNet Kot je navedeno na začetku sestavka, je FrameNet primarno računalniški projekt, katerega rezultat je računalniška leksikalna baza podatkov, cel proces ustvarjanja baze pa je ravno tako v precejšnji meri avtomatiziran. Izhodišče je uravnoteženi referenčni korpus - v primeru projekta FrameNet je to British National Corpus, kar je zanimivo, saj projekt poteka v Združenih državah Amerike, kjer podobnega korpusa še nimajo.11 V prilagojenem programu za vnašanje podatkov v bazo FrameNet leksikograf po zgoraj opisanem postopku identificira pomensko shemo, v našem primeru 11 Glej . »fizično_povezati« in določi definicijo. V naslednjem oknu, kjer leksikograf določa shemske elemente, jih najprej določi, poda definicijo in jim določi status jedrnosti ali obrobnosti. Naslednji del postopka je določanje razmerij med pomenskimi shemami. Leksikograf izbere »nadshemo«, pod katero spada izbrana pomenska shema, in poveže med sabo shemske elemente, ki jih hierarhično nižja shema nasledi iz višje sheme. Ce ima denimo shema »namerno_povzročiti« naslednje elemente, obe shemi povezujejo trije jedrni in pet obrobnih elementov: namerno_povzročiti fizično_povezati DEJANJE VRŠILEC VRŠILEC PREDMET VEZ naCin naCin SREDSTVO SREDSTVO PREJEMNIK PREDMET MESTO MESTO NAMEN NAMEN RAZLOG Cas Cas Po vnosu pomenske sheme v bazo in določitvi njenih elementov in razmerij z drugimi elementi in shemami je potrebno določiti, katere leksikalne enote spadajo v opisano shemo. Ce si zamislimo vnos leksikalne enote »pritrditi«, ta v ustreznem oknu prejme informacijo o imenu, besedni vrsti, pomenu (slovarska definicija) ter oblikoslovni paradigmi. Temu postopku sledi iskanje po korpusu oz. izločanje podkorpusov za posamezno leksikalno enoto na podlagi izbrane okolice. Okno za izločanje podkorpusa ima tri glavne sestavne dele, kolokacijski, skladenjski ter del za predložne zveze. To pomeni, da lahko podkorpus sestavimo v kombinaciji na podlagi kolokatorjev, ki se pojavljajo v bližini iskane besede, skladenjskih informacij, ki so prisotne v korpusu na podlagi skladenjske analize (parsing), ter predložnih zvez z različnimi dopolnili, ki so opisana zgoraj. Iz podkorpusov, dobljenih na podlagi različnih iskalnih pogojev, leksikograf izloči zglede, ki bodo vključeni v bazo FrameNet. Za vsak vezljivostni vzorec vnese do pet zgledov, ki jim v naslednjem oknu pripiše informacijo na treh glavnih nivojih analize: shemski element, besednozvezno oznako ter skladenjsko funkcijo. Po končani analizi in vnosu v bazo je mogoče generirati različna »poročila«, od katerih so tipična tri: poročilo z zgledi, poročilo o leksikalni enoti ter poročilo o vezljivostnih vzorcih. 4.1 Poročilo z zgledi Element Vršilec Vez Cilj Predmet (1) [Škotski inženir Robert W. Thomson (Vršilec)] je prvi uspešno pritrdil [gumijasto oblogo (Predmet)] [na kolesa vozila (Cilj)]. (2) [Maja (Vršilec)] si je [note (Predmet)] pritrdila kar [na poševno streho bivalne hišice (Cilj)]. (3) [Najljubše recepte in druge koristne podatke (Predmet)] pritrdite [na notranjo stran vrat omar (Cilj)], tako da si jih lahko hitro ogledate. (4) [Pijavka (Vršilec)] [se (Predmet)] [z zadnjim priseskom (Vez)] pritrdi [na podlago (Cilj)] in se s prvim priseskom dvigne od podlage. 4.2 Poročilo o leksikalni enoti Leksikalna enota: pritrditi Shema: fizično_povezati Definicija: namestiti kaj trdno na določenem mestu, v določenem položaju. Shemski elementi in njihove skladenjske realizacije Element Število označenih Realizacije Vršilec (3) SDNP12 (1) sam. zv / zun. dol.(3) Vez (1) predl. zv. [s/z] / odv. (1) Cilj (4) predl. zv. [na] / odv. (4) Predmet (4) sam. zv. / predm. (4) 4.3 Poročilo o vezljivostnih vzorcih Število označenih Vzorci 2 Vršilec Predmet Cilj (2) sam. zv sam. zv. predl. zv. [na] zun. dol. predm. odv. 1 Predmet Cilj (1) sam. zv. predm. predl. zv. [na] odv. 1 Vršilec Predmet Vez Cilj (1) sam. zv sam. zv. predl. zv. [s/z] predl. zv. [na] zun. dol. predm. odv. odv. 12 »Strukturno dopuščena ničta pojavitev« (SDNP) - (Constructionally-licensedNull Instantiation ali Constructional Null Instatiation). 5 Zaključek Največja prednost ideje FrameNetaj e gotovo v povezovanju pomenske in skladenjske jezikovne ravni po relativno strogo določeni metodologiji. Pri tem je zelo pomembno, da je izhodišče vedno jezikovna realnost, ne pa abstrakten jezikovni sistem, kar idejo eksplicitno oddaljuje od tistih jezikoslovnih interpretacij, ki skušajo najti strogo ločnico med jezikom kot sistemom in jezikom kot diskurzom. Po drugi strani se s tem približa interpretacijam, ki poudarjajo funkcijsko plat jezika in menijo, da brez upoštevanja pomenske plati jezikovnih izrazov ni mogoče interpretirati. Druga prednost FrameNeta je v uspešnem izkoriščanju avtomatiziranih postopkov za analizo velikih zbirk besedil, ki so vsaj glede kolokacijskih razmerij in skladenjske analize za angleščino že zelo razviti. Ob tem je potrebno pripomniti, da je FrameNet zaradi svoje narave najbolj uspešen pri interpretaciji polnopomenskih besed, manj pa pri jezikovnih elementih, ki nosijo manj leksikalnega ter več skladenjskega pomena: funkcijske besedne vrste, pomensko izpraznjeni glagoli ipd. Poleg tega se zdi, da ravno okvir najbolj računalniško obdelane angleščine v precejšnji meri utesnjuje prenosljivost idej projekta na druge jezike, saj brez računalniških jezikovnih orodij, ki so na voljo za angleški jezik, prenos niti ni smiseln. Poleg tega bi bila potrebna precejšnja revizija slovničnih kategorij, ki bi bile primernejše denimo za slovenski jezik. Podoben cilj -računalniško leksikalno bazo z združenimi semantično-skladenjsko-vezljivostnimi informacijami - pa si je vendarle mogoče vsaj zamisliti tudi za slovenščino. Literatura Atkins, Beryl T. S, Fillmore, Charles J., in Heid, Ulrich, 1995: Lexicographical Relevance in Corpus Evidence, Deliverable D-IX-2 of DELIS Project (LRE 61.034). Atkins, Sue, Fillmore, Charles J., in Johnson, Christopher R., 2003: Lexicographic Relevance: Selecting Information From Corpus Evidence. International Journal of Lexicography 16/3. 251-280. Atkins, Sue, Rundell, Michael, in Sato, Hiroaki, 2003: The Contribution of Framenet to Practical Lexicography. International Journal of Lexicography 16/3. 333-357. Baker, Collin F., Fillmore, Charles J., in Cronin, Beau, 2003: The Structure of the Framenet Database. International Journal of Lexicography 16/3. 281-296. Fillmore, Charles J., Beryl T., in Atkins, Sue, 1992: Towards a frame-based organization of the lexicon: the semantics of RISK and its neighbors. Lehrer, Adrienne, in Kittay, Eva Feder (ur.): Frames, Fields, and Contrasts. Hillsdale, New Jersey: Lawrence Erlbaum Associates. 75-102. Fillmore, Charles J., Johnson, Christopher R., in Petruck, Miriam R. L., 2003: Background to Framenet. International Journal of Lexicography 16/3. 235-250. Fillmore, Charles J., Petruck, Miriam R. L., Ruppenhofer, Josef, in Wright, Abby, 2003: Framenet in Action: The Case of Attaching. International Journal of Lexicography 16/3. 297-332. Fillmore, Charles J., 1968: The case for case. Bach in Harms (ur.): Universals in Linguistic Theory. New York: Holt, Rinehart and Winston. 1-88. Lönneker-Rodman, Birte, 2007a: Multilinguality and FrameNet. ICSI Technical Report TR-07-001, International Computer Science Institute, Berkeley, CA. Lönneker-Rodman, Birte 2007b: Beyond Syntactic Valence: FrameNet Markup of Example Sentences in a Slovenian-German Online Dictionary. Levicka, Jana, in Garab^k, Radovan (ur.): Slovko 2007. Computer Treatment of Slavic and East European Languages. Proceedings of the Fourth International Seminar. Bratislava, Slovakia, 25-27 October 2007. Tribun, Bratislava. 152-164. Lönneker-Rodman, Birte, Baker, Collin, in Hong, Jisup, 2008: The new FrameNet Desktop: A Usage Scenario for Slovenian. Proceedings of ICGL 2008, the First International Conference on Global Interoperability for Language Resources, 9-11 January 2008. Hong Kong. 147-154. Perko, Gregor, 2004: Razločevanje prevodnih ustreznic v dvojezičnem uvezovalnem slovarju: (predlogiza slovensko-francoskislovar). Doktorska disertacija. Mentorja: Vladimir Pogačnik in Dušan Gabrovšek. Ljubljana: Filozofska fakulteta (neobjavljeno). Žele, Andreja, 2001: Vezljivost v slovenskem jeziku. Ljubljana, ZRC SAZU. Žele, Andreja, 2008: Vezljivostni slovar slovenskih glagolov. Ljubljana: Založba ZRC, ZRC SAZU. CD-ROM. Spletni naslovi FrameNet: . FidaPlus: . WordNet: - angleški: . - slovenski: .