Oznaka poročila: ARRS-RPROJ-ZP-2015/191 H^^lll mm ZAKLJUČNO POROČILO RAZISKOVALNEGA PROJEKTA A. PODATKI O RAZISKOVALNEM PROJEKTU 1.Osnovni podatki o raziskovalnem projektu Šifra projekta J6-4081 Naslov projekta Korpus in pilotna slovnica slovenskega znakovnega jezika Vodja projekta 20453 Špela Vintar Tip projekta J Temeljni projekt Obseg raziskovalnih ur 8427 Cenovni razred B Trajanje projekta 07.2011 - 06.2014 Nosilna raziskovalna organizacija 581 Univerza v Ljubljani, Filozofska fakulteta Raziskovalne organizacije -soizvajalke r.a Znanstvenoraziskovalni center Slovenske akademije 618 znanosti in umetnosti Raziskovalno področje po šifrantu ARRS 6 HUMANISTIKA 6.05 Jezikoslovje 6.05.02 Teoretično in uporabno jezikoslovje Družbenoekonomski cilj 10 Kultura, rekreacija, religija in sredstva javnega . obveščanja Raziskovalno področje po šifrantu FOS 6 Humanistične vede 6.02 Jeziki in književnost B. REZULTATI IN DOSEŽKI RAZISKOVALNEGA PROJEKTA 2.Povzetek raziskovalnega projekta1 SLO Projekt si je na začetku zastavil tri cilje: - zgraditi reprezentativni označeni korpus slovenskega znakovnega jezika (SZJ), - zgraditi pilotno slovnico SZJ in - ustvariti javno dostopen vir za nadaljnje raziskave SZJ. V triletnem projektu smo zbrali vzorce SZJ s posnetki 80 gluhih oseb z vse Slovenije. Pri zibranju gradiva smo navezali stike z regionalnimi društvi in Zvezo društev gluhih in naglušnih Slovenije. Vse posnetke smo ročno označili z več ravnmi: segmentacija na posamezne kretnje (tokenizacija), označevanje s pomenskimi glosi (lematizacija), označevanje sestavljenih kretenj, pripis oznake HamNoSys, pripis ustne artikulacije, kontekstni pomen v slovenščini, segmentacija na izjave. V postopku označevanja je nastala leksikalna baza, ki obsega približno 3.000 različnih kretenj. Skupna velikost korpusa je 33.000 kretenj. V zadnji fazi projekta je bil razvit korpusni iskalnik, prek katerega je mogoče preiskovati posamezne kretnje v kontekstu, pregledovati metapodatke in si ogledati prikaz kretnje z animiranim agentom. Korpus SIGNOR predstavlja prvi korpusni vir za SZJ in bo omogočal nova empirično utemeljena spoznanja o SZJ, obenem pa lahko služi kot osnova novim jezikovnim priročnikom za SZJ. ANG_ The objectives of the project were threefold: . Compile a representative annotated corpus of Slovene Sign Language (SZJ), - Build a Pilot Grammar of SZJ and - Create a publicly available resource for future explorations of SZJ. The project duration was three years and in this period we collected samples of SZJ from 80 Deaf speakers from all Slovenian regions. Data collection was facilitated by regional Deaf Clubs and the Slovenian Association of Deaf Clubs (ZDGNS). Once the recordings were collected we performed manual annotation of several layers: segmentation to individual signs (tokenisation), assigning unique glosses (lemmatisation), marking compund signs, adding the HamNoSys transcription, mouthing and contextual meaning, and finally segmentation to utterances. Through the process of annotation we built the lexical database of SZJ containing over 3,000 signs (types). The full size of the corpus is 33,000 tokens. The last stage of the project included the development of a web-based corpus query tool which allows users to search for signs in context, query metadata and view the sign as demonstrated by an animated agent. The SIGNOR corpus represents the first such resource for SZJ and will serve as the source of new empirical research findings about SZJ, while at the same time paving the way for better teaching aids and other reference works for SZJ. 3.Poročilo o realizaciji predloženega programa dela na raziskovalnem projektu2 1. Potek raziskovanja Pri razumevanju pričujočega raziskovalnega projekta je pomembno vedeti, da je gradnja korpusa znakovnega jezika neprimerno bolj kompleksen cilj od gradnje korpusov pisnih ali govorjenih besedil, saj je znakovni jezik mogoče zajeti le z videoposnetkom, ki ga je nato mogoče zgolj ročno jezikoslovno označiti; samodejne metode označevanja namreč ne obstajajo. Prav tako je pomembno razumeti, da so tovrstni korpusi redkost tudi v tujini - znani so nam le štirje sorodni projekti, od katerih pa niti eden ne ponuja prosto dostopnega korpusa na internetu, niti ni splošno sprejetih standardov za označevanje. Pri gradnji korpusa SIGNOR smo morali zato vseskozi razreševati jezikoslovne dileme in iskati strokovno utemeljene rešitve, bodisi z razpravo v okviru raziskovalne skupine, še največkrat pa skozi posvetovanje s tujimi raziskovalci. 1.1 Gradnja korpusa Na začetku projekta smo oblikovali zasnovo korpusa, ki je zagotavljala reprezentativnost in relativno uravnoteženost glede na regijo, spol, starost in stopnjo izobrazbe. Zasnovali smo strukturo snemalnih seans, zbrali gradiva za elicitacijo in usposobili snemalno ekipo, ki je bila sestavljena iz dveh gluhih študentk. Oblikovali smo tudi obrazec za zbiranje podatkov o informantih in izjavo o sodelovanju, s katero so nam informanti dovolili uporabo posnetkov v raziskovalne namene. Snemanja so večinoma potekala v prostorih lokalnih društev, v nekaj primerih tudi na domu informanta. Snemanje dijakov Zavoda za gluhe in naglušne je potekalo v šolskih prostotih, pri čemer je bilo v ta namen pridobljeno dovoljenje ravnateljice in pisna dovoljenja vseh staršev dijakov. Vsaka nsemalna seansa je bila sestavljena iz treh delov: • spontano kretanje o sebi; spraševalka prosi informanta, da se predstavi, spregovori o sebi, družini, poklicu, o svoji gluhoti, šolanju itd. • kretanje po video predlogi s splošno vsebino; spraševalka informantu pokaže kratek video, ki ga informant nato povzame ali komentira, • kretanje po video predlogi s specializirano vsebino ali prosto kretanje na specializirano temo po izboru informanta. 1.2 Označevanje korpusa Pri zasnovi označevalne sheme smo se opirali na izkušnje nemškega projekta DGS, saj je večino opažanj, ki jih je hamburška skupina zabeležila za nemški znakovni jezik, moč prenesti na analizo slovenskega znakovnega jezika. Za označevanje posnetkov smo uporabljali orodje iLex. Označevalna shema SIGNOR tako zajema naslednje ravni označevanja: • Segmentacija oziroma tokenizacija. Tu se tok pripovedi v kretnjah razdeli na posamezne kretnje, ki se v programu iLex zabeležijo kot časovni intervali v določenem posnetku. • Pripisovanje pomenskih oznak (glos) oziroma lematizacija. Vsaki kretnji v SZJ je dodeljena edinstvena pomenska oznaka (npr. MAMA1), ki ima točno določeno obliko in ki se navezuje na točno določen pojem. • Oblika ust. Pogosto je razumevanje določene kretnje tesno povezano z obliko ust, ki lahko posnema določeno besedo ali njen začetek ali na drug način usmeri sogovornika proti pravemu pomenu. • Transkripcija kretnje v zapis HamNoSys. HamNoSys je poseben način zapisovanja kretenj, pri katerem s posebnimi znaki zapišemo obliko, položaj in gibanje rok. • Pomen. Vsaka kretnja kot določeni leksem ima enega ali več ustaljenih (slovarskih) pomenov, ki so vnešeni v pomensko bazo. • Sestavljeni pomen. Na vseh prejšnjih ravneh se sestavljene kretnje označujejo po posameznih delih. Šele na tej ravni označimo pomen, ki nastane iz kombinacije več kretenj; npr. DELATI1 + ŽENSKA1 = delavka • Segmentacija na izjave. Ker kretano besedilo ne vsebuje ločil, je za segmentacijo na posamezne izjave potrebno uporabiti strukturne in vsebinske indikatorje. Ko je bila prva faza označevanja končana, se je pokazalo mnogo neskladij, hkrati pa je ostalo še precej vprašanj v zvezi z označevalnimi dilemami nerazrešenih. V drugi fazi je bilo zato izvedeno ponovno ročno preverjanje oznak in popravljanje napačno označenih kretenj. Predvsem so bile poenotene oznake za sestavljene kretnje in variacije, ki predstavljajo skoraj četrtino vseh oznak v korpusu. Vzporedno s tem je bila izvedena segmentacija na izjave, vendar ne za celoten korpus - trenutno je obseg označenih izjav 3.000. To je bil še posebej zahteven korak, saj zanj skoraj ne obstajajo vzorčni primeri iz tujine. Kljub temu smo na podlagi strokovne literature in vzporednic z govorjenimi besedili oblikovali označevalna načela, ki smo jih nato preskusili na vzorcu posnetkov treh oseb. Pokazale so se številne razlike med označevalci, zato smo načela posodobili in uskladili. Končno število označenih izjav bi po naši oceni zadoščalo za raziskave skladenjske strukture SZJ, česar v pričujočem projektu še nismo uspeli uresničiti. 1.3 Razvoj informacijske infrastrukture za korpus SZJ Že na začetku gradnje smo izbrali zmogljivo strežniško rešitev programske aplikacije iLex, ki omogoča označevanje ob prikazu videoposnetkov, pri čemer se vsi projektni podatki shranjujejo na strežnik, označevanje pa lahko izvaja več označevalcev vzporedno prek odjemalske aplikacije. Poleg tega okolje iLex samodejno ustvarja leksikalno bazo, ki bi lahko služila kot osnova za slovar. V zadnjem projektnem obdobju je bil povsem na novo razvit iskalnik po transkribiranem delu korpusa, ki prikaže konkordančni niz s kontekstom, pogostost iskane kretnje ter iz nje izhajajočih sestavljenih kretenj, metapodatke za vsakega informanta, obliko kretnje pa si je mogoče ogledati tudi z animiranim agentom. 2. Glavni rezultati Najpomembnejši rezultat projekta je korpus SIGNOR, prvi reprezentativni ročno označeni korpus SZJ v obsegu 33.000 pojavnic, ki je v transkribirani obliki prosto dostopen prek spletnega iskalnika. Pomemben stranski rezultat korpusa je tudi leksikalna baza SZJ, ki obsega okrog 3.000 različnih kretenj s pomenskimi oznakami in zapisom HamNoSys. Nadalje je pomemben rezultat javno osveščanje o SZJ, gluhi skupnosti in pomenu projekta. Projekt smo predstavili na treh mednarodnih konferencah, v dveh televizijskih oddajah, eni radijski oddaji, na strokovnem srečanju Gluhi v Ljubljani in na projektni spletni strani, ki se redno vzdržuje in je bila zadnjič temeljito posodobljena februarja 2015. V načrtu so še druge predstavitve rezultatov projekta: na mednarodni konferenci o označevanju korpusov znakovnih jezikov v Londonu 30. marca 2015 in na Lingvističnem krožku jeseni 2015. Pomemben rezultat projekta je tudi korpusna leksikalna analiza SZJ, ki je objavljena v ugledni mednarodni reviji Sign Language Studies 15:2. 3. Sodelovanje s tujimi partnerji Ves čas trajanja projekta je potekalo tesno sodelovanje z raziskovalci hamburške univerze, kjer se gradi obzežen korpus DGS. Na začetku projekta je Ljubljano obiskal prof. dr. Thomas Hanke, ki je predstavil potek gradnje nemškega korpusa DGS, v nadaljevanju projekta pa je komunikacija potekala po elektronski pošti. V zadnjem času je intenzivno sodelovanje z mednarodno skupino za vzpostavitev označevalnih načel, v sklopu tega sodelovanja bo projekt predstavljen tudi na že omenjeni delavnici v Londonu. 4.Ocena stopnje realizacije programa dela na raziskovalnem projektu in zastavljenih raziskovalnih ciljev3 Glede na zastavljene cilje in kompleksnost raziskovalne naloge ocenjujem, da je bila realizacija uspešna in da je projekt dosegel večino zastavljenih ciljev. Korpus SIGNOR je končan in ročno označen, izvedene so številne jezikoslovne analize, ustvarjeni vir je dostopen za nadaljnje raziskave, rezultati projekta pa so bili delno že uporabljeni pri gradnji spletnega slovarja SZJ, ki nastaja v okviru Zveze društev gluhih in naglušnih Slovenije. Projekt ni uspel izpolniti cilja gradnje pilotne slovnice SZJ, kar utemeljujemo s pomanjkljivim sodelovanjem projektnega partnerja ZRC SAZU. Projektni partner ZRC SAZU je bil pri projektu udeležen v obsegu 700 raziskovalnih ur letno, njihovo sodelovanje pa je bilo predvideno predvsem v fazi analize skladenjske strukture. Ker se je gradnja samega korpusa nekoliko podaljšala, predvsem pa se je podaljšala faza označevanja, bi se z gradnjo pilotne slovnice lahko pričeli ukvarjati šele proti koncu projekta, vendar pa raziskovalna skupina ZRC SAZU žal ni izkazovala potrebnega interesa niti jezikovnih kompetenc (znanja SZJ), da bi lahko k projektu karkoli doprinesla. Kljub temu, da pilotne slovnice nismo zgradili, pa smo uspeli ustvariti vir, ki bo k njeni morebitni izdelavi v prihodnosti lahko zelo veliko doprinesel - označenih 3.000 izjav je namreč dobra osnova za analizo tipičnih skladenjskih struktur. 5.Utemeljitev morebitnih sprememb programa raziskovalnega projekta oziroma sprememb, povečanja ali zmanjšanja sestave projektne skupine4 Projekt je zaključen, tako da ni sprememb. 6.Najpomembnejši znanstveni rezultati projektne skupine5 Znanstveni dosežek 1. COBISS ID 111111 Vir: vpis v poročilo Naslov SLO Vintar, Špela (2015): Leksikalne značilnosti SZJ: korpusna raziskava. ANG Vintar, Špela (2015): Lexical Properties of Slovene Sign Language: A Corpus-Based Study Slovenski znakovni jezik (SZJ) je z jezikoslovnega stališča doslej dobil razmeroma malo pozornosti. Članek predstavlja osnovna dejstva o SZJ, pregled zgodovine in trenutnega stanja, nato pa opišemo projekt Korpusa Opis SLO SZJ (SIGNOR), v okviru katerega je bil zgrajen in označen prvi reprezentativni korpus SZJ. V prispevku predstavimo tudi izbrane kvantitativne podatke iz korpusa, razpravljamo o leksikalnih in semantičnih značilnostih SZJ, pa tudi o specifični vlogi mašil in gest. Empirične podatke primerjamo s korpusnimi raziskavami, ki so bile izvedene za britanski znakovni jezik (BSL) in avstralski Auslan. V zaključku navedeno načrte za nadaljnje delo in izhodišča za izrabo korpusa za boljše priročnike in nove tehnologije. ANG Slovene Sign Language (SZJ) has as yet received little attention from linguists. This article presents some basic facts about SZJ, its history, current status, and a description of the Slovene Sign Language Corpus and Pilot Grammar (SIGNOR) project, which compiled and annotated a representative corpus of SZJ. Finally, selected quantitative data extracted from the corpus are presented. The article discusses certain lexical and semantic properties of SZJ, for example, the role of fillers and gestures. Figures are compared to related works, particularly corpus-based studies of British Sign Language (BSL) and Auslan. The article concludes by outlining plans for future research and ways in which the present corpus could improve basic reference works for SZJ and serve as a basis for new technologies. Objavljeno v Sign Language Studies 15:2, str. 103-224. (v tisku) Tipologija 1.01 Izvirni znanstveni članek 2. COBISS ID 51469154 Vir: COBISS.SI Naslov SLO Vintar, Š., Jerko, B., Kulovec, M jezika . (2012): Korpus slovenskega znakovnega ANG Vintar, Š., Jerko, B., Kulovec, M (SZJ) . (2012): Corpus of Slovene Sign Language Opis SLO Prispevek opisuje metodološke razmisleke in načela pri gradnji korpusa slovenskega znakovnega jezika SIGNOR. ANG The paper describes the methodology and theoretical guidelines for the compilation of the first Slovene corpus of Slovene Sign Language SIGNOR. Objavljeno v Institut Jožef Stefan; Zbornik Osme konference Jezikovne tehnologije, 8. do 12. oktober 2012, [Ljubljana, Slovenia]; 2012; Str. 203-206; Avtorji / Authors: Vintar Špela, Jerko Boštjan, Kulovec Marjetka Tipologija 1.08 Objavljeni znanstveni prispevek na konferenci 3. COBISS ID 55706210 Vir: COBISS.SI Naslov SLO Prvi leksikalni podatki o slovenskem znakovnem jeziku iz korpusa Signor ANG First corpus-based lexical analyses of the Slovene Sign Language Opis SLO O leksikalnih in slovničnih lastnostih slovenskega znakovnega jezika (SZJ) je bilo do nedavnega mogoče pisati zgolj na podlagi domnev in posamičnih opažanj. Prispevek predstavlja rezultate leksikalne analize, ki je bila izvedena s pomočjo korpusa Signor, prvega reprezentativnega korpusa SZJ. Po predstavitvi osnovnih korpusnih statistik se v prispevku posvetimo izbranim leksikalnosemantičnim elementom SZJ, med drugim tudi vlogi mašil in gest. Opažene pogostosti primerjamo s podatki, pridobljenimi v sorodnih raziskavah v tujini, predvsem za britanski BSL in avstralski Auslan. V zaključku razpravljamo o nadaljnjih raziskavah in možnostih uporabe korpusa Signor za posodobitev jezikovnih priročnikov in razvoj jezikovnih tehnologij. The lexical and grammatical properties of Slovene Sign Language (SZJ) have so far only been described on the basis of isolated observations or presumptions. This paper presents the results of a lexical analysis performed on the Signor corpus, the first representative corpus of SZJ. ANG After presenting general corpus statistics we discuss selected lexical and semantic properties of SZJ, for example the role of fillers and gestures. The figures obtained are compared to related works, in particular corpus-based studies performed for BSL and Auslan. The paper concludes by outlining our plans for future research and the ways in which our corpus could help improve basic reference works for SZJ as well as serve as a basis of new technologies. Objavljeno v Institut Jožef Stefan; Jezikovne tehnologije; 2014; Str. 163-168; Avtorji / Authors: Vintar Špela, Jerko Boštjan, Kulovec Marjetka Tipologija 1.08 Objavljeni znanstveni prispevek na konferenci 4. COBISS ID 49680738 Vir: COBISS.SI Naslov SLO Gradnja korpusa SZJ ANG Compiling the Slovene sign language corpus Opis SLO Poročamo o projektu gradnje prvega korpusa slovenskega znakovnega jezika SIGNOR. Prispevek opisuje postopke zbiranja podatkov, odločitve glede izbora informantov in načrte za transkripcijo in označevanje. Opišemo tudi posebnosti slovenske situacije, še posebej visoko variabilnost v jeziku, vprašanja glede jezikovne kompetence ter težave v zvezi z odnosom gluhe skupnosti do tovrstnih raziskav. V času pisanja prispevka je zbiranje posnetkov skoraj zaključeno in obsega skoraj 70 oseb, označevanje v programu iLex pa je v polnem teku. Namen projekta je izraba korpusa zaraziskovanje slovničnih lastnosti SZJ. ANG We report on the project of compiling the first corpus of the Slovene Sign Language. The paper describes the procedures of data collection, the decisionsregarding informant selection and plans for transcription and annotation. We outline the particularities of the Slovene situation, especially the high variability of the language, issues concerning language competence and the attitutes of the deaf community towards such data collection. At the time of writing, the data collection stage is nearly finished with over 70 recorded persons, and trancriptions with iLex are underway. The aim of the project is to use the corpus for explorations into the grammatical properties of SSL. Objavljeno v ELRA; LREC 2012; 2012; Str. 159-162; Avtorji / Authors: Vintar Špela, Jerko Boštjan, Kulovec Marjetka Tipologija 1.08 Objavljeni znanstveni prispevek na konferenci 5. COBISS ID 1111 Vir: vpis v poročilo Naslov SLO Korpus slovenskega znakovnega jezika SIGNOR ANG Slovene Sign Language Corpus SIGNOR Opis SLO Zaključena in ročno označena podatkovna zbirka, ki obsega 33.000 pojavnic in je bila ustvarjena na podlagi posnetkov 80 oseb z vse Slovenije. ANG A complete manually annotated collection of text samples containing 33,000 gloss tokens and was compiled from recordings of 80 persons from all Slovene regions. Objavljeno v http://lojze.lugos.si/signor/index.html Tipologija 2.20 Zaključena znanstvena zbirka podatkov ali korpus 7.Najpomembnejši družbeno-ekonomski rezultati projektne skupine6 Družbeno-ekonomski dosežek 1. COBISS ID i 25706241 Vir: vpis v poročilo Naslov SLO Jerko, B., Vintar, Š., Kulovec, M znakovnega jezika. . (2011) Korpus in slovnica slovenskega ANG Jerko, B., Vintar, Š., Kulovec, M Sign Language. . (2011) Corpus and grammar of slovene Opis SLO Prispevek na poljuden način opisuje projekt gradnje korpusa SZJ in utemeljuje potrebo po raziskavah. ANG The article describes the project of building the Corpus of Slovene Sign Language and justifies the need for linguistic research in this field. Šifra F.18 Posredovanje novih znanj neposrednim uporabnikom (seminarji, forumi, konference) Objavljeno v Iz sveta tišine, Letnik XXXII, št. 11 / november 2011, str. 9-10. Tipologija 1.04 Strokovni članek 2. COBISS ID Vir: vpis v poročilo Naslov SLO Korpus slovenskega znakovnega jezika, Oddaja RTVSLO Prisluhnimo tišini, 14. april 2013. ANG Corpus of Slovene Sign Language, Broadcast RTVSLO "Listen to Silence", 14 April 2013. Opis SLO V televizijski oddaji, ki je bila posneta na različnih lokacijah izvajanja projekta, raziskovalci in sodelavci projekta prikažemo potek dela in cilje raziskav. ANG The television broadcast which was recorded at various locations of project activities researchers demonstrate the goals and expected results of the project. Šifra F.29 Prispevek k razvoju nacionalne kulturne identitete Objavljeno v http://ava.rtvslo.si/predvajaj/korpus-tolmacenje-dnevnika-in-anketa/ava2.163812560/ Tipologija 2.19 Radijska ali televizijska oddaja 3. COBISS ID Vir: vpis v poročilo Naslov SLO Vintar, Špela; Čobec, Aleksander. Znakovni jezik, radijska oddaja Jezikovni pogovori. ANG Vintar, Špela; Čobec, Aleksander. Sign language, radio broadcast Language discussions. Opis SLO V radijski oddaji so bili predstavljeni problemi slovenske gluhe skupnosti in pomen projekta gradnje korpusa SZJ SIGNOR. ANG The radio show presented the problems of the Slovene deaf community and the significance of the Slovene Sign Language Corpus SIGNOR. Šifra F.29 Prispevek k razvoju nacionalne kulturne identitete Objavljeno v Radio Slovenija, 3. program, 10. februar 2015 od 18.00 do 18.21.http://4d.rtvslo.si/arhiv/jezikovni-pogovori/174319062 Tipologija 2.19 Radijska ali televizijska oddaja 4. COBISS ID Vir: vpis v poročilo Naslov SLO Jerko, B. in Vintar, Š. (2015) Označevalna shema SIGNOR. ANG Jerko, B. in Vintar, Š. (2015) SIGNOR Annotation Guidelines. Opis SLO Predstavitev označevalne sheme pri projektu SIGNOR na mednarodnem srečanju Digging into Signs, London, Velika Britanija, 30.-31. marec 2015. ANG Presentation of the SIGNOR annotation guidelines at the Digging into Signs Workshop, London, Great Britain, 30-31 March 2015. Šifra B.03 Referat na mednarodni znanstveni konferenci Objavljeno v http://www.bslcorpusproject.org/events/digging-workshop/ Tipologija 1.03 Kratki znanstveni prispevek 8.Drugi pomembni rezultati projetne skupine7 Poleg korpusa SIGNOR so med projektom nastali drugi rezultati, ki bodo lahko predstavljali pomembno osnovo za nadaljnje raziskave: - leksikalna baza SZJ Podatkovna baza kretenj iz korpusa SIGNOR predstavlja inventar opisanih kretenj SZJ in bo lahko služila kot vir za novi korpusno utemeljeni slovar SZJ. - korpusni iskalnik Korpusni iskalnik po transkribirani različici korpusa je inovativen način dostopanja do korpusa, kakršnega tudi v tujih projektih še nismo zasledili. Iskalnik poleg prikaza iskane kretnje s kontekstom omogoča tudi prikaz kretnje z animiranim agentom. Lahko se uporablja tudi kot pedagoški pripomoček. - ozaveščanje javnosti o statusu gluhe skupnosti in značilnostih slovenskega znakovnega jezika Projektna skupina je projekt predstavila v dveh televizijskih oddajah, eni radijski oddaji in na številnih drugih srečanjih: predsednikom društev v sklopu ZDGNS, raziskovalcem na Filozofski fakulteti UL, udeležencem delavnice Gluhi v Ljubljani in nekoč, dijakom Zavoda za gluhe in naglušne Ljubljana itd. Predstavitve smo ciljno usmerjali ne le v jezikoslovne kroge, temveč tudi v splošno javnost in različne organe gluhe skupnosti. S tem smo pomembno prispevali k zavedanju pomena SZJ za slovensko kulturno identiteto. 9.Pomen raziskovalnih rezultatov projektne skupine8 9.1.Pomen za razvoj znanosti9 SLO_ Projekt je pomemben mejnik v raziskovanju SZJ, saj so bile jezikoslovne raziskave SZJ doslej maloštevilne, predvsem pa niso resnično vključevale gluhe skupnosti. Raziskovalna skupina pričujočega projekta je poleg vodje vključevala dva raziskovalca, Boštjana Jerka in Marjetko Kulovec, prvi je otrok gluhih staršev in tolmač, druga pa od rojstva gluha učiteljica SZJ. Snemalna ekipa je bila prav tako sestavljena iz dveh gluhih študentk. Vključenost gluhih je bila za uspeh projekta ključna, saj si v nasprotnem primeru ne bi mogli pridobiti zaupanja gluhih informantov. Korpus SIGNOR nam zdaj ponuja odgovore na številna vprašanja: razširjenost posameznih kretenj in njihovih različic v določeni regiji ali starostni skupini, pojavnost novih kretenj, ki se razvijajo predvsem v izobraževalnem okolju, rabo mašil, artikulacije in gestikulacije; tipične skladenjske strukture ipd. Posnetki skupaj z večplastnimi oznakami so obdelani v strežniškem okolju iLex in prek tega tudi dostopni. Za laične uporabnike in širšo javnost smo razvili tudi spletni pregledovalnik, ki zaenkrat zaradi varstva osebnih podatkov ne omogoča prikaza posnetka osebe, omogoča pa pregledovanje transkripcij in metapodatkov ter prikaz kretnje z animiranim agentom. Doslej objavljeni rezultati empiričnih raziskav leksike SZJ kažejo, da se SZJ po temeljnih pogostnostih značilnostih ne razlikuje bistveno od drugih znakovnih jezikov po svetu. Projektni rezultati tako omogočajo domačim in tujim jezikoslovcem, učiteljem in tolmačem dostop do empiričnih podatkov o SZJ, za gluho skupnost pa predstavljajo pomemben dokument o podobi njihovega jezika. ANG_ The project represents an important milestone in the research of SZJ, especially because prior linguistic studies of SZJ were scarce and, more importantly, failed to include researchers from the Deaf community. The research team of this project included apart from the leader two researchers, Boštjan Jerko and Marjetka Kulovec, the former a child of Deaf parents and interpreter, and the latter a Deaf teacher of SZJ. The mobile recording team consisted of two Deaf students. The inclusion of the Deaf community was crucial for the success of this project because the trust of the Deaf informants could not have been gained otherwise. The SIGNOR corpus now offers answers to numerous questions: the use patterns of individual signs and their variants across regions or age groups, the frequency and distribution of new signs which appear particularly within the educational environment, the use of fillers, mouthing and gestures, typical syntactic structures and many more. The recordings are annotated on multiple layers and accessible through the iLex server environment. For lay users and the general audience we also developed a web-based corpus query system which currently does not display the recordings themselves for reasons of data protection, however gives access to transcriptions and metadata as well as displays signs via an animated agent. The published research results of the lexical properties of SZJ show that the basic frequency characteristics of SZJ comply with those found for other sign languages in the world. The project results allow Slovene and foreign linguists, teachers and interpreters to access empirical data about SZJ, while the Deaf community gained an important resource documenting the use of their language. 9.2. Pomen za razvoj Slovenije10 SLO_ Rezultati projekta bodo pomembno vplivali na razvoj Slovenije v naslednjih segmentih: - z različnimi že doslej izvedenimi javnimi predstavitvami projekta se dviga ozaveščenost o pomenu SZJ za kulturno identiteto Slovenije, - z objavo korpusa in jezikoslovnih raziskav se utrjuje zavest, da je SZJ polno razvit jezik, ki izpolnjuje vse komunikacijske funkcije, - z nadaljnjimi raziskavami na podlagi korpusa bo mogoče razviti učna gradiva, ki bodo bolje razvijala jezikovno kompetenco SZJ pri gluhih otrocih in mladostnikih, - korpus SIGNOR se lahko uporabi za izdelavo boljšega in sodobnejšega slovarja SZJ, ki bo v pomoč učencem, učiteljem in tolmačem, - posreden učinek projekta je boljša vključenost gluhe skupnosti, tudi skozi raziskovalna sodelovanja, ki jih prej ni bilo mogoče udejaniti. ANG_ The project results will importantly influence the development of Slovenia in the following segments: - Through numerous past and future public presentations of the project we raise the awareness about the role of SZJ within Slovenian cultural identity, - Through the publication of the corpus and linguistic studies we reinforce the belief that SZJ is a fully developed language fulfilling all communicative functions, - Through future corpus-based activities teaching aids can be developed which will enhance the language competence in SZJ in Deaf children and youngsters, - The SIGNOR corpus may be used to build a better and up-to-date dictionary of SZJ which would help learners, teachers and interpreters, - An indirect impact of the project is better inclusion of the Deaf community and the emergence of new forms of cooperation in research. iO.Samo za aplikativne projekte in podoktorske projekte iz gospodarstva! Označite, katerega od navedenih ciljev ste si zastavili pri projektu, katere konkretne rezultate ste dosegli in v kakšni meri so doseženi rezultati uporabljeni Cilj F.01 Pridobitev novih praktičnih znanj, informacij in veščin Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v F.02 Pridobitev novih znanstvenih spoznanj Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v F.03 Večja usposobljenost raziskovalno-razvojnega osebja Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v F.04 Dvig tehnološke ravni Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 v F.05 Sposobnost za začetek novega tehnološkega razvoja Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 v F.06 Razvoj novega izdelka Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 v F.07 Izboljšanje obstoječega izdelka Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v F.08 Razvoj in izdelava prototipa Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v F.09 Razvoj novega tehnološkega procesa oz. tehnologije Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 v F.10 Izboljšanje obstoječega tehnološkega procesa oz. tehnologije Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 v F.11 Razvoj nove storitve Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v F.12 Izboljšanje obstoječe storitve Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 - F.13 Razvoj novih proizvodnih metod in instrumentov oz. proizvodnih procesov Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 - F.14 Izboljšanje obstoječih proizvodnih metod in instrumentov oz. proizvodnih procesov Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 - F.15 Razvoj novega informacijskega sistema/podatkovnih baz Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 - F.16 Izboljšanje obstoječega informacijskega sistema/podatkovnih baz Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 - F.17 Prenos obstoječih tehnologij, znanj, metod in postopkov v prakso Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 - F 18 Posredovanje novih znanj neposrednim uporabnikom (seminarji, forumi, konference) Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 - F.19 Znanje, ki vodi k ustanovitvi novega podjetja ("spin off") Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 - F.20 Ustanovitev novega podjetja ("spin off") Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 - F.21 Razvoj novih zdravstvenih/diagnostičnih metod/postopkov 1 Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 - F.22 Izboljšanje obstoječih zdravstvenih/diagnostičnih metod/postopkov Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 - F.23 Razvoj novih sistemskih, normativnih, programskih in metodoloških rešitev Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 - F 24 Izboljšanje obstoječih sistemskih, normativnih, programskih in metodoloških rešitev Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 - F.25 Razvoj novih organizacijskih in upravljavskih rešitev Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 - F.26 Izboljšanje obstoječih organizacijskih in upravljavskih rešitev Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 - F.27 Prispevek k ohranjanju/varovanje naravne in kulturne dediščine Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 - F.28 Priprava/organizacija razstave Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 - F.29 Prispevek k razvoju nacionalne kulturne identitete Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 - F.30 Strokovna ocena stanja Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v F.31 Razvoj standardov Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v F.32 Mednarodni patent Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 v F.33 Patent v Sloveniji Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 v F.34 Svetovalna dejavnost Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 v F.35 Drugo Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v Komentar ll.Samo za aplikativne projekte in podoktorske projekte iz gospodarstva! Označite potencialne vplive oziroma učinke vaših rezultatov na navedena področja Vpliv Ni vpliva Majhen vpliv Srednji vpliv Velik vpliv G.01 Razvoj visokošolskega izobraževanja G.01.01. Razvoj dodiplomskega izobraževanja O O O O G.01.02. Razvoj podiplomskega izobraževanja o o o o G.01.03. Drugo: o o o o G.02 Gospodarski razvoj G.02.01 Razširitev ponudbe novih izdelkov/storitev na trgu O O O O G.02.02. Širitev obstoječih trgov o o o o G.02.03. Znižanje stroškov proizvodnje o o o o G.02.04. Zmanjšanje porabe materialov in energije O O O O G.02.05. Razširitev področja dejavnosti O o o o G.02.06. Večja konkurenčna sposobnost o o o o G.02.07. Večji delež izvoza o o o o G.02.08. Povečanje dobička o o o o G.02.09. Nova delovna mesta o o o o G.02.10. Dvig izobrazbene strukture zaposlenih O O O O G.02.11. Nov investicijski zagon o o o o G.02.12. Drugo: o o o o G.03 Tehnološki razvoj G.03.01. Tehnološka razširitev/posodobitev dejavnosti O O O O G.03.02. Tehnološko prestrukturiranje dejavnosti O O O O G.03.03. Uvajanje novih tehnologij o o o o G.03.04. Drugo: o o o o G.04 Družbeni razvoj G.04.01 Dvig kvalitete življenja o o o o G.04.02. Izboljšanje vodenja in upravljanja o o o o G.04.03. Izboljšanje delovanja administracije in javne uprave O O O O G.04.04. Razvoj socialnih dejavnosti o o o o G.04.05. Razvoj civilne družbe o o o o G.04.06. Drugo: o o o o G.05. Ohranjanje in razvoj nacionalne naravne in kulturne dediščine in identitete O O O O G.06. Varovanje okolja in trajnostni razvoj O O O O G.07 Razvoj družbene infrastrukture G.07.01. Informacijsko-komunikacijska infrastruktura O O O O G.07.02. Prometna infrastruktura o o o o G.07.03. Energetska infrastruktura o o o o G.07.04. Drugo: o o o o G.08. Varovanje zdravja in razvoj zdravstvenega varstva O O O O G.09. Drugo: o o o o Komentar 12.Pomen raziskovanja za sofinancerje11 Sofinancer 1 1 1. Naziv Naslov Vrednost sofinanciranja za celotno obdobje trajanja projekta je znašala: EUR Odstotek od utemeljenih stroškov projekta: % Najpomembnejši rezultati raziskovanja za sofinancerja Šifra 1. 2. 3. 4. 5. Komentar Ocena 13.Izjemni dosežek v letu 201412 13.1. Izjemni znanstveni dosežek Korpus SIGNOR, ki vključuje ročno označene in transkribirane posnetke 80 gluhih oseb z vse Slovenije. Za gradnjo korpusa je bilo potrebno razviti celotno metodologijo zbiranja in obdelave posnetkov. Označevanje posnetkov vključuje podrobno jezikoslovno analizo in razreševanje temeljnih vprašanj o značilnostih znakovnega jezika, vključno z obdelavo variacij, sestavljenih kretenj, oblikoslovnih značilnosti, mašil, gestike, artikulacije in drugih ravni. Korpus je zaključen in vsebuje 33.000 ročno označenih in pregledanih kretenj. Razvili smo tudi inovativni korpusni pregledovalnik, ki omogoča preiskovanje kretenj v kontekstu, prikazuje podatke o pogostosti, metapodatke o informantih, vsako kretnjo pa tudi prikaže z animiranim agentom. Pregledovalnik je edinstven v svetovnem merilu, saj sorodnega orodja nismo zasledili za noben drug znakovni jezik. 13.2. Izjemni družbeno-ekonomski dosežek Prej opisani dosežek ima tudi družbeno-ekonomsko relevanco, saj bo pomembno vplival na slovensko kulturno identiteto, vključenost gluhe skupnosti in razvoj novih možnosti raziskovalnih sodelovanj. C. IZJAVE Podpisani izjavljam/o, da: • so vsi podatki, ki jih navajamo v poročilu, resnični in točni • se strinjamo z obdelavo podatkov v skladu z zakonodajo o varstvu osebnih podatkov za potrebe ocenjevanja ter obdelavo teh podatkov za evidence ARRS • so vsi podatki v obrazcu v elektronski obliki identični podatkom v obrazcu v pisni obliki • so z vsebino zaključnega poročila seznanjeni in se strinjajo vsi soizvajalci projekta Podpisi: zastopnik oz. pooblaščena oseba in vodja raziskovalnega projekta: raziskovalne organizacije: Univerza v Ljubljani, Filozofska Špela Vintar fakulteta ŽIG Kraj in datum: Ljubljana |l0.3.2015 Oznaka poročila: ARRS-RPROJ-ZP-2015/191 1 Napišite povzetek raziskovalnega projekta (največ 3.000 znakov v slovenskem in angleškem jeziku) Nazaj 2 Napišite kratko vsebinsko poročilo, kjer boste predstavili raziskovalno hipotezo in opis raziskovanja. Navedite ključne ugotovitve, znanstvena spoznanja, rezultate in učinke raziskovalnega projekta in njihovo uporabo ter sodelovanje s tujimi partnerji. Največ 12.000 znakov vključno s presledki (približno dve strani, velikost pisave 11). Nazaj 3 Realizacija raziskovalne hipoteze. Največ 3.000 znakov vključno s presledki (približno pol strani, velikost pisave 11) Nazaj 4 V primeru bistvenih odstopanj in sprememb od predvidenega programa raziskovalnega projekta, kot je bil zapisan v predlogu raziskovalnega projekta oziroma v primeru sprememb, povečanja ali zmanjšanja sestave projektne skupine v zadnjem letu izvajanja projekta, napišite obrazložitev. V primeru, da sprememb ni bilo, to navedite. Največ 6.000 znakov vključno s presledki (približno ena stran, velikost pisave 11). Nazaj 5 Navedite znanstvene dosežke, ki so nastali v okviru tega projekta. Raziskovalni dosežek iz obdobja izvajanja projekta (do oddaje zaključnega poročila) vpišete tako, da izpolnite COBISS kodo dosežka - sistem nato sam izpolni naslov objave, naziv, IF in srednjo vrednost revije, naziv FOS področja ter podatek, ali je dosežek uvrščen v A'' ali A'. Nazaj 6 Navedite družbeno-ekonomske dosežke, ki so nastali v okviru tega projekta. Družbeno-ekonomski rezultat iz obdobja izvajanja projekta (do oddaje zaključnega poročila) vpišete tako, da izpolnite COBISS kodo dosežka - sistem nato sam izpolni naslov objave, naziv, IF in srednjo vrednost revije, naziv FOS področja ter podatek, ali je dosežek uvrščen v A'' ali A'. Družbeno-ekonomski dosežek je po svoji strukturi drugačen kot znanstveni dosežek. Povzetek znanstvenega dosežka je praviloma povzetek bibliografske enote (članka, knjige), v kateri je dosežek objavljen. Povzetek družbeno-ekonomskega dosežka praviloma ni povzetek bibliografske enote, ki ta dosežek dokumentira, ker je dosežek sklop več rezultatov raziskovanja, ki je lahko dokumentiran v različnih bibliografskih enotah. COBISS ID zato ni enoznačen, izjemoma pa ga lahko tudi ni (npr. prehod mlajših sodelavcev v gospodarstvo na pomembnih raziskovalnih nalogah, ali ustanovitev podjetja kot rezultat projekta ... - v obeh primerih ni COBISS ID). Nazaj 7 Navedite rezultate raziskovalnega projekta iz obdobja izvajanja projekta (do oddaje zaključnega poročila) v primeru, da katerega od rezultatov ni mogoče navesti v točkah 6 in 7 (npr. ni voden v sistemu COBISS). Največ 2.000 znakov, vključno s presledki. Nazaj 8 Pomen raziskovalnih rezultatov za razvoj znanosti in za razvoj Slovenije bo objavljen na spletni strani: http://sicris.izum.si/ za posamezen projekt, ki je predmet poročanja Nazaj 9 Največ 4.000 znakov, vključno s presledki Nazaj 10 Največ 4.000 znakov, vključno s presledki Nazaj 11 Rubrike izpolnite / prepišite skladno z obrazcem "izjava sofinancerja" http://www.arrs.gov.si/sl/progproj/rproj/gradivo/, ki ga mora izpolniti sofinancer. Podpisan obrazec "Izjava sofinancerja" pridobi in hrani nosilna raziskovalna organizacija -izvajalka projekta. Nazaj 12 Navedite en izjemni znanstveni dosežek in/ali en izjemni družbeno-ekonomski dosežek raziskovalnega projekta v letu 2014 (največ 1000 znakov, vključno s presledki). Za dosežek pripravite diapozitiv, ki vsebuje sliko ali drugo slikovno gradivo v zvezi z izjemnim dosežkom (velikost pisave najmanj 16, približno pol strani) in opis izjemnega dosežka (velikost pisave 12, približno pol strani). Diapozitiv/-a priložite kot priponko/-i k temu poročilu. Vzorec diapozitiva je objavljen na spletni strani ARRS http://www.arrs.gov.si/sl/gradivo/, predstavitve dosežkov za pretekla leta pa so objavljena na spletni strani http://www.arrs.gov.si/sl/analize/dosez/. Nazaj Obrazec: ARRS-RPROJ-ZP/2015 v1.00a C4-62-3F-03-98-82-A8-A4-7F-CD-59-99-7F-50-03-86-6B-66-F2-36 Priloga 1 HUMANISTIKA Področje: 6.05 Jezikoslovje Dosežek 1: Korpus SIGNOR, Vir: http://aloysius.ijs.si/signor Korpus slovenskega znakovnega jezika A posnetki 80 gluhih oseb V_У označevanje v iLexu tokenizacija lematizacija artikulacija zapis HamNoSys pomen sestavljene kretnje Iskalnik po korpusu SZJ velikosti 33.000 kretenj in prikaz z animiranim agentom O C ад '«л "Јл (Л «л > O (U a t Korpus SIGNOR vključuje ročno označene in transkribirane posnetke 80 gluhih oseb z vse Slovenije. Za gradnjo korpusa je bilo potrebno razviti celotno metodologijo zbiranja in obdelave posnetkov. Označevanje posnetkov vključuje podrobno jezikoslovno analizo in razreševanje temeljnih vprašanj o značilnostih znakovnega jezika, vključno z obdelavo variacij, sestavljenih kretenj, oblikoslovnih značilnosti, mašil, gestike, artikulacije in drugih ravni. Korpus je zaključen in vsebuje 33.000 ročno označenih in pregledanih kretenj. Razvili smo tudi inovativni korpusni pregledovalnik, ki omogoča preiskovanje kretenj v kontekstu, prikazuje podatke o pogostosti, metapodatke o informantih, vsako kretnjo pa tudi prikaže z animiranim agentom. Pregledovalnik je edinstven v svetovnem merilu, saj sorodnega orodja nismo zasledili za noben drug znakovni jezik. S pomočjo korpusa bo mogoče razviti učna gradiva, ki bodo bolje razvijala jezikovno kompetenco SZJ pri gluhih otrocih in mladostnikih. Korpus SIGNOR se lahko uporabi za izdelavo boljšega in sodobnejšega slovarja SZJ, ki bo v pomoč učencem, učiteljem in tolmačem. Korpus SIGNOR za gluho skupnost pomeni pomemben dokument o aktualni podobi njihovega jezika, pomembno pa prispeva tudi k ozaveščenosti in utrjevanju kulturne identitete. Priloga 2 Korpus slovenskega znakovnega jezika označevanje v iLexu tokenizacija lematizacija artikulacija zapis HamNoSys pomen sestavljene kretnje Iskalnik po korpusu SZJ velikosti 33.000 kretenj in prikaz z animiranim agentom