144
Prispevki za novejšo zgodovino LXI – 1/2021
Darja Fišer,
*
Kristina Pahor de Maiti
**
»Prvič, sem političarka in ne
politik, drugič pa …«
Korpusni pristop k raziskovanju
parlamentarnega diskurza
IZVLEČEK
V tem učnem gradivu predstavljamo uporabnost jezikovnih korpusov za analizo druž-
benokulturnih pojavov, ki jih lahko raziskujemo na podlagi jezikovne rabe v specializira-
nem, političnem diskurzu. Na primeru korpusne analize govorov poslank in poslancev, kjer
nas bo zanimala dinamika zastopanosti žensk v parlamentu in značilnosti njihove rabe
jezika, bomo pokazali vrednost bogato označenega diahronega korpusa slovenskih parla-
mentarnih razprav za digitalno humanistiko in družboslovje.
Ključne besede: parlamentarne razprave, parlamentarni korpusi, jezik in spol, digitalna
humanistika
ABSTRACT
„FIRST, I’M A FEMALE POLITICIAN, NOT A MALE ONE, AND SECOND … ”
A CORPUS APPROACH TO PARLIAMENTARY DISCOURSE RESEARCH
This tutorial shows how corpora can be used to investigate language use and commu -
nication practices in a specialized socio-cultural context of political discourse in order to
explore socio-cultural phenomena. We will demonstrate the potential of a richly annotated
1.01 DOI: https://doi.org/10.51663/pnz.61.1.07
* Izr. prof., Filozofska fakulteta Univerze v Ljubljani, Inštitut za novejšo zgodovino in Institut Jožef Stefan;
darja.fiser@ff.uni-lj.si
** Asist., Filozofska fakulteta Univerze v Ljubljani, Aškerčeva 2, SI-1000 Ljubljana;
kristina.pahordemaiti@ff.uni-lj.si
145
Darja Fišer, Kristina Pahor de Maiti: »Prvič, sem političarka in ne politik, drugič pa …«
diachronic corpus of Slovenian parliamentary debates for investigating the characteristics
and dynamics of the representation of women and their language use in the Slovenian
Parliament.
Keywords: Parliamentary proceedings, parliamentary corpora, language and gender,
digital humanities
Uvod
1
V parlamentu se odvija glavnina političnih razprav, na podlagi katerih se oblikuje
zakonodaja, ki nato neposredno vpliva na vsakdanje življenje vseh prebivalcev in prebi-
valk določene države. V parlamentarnem diskurzu se tudi odsevajo politični programi,
ideološka stališča in institucionalne vloge poslank in poslancev, ki zastopajo interese
državljanov in državljank.
2
Zato je parlamentarni govor vedno aktualen predmet druž-
boslovnih in humanističnih raziskav.
Zapisi parlamentarnih sej so vse pogosteje dostopni v digitalni obliki, kar poe-
nostavlja njihovo združevanje v strukturirane jezikovne vire oziroma korpuse. Ti so
pogosto na voljo prek namenskih spletnih orodij, ki jih imenujemo konkordančniki.
Raziskovalci jih uporabljajo pri različnih jezikovnih, slogovnih, kulturnih, družbenih
in političnih raziskavah.
3
Medtem ko so v jezikoslovju metode korpusne analize že dodobra uveljavljene
4
in se med drugim pogosto uporabljajo tudi za sociolingvistično proučevanje spolno
zaznamovanega jezika,
5
so v drugih humanističnih in družboslovnih vedah, kjer prav
tako številne raziskave temeljijo na jezikovnem gradivu, še razmeroma redke. V tem
učnem gradivu zato prikazujemo potencial bogato označenih jezikovnih korpusov in
konkordančnikov za raziskave družbenokulturnih pojavov, ki se odražajo v rabi jezika.
Za oblikovanje natančnih kvantitativnih poizvedb o jezikovnih podatkih uporabimo
dragocene metapodatke o poslankah in poslancih in njihovih govorih, rezultate pa
nato še nadgradimo z ročno kvalitativno analizo, s katero pridobimo podroben vpo-
gled v kontekst in zagotovimo ustrezno interpretacijo.
1 Avtorica naslovne izjave z redne seje 4. 6. 2003 je Cvetka Zalokar Oražem (LDS). Gl. Iskanje, pridobljeno
19. 2. 2021, http://hdl.handle.net/11346/siparl-NYUL.
2 Cornelia Ilie, »Parliamentary Debates,« v: Ruth Wodak in Bernhard Forchtner, ur., The Routledge Handbook of
Language and Politics (London: Routledge, 2017), 309–25.
3 Łucja Biel, Agnieszka Biernacka in Anna Jopek-Bosiacka, »Collocations of Terms in EU Competition Law:
A Corpus Analysis of EU English Collocations,« v: Language and Law (Cham: Springer, 2018), 249–74. Sylvia
Jaworska in Kath Ryan, »Gender and the Language of Pain in Chronic and Terminal Illness: A Corpus-based
Discourse Analysis of Patients’ Narratives,« Social Science & Medicine 215 (2018): 107–14.
4 Douglas Biber in Randi Reppen, The Cambridge Handbook of English Corpus Linguistics (Cambridge: Cambridge
University Press, 2015). Tony McEnery in Andrew Hardie, Corpus Linguistics: Method, Theory and Practice
(Cambridge: Cambridge University Press, 2011).
5 Paul Baker, Using Corpora to Analyze Gender (London: Bloomsbury, 2014).
146
Prispevki za novejšo zgodovino LXI – 1/2021
S tem učnim gradivom želimo prikazati možnosti, ki jih raziskovalkam in razisko-
valcem brez programerskih znanj ponujajo obsežne zbirke parlamentarnih razprav in
konkordančniki. T o učno gradivo je primerno tudi za uporabnice in uporabnike brez
izkušenj z uporabo jezikovnih korpusov in orodij za iskanje po njih. Gradivo temelji
na korpusu siParl 2.0,
6
ki vsebuje parlamentarne razprave Državnega zbora Republike
Slovenije od leta 1990 do 2018.
Kako uporabljati učno gradivo
V tem gradivu najprej predstavimo osnove korpusnega jezikoslovja in korpusne
analize, čemur sledi uvod v značilnosti specializiranih korpusov parlamentarnih raz-
prav in jedrnat pregled raziskav s področja jezika in spola. Drugi del učnega gradiva
je namenjen praktičnemu prikazu najbolj razširjenih tehnik korpusne analize, kot so
konkordančni nizi, frekvenčni seznami, ključne besede in kolokacije. Predstavljene
tehnike uporabimo za raziskovanje zastopanosti žensk v slovenskem parlamentu, nji-
hovih interesnih področij in govora o ženskah, pri čemer v analizo vključimo primer-
javo z značilnostmi, ki veljajo za poslance oziroma skozi čas.
Vsi viri in orodja, uporabljeni v tem gradivu, so brezplačno na voljo v spletu. Za
iskanje po korpusu uporabljamo NoSketch Engine,
7
za dodatne ročne analize in pred-
stavitve rezultatov pa enega od urejevalnikov preglednic (npr. Google Spreadsheet
8
ali
MS Excel
9
).
Besedila v sivih okvirčkih vsebujejo razlago uporabljenih funkcij in povezavo
do videoposnetka, ki prikazuje, kako relevantno funkcijo poženemo v kon-
kordančniku. Poleg tega so v okvirčkih tudi povezave do rezultatov v konkor-
dančniku, kar bralkam in bralcem omogoča, da ponovijo analizo na svojem
računalniku.
Iskanje po korpusu siParl 2.0 je mogoče prek konkordančnikov NoSketch Engine
10
in KonT ext
11
na spletnem mestu CLARIN.SI
12
– slovenski center v okviru Evropske
raziskovalne infrastrukture za jezikovne vire in tehnologije CLARIN ERIC.
13
Prek
6 Slovenian parliamentary corpus (1990-2018) siParl 2.0, pridobljeno 18. 2. 2021, http://hdl.handle.net/11356/1300.
7 NoSketch Engine, pridobljeno 18. 2. 2021, https://tinyurl.com/4exc2b3e.
8 Google Preglednice – brezplačno ustvarjajte in urejajte preglednice v spletu, pridobljeno 18. 2. 2021, https://tinyurl.
com/8mdwez3m.
9 Microsoft Excel, Spreadsheet Software, Excel Free Trial, pridobljeno 18. 2. 2021, https://tinyurl.com/6sdr9vwj .
10 NoSketch Engine @ CLARIN.SI, pridobljeno 18. 2. 2021, https://www.clarin.si/noske.
11 Konkordance – Obrazec za prvo poizvedbo, pridobljeno 18. 2. 2021, http://hdl.handle.net/11346/siparl-XOZH.
12 CLARIN.SI; Slovenska raziskovalna infrastruktura za jezikovne vire in tehnologije, pridobljeno 18. 2. 2021, https://
tinyurl.com/wuhvy98b.
13 CLARIN – European Research Infrastructure for Language Resources and Technology | CLARIN ERIC, pridobljeno
18. 2. 2021, https://www.clarin.eu.
147
Darja Fišer, Kristina Pahor de Maiti: »Prvič, sem političarka in ne politik, drugič pa …«
repozitorija CLARIN.SI je korpus siParl 2.0 mogoče tudi prenesti
14
v računalnik in
ga nato analizirati z drugimi korpusnimi orodji ali orodji za rudarjenje besedil, npr.
z orodjem za korpusno analizo Antconc
15
ali z orodji za osnovno obdelavo besedil v
jeziku R.
16
T o gradivo je posodobljena različica izvirnega učnega gradiva,
17
v katerem je bila
uporabljena prva različica korpusa siParl. Korpus siParl 2.0 v primerjavi s korpusom
siParl 1.0
18
vsebuje bogatejše metapodatke o govorkah in govorcih ter sejah, kar omo-
goča razlikovanje med poslankami in poslanci ter drugimi govorkami in govorci v par-
lamentu. Poleg tega govori vsebujejo oznake parlamentarnih mandatov, kar omogoča
lažjo primerjalno analizo elementov med posameznimi parlamentarnimi sklici. Druga
različica korpusa vsebuje tudi dodatne ravni jezikoslovnih oznak, kot so skladenjske
oznake in imenske entitete, ki pa jih v naši analizi ne bomo uporabljali, zato jih v gra-
divu ne obravnavamo.
Če želite tehnike korpusne analize takoj preizkusiti na praktičnih primerih,
nadaljujte z nalogami v razdelku Korpusna analiza. Naslednji trije razdelki (Korpusi
in konkordančniki, Zapisi parlamentarnih sej in Jezik in spol) so namreč namenjeni
poljudnemu pregledu teoretičnih osnov in najpomembnejše terminologije. Čeprav
nalogam v šestem razdelku lahko sledite brez predhodnega branja omenjenih treh
razdelkov, vas spodbujamo, da se z njihovo vsebino na neki točki seznanite, saj pred-
stavljene osnove zagotavljajo celovito razumevanje in samostojno rabo analitičnih
postopkov ter ustrezno interpretacijo rezultatov.
Korpusi in konkordančniki
Korpusi
Besedilni korpusi
19
so obsežne zbirke skrbno izbranih strojno berljivih jezikov-
nih podatkov, ki jih lahko uporabimo za pripravo jezikovnih opisov ali za preverjanje
hipotez o jeziku. Vendar pa so korpusi veliko več kot le zbirke besedil v elektronski
obliki. Oblikovani so v enem od standardnih formatov, kot je razširljivi označevalni
jezik oziroma XML,
20
in kodirani v skladu z vnaprej določeno, a prilagodljivo shemo
za predstavitev besedil v digitalni obliki, med katerimi je v jezikoslovju in digitalni
humanistiki najbolj uveljavljen standard TEI.
21
Osnovna enota korpusa je pojavnica,
22
ki jo dobimo z avtomatskim postopkom
tokenizacije, pri katerem je izbrano besedilo razdeljeno na manjše enote, v našem
14 Slovenian parliamentary corpus (1990-2018) siParl 2.0, pridobljeno 18. 2. 2021, http://hdl.handle.net/11356/1300.
15 Corpus Analysis with Antconc, pridobljeno 18. 2. 2021, https://tinyurl.com/3x85dvvs.
16 Basic T ext Processing in R, pridobljeno 18. 2. 2021, https://tinyurl.com/f3nj4jt8.
17 Voices of the Parliament, pridobljeno 18. 2. 2021, https://tinyurl.com/hb68794d.
18 Slovenian parliamentary corpus (1990-2018) siParl 2.0, pridobljeno 18. 2. 2021, http://hdl.handle.net/11356/1236.
19 Besedilni korpus – Wikipedija, prosta enciklopedija, pridobljeno 18. 2. 2021, https://tinyurl.com/23zu8r2e.
20 XML Tutorial, pridobljeno 18. 2. 2021, https://www.w3schools.com/xml.
21 TEI: Text Encoding Initiative, pridobljeno 18. 2. 2021, https://tei-c.org.
22 Tok en | Sketch Engine, pridobljeno 18. 2. 2021, https://tinyurl.com/48a5j4ru.
148
Prispevki za novejšo zgodovino LXI – 1/2021
primeru na besede. Običajno se pojavnice določajo glede na presledke med bese-
dami. Za bolj poglobljeno analizo so besedila v korpusu jezikoslovno označena.
Najosnovnejši obliki jezikoslovnega označevanja sta oblikoskladenjsko označevanje,
s katerim besedam v besedilih pripišemo besedno vrsto (npr. glagol), in lematizacija,
23
pri kateri pojavnicam (besednim oblikam v različnih sklonih) pripišemo osnovno
slovarsko obliko oz. lemo. Lematizacija je pomembna zlasti za korpuse morfološko
bogatih jezikov, kot je slovenščina. Poleg jezikoslovnih oznak so v korpus dodani
tudi metapodatki o besedilu (npr. datum, vrsta) in govorcu (npr. ime, spol), ki so
pomembni za kontekstualizacijo rezultatov, vendar se lahko uporabljajo tudi za izva-
janje natančnejših korpusnih poizvedb.
Slika 1. Izvleček iz jezikoslovno označenega korpusa v zapisu TEI.
Konkordančniki
Po korpusih iščemo s specializiranimi orodji, ki se imenujejo konkordančniki.
24
Nekatere konkordančnike moramo pred uporabo namestiti na osebni računalnik,
drugi pa so dostopni neposredno prek spleta. Uporabljamo jih za iskanje vseh poja-
vitev pojavnic v korpusu, ki ustrezajo našemu iskalnemu pogoju. Na voljo je veliko
konkordančnikov, ki omogočajo podobne funkcije (gl. npr. ta podrobni seznam),
25
med najbolj priljubljenimi pa so AntConc
26
(brezplačen) in WordSmith Tools
27
(potreben je nakup licence), ki ju je mogoče uporabljati brez internetne povezave in
23 Lematizacija – Wikipedija, prosta enciklopedija, pridobljeno 18. 2. 2021, https://tinyurl.com/u37yyhur.
24 Corpus Linguistics: Method, theory and practice, pridobljeno 18. 2. 2021, https://tinyurl.com/27ajek5j.
25 Concordancers, pridobljeno 18. 2. 2021, https://tinyurl.com/yn6wcebj.
26 Laurence Anthony’s AntConc, pridobljeno 18. 2. 2021, https://tinyurl.com/3ntaevtt.
27 WordSmith Tools home page, pridobljeno 19. 2. 2021, https://tinyurl.com/4256exts.
149
Darja Fišer, Kristina Pahor de Maiti: »Prvič, sem političarka in ne politik, drugič pa …«
ne vsebujeta predhodno naloženih korpusov, ter spletna konkordančnika BYU
28
(za
polno delovanje je potrebna brezplačna registracija) in SketchEngine
29
(brezplačna
akademska licenca), ki vsebujeta številne predhodno naložene korpuse za različne
jezike. SketchEngine omogoča tudi ustvarjanje in označevanje lastnih korpusov.
V ečina sodobnih konkordančnikov omogoča naslednje funkcije, ki jih bomo upo-
rabili tudi v tem gradivu:
– Konkordančni niz
30
prikazuje vse zadetke iskane besede ali niza besed v korpusu
ter njihovo sobesedilo. Konkordance, posamezne enote konkordančnega niza,
so lahko razvrščene naključno ali glede na iskano besedo oziroma niz besed.
Razvrstiti jih je mogoče tudi glede na levi ali desni kontekst, kar izpostavi značilne
vzorce, v katerih se iskana beseda oziroma niz besed pojavlja.
– Frekvenčni seznami
31
prikazujejo vse zadetke za izbrano korpusno poizvedbo,
ki je lahko v obliki besede/besedne zveze ali določenega nabora metapodatkov.
Zadetki so lahko razvrščeni po abecedi ali pogostosti, pripisan pa jim je tudi poda-
tek o njihovi frekvenci. V nasprotju s konkordančnim nizom besedni seznami ne
vsebujejo sobesedila zadetkov.
– Seznami ključnih besed
32
izpostavljajo besede, ki v izbranem korpusu izstopajo v
primerjavi z izbranim referenčnim korpusom.
– Seznami kolokacij
33
vsebujejo nize besed, ki se v kombinaciji z iskano besedo poja-
vljajo pogosteje kot ob naključnem pojavljanju.
Na voljo so že številna navodila za uporabo konkordančnikov (npr. SketchEngine
Quick Start Guide
34
) in tečaji korpusnega jezikoslovja (npr. Corpus Linguistics:
Method, Analysis, Interpretation
35
). V tem gradivu se osredotočamo na prikaz upo-
rabe konkordančnika NoSketchEngine in specializiranega korpusa za iskanje odgovo-
rov na konkretna raziskovalna vprašanja na metodološko ustrezen način. Gradivo je
namenjeno študentkam in študentom ter raziskovalkam in raziskovalcem s področja
(digitalne) humanistike in družboslovja, ki jih zanima raziskovanje sociokulturnih
pojavov prek jezikovne rabe.
Zapisi parlamentarnih sej
Parlamentarni korpusi so različnih velikosti in vsebujejo podatke v različnih
modalitetah (pisni, govorjeni, gestikulacija), iz različnih časovnih obdobij in v enem
ali več jezikih. Čeprav so parlamentarne razprave večinoma dostopne v pisni obliki
28 English Corpora: most widely used online corpora. Billions of words of data: free online access, pridobljeno 18. 2. 2021,
https://www.english-corpora.org.
29 CQL – Corpus Query Language | Sketch Engine, pridobljeno 18. 2. 2021, https://tinyurl.com/skdvt638.
30 Concordance – most powerful corpus search | Sketch Engine, pridobljeno 18. 2. 2021, https://tinyurl.com/8zrs9f8n.
31 Wordlists – word frequency lists | Sketch Engine, pridobljeno 18. 2. 2021, https://tinyurl.com/9cn4afkz.
32 Keywords and term extraction | Sketch Engine, pridobljeno 18. 2. 2021, https://tinyurl.com/9sfrjfp3.
33 collocation | Sketch Engine, pridobljeno 18. 2. 2021, https://tinyurl.com/3ket5dps.
34 Quick Start Guide - learn to use | Sketch Engine, pridobljeno 18. 2. 2021, https://tinyurl.com/3hx8y7px.
35 Corpus Linguistics Analysis - Online Course – FutureLearn, pridobljeno 18. 2. 2021, https://tinyurl.com/4x9cp5t4.
150
Prispevki za novejšo zgodovino LXI – 1/2021
(npr. korpus razprav iz danskega parlamenta
36
), so včasih dostopne tudi kot zvočni
posnetki ali videoposnetki skupaj s transkripcijami (npr. korpus razprav iz češkega
parlamenta
37
). Parlamentarni korpusi kot diahroni viri
38
nam omogočajo poglobljeno
raziskovanje jezikovnih in družbenih sprememb skozi čas. V ečina parlamentarnih kor-
pusov vsebuje bogate metapodatke
39
o govorih (npr. datum govora, trajanje govora,
točka dnevnega reda, v kateri je bil govor podan) ali govorkah in govorcih (npr. spol,
starost, izobrazba, politična pripadnost, institucionalna vloga), kar omogoča poglo-
bljen vpogled v kontekst preučevanega pojava.
40
Parlamentarni diskurz
Parlament je institucija, za katero veljajo specifična pravila in konvencije, kar
vpliva tudi na jezikovno rabo, začenši s pravili glede podeljevanja besede, naslavljanja
itd. (gl. npr. poslovnik državnega zbora RS
41
). T a pravila in konvencije so se izobliko-
vale v določenem družbenozgodovinskem okolju, zato niso v vseh parlamentih enake;
v grškem parlamentu je na primer skakanje v besedo strogo prepovedano, medtem ko
je v britanskem parlamentu prekinjanje govorcev pogosto in običajno ni sankcionira-
no.
42
T o je seveda treba upoštevati pri oblikovanju raziskovalnih vprašanj, izvedbi raz-
iskave in interpretaciji rezultatov. Zato je pri raziskovanju te vrste diskurza
43
še posebej
pomembno, da dobro razumemo okoliščine, v katerih je nastal.
Zanesljivost sejnih zapisov
Uradno objavljeni sejni zapisi niso dobesedne transkripcije
44
parlamentarnih raz-
prav, ampak zapisi v skladu z uveljavljenimi zapisovalnimi praksami institucije. T e pra-
kse se razlikujejo med posameznimi državami in časovnimi obdobji. Med urejanjem
zapisov običajno pride do izločanja značilnih prvin govorjenega jezika, lahko pa tudi
do nekaterih drugih posegov, kot so izločanje očitnih jezikovnih ali vsebinskih napak,
narečnih ali pogovornih izrazov ter žaljivega in vulgarnega jezika. Smernice za urejanje
sejnih zapisov običajno žal niso javno objavljene, kar lahko bistveno oteži raziskovalno
36 The Danish Parliament Corpus 2009 - 2017, v1, pridobljeno 18. 2. 2021, http://hdl.handle.net/20.500.12115/8.
37 Czech Parliament Meetings, pridobljeno 18. 2. 2021, http://hdl.handle.net/11858/00-097C-0000-0005-CF9C-4.
38 Synchrony and diachrony – Wikipedia, pridobljeno 18. 2. 2021, https://tinyurl.com/s96f8r38.
39 Metapodatek – Wikipedija, prosta enciklopedija, pridobljeno 18. 2. 2021, https://tinyurl.com/yyj88wak.
40 Pertti Alasuutari, Marjaana Rautalin in Jukka Tyrkkö, »The Rise of the Idea of Model in Policymaking: The Case
of the British Parliament, 1803-2005,« European Journal of Sociology/Archives Européennes de Sociologie 59, št. 3
(2018): 341–63. Jane Demmen, Lesley Jeffries in Brian Walker, »Charting the Semantics of Labour Relations
in House of Commons Debates Spanning Two Hundred Years,« Doing Politics: Discursivity, Performativity and
Mediation in Political Discourse 80 (2018): 81.
41 Poslovnik državnega zbora, pridobljeno 18. 2. 2021, https://tinyurl.com/wmbczcj4.
42 Cornelia Ilie, »Parliamentary Debates.«
43 Diskurz – Wikipedija, prosta enciklopedija, pridobljeno 18. 2. 2021, https://tinyurl.com/tjj76yh.
44 Transcription (linguistics) – Wikipedia, pridobljeno 18. 2. 2021, https://tinyurl.com/e86cheyh.
151
Darja Fišer, Kristina Pahor de Maiti: »Prvič, sem političarka in ne politik, drugič pa …«
delo. Kritiko virov v parlamentarnem kontekstu podrobneje obravnavata Mollin
45
in
Rix.
46
Drug pomemben vidik pri proučevanju parlamentarnega govora je, da so govori
poslank in poslancev pogosto pripravljeni vnaprej, in sicer v pisni obliki, kar vpliva
na njihove skladenjske in slogovne značilnosti. T o sicer ne velja za vsa parlamentarna
okolja, niti za vse vrste parlamentarnih nastopov (npr. interpelacije, obrazložitve glasu,
poslanska vprašanja). Tudi te posebnosti je poleg družbenozgodovinskega konteksta
treba vedno upoštevati pri oblikovanju raziskovalnih vprašanj, izvedbi raziskave in
interpretaciji rezultatov.
Slika 2 prikazuje primerjavo uradnega zapisa govora Anje Bah Žibert,
47
poslanke
Državnega zbora RS 2014–2018, s 33. seje Državnega zbora na temo predloga zakona
o Prešernovi nagradi (18. točka dnevnega reda
48
) z dobesedno transkripcijo njenega
govora, ki smo jo pripravili na podlagi videoposnetka seje (min. 5:00–7:33).
49
Že na
prvi pogled se vidi, da uradni sejni zapisi DZ RS niso najboljši vir za preučevanje zna-
čilnosti spontanega govora, kot so napačni začetki, premori, raba mašil ali ponovitev.
Slika 2. Primerjava uradnega sejnega zapisa in dobesedne transkripcije iz Državnega
zbora RS.
45 Sandra Mollin, »The Hansard Hazard: Gauging the Accuracy of British Parliamentary Transcripts,« Corpora 2, št.
2 (2007): 187–210.
46 Kathryn Rix, »‘Whatever Passed in Parliament Ought to be Communicated to the Public’: Reporting the
Proceedings of the Reformed Commons, 1833–50,« Parliamentary History, 33, št. 3 (2014): 453–74.
47 Anja Bah Žibert – Wikipedija, prosta enciklopedija, pridobljeno 18. 2. 2021, https://tinyurl.com/ed7p75r8.
48 Sejni zapisi Državnega zbora, 33. seja (Ljubljana: Državni zbor, 20218), 128, dostopno na https://tinyurl.
com/2s6r3r54.
49 33. redna seja Državnega zbora, 4. del, pridobljeno 18. 2. 2021, https://tinyurl.com/55twvm6u.
152
Prispevki za novejšo zgodovino LXI – 1/2021
Poznavanje raziskovalnih podatkov
Predpogoj za ustrezno oblikovanje raziskovalnih vprašanj, izvedbo raziskave in inter-
pretacijo rezultatov, pa tudi za optimalno izkoriščanje vsega, kar raziskovalni podatki
omogočajo, je, da se najprej podrobno seznanimo s tem, kaj izbrani korpus vsebuje,
kako je bil zgrajen in označen ter kakšne so njegove omejitve. Ker niso vsi korpusi enako
označeni, moramo vedno preveriti podrobnosti o izbranem korpusu. T e informacije so
običajno na voljo na domači strani korpusa (npr. korpus historične nizke nemščine
50
), v
konkordančniku, prek katerega je korpus na voljo (npr. britanski parlamentarni korpus
Hansard v konkordančniku Univerze Brigham Young
51
), ali v repozitoriju, kjer je kor-
pus arhiviran (npr. hrvaški parlamentarni korpus ParlaMeter-hr v repozitoriju CLARIN.
SI
52
). V eč o kodiranju in označevanju parlamentarnih podatkov lahko preberete v izobra-
ževalnem modulu o zbirkah parlamentarnih podatkov PARTHENOS.
53
Jezik in spol
Razlike med jezikom moških in žensk so predmet številnih raziskav na področju
sociolingvistike, stilistike, retorike, študij spola, medijskih študij in analize diskurza.
54
Rezultati kažejo, da so razlike majhne, a sistematične.
55
Pri raziskavah politične komu-
nikacije pa lahko opazimo, da se tradicionalno posvečajo predvsem diskurzu politikov,
medtem ko je diskurz političark šele pred kratkim postal predmet raziskav.
56
T o je pomembno, ker je več avtoric
57
pokazalo, da se zakonodajalke razlikujejo od
svojih sodelavcev pri vprašanjih, ki jih naslavljajo, stališčih, ki jih zavzemajo, in pristo-
pih, ki jih uporabljajo pri pripravi zakonodaje. Blaxill in Beelen
58
sta v analizi zastopa-
nosti žensk v britanskem parlamentu po letu 1945 odkrila, da je v govorih poslank večji
poudarek na vprašanjih, ki zadevajo ženske (npr. izobraževanje, zdravstvo itd.) in ki se
neposredno dotikajo njihove dobrobiti v družbi (npr. varstvo otrok, nasilje v družini,
50 Corpus of Historical Low German, pridobljeno 18. 2. 2021, http://www.chlg.ac.uk/helipad.
51 Corpus of British Parliament speeches (Hansard), pridobljeno 18. 2. 2021, https://www.english-corpora.org/hansard.
52 Croatian parliamentary corpus ParlaMeter-hr 1.0, pridobljeno 18. 2. 2021, http://hdl.handle.net/11356/1209.
53 Working with parliamentary corpora; Parthenos training, pridobljeno 18. 2. 2021, https://tinyurl.com/yypffemm.
54 Penelope Eckert in Sally McConnell-Ginet, Language and Gender (Cambridge: Cambridge University Press, 2013).
Ruth Wodak, »Pragmatics and Critical Discourse Analysis: A Cross-disciplinary Inquiry,« Pragmatics & Cognition
15 (2017): 203–25.
55 Matthew L. Newman, Clara J. Groom, Lori D. Handelman in James W. Pennebaker, »Gender Differences in
Language Use: An Analysis of 14,000 T ext Samples,« Discourse Processes 45, št. 3 (2008): 211–36.
56 Catherine Marshall, »Policy Discourse Analysis: Negotiating Gender Equity,« Journal of Education Policy 15, št. 2
(2000): 125–56.
57 Milica Antić Gaber in Gabriella Ilonszki, Women in Parliamentary Politics: Hungarian and Slovene Cases Comparur
(Ljubljana: Peace Institute, Institute for Contemporary Social and Political Studies, 2003). Monique Leijenaar, How
to Create a Gender Balance in Political Decision-making: A Guide to Implementing Policies for Increasing the Participation
of Women in Political Decision-making (Luxembourg: Office for Official Publications of the European Communities,
1997). Christina Wolbrecht, »Female Legislators and the Women’s Rights Agenda: From Feminine Mystique to
Feminist Era,« v: Cindy S. Rosenthal, ur., Women Transforming Congress (Norman: University of Oklahoma Press,
2002), 170–97.
58 Luke Blaxill in Kaspar Beelen, »A Feminized Language of Democracy? The Representation of Women at
Westminster since 1945,« Twentieth Century British History 27, št. 3 (2016): 412–49.
153
Darja Fišer, Kristina Pahor de Maiti: »Prvič, sem političarka in ne politik, drugič pa …«
enakost itd.).
59
Tudi Bäck idr.,
60
Hansen idr.
61
ter Mensah in Wood,
62
ki so raziskovali
korpuse razprav iz švedskega, danskega oz. ganskega parlamenta, so odkrili, da ženske
pogosteje kot moški govorijo o temah, ki se tičejo t. i. mehkih zakonodajnih področij
(npr. makroekonomija, energetika, promet, bančništvo, finance, vesolje, znanost in
tehnologija ter komunikacija
63
), medtem ko moški pogosteje razpravljajo o temah s t.
i. trdih zakonodajnih področij (npr. zdravstvo, delo, zaposlitev in priseljevanje, izobra-
ževanje ter socialno varstvo).
Upoštevati je treba, da na uporabo jezika vplivajo različni dejavniki (npr. družbeni
razred, kontekst, starost, hierarhija), pri čemer je spol le eden od mnogih.
64
Bing in
Bergvall
65
poudarjata, da so podobnosti v uporabi jezika pri različnih spolih običajno
spregledane, čeprav so bolj izrazite kot razlike. Tudi Blaxill in Beelen
66
sta odkrila
podobno težnjo v okviru raziskav parlamentarnega diskurza. Če torej spol govorca
poznamo vnaprej, kot to velja v našem primeru, je treba to dejstvo nujno upoštevati,
da se izognemo napačni interpretaciji rezultatov in pretiranemu poudarjanju razlik.
67
Korpusna analiza
V tem razdelku bomo na obsežnem korpusu slovenskih parlamentarnih razprav poka-
zali, kako lahko osnovne tehnike korpusne analize (za več o tem gl. razdelek 3 Korpusi in
konkordančniki) uporabimo za iskanje odgovorov na naslednja raziskovalna vprašanja:
– V Nalogi 1 bomo analizirali zastopanost žensk v slovenskem parlamentu. Najprej si
bomo ogledali, kako ustvarimo podkorpuse. Nato se bomo naučili, kako sestaviti
frekvenčne sezname, ki prikazujejo število govorcev oziroma govork in njihovih
govorov v podkorpusih.
– V Nalogi 2 bomo identificirali tematike, o katerih so skozi čas razpravljale poslanke
v primerjavi s poslanci. Pri tem se bomo naučili, kako izluščimo ključne besede iz
podkorpusov, in si nato ogledali, kako prek analize konkordanc preverimo njihov
kontekst in rabo.
59 Gl. T racey L. Osborn, How Women Represent Women: Political parties, gender and representation in the state legislatures
(Oxford: Oxford University Press, 2012).
60 Hanna Bäck, Marc Debus in Jochen Müller, »Who T akes the Parliamentary Floor? The Role of Gender in Speech-
making in the Swedish Riksdag,« Political Research Quarterly 67, št. 3 (2014): 504–18.
61 Dorte H. Hansen, Costanza Navarretta in Lene Offersgaard, »A Pilot Gender Study of the Danish Parliament
Corpus,« v: Darja Fišer, Maria Eskevich in Franciska de Jong, ur., Proceedings of the Eleventh International Conference
on Language Resources and Evaluation (Miyazaki: LREC, 2018).
62 Eric O. Mensah in Sandra F. Wood, »Articulations of Feminine Voices in Ghana’s Parliament: A Study of the
Hansard from 2010-2011,« AFRREV LALIGENS: An International Journal of Language, Literature and Gender
Studies 7, št. 2 (2018): 61–77.
63 Lena Wängneru, »Intressen kontra stereotyper. Varför finns det kvinnliga och manliga politikområden i riksda-
gen?,« Statsvetenskaplig Tidskrift 99, št. 2 (1996).
64 Jennifer Coates, Women, Men and Language: A Sociolinguistic Sccount of Gender Differences in Language (London:
Longman, 1997). Lia Litosseliti, Gender and Language: Theory and Practice (London: Hodder Arnold, 2006).
65 Janet M. Bing in Victoria L. Bergvall, »The Question of Questions: Beyond Binary Thinking,« v: Jennifer Coates,
ur., Language and Gender: A Reader: Vol. 1 (Oxford: Blackwell, 1998), 496–510.
66 Blaxill in Beelen, »A Feminized Language of Democracy?«.
67 Angela Goddard in Lindsey M. Patterson, Language and Gender (London: Routledge, 2015).
154
Prispevki za novejšo zgodovino LXI – 1/2021
– V Nalogi 3 bomo raziskali, kako so poslanke in poslanci v minulih 25 letih razpravljali
o tematikah, povezanih z ženskami. Ogledali si bomo, kako uporabljamo podatke
o relativni frekvenci v različno velikih podkorpusih in kako izluščimo kolokacije
izbranih samostalnikov v podkorpusih.
Korpus siParl 2.0
Korpus siParl 2.0
68
vsebuje sejne zapise 11. mandata Skupščine socialistične
republike Slovenije za obdobje 1990-1992, sejne zapise Državnega zbora Republike
Slovenije
69
za obdobje 1992-2018 (1.–7. mandat), sejne zapise delovnih teles
Državnega zbora Republike Slovenije za obdobje 1996–2018 (2.–7. mandat) in sejne
zapise Sveta predsednika Državnega zbora za obdobje 1996–2018 (2.–7. mandat).
Korpus vsebuje metapodatke o govorkah in govorcih (npr. ime, spol, vloga, poli-
tična stranka), tipologijo parlamentarnih zasedanj (npr. redna seja, izredna seja itd.)
ter strukturne in uredniške oznake (npr. zakonodajno obdobje, leto/naslov seje, imen-
ske entitete).
70
Korpus je tudi oblikoskladenjsko označen in lematiziran. Poleg tega
vsebuje nekatere druge jezikoslovne oznake (npr. oznake univerzalne odvisnostne
drevesnice (Universal Dependencies) in skladenjsko razčlenjevanje), ki pa jih v tem
gradivu ne uporabljamo. Korpus obsega več kot milijon govorov oziroma 200 milijo-
nov besed, ki jih je prispevalo skoraj 8.500 različnih govork in govorcev (npr. poslanke
in poslanci, članice in člani vlade, predstavnice in predstavniki ministrstev, strokovnih
organizacij, nevladnih organizacij in interesnih skupin). Splošne informacije o korpu-
sih in o zapisih parlamentarnih sej najdete v razdelku 3 Korpusi in konkordančniki in
v razdelku 4 Zapisi parlamentarnih sej.
Te informacije o korpusu so na voljo tudi v konkordančniku na strani CLARIN.
SI
71
(gl. Sliki 3a in 3b):
72
– Kvantitativne informacije o velikosti korpusa so na voljo v razdelku Zadetki (gl.
številko 1).
– Osnovne oznake za besedne vrste so navedene v Legendi oznak (gl. številko 2), opis
celotnega nabora oznak pa je na voljo prek povezave T agset/Opis
73
(gl. številko 3).
– Korpus je organiziran prek strukturnih atributov. Atribut session/seja zamejuje
posamezne seje (gl. številko 4) in vsebuje informacije, kot so datum, vrsta in
naslov seje (gl. Sliko 3b, številko 4).
68 Slovenian Parliamentary Corpus (1990-2018) siParl 2.0, pridobljeno 18. 2. 2021, http://hdl.handle.net/11356/1300,
gl. Andrej Pančur, T omaž Erjavec, Mihael Ojsteršek, Mojca Šorn in Neja Blaj Hribar, Slovenian Parliamentary Corpus
(1990-2018) siParl 2.0. Slovenian language resource repository CLARIN.SI, 2020.
69 Državni zbor Republike Slovenije – Wikipedija, prosta enciklopedija, pridobljeno 18. 2. 2021, https://tinyurl.
com/8ke5j554.
70 Named entity – Wikipedia, pridobljeno 18. 2. 2021, https://tinyurl.com/3jc7ftsd.
71 Corpus info: siParl 2.0 (parlament 1990-2018), pridobljeno 18. 2. 2021, http://hdl.handle.net/11346/siparl-0LBP .
72 Slovensko različico konkordančnika izberete v zgornjem desnem kotu s klikom simbola zobnika in izbiro ustrezne-
ga jezika s spustnega seznama.
73 Zaradi izida nove različice konkordančnika je ta trenutno zgolj delno preveden v slovenščino.
155
Darja Fišer, Kristina Pahor de Maiti: »Prvič, sem političarka in ne politik, drugič pa …«
– Atribut speech/govor zamejuje posamezne govore (gl. številko 5) in vsebuje infor-
macije o imenu, spolu, vlogi in strankarski pripadnosti govorke oz. govorca (gl.
Sliko 3b, številko 5).
Slika 3a: Osnovne informacije o korpusu siParl 2.0.
Slika 3b: Razširjene informacije o strukturnih atributih v korpusu siParl 2.0.
156
Prispevki za novejšo zgodovino LXI – 1/2021
NALOGA 1: Zastopanost žensk v slovenskem parlamentu
Državni zbor Republike Slovenije ima 90 poslank in poslancev, vključno s pred-
stavnico oz. predstavnikom italijanske in madžarske manjšine, ki so trenutno del
devetih političnih strank.
74
Slovenija je ena od najmlajših držav Evropske unije, ki je v
preteklih 30 letih doživela dramatične spremembe na področju enakosti spolov. Leta
1986, ko je bila Slovenija še vedno del Socialistične federativne republike Jugoslavije,
so poslanke zasedale skoraj četrtino vseh poslanskih sedežev, leta 1992, ko je bil prvič
sklican Državni zbor Republike Slovenija, pa se je ta delež občutno zmanjšal, saj so
poslanke zasedale le še vsaki deseti poslanski sedež.
75
Med postopkom tranzicije, ko
so se družbeni, politični, gospodarski in vrednostni sistem bistveno spremenili, so
ženske v Sloveniji izgubile več gospodarskih in družbenih prednosti, pridobljenih v
času socializma, in so bile skoraj popolnoma izrinjene iz političnih institucij. V sed-
mem mandatu (1. 8. 2014–21. 6. 2018), ki je zadnji mandat, vključen v korpus siParl
2.0, so poslanke zasedle malo več kot 40 % sedežev, večinoma zaradi zakonodajnih
ukrepov, ki predpisujejo spolne kvote.
76
Glede na EU indeks vrednosti enakosti spolov
in politične moči v Evropski uniji za leto 2017
77
je bila Slovenija uvrščena med prvih
10 držav Evropske unije po deležu poslank.
V Nalogi 1 bomo primerjali govore v korpusu siParl 2.0 s trendi na parlamentarnih
volitvah in v slovenski družbi.
Izdelava podkorpusov
Na podlagi metapodatkov, ki so na voljo v korpusu (gl. Sliko 3b), korpus razdelimo
na več delov, t. i. podkorpuse, in sicer glede na naslednja merila:
– Spol. Govorke in govorci so v korpusu označeni z eno od naslednjih kategorij
v skladu s podatki iz uradnih sejnih zapisov državnega zbora: moški, ženska ali
ni podatka (v primerih, ko so zapisi metapodatkov nepopolni). V tem gradivu
uporabljamo le prvi dve kategoriji (moški, ženska), medtem ko tistih, za katere ni
podatka o spolu, v analizo ne vključujemo.
– Vloga. Govorkam in govorcem je v korpusu pripisana ena od dveh vlog, in sicer
član parlamenta oziroma zunanji govornik
78
(ta vloga označuje povabljene govorke
in govorce, ki niso del parlamenta (npr. članice in člani vlade, predstavnice in
74 Portal DZ - Poslanske skupine, pridobljeno 18. 2. 2021, https://tinyurl.com/yh6brs32.
75 Milica Antić Gaber in Irena Selišnik, »The Slovene Version of a ‚Fast T rack‘ to Political Equality,« Teorija in Praksa
54, št. 2 (2017): 337.
76 Delež temelji na uradnem številu vseh poslank, kot ga navaja Simona K. Lipicer (2017), nato pa je deljen s številom
vseh poslank in poslancev (tj. 90). T a delež je rahlo višji od deleža, navedenega v naši analizi, v kateri smo dosledno
uporabljali le podatke iz korpusa. Ker le redko vsi izvoljeni poslanci in poslanke ostanejo na istem položaju celoten
mandat, jih nato zamenjajo drugi poslanci oziroma poslanke. To se odraža v korpusu, ki vključuje vse poslanke in
poslance, in ne le tistih, ki so bili izvoljeni na volitvah. Glede na podatke iz korpusa je skupno število poslancev in
poslank na mandat tako večje od 90.
77 European Institute for Gender Equality Home, pridobljeno 18. 2. 2021, https://tinyurl.com/84embf66.
78 Pri oznakah v korpusu je uporabljen generični moški spol.
157
Darja Fišer, Kristina Pahor de Maiti: »Prvič, sem političarka in ne politik, drugič pa …«
predstavniki ministrstev ali nevladnih organizacij). V tem gradivu upoštevamo
le govorce in govorke z oznako član parlamenta, ker se želimo osredotočiti na
prispevke izvoljenih predstavnic in predstavnikov državljanov Slovenije.
– Tip. Poleg vloge je govorkam in govorcem v korpusu pripisan tudi njihov tip, ki
ima eno od naslednjih dveh vrednosti: redni govornik ali predsedujoči. Prva kate-
gorija označuje govorke in govorce v parlamentu, ki so v skladu s poslovnikom
izrecno dobili besedo. V naši analizi upoštevamo le to kategorijo. Tiste z oznako
predsedujoči smo namerno izključili, saj je večina njihovih izjav namreč pogojena
s postopkovnimi predpisi in dogovori in torej nanje ne vplivajo strankarska pripa-
dnost, spol ali drugi dejavniki.
– Mandat. V sak govor v korpusu je kategoriziran glede na parlamentarno obdobje, v
katerem je bil izrečen (1.–7. mandat). Ker to presega meje naše raziskave, smo iz
analize izključili obdobje odcepitve od Jugoslavije,
79
ki je v korpusu označeno kot
11. sklic.
– Delovni organ. Korpus siParl 2.0 vsebuje govore s plenarnih zasedanj, z zasedanj
delovnih organov državnega zbora (npr. Komisija za peticije, človekove pravice in
enake možnosti) in z zasedanj Sveta predsednika Državnega zbora. V tem gradivu
analiziramo le govore s plenarnih zasedanj.
Na podlagi teh meril izdelamo 14 podkorpusov, po dva za vsakega od sedmih
mandatov, pri čemer eden vsebuje govore poslank, drugi pa govore poslancev s pri-
pisano vlogo redni govornik. Poleg teh 14 podkorpusov izdelamo tudi podkorpuse, ki
vsebujejo vse govore poslank in poslancev za vsak posamezni mandat in za vseh sedem
mandatov skupaj.
Videoposnetek, ki prikazuje izdelavo podkorpusa v konkordančniku NoSketch
Engine, je na voljo na https://sidih.si/20.500.12325/120.
Ustvarjeni podkorpusi in informacije o njihovi velikosti so na voljo tukaj.
80
Spodaj je naveden tudi primer zahtevnejšega iskalnega izraza v jeziku CQL, ki
ga je treba uporabiti pri izdelavi spodnjega podkorpusa:
Mandat1-Ženske:
81
within
79 Socialistična republika Slovenija – Wikipedija, prosta enciklopedija, pridobljeno 18. 2. 2021, https://tinyurl.com/k3mafd47.
80 Subcorpus information, pridobljeno 18. 2. 2021, http://hdl.handle.net/11346/siparl-KGFY .
81 Ker je to gradivo na voljo v slovenščini in angleščini, so poimenovanja podkorpusov v konkordančniku dvojezična.
V endar pa v tem gradivu zaradi jasnosti in jedrnatosti uporabljamo zgolj slovenski del imena podkorpusov. Povezava
do angleških videov: https://youtube.com/playlist?list=PLhZ_k72iCcmon0HVgd4O3UcwRIs-W-R0R.
158
Prispevki za novejšo zgodovino LXI – 1/2021
S tem ukazom poiščemo vse izjave (atribut speech/govor) govork (atribut
F/Ž), ki so članice parlamenta (atribut MP/Član parlamenta) in redne
govorke (atribut Regular speaker/Redni govornik), in sicer v govorih iz prvega
mandata (atribut T erm 1 .*/1. Mandat .*), ki so bili izrečeni v Državnem zboru
Republike Slovenije (atribut Državni zbor Republike Slovenije).
Če želimo ustvariti podkorpus govorov poslancev, moramo spremeniti le
spol prek atributa speech gender/spol (speech gender="M"). Za podkorpus,
ki vsebuje govore poslank in poslancev iz vseh mandatov, pa moramo naj-
prej vključiti moški in ženski spol prek atributa speech gender/spol (speech
gender="F|M"), nato pa še vse mandate prek atributa session mandate/mandat
seje (session mandate_en="T erm .*").
Uporaba frekvenčnih seznamov
V podkorpusih, ustvarjenih v prejšnjem koraku, bomo analizirali govore poslank
in poslancev skozi čas, in sicer na podlagi podatkov s frekvenčnih seznamov,
82
ki so
ena od najosnovnejših korpusnih tehnik. Frekvenčni seznami prikazujejo rezultate od
najbolj do najmanj pogostega. T o tehniko lahko na primer uporabimo za sestavljanje
frekvenčnega seznama vseh besed, ki so bile izrečene v parlamentu oziroma v govo-
rih izbrane poslanke ali izbranega poslanca. V tej nalogi bomo s to tehniko pridobili
podatke o številu vseh poslank in poslancev v posameznem mandatu ter številu njiho-
vih govorov, vključno s skupnim številom pojavnic v teh govorih.
Videoposnetek, ki prikazuje izdelavo frekvenčnega seznama v konkordanč-
niku NoSketch Engine, je na voljo na https://youtu.be/LrYmwK51Fbc.
Slika 4 prikazuje primer dveh frekvenčnih seznamov.
Kot prikazuje Slika 4, je bilo v prvem mandatu prisotnih 14 poslank, ki so skupno
izrekle več kot 3.500 govorov, kar je le malo manj kot milijon pojavnic. Povprečno je
to skoraj 260 govorov oziroma 69.000 pojavnic na poslanko. V endar pa je porazdelitev
med poslankami zelo neenakomerna, pri čemer sega od skoraj 700 govorov oziroma
več kot 170.000 pojavnic do manj kot 40 govorov oziroma 9.000 pojavnic.
82 Wordlists – word frequency lists | Sketch Engine, pridobljeno 18. 2. 2021, https://tinyurl.com/v4ta5zbh.
159
Darja Fišer, Kristina Pahor de Maiti: »Prvič, sem političarka in ne politik, drugič pa …«
Slika 4. Frekvenčna seznama za poslanke iz prvega mandata. Na levi
83
je prikazano število
govorov, ki jih je posamezna poslanka prispevala, na desni
84
pa je število pojavnic v teh govorih.
Po številu govorov je na prvem mestu Danica Simšič, članica Demokratske stranke
Slovenije, manjše opozicijske stranke iz prvega mandata. T a poslanka je prispevala 680
govorov ali skoraj 19 % vseh govorov v celotnem podkorpusu, kar je skoraj 3-kratno
povprečje pri ženskah. Podatek o deležu govorov smo pridobili tako, da smo število
njenih govorov delili s številom vseh govorov poslank (gl. Slika 4, levo: T otal frequency
in Simšič, Danica), podatek o razmerju glede na povprečje pa smo pridobili tako, da
smo število poslankinih govorov delili s povprečjem števila vseh govorov, ki ga dobimo
tako, da skupno število govorov poslank delimo s številom vseh poslank (gl. Slika 4,
levo: Total frequency in Total number of items).
Po številu pojavnic je poslanka z največjim prispevkom v tem podkorpusu Metka
Karner Lukač, članica Slovenske ljudske stranke, najstarejše stranke v Sloveniji. Njeni
govori vsebujejo 173.067 pojavnic ali 18 % celotnega podkorpusa, kar je skoraj 3-kratnik
povprečja. Poslanka z najnižjim številom govorov in pojavnic je Mihaela Logar, prav
tako članica Slovenske ljudske stranke, ki je v svojem 4-letnem mandatu spregovorila le
39-krat, v njenih govorih pa je nekaj več kot 9.000 pojavnic, kar je skoraj 20-krat manj od
prvouvrščene govorke. Poleg tega je še zanimivo, da približno polovica vseh prispevkov
pripada le trem poslankam, in sicer že omenjenima poslankama ter Bredi Pečan, članici
Socialnih demokratov, katere govori so bili v povprečju tudi najdaljši. T a podatek razbe-
remo iz podatkov o povprečni dolžini govorov za posamezno poslanko, pri čemer pov-
prečno dolžino govora izračunamo tako, da število vseh pojavnic za posamezno poslanko
(gl. Slika 4, desno) delimo s številom vseh govorov te iste poslanke (gl. Slika 4, levo).
83 Word list, pridobljeno 18. 2. 2021, http://hdl.handle.net/11346/siparl-WR9T .
84 Word list, pridobljeno 18. 2. 2021, http://hdl.handle.net/11346/siparl-GSW5.
160
Prispevki za novejšo zgodovino LXI – 1/2021
Primerjalna analiza
Za potrebe primerjalne analize zastopanosti moških in žensk v slovenskem par-
lamentu skozi čas zabeležimo število poslancev in poslank ter število pojavnic v vsa-
kem od 14 podkorpusov (gl. razdelek 6.2.1 Izdelava podkorpusov). Ker zbirnih tabel
s podatki ne dobimo neposredno v konkordančniku, si pomagamo tako, da podatke
ročno vnesemo v preglednico, kot prikazuje Tabela 1. Grafični prikaz rezultatov si
lahko ogledate na Sliki 5 in Sliki 6.
Tabela 1. Pregled velikosti podkorpusov siParl 2.0.
85
85 Zaradi napake v metapodatkih korpusa, ki so bili pripisani enemu od poslancev (in sicer poslancu z imenom Geza,
ki mu je bil napačno samodejno pripisan ženski spol najverjetneje zaradi kombinacije končnice –a, ki je sicer tipična
za samostalnike ženskega spola, in redkosti imena), podatki za šesti mandat v času analize ne odražajo uradnega
števila poslank, ki je po navedbah Simone K. Lipicer (2017) 39, in ne 38, kot prikazuje korpus.
161
Darja Fišer, Kristina Pahor de Maiti: »Prvič, sem političarka in ne politik, drugič pa …«
Slika 5: Delež poslank in poslancev v korpusu siParl 2.0 skozi čas.
Slika 6: Prispevek poslank in poslancev v korpusu siParl 2.0, izmerjen v izrečenih
pojavnicah skozi čas.
162
Prispevki za novejšo zgodovino LXI – 1/2021
Rezultati kažejo, da delež pojavnic, ki sestavljajo govore poslank, postopoma nara-
šča skupaj z zastopanostjo žensk v parlamentu. Precejšen skok v zastopanosti žensk
je mogoče opaziti predvsem v zadnjih dveh mandatih, vključenih v korpus siParl 2.0,
kar je najverjetneje posledica sprejema spolnih kvot, v skladu s katerimi mora biti od
leta 2011 na volilnih seznamih 35 % žensk.
86
Pomembna pa je ugotovitev, da kljub
temu, da so kvote eden najuspešnejših ukrepov za povečanje števila poslank,
87
naša
korpusna analiza prikazuje velika odstopanja med številom govork in številom pojav-
nic v njihovih govorih. Rezultati volitev so enostavno dostopni in raziskovalci in ana-
litiki jih pogosto uporabljajo, število in vsebina govorov pa sta veliko težje dostopna,
zato ju raziskovalci izven korpusnega jezikoslovja precej manj izčrpno preučujejo,
kar predstavlja vrzel, ki jo želimo s to analizo premostiti. Podatki kažejo jasen trend,
da poslanke prispevajo manjši delež vsebine, kot bi pričakovali glede na njihov delež
v izbranem mandatu. To velja zlasti za drugi mandat, kjer govori poslank vsebujejo
dvakrat manj pojavnic glede na njihovo število. Pravzaprav je le v četrtem mandatu
prispevek žensk nekoliko večji od njihovega deleža v parlamentu. Zato lahko skle-
pamo, da več izvoljenih poslank ne pomeni nujno, da bo njihov glas tudi bolj prisoten
v Državnem zboru. Vseeno pa se je v preteklih letih z večanjem števila poslank v parla-
mentu začelo povečevati tudi število njihovih govorov. Prispevek poslank se je s pičle
desetine vseh govorov v parlamentu v prvih petih mandatih povečal na skoraj tretjino
v zadnjih dveh mandatih, ki jih pokriva naš korpus.
NALOGA 2: Ključne teme poslank in poslancev
Raziskave političnega diskurza žensk so pokazale, da ženske običajno razpravljajo
o drugačnih temah kot moški. V eč o vplivu spola na jezik si lahko preberete v razdelku
5 Jezik in spol.
V Nalogi 2 želimo na podlagi govorov iz korpusa siParl 2.0 primerjati teme, o
katerih razpravljajo poslanke in poslanci. Za nekatere parlamentarne korpuse je klasi-
fikacija tem že na voljo,
88
za korpus siParl 2.0 pa to ne velja. Klasifikacijo tem je mogoče
izvesti samodejno, kot v članku Analysis of policy agendas,
89
vendar pa je cilj tega gra-
diva pokazati učinkovitost raziskav parlamentarnih korpusov zgolj prek uporabe kon-
kordančnikov, torej brez kakršnegakoli znanja programiranja, zaradi česar smo izbrali
ročni pristop v dveh korakih. Ročni pristopi so še posebej primerni za zelo specifično
razvrščanje tem, kot to velja za našo analizo, za katero še ne obstajajo računalniški
modeli ali učne množice za razvoj takih modelov. Pri tem je treba opozoriti, da lahko
86 Antić Gaber in Selišnik, »The Slovene Version of a ‚Fast T rack‘ ,« 337.
87 Ibid.
88 Gl. Federico Nanni, Mahmoud Osman, Yi-Ru Cheng, Simone Paolo Ponzetto in Laura Dietz, »UKParl: A Semantified
and Topically Organized Corpus of Political Speeches,« v: Darja Fišer, Maria Eskevich in Franciska de Jong, ur.,
Proceedings of the Eleventh International Conference on Language Resources and Evaluation (Miyazaki: LREC 2018).
89 Mladen Karan, Jan Šnajder, Daniela Širinić in Goran Glavaš, »Analysis of Policy Agendas: Lessons Learned from
Automatic T opic Classification of Croatian Political T exts,« Proceedings of the 10th SIGHUM Workshop on Language
Technology for Cultural Heritage, Social Sciences, and Humanities (2016): 12–21.
163
Darja Fišer, Kristina Pahor de Maiti: »Prvič, sem političarka in ne politik, drugič pa …«
tako pri samodejnem kot pri ročnem razvrščanju pride do napak, vendar lahko pri
ročnem označevanju število napak, ki so posledica nenatančnosti ali pa tudi pristran-
skosti označevalca oziroma označevalke, zmanjšamo z večjim številom označevalk oz.
označevalcev, s čimer pridobimo vpogled v stopnjo ujemanja med njimi, za nadaljnje
delo pa lahko upoštevamo temo, ki jo je izbrala večina, oz. vse pripisane teme.
Luščenje ključnih besed
V tej nalogi bomo uporabili uveljavljeno tehniko korpusne analize, ki ji rečemo
luščenje ključnih besed.
90
S to tehniko izbrani korpus primerjamo z referenčnim korpu-
som in tako pridobimo najbolj značilno besedišče izbranega korpusa, torej (pod)kor-
pusa, ki ga analiziramo. Referenčni korpus pa je običajno velik reprezentativni korpus
ustreznega jezika, lahko pa je tudi katerikoli drug (pod)korpus, ki ga želimo uporabiti
kot referenčno točko za primerjavo. V tej nalogi bomo primerjali podkorpusa govorov
poslank in poslancev za posamezni mandat. T ako bomo pridobili podatke, na podlagi
katerih bomo lahko opredelili najbolj izstopajoče teme v slovenskem parlamentu.
Videoposnetek, ki prikazuje izdelavo seznama ključnih besed v konkordanč-
niku NoSketchEngine, je na voljo na https://youtu.be/DMiZP6f4qI8.
Ustvarjeni seznami ključnih besed, prikazanih kot leme s poenoteno malo
začetnico, so na voljo tukaj:
– Mandat1-Ženske
91
– Mandat1-Moški
92
– Mandat7-Ženske
93
– Mandat7-Moški
94
Sezname ključnih besed za vse štiri podkorpuse izvozimo v preglednico in jih
ročno označimo (gl. razdelek 6.3.3 Primerjalna analiza).
Sliki 7 in 8 prikazujeta prvih 20 ključnih besed poslank in poslancev v sedmem
mandatu.
95
Opazimo lahko velike razlike. Večina vseh prikazanih ključnih besed
poslank je povezana s področjem zdravstvenega varstva, medtem ko ključne besede
govorov poslancev pripadajo področjem zunanjih zadev, infrastrukture in pravosodja.
90 Keyword (linguistics) – Wikipedia, pridobljeno 18. 2. 2021, https://tinyurl.com/3eu8u66s.
91 Word list, pridobljeno 18. 2. 2021, http://hdl.handle.net/11346/siparl-VBX5.
92 Word list, pridobljeno 18. 2. 2021, http://hdl.handle.net/11346/siparl-74HT .
93 Word list, pridobljeno 18. 2. 2021, http://hdl.handle.net/11346/siparl-AZM0.
94 Word list, pridobljeno 18. 2. 2021, http://hdl.handle.net/11346/siparl-7E3V .
95 Konkordančnik NoSketchEngine za računanje ključnih besed uporablja formulo Simple Maths.
164
Prispevki za novejšo zgodovino LXI – 1/2021
Slika 7: Prvih 20 ključnih besed poslank v primerjavi s poslanci v prvem mandatu.
Slika 8: Prvih 20 ključnih besed poslancev v primerjavi s poslankami v prvem mandatu.
Analiza konkordanc
Za nadaljnjo analizo izberemo prvih 100 ključnih lem z vsakega od štirih sezna-
mov ključnih besed, pri čemer ne upoštevamo osebnih lastnih imen. Naš cilj je ročno
kategorizirati leme, in sicer glede na prevladujočo temo, ki jo prepoznamo pri pre-
gledu konkordanc
96
za izbrano lemo. Konkordančni niz vsebuje seznam vseh pojavitev
iskane pojavnice v kontekstu, kot prikazuje Slika 9:
96 Concordance – most powerful corpus search | Sketch Engine, pridobljeno 18. 2. 2021, https://tinyurl.com/8zrs9f8n.
165
Darja Fišer, Kristina Pahor de Maiti: »Prvič, sem političarka in ne politik, drugič pa …«
– Konkordance je mogoče neposredno prikazati s klikom leme na seznamu ključnih
besed. Prikaže se stran, kjer je na vrhu zaslona prikazana izbrana lema z vsemi
zadetki (gl. številko 1).
– Besede v rdeči barvi na sredini zaslona (gl. številko 2) so zadetki iskane besede v
našem podkorpusu, besedilo v črni barvi (gl. številko 3) pa je kontekst.
– Besedilo v modri barvi na levi (gl. številko 4) so metapodatki. V našem primeru
je prikazan podatek o govorcu.
– S klikom želene konkordance lahko še dodatno razširimo kontekst (gl. številko 5).
Na podoben način lahko s klikom govorca pridobimo več metapodatkov.
– Prikaz lahko tudi prilagodimo, in sicer prek Možnosti prikaza (gl. številko 6), ter
prikažemo več metapodatkov ali širši kontekst.
Slika 9: Razširjeni kontekst za prvi zadetek v konkordančnem nizu
97
za ključno besedo
»proporcionalen«.
Primerjalna analiza
Parlament je v prvi vrsti zakonodajno telo, v katerem potekajo zakonodajne in
proračunske razprave, ki so strukturirane po ministrstvih. Zato nam seznam 14 mini-
strstev trenutne slovenske vlade
98
služi kot seznam kategorij za ročno označevanje tem.
Kategorije so navedene v T abeli 2. Lahko bi uporabili tudi številne druge sezname tem,
vendar je takšen nabor tem po našem mnenju najbolj naravna izbira v specifičnem
okolju parlamentarnega diskurza. Tem 14 vsebinskim kategorijam dodamo še 4 teh-
nične kategorije za ključne besede, ki jih ni mogoče uvrstiti drugam: razno – za ključne
besede, uporabljene v razpravah o več različnih temah, slog – za očitne pogovorne ali
97 Iskanje, pridobljeno 18. 2. 2021, http://hdl.handle.net/11346/siparl-VZB9.
98 Ministrstva | GOV .SI, pridobljeno 18. 2. 2021, https://tinyurl.com/jbjhnjjb.
166
Prispevki za novejšo zgodovino LXI – 1/2021
žargonske ključne besede, ki so izrazito značilne za posamezne govorce, ideologija –
za ključne besede, uporabljene za ideološko označevanje (npr. partijski, socialist), in
interakcija/postopkovnik – za ključne besede, ki naslavljajo druge poslance ali pa so del
postopkovnika. V T abeli 3 so navedeni ponazoritveni primeri ročno pripisanih tem za
prvih 10 ključnih besed poslank in poslancev.
Tabela 2. Kategorije za označevanje ključnih besed. Zadnje štiri kategorije zapisujemo z
velikimi tiskanimi črkami, da jih tako ločimo od vsebinskih kategorij.
Tabela 3: Ponazoritveni primeri ročno pripisanih oznak glede na temo za prvih 10 ključnih
besed poslank in poslancev v prvem mandatu.
167
Darja Fišer, Kristina Pahor de Maiti: »Prvič, sem političarka in ne politik, drugič pa …«
T abeli 4 in 5 vsebujeta povzetek rezultatov ročnega označevanja prvih 100 ključ-
nih lem poslank in poslancev v prvem in sedmem mandatu. Rezultati kažejo, da je
nabor tem skozi čas in med spoloma primerljiv. Kljub podobnemu številu opredelje-
nih vsebinskih tem se poslanci in poslanke pri najbolj izpostavljenih tematikah zelo
razlikujejo.
Tabela 4: Teme prvih 100 ključnih besed poslank in poslancev v prvem mandatu.
Tabela 5: Teme prvih 100 ključnih besed poslank in poslancev v sedmem mandatu.
168
Prispevki za novejšo zgodovino LXI – 1/2021
V prvem mandatu večina (54 %) vseh analiziranih ključnih besed poslank spada
v dve tematski kategoriji: Zdravje in Delo, družina in socialne zadeve, pri poslancih pa
sta najpogostejši temi s podobnim deležem (55 %) Infrastruktura in Javna uprava. V
sedmem mandatu sta najpogostejši temi poslank enaki kot v prvem mandatu, vendar
predstavljata večji delež ključnih besed (58 %), pri poslancih pa je najpogostejša tema
postala Zunanje zadeve. Razdelitve tem med spoloma ni mogoče v celoti razložiti s kor-
pusno analizo, vendar pa dobljeni rezultati, ki pri poslankah kažejo izrazito zanimanje
za zdravstvene in socialnovarstvene teme, pri poslancih pa premik z infrastrukturnih
tematik na zunanjepolitične, zelo nazorno odražajo stanje v družbi. V času neodvi-
snosti je morala novonastala država oblikovati javno upravo in izgraditi infrastruk-
turo, za kar so bile v prvem mandatu potrebne intenzivne razprave. Zadnji mandat pa
zaznamujejo živahna mednarodna trgovina in večje mednarodne varnostne grožnje,
kar vpliva na zakonodajne in proračunske odločitve. V sedmem mandatu lahko še
vedno zasledimo poudarjeno zanimanje za socialnovarstvene tematike, poleg tega pa
tudi intenzivnejše razprave s področja zdravstva, kar je v veliki meri posledica močnega
pritiska na proračun zaradi hude gospodarske krize v tistem obdobju, ki je negativno
vplivala tudi na že propadajoči sistem javnega zdravstva.
Opazimo lahko tudi, da v prvem mandatu poslanci in poslanke namenjajo skoraj
enako pozornost (glede na delež analiziranih ključnih besed) večjemu številu tem kot
v sedmem mandatu (pet skupnih tem z enako pomembnostjo v prvem mandatu oz. tri
skupne teme v sedmem mandatu). V prvem mandatu tako poslanci le rahlo pogosteje
kot poslanke razpravljajo o Javni upravi (M: 14 %, Ž: 11 %), Gospodarstvu in tehnolo-
giji (M: 8 %, Ž: 6 %) ter Pravosodju (M: 2 %, Ž: 1%), poslanke pa nekaj pogosteje o
Kmetijstvu, gozdarstvu in prehrani (M: 3 %, Ž: 4 %), medtem ko vsi razpravljajo enako
pogosto o Obrambi (1 %). V sedmem mandatu so glede na delež analiziranih ključnih
besed poslankam in poslancem enako pomembne zgolj tri teme, in sicer Finance (4
%), Pravosodje (3 %) in Javna uprava (3 %). Za poglobitev rezultatov bi bilo zanimivo
raziskati, na kakšne načine poslanke in poslanci pristopajo k tem skupnim temam in
o njih razpravljajo.
Med temami, ki se pojavijo zgolj v podkorpusu govorov poslank, najdemo
Izobraževanje, znanost in šport v prvem mandatu ter Zdravje, Delo, družino in socialne
zadeve ter Kulturo v sedmem mandatu. T eme, ki se pojavijo zgolj pri poslancih, pa so
Okolje in prostor ter Notranje zadeve v obeh parlamentarnih mandatih, Zunanje zadeve
(v prvem mandatu) in Obramba (v sedmem mandatu). Presenetljivo je, da se najpo-
gostejše tri teme poslank sploh ne pojavijo na seznamu tem poslancev, medtem ko se
najpogostejše teme poslancev (Infrastruktura, Javna uprava, Zunanje zadeve) pojavijo
na seznamu tem poslank, čeprav je njihov delež majhen. Poleg tega je zanimivo, da
tema Gospodarstvo in tehnologija pri poslankah izgubi na pomembnosti med prvim in
sedmim mandatom, medtem ko to ne velja za poslance.
Rezultati poleg različnih področij zanimanja kažejo tudi na slogovne razlike v raz-
pravah poslank in poslancev. V obeh mandatih so poslanci uporabili precej več slo-
govno zaznamovanih besed (tj. očitnih pogovornih ali žargonskih besed, ki so izrazito
169
Darja Fišer, Kristina Pahor de Maiti: »Prvič, sem političarka in ne politik, drugič pa …«
značilne za posamezne govorce) kot poslanke. Uporaba takšnih besed pri poslancih
se je v sedmem mandatu v primerjavi s prvim mandatom potrojila, kar po eni strani
kaže na večjo sproščenost poslancev na splošno, po drugi pa označuje spremembo v
kulturi razpravljanja, ki je v zadnjih dveh desetletjih postala živahnejša in bolj nefor-
malna. Opazimo lahko tudi, da so ideološke besede, ki običajno delujejo razdvajajoče,
značilne le za poslance. T o je v skladu z literaturo, kjer avtorji ugotavljajo, da so moške
sporazumevalne strategije bolj agresivne in tekmovalne, medtem ko je ženski slog spo-
razumevanja bolj sodelovalen.
99
Vendar naj opozorimo, da bi bilo treba te zaključke
preveriti s podrobnejšo analizo, saj nekatere sodobne raziskave kažejo, da na spora-
zumevanje vplivajo številni dejavniki in je zato razlikovanje med moškim in ženskim
načinom sporazumevanja pogosto preveč simplistično.
100
Naša analiza kaže tudi na opazne razlike v vlogah in zanimanjih poslank in poslan-
cev, kar je v skladu s prejšnjimi raziskavami, iz katerih je razvidno, da se ženske v pri-
merjavi z moškimi bolj osredotočajo na t. i. mehka zakonodajna področja. Diahrone
primerjave razkrivajo, da temi Zdravje in Socialne zadeve ostajata med prednostnimi
zanimanji poslank, osredotočenost poslancev pa se je premaknila s tem Infrastruktura
in Javna uprava na Zunanje zadeve. V prvem mandatu je bila najpogostejša skupna tema
Javna uprava, v zadnjem mandatu pa so poslanke in poslanci najpogosteje razpravljali
o temi Finance. To pa ne pomeni, da poslanke zdaj več razpravljajo o t. i. trdih zako-
nodajnih področjih. Pravzaprav je ravno nasprotno, saj analiza kaže, da so se poslanke
v sedmem mandatu celo bolj osredotočale na t. i. mehka zakonodajna področja kot v
prvem mandatu.
NALOGA 3: Obravnava tematik, povezanih z ženskami
T a naloga se naslanja na sorodne raziskave,
101
v katerih so raziskovalci ugotavljali,
kako pogosto so bile v parlamentarni zgodovini naslovljena vprašanja enakosti spolov
(npr. pravice žensk, diskriminacija itd.) ter kdo in na kakšen način je takšna vprašanja
odpiral. Zanimivo je, da je vpliv spola očitno opazen tudi v državah z visokim dele-
žem žensk v parlamentu. Ena takšnih je Švedska, za katero so Bäck idr.
102
ugotovili, da
poslanke redkeje razpravljajo o vprašanjih s t. i. trdih zakonodajnih področij. Antić
Gaber in Ilonszki
103
pravita, da družba običajno pričakuje, da bodo poslanke dejavne
na drugih področjih politike kot moški. Pri tem gre, kot to ugotavljajo politologi,
104
za
področja politike, ki so še posebej povezana z ženskami zaradi njihove zgodovinske
vloge v družbi ali neposrednega vpliva na življenje žensk.
99 Jennifer Coates, Women, Men and Language.
100 Cornelia Ilie, »Gendering Confrontational Rhetoric: Discursive Disorder in the British and Swedish Parliaments,«
Democratization 20, št. 3 (2013): 501–21.
101 Blaxill in Beelen, »A Feminized Language of Democracy«.
102 Bäck, Debus in Müller, »Who T akes the Parliamentary Floor?«
103 Antić Gaber in Ilonszki, Women in Parliamentary Politics.
104 Gl. Tracey L. Osborn, How Women Represent Women: Political Parties, Gender and Representation in the State
Legislatures (Oxford: Oxford University Press, 2012).
170
Prispevki za novejšo zgodovino LXI – 1/2021
Ker se pri vprašanjih enakosti spolov še vedno največkrat govori o neenaki vlogi
žensk v družbi in njihovem posebnem položaju, iz katerega izhajajo tako določene pra-
vice in teme, ki se tičejo njihovega življenja, kot tudi diskriminatorne prakse, bomo v
Nalogi 3 raziskali, katere tematike, povezane z ženskami, prevladujejo v parlamentarnih
razpravah in kako pogosto se o njih razpravlja, pri čemer se bomo osredotočili na upo-
rabo samostalnika »ženska« kot eksplicitnega pokazatelja razprav o teh tematikah.
Delo s frekvencami
V tem delu nas najprej zanima, kako pogosto poslanci in poslanke uporabljajo lemo
samostalnika »ženska« v različnih časovnih obdobjih (1992–2018). Izvedemo poizvedbe
v vseh podkorpusih in v preglednico zabeležimo podatke o frekvenci, kot prikazuje T abela 6.
Ker želimo primerjati podkorpusa različnih velikosti, moramo namesto absolutne frekvence
uporabiti normalizirano frekvenco,
105
pri kateri je uporabljeno enako skupno število vseh
besed v (pod)korpusu. Absolutna frekvenca je v primeru primerjave korpusov različnih
velikosti namreč lahko zavajajoča. Če na primer pogledamo podatka o absolutni frekvenci
izbrane besede za drugi mandat (Ž: 190; M: 794), bi lahko sklepali, da poslanci upora-
bijo samostalnik »ženska« štirikrat pogosteje kot poslanke. Ker pa je podkorpus govorov
poslank v tem parlamentarnem mandatu veliko manjši od podkorpusa govorov poslancev,
nam šele normalizirana frekvenca (v našem primeru na milijon besed), pove, da so ta samo-
stalnik poslanke izrekle pravzaprav petkrat pogosteje (249,29) kot poslanci (50,36).
Prikaz poizvedbe v konkordančniku NoSketchEngine za lemo samostal-
nika »ženska« si lahko ogledate v videoposnetku o luščenju kolokacij (min.
00:10–1:13). https://youtu.be/ENXP8T rH42U.
Konkordančni niz za lemo samostalnika »ženska« je na voljo tukaj:
VsiMandati-Ženske
106
Slika 10: Začetek konkordančnega niza za lemo samostalnika »ženska« z absolutno
frekvenco (številka 1) in normalizirano frekvenco (številka 2).
105 Normalizing word counts – The Grammar lab, pridobljeno 18. 2. 2021, https://tinyurl.com/pkwaaf34.
106 Iskanje, pridobljeno 18. 2. 2021, http://hdl.handle.net/11346/siparl-YMFX.
171
Darja Fišer, Kristina Pahor de Maiti: »Prvič, sem političarka in ne politik, drugič pa …«
Tabela 6. Podatki o absolutni in normalizirani frekvenci za lemo samostalnika »ženska« v
korpusu siParl 2.0.
Na splošno je normalizirana frekvenca iskane besede za celotno časovno obdobje, ki
ga zajema korpus siParl 2.0, skoraj petkrat višja v podkorpusu govorov poslank kot v pod-
korpusu govorov poslancev (221,21 proti 45,99). Kot je razvidno iz Slike 10, poslanke v
svojih govorih pogosteje omenjajo ženske kot poslanci. Čeprav je v obdobju med drugim
in četrtim mandatom (1996–2008) mogoče opaziti intenzivnejšo obravnavo teh področij
pri poslankah, je v zadnjih mandatih njihovo zanimanje za ta področja izrazito usahnilo.
Najbolj presenetljive rezultate pri poslankah smo odkrili v tretjem in petem man-
datu. V tretjem mandatu je normalizirana frekvenca iskane besede dosegla rekordno
visoko stopnjo, kar je lahko posledica manjšega števila poslank v prejšnjih dveh parla-
mentarnih mandatih in neenakopravnega položaja žensk v družbi nasploh. Ker pa je
enak trend mogoče opaziti tudi v podkorpusu govorov poslancev, se zdi, da so k temu
prispevali tudi drugi razlogi. Za boljši vpogled v ta pojav smo izvedli kvalitativno analizo,
pri kateri smo pregledali 50 konkordanc petih najdejavnejših poslancev. Iz konkordanc
je razvidno, da se je v tistem času veliko razpravljalo o zakonodaji prav v zvezi z vprašanji
enakosti spolov (npr. zakonodaja o enakih možnostih in spolnih kvotah). Skoraj desetle-
tje pozneje, v petem mandatu, se je število omemb iskane besede v podkorpusu govorov
poslank nenadoma zmanjšalo in padlo celo pod vrednost frekvence pred letom 2000,
kljub precej večjemu številu poslank v parlamentu. Peti mandat je potekal v obdobju
velike svetovne gospodarske krize, ki je Slovenijo močno prizadela in je bila verjetno
osrednji predmet parlamentarnih razprav, vendar bi bilo to treba potrditi z nadaljnjo raz-
iskavo in kontekstualizacijo ob uporabi kvalitativnih metod, kot je analiza konkordanc.
Zanimivo je tudi, da se v četrtem mandatu kljub drugemu najnižjemu številu poslank
samostalnik »ženska« še vedno zelo pogosto pojavlja v primerjavi s šestim in sedmim
mandatom, kjer je bilo število poslank precej večje, frekvenca iskane besede pa skoraj
dvakrat nižja. Kot smo opazili že pri splošnem doprinosu poslank k razpravam (gl. raz-
delek 6.2.3 Primerjalna analiza), kjer smo odkrili veliko razhajanje med številom poslank
in številom besed, ki so jih izrekle, ti rezultati znova kažejo, da zgolj večje število poslank
ne zagotavlja intenzivnejše razprave o tematikah, ki zadevajo ženske.
172
Prispevki za novejšo zgodovino LXI – 1/2021
Slika 11: Normalizirana frekvenca za lemo samostalnika »ženska« v govorih poslank in
poslancev v korpusu siParl 2.0.
Luščenje kolokacij
Predstavili bomo še eno priljubljeno tehniko korpusne analize, in sicer luščenje
kolokacij.
107
S to tehniko, ki temelji na statističnih testih, pridobimo seznam besed,
ki se ob jedrni besedi pojavljajo pogosteje, kot bi se zgolj po naključju. Kolokacije se
najpogosteje uporabljajo v leksikografiji in na sorodnih področjih uporabnega jezi-
koslovja, mi pa jih bomo uporabili kot sredstvo za raziskovanje konceptov ali tem, o
katerih se razpravlja v parlamentu.
Da bi lahko ugotovili, o katerih tematikah, ki zadevajo ženske, se v parlamentu
največ razpravlja, bomo analizirali kolokacije samostalnika »ženska« v dveh podkor-
pusih, ki vsebujeta govore poslank oziroma poslancev iz vseh sedmih mandatov, torej
podkorpusa VsiMandati-Ženske in VsiMandati-Moški.
Videoposnetek, ki prikazuje postopek luščenja kolokacij v konkordančniku
NoSketchEngine, je na voljo na https://youtu.be/ENXP8T rH42U.
Izluščimo kolokacije v razponu ene besede levo in ene besede desno od jedrne
besede (tj. leme samostalnika »ženska«), pri čemer se mora kolokacijski kan-
didat (tj. beseda, ki se tipično pojavlja ob jedrni besedi) v korpusu pojaviti vsaj
petkrat, skupaj z jedrno besedo v določenem razponu pa vsaj trikrat. Razpon
in najnižjo frekvenco je mogoče nastaviti ročno in sta odvisna od jedrne
besede, velikosti korpusa ter cilja naše raziskave. Ker želimo analizo v tem
gradivu omejiti na ustaljene besedne zveze, uporabljamo ozek razpon in stroga
merila glede frekvence.
107 Kolokacija – Wikipedija, prosta enciklopedija, pridobljeno 18. 2. 2021, https://tinyurl.com/5b87rmft.
173
Darja Fišer, Kristina Pahor de Maiti: »Prvič, sem političarka in ne politik, drugič pa …«
Za določanje trdnosti kolokacij uporabimo statistično mero logDice.
108
Čeprav konkordančnik NoSketch Engine ponuja tudi druge mere, po katerih
se izračuna trdnost kolokacij, kot sta Mutual Information ali T -score, izberemo
mero logDice, ker nanjo ne vpliva velikost korpusa in so zato rezultati upo-
rabni za primerjalno analizo tudi v primeru uporabe podkorpusov različnih
velikosti, kot to velja za našo analizo.
Seznama kolokacij za lemo samostalnika »ženska« sta na voljo tukaj:
– VsiMandati-Ženske
109
– VsiMandati-Moški
110
Oba seznama kolokacij uvozimo v preglednico in ju ročno analiziramo
(gl. razdelek 6.4.3 Primerjalna analiza).
Primerjalna analiza
Z vsakega seznama vzamemo prvih 100 kolokacijskih kandidatov (tj. besed, ki se tipično
pojavljajo ob jedrni besedi in torej skupaj z njo tvorijo kolokacijo) in jih ročno razdelimo v
tri kategorije: ženske, moški in skupno.
111
Nato vsako besedo razvrstimo v enega od sedmih
tematskih sklopov, ki smo jih oblikovali na podlagi predhodnega pregleda konkordanc, kot
prikazuje T abela 7. Kolokacijskim kandidatom, ki so slovnične besede (na primer predlogi)
in niso uporabljeni v konkordancah na eno prevladujočo temo, pripišemo oznako Razno.
Tabela 7: Primeri sklopov kolokacij.
108 logDice | Sketch Engine, pridobljeno, 18. 2. 2021, https://tinyurl.com/3dv63nhm.
109 Collocations, pridobljeno 18. 2. 2021, http://hdl.handle.net/11346/siparl-QIKC.
110 Collocations, pridobljeno 18. 2. 2021, http://hdl.handle.net/11346/siparl-Q5MN.
111 Kategorija skupno, kot nakazuje njeno ime, združuje kolokacijske kandidate, ki se pojavijo tako na seznamu za pod-
korpus govorov poslank kot za podkorpus govorov poslancev.
174
Prispevki za novejšo zgodovino LXI – 1/2021
Rezultati, predstavljeni v Tabeli 8, kažejo, da se nekaj več kot polovica koloka-
cij (51 %) pojavlja tako pri poslankah kot pri poslancih, kar kaže na skupne točke v
razumevanju položaja žensk v sodobni družbi. Velika večina skupnih kolokacij (sko-
raj 70 %) spada v prva dva tematska sklopa: Politika, zastopanost in enakopravnost in
Družbeni status in zaposlitev, in se nanaša na koncepte, povezane z zastopanostjo žensk
(npr. »participacija«), njihovim družbenim položajem (npr. »samski«) in enakostjo
(npr. »emancipacija«).
Tabela 8: Frekvenca tematskih sklopov za prvih 100 kolokacijskih kandidatov v govorih
poslank in poslancev v vseh sedmih mandatih.
Opazimo lahko tudi, da so v podkorpusu govorov poslank primerljivo zastopani
vsi tematski sklopi razen enega, skupaj pa pokrivajo skoraj 60 % kolokacij. Edina
izjema je torej tematski sklop Proaktivnost žensk in opolnomočenje. Kolokacije, ki spa-
dajo v ta tematski sklop, so približno dvakrat redkejše kot kolokacije iz kateregakoli
drugega sklopa. V podkorpusu govorov poslancev večina kolokacij (61 %) spada v
tri tematske sklope, in sicer Problemi in nasilje, Politika, zastopanost in enakopravnost
in Proaktivnost žensk in opolnomočenje. Poleg tega podroben pregled oznak razkriva,
da se poslanci osredotočajo predvsem na družbeni status žensk (npr. »poročen«) in
njihove težave (npr. »zatiranje«) ter na njihovo proaktivnost in opolnomočenje (npr.
»sposoben«), medtem ko težavam, povezanim z zaposlitvijo in zdravjem žensk, ne
posvečajo posebne pozornosti. Kolokacije iz podkorpusa govorov poslank se v prvi
vrsti nanašajo na področje zdravstva (npr. »zdrav«) in ukrepe, vezane na pomoč in
zaščito (npr. »omogočati«). Tem sledijo kolokacije, ki se nanašajo na družbeni sta-
tus žensk (npr. »izobrazba«) in nasilje (npr. »posiljen«), kar je spet v nasprotju s
podkorpusom govorov poslancev, kjer je večji poudarek na težavah, ki ne vključujejo
nasilja (npr. »poniževanje«). Podobno kot v podkorpusu govorov poslancev pa tudi
v podkorpusu govorov poslank med prvimi 100 kolokacijskimi kandidati ni besed,
povezanih z zaposlitvijo.
175
Darja Fišer, Kristina Pahor de Maiti: »Prvič, sem političarka in ne politik, drugič pa …«
Ti rezultati kažejo, da poslanke poskušajo obravnavati številna vprašanja, s kate-
rimi se ženske srečujejo na različnih področjih življenja, in sicer od zdravstvenih vpra-
šanj do nasilja nad ženskami in težav pri političnem delovanju. Poslanci pa se bolj
osredotočajo na neenakopravnost žensk v sodobni družbi in ženske vidijo kot dejavne
udeleženke v procesu sprememb. Ti rezultati potrjujejo tudi ugotovitve avtoric Antić
Gaber in Ilonszki,
112
ki sta opazovali dejavnost žensk v slovenskem parlamentu v kraj-
šem obdobju (1996–2004) in z raznolikimi nekorpusnimi metodami analize pokazali,
da med poslankami in poslanci obstaja jasna razlika med zakonodajnimi prioritetami,
pri čemer sta opredelili podobne teme kot naša analiza.
Naša zadnja ugotovitev zadeva veliko število slovničnih besed v podkorpusu govo-
rov poslank, ki so skoraj štirikrat pogostejše kot v podkorpusu govorov poslancev.
Slovnične besede kot kolokacijski kandidati v podkorpusu govorov poslank večinoma
vključujejo prislove, predloge, veznike, zaimke in števnike, v podkorpusu govorov
poslancev pa prevladujejo le števniki. Podobno kot smo ugotovili pri analizi ključnih
besed (gl. razdelek 6.3.3 Primerjalna analiza), to znova kaže na drugačen slog raz-
pravljanja pri poslankah. Ta ugotovitev je skladna s sorodnimi raziskavami, v katerih
raziskovalci poročajo, da ženske običajno uporabljajo več jezikovnih sredstev, kot so
diskurzni omejevalci, vljudnostne oblike in vprašalni pristavki,
113
več intenzifikatorjev
in (predvsem ocenjevalnih) pridevnikov
114
ter več osebnih zaimkov kot moški, ki pri
sporazumevanju uporabljajo več števnikov, členov in predlogov.
115
Zaključki
Cilj učnega gradiva je bil prikazati uporabnost jezikovnih korpusov za analizo
družbenokulturnih pojavov, ki jih lahko raziskujemo na podlagi jezikovne rabe v
specializiranem diskurzu. Pokazali smo, kako korpusnoanalitične tehnike omogo-
čajo ugotovitve, ki presegajo intuicijo raziskovalke oz. raziskovalca in tako ponujajo
večjo preglednost, objektivnost, zanesljivost in ponovljivost raziskav, kar postajajo vse
pomembnejša načela tudi na področju humanistike in družboslovja.
Glavni doprinos tega učnega gradiva lahko razdelimo na tri dele. Najprej smo poka-
zali, kako pomembno je razumeti vsebino in strukturo podatkov, ki jih uporabljamo
v raziskavi, da lahko čim bolje izkoristimo njihov potencial. Nato smo predstavili,
kako lahko nabor standardnih metod korpusne analize uporabimo za veliko več kot le
kvantifikacijo in preproste poizvedbe v korpusu. Namesto tega smo rezultate, prido-
bljene s konkordančnikom, sistematično uporabili kot odskočno desko za podrobno
ročno kvalitativno analizo, ki rezultate previdno umešča v ustrezni družbenojezikovni
kontekst. Čeprav smo preučevali razprave iz slovenskega parlamenta, so predstavljeni
analitični postopki splošni in jih je mogoče uporabiti tudi na (parlamentarnih)
112 Antić Gaber in Ilonszki, Women in Parliamentary Politics.
113 Coates, Women, Men and Language.
114 Cate Poynton, Language and Gender: Making the Difference (Oxford: Oxford University Press, 1989).
115 Newman, Groom, Handelman in Pennebaker, »Gender Differences in Language Use«.
176
Prispevki za novejšo zgodovino LXI – 1/2021
korpusih v drugih jezikih.
116
Nenazadnje smo analizo umestili tudi v resnično razi-
skovalno okolje, s čimer smo skušali prikazati uporabnost splošnih metod korpusne
analize za obravnavo številnih raziskovalnih vprašanj na področju humanistike in
družboslovja.
Zahvale
Izdelavo tega učnega gradiva so podprli CLARIN.SI, slovenski del Evropske
infrastrukture za jezikovne vire in tehnologije CLARIN, raziskovalni program ARRS
P6-0215 (Slovenski jezik – osnovne, kontrastivne in uporabne študije) in projekt
H2020 SSHOC – Social Sciences and Humanities Open Cloud (GA 823782).
Posebna zahvala gre tudi red. prof. dr. Milici Antić Gaber, doc. dr. Ireni Selišnik, prof.
dr. Cornelii Ilie, Tjaši Cankar, Mladenu Zobcu in Rubenu Rosu za strokovno recenzijo
in testiranje učnega gradiva ter vse njihove dragocene komentarje.
Viri in literatura
• Alasuutari, Pertti, Marjaana Rautalin in Jukka Tyrkkö. »The Rise of the Idea of Model in Policyma -
king: The Case of the British Parliament, 1803–2005.« European Journal of Sociology/Archives Euro-
péennes de Sociologie 59, št. 3 (2018): 341–63. https://doi.org/10.1017/S0003975618000164.
• Antić Gaber, Milica in Gabriella Ilonszki. Women in Parliamentary Politics: Hungarian and Slovene Cases
Comparur. Ljubljana: Peace Institute, Institute for Contemporary Social and Political Studies, 2003.
• Antić Gaber, Milica in Irena Selišnik. »The Slovene Version of a ‚Fast T rack‘ to Political Equality.«
T eorija in Praksa 54, št. 2 (2017): 337.
• Bäck, Hanna, Marc Debus in Jochen Müller. »Who Takes the Parliamentary Floor? The Role of
Gender in Speech-making in the Swedish Riksdag.« Political Research Quarterly 67, št. 3, (2014):
504–18. https://doi.org/10.1177/1065912914525861.
• Baker, Paul. Using Corpora to Analyze Gender. London: Bloomsbury, 2014. https://doi.
org/10.1177/0075424215578282.
• Biber, Douglas in Randi Reppen. The Cambridge Handbook of English Corpus Linguistics. Cam -
bridge: Cambridge University Press, 2015. https://doi.org/10.1017/CBO9781139764377.
• Biel, Łucja, Agnieszka Biernacka in Anna Jopek-Bosiacka. »Collocations of T erms in EU Competi-
tion Law: A Corpus Analysis of EU English Collocations.« V: Language and Law, 249–74. Cham:
Springer, 2018. https://doi.org/10.1007/978-3-319-90905-9_14.
• Bing, Janet M. in Victoria L. Bergvall. »The Question of Questions: Beyond Binary Thinking.« V:
Jennifer Coates (ur.), Language and Gender: A Reader, Vol. 1, 496–510. Oxford: Blackwell, 1998.
• Blaxill, Luke in Kaspar Beelen. »A Feminized Language of Democracy? The Representation of
Women at Westminster since 1945.« Twentieth Century British History 27, št. 3 (2016): 412–49.
https://doi.org/10.1093/tcbh/hww028.
• Coates, Jennifer. Women, Men and Language: A Sociolinguistic Account of Gender Differences in Lan-
guage. London: Longman, 1997.
• Demmen, Jane, Lesley Jeffries in Brian Walker. »Charting the Semantics of Labour Relations in
House of Commons Debates Spanning Two Hundred Years.« Doing Politics: Discursivity, Performa-
tivity and Mediation in Political Discourse 80 (2018): 81. https://doi.org/10.1075/dapsac.80.04dem.
116 Resource families | CLARIN ERIC, pridobljeno 18. 2. 2021, https://www.clarin.eu/resource-families.
177
Darja Fišer, Kristina Pahor de Maiti: »Prvič, sem političarka in ne politik, drugič pa …«
• Eckert, Penelope in Sally McConnell-Ginet. Language and Gender. Cambridge: Cambridge Uni-
versity Press, 2013. https://doi.org/10.1017/CBO9781139245883.
• Goddard, Angela in Lindsey M. Patterson. Language and Gender. London: Routledge, 2015.
• Hansen, Dorte H., Costanza Navarretta in Lene Offersgaard. »A Pilot Gender Study of the Danish
Parliament Corpus.« V: Darja Fišer, Maria Eskevich in Franciska de Jong (ur.), Proceedings of the
Eleventh International Conference on Language Resources and Evaluation. Miyazaki: LREC 2018.
• Ilie, Cornelia. »Gendering Confrontational Rhetoric: Discursive Disorder in the British and Swedish Par-
liaments.« Democratization 20, št. 3 (2013): 501–21. https://doi.org/10.1080/13510347.2013.786547.
• Ilie, Cornelia. »Parliamentary Debates. V: Ruth Wodak in Bernhard Forchtner (ur.), The
Routledge Handbook of Language and Politics, 309–25. London: Routledge, 2017. https://doi.
org/10.4324/9781315183718.
• Jaworska, Sylvia in Kath Ryan. »Gender and the Language of Pain in Chronic and Terminal Ill-
ness: A Corpus-based Discourse Analysis of Patients’ Narratives.« Social Science & Medicine 215
(2018): 107–14. https://doi.org/10.1016/j.socscimed.2018.09.002.
• Karan, Mladen, Jan Šnajder, Daniela Širinić in Goran Glavaš. »Analysis of Policy Agendas: Les-
sons Learned from Automatic T opic Classification of Croatian Political T exts.« Proceedings of the
10th SIGHUM Workshop on Language Technology for Cultural Heritage, Social Sciences, and Huma-
nities (2016): 12–21. https://doi.org/10.18653/v1/W16-2102.
• Kustec Lipicer, Simona, ur. Poslanke Državnega zbora: Uradno in osebno od prvega do sedmega man-
data (1992-2017). Ljubljana: Državni zbor, 2017.
• Leijenaar, Monique. How to Create a Gender Balance in Political Decision-making: A Guide to Imple-
menting Policies for Increasing the Participation of Women in Political Decision-making. Luxembourg:
Office for Official Publications of the European Communities, 1997.
• Litosseliti, Lia. Gender and Language: Theory and Practice. London: Hodder Arnold, 2006. https://
doi.org/10.1111/j.1467-9841.2008.00371_10.x.
• Marshall, Catherine. »Policy Discourse Analysis: Negotiating Gender Equity.« Journal of Educa-
tion Policy 15, št. 2 (2000): 125–56. https://doi.org/10.1080/026809300285863.
• McEnery, Tony in Andrew Hardie. Corpus linguistics: Method, Theory and Practice. Cambridge:
Cambridge University Press, 2011. https://doi.org/10.1017/CBO9780511981395.
• Mensah, Eric O. in Sandra F. Wood. »Articulations of Feminine Voices in Ghana’s Parliament: A
Study of the Hansard from 2010-2011.« AFRREV LALIGENS: An International Journal of Langu-
age, Literature and Gender Studies 7, št. 2 (2018): 61–77. https://doi.org/10.4314/laligens.v7i2.6.
• Mollin, Sandra. »The Hansard Hazard: Gauging the Accuracy of British Parliamentary Trans -
cripts.« Corpora 2, št. 2 (2007): 187–210. https://doi.org/10.3366/cor.2007.2.2.187.
• Nanni, Federico, Mahmoud Osman, Yi-Ru Cheng, Simone Paolo Ponzetto in Laura Dietz.
»UKParl: A Semantified and Topically Organized Corpus of Political Speeches.« V: Darja Fišer,
Maria Eskevich in Franciska de Jong (ur.), Proceedings of the Eleventh International Conference on
Language Resources and Evaluation. Miyazaki: LREC 2018.
• Newman, Matthew L., Clara J. Groom, Lori D. Handelman in James W. Pennebaker. »Gender
Differences in Language Use: An Analysis of 14,000 Text Samples.« Discourse Processes 45, št. 3
(2008), 211–36. https://doi.org/10.1080/01638530802073712.
• Osborn, Tracey L. How Women Represent Women: Political Parties, Gender and Representation in
the State Legislatures. Oxford: Oxford University Press, 2012. https://doi.org/10.1093/acpro-
f:oso/9780199845347.001.0001.
• Pančur, Andrej, Tomaž Erjavec, Mihael Ojsteršek, Mojca Šorn in Neja Blaj Hribar. Slovenian Par-
liamentary Corpus (1990-2018) siParl 2.0. Slovenian language resource repository CLARIN.SI,
20202020, http://hdl.handle.net/11356/1300.
• Poynton, Cate. Language and Gender: Making the difference. Oxford: Oxford University Press, 1989.
• Rix, Kathryn. »‘Whatever Passed in Parliament Ought to be Communicated to the Public’:
Reporting the Proceedings of the Reformed Commons, 1833–50.« Parliamentary History 33, št. 3
(2014): 453–74. https://doi.org/10.1111/1750-0206.12106.
178
Prispevki za novejšo zgodovino LXI – 1/2021
• Wängnerud, Lena. »Intressen kontra stereotyper. Varför finns det kvinnliga och manliga politi-
kområden i riksdagen?.« Statsvetenskaplig Tidskrift 99, št. 2(1996).
• Wodak, Ruth. »Pragmatics and Critical Discourse Analysis: A Cross-disciplinary Inquiry.« Prag-
matics & Cognition 15 (2007): 203–25. https://doi.org/10.1075/pc.15.1.13wod.
• Wolbrecht, Christina. »Female Legislators and the Women’s Rights Agenda: From Feminine
Mystique to Feminist Era.« V: Cindy S. Rosenthal (ur.), Women transforming congress, 170–97.
Norman: University of Oklahoma Press, 2002.
Darja Fišer, Kristina Pahor de Maiti
“FIRST, I’M A FEMALE POLITICIAN, NOT A MALE ONE,
AND SECOND … ” A CORPUS APPROACH
TO PARLIAMENTARY DISCOURSE RESEARCH
SUMMARY
Parliaments represent the main fora for political debate that shapes legislation
which directly impacts our everyday lives. Parliamentary discourse is motivated by
a wide range of communicative roles and reveals political, ideological and instituti-
onal patterns, which is why it has always been of interest to scholars from a range of
disciplines in the humanities and social science. Parliamentary proceedings are being
increasingly made available in a digitized form, and turned into structured linguistic
resources called corpora for many languages. Researchers use them to perform diverse
linguistic, stylistic, cultural, societal and political studies.
This tutorial shows the potential of richly annotated parliamentary corpora for
research of the socio-cultural context and changes over time that are reflected through
language use. The tutorial encourages students and scholars from digital humanities
and social sciences who are interested in the study of socio-cultural phenomena thro-
ugh language, to engage with user-friendly digital tools for the analysis of large text
collections. The tutorial is designed in a way that takes full advantage of both linguistic
annotations and the available speaker and text metadata to formulate powerful quanti-
tative queries that are then further extended with manual qualitative analysis in order
to ensure adequate framing and interpretation of the results.
The tutorial demonstrates the potential of the siParl 2.0 corpus which contains
parliamentary debates of the National Assembly of the Republic of Slovenia from
1990 to 2018 via concordancers without the need for programming skills. No prior
experience in using language corpora and corpus querying tools is required in order
to follow this tutorial.
This tutorial starts with a brief introduction to corpora and corpus analysis, fol -
lowed by an introduction of the characteristics of specialized corpora of parliamentary
debates and an overview of research into language and gender. The second part of the
179
Darja Fišer, Kristina Pahor de Maiti: »Prvič, sem političarka in ne politik, drugič pa …«
tutorial is hands-on and demonstrates the potential of some of the best-known corpus
analysis techniques, such as concordances, frequency lists, keywords and collocations,
to explore the topics female MPs debate in in the Slovenian Parliament over time and
to compare and contrast their language use with that of their male counterparts.