Viktorija Pirš STATISTIČNA ANALIZA POJAVOV Program: EKONOMSKI TEHNIK Modul: Ekonomika poslovanja Vsebinski sklop: POSLOVNO RAČUNSTVO IN STATISTIČNA ANALIZA POJAVOV Ljubljana, november 2010 Srednje strokovno izobraževanje Program: Ekonomski tehnik Modul: Ekonomika poslovanja Vsebinski sklop: Poslovno računstvo in statistična analiza pojavov Naslov učnega gradiva Statistična analiza pojavov Ključne besede: statistika, statistična analiza pojavov, osnovni statistični kazalci, statistično raziskovanje, statistično opazovanje, obdelava zbranih podatkov, prikazovanje statističnih podatkov, relativna števila, strukture, koeficienti, indeksi, kazalci rasti, stopnje, frekvenčna porazdelitev, srednje vrednosti, aritmetična sredina, mediana, modus. Seznam kompetenc, ki jih zajema učno gradivo: PRS1 : Reševanje problemov s področja sklepnega, razdelilnega, procentnega in obrestnega računa. PRS2: Izračun in interpretacija osnovnih statističnih kazalcev. CIP - Kataložni zapis o publikaciji Narodna in univerzitetna knjižnica, Ljubljana 311:33(075.8)(0.034.2) PIRŠ, Viktorija Statistična analiza pojavov [Elektronski vir] / Viktorija Pirš. - El. knjiga. - Ljubljana : GZS, Center za poslovno usposabljanje, 2010. - (Srednje strokovno izobraževanje. Program Ekonomski tehnik. Modul Ekonomika poslovanja. Vsebinski sklop Poslovno računstvo in statistična analiza pojavov) Način dostopa (URL): http://www.unisvet.si/index/activityld/44. -Projekt UNISVET ISBN 978-961-6413-54-1 254490112 Avtorica: Viktorija Pirš Recenzentka: Monika Terseglav Klemenc Lektorica: Vesna Fabjan Založnik: GZS Ljubljana, Center za poslovno usposabljanje Projekt unisVET URL: http://www.unisvet.si/index/index/activityId/44 Kraj in datum: Ljubljana, november 2010 To delo je ponujeno pod licenco Creative Commons: Priznanje avtorstva-Nekomercialno-Deljenje pod enakimi pogoji. Učno gradivo je nastalo v okviru projekta unisVET Uvajanje novih izobraževalnih programov v srednjem poklicnem in strokovnem izobraževanju s področja storitev za obdobje 2008-2012, ki ga sofinancirata Evropska unija preko Evropskega socialnega sklada in Ministrstvo Republike Slovenije za šolstvo in šport. Operacija se izvaja v okviru operativnega programa razvoja človeških virov za obdobje 2007 - 2013, razvojne prioritete: Razvoj človeških virov in vseživljenjskega učenja, prednostna usmeritev Izboljšanje kakovosti in učinkovitosti sistemov izobraževanja in usposabljanja. Vsebina gradiva v nobenem primeru ne odraža mnenja Evropske unije. Odgovornost za vsebino nosi avtor. KAZALO PREDGOVOR..........................................................................................................................5 1. STATISTIKA IN STATISTIČNA ANALIZA POJAVOV..............................................6 1.1 POMEN BESEDE STATISTIKA.....................................................................................6 1.2 OSNOVNI STATISTIČNI POJMI...................................................................................7 2. STATISTIČNO RAZISKOVANJE....................................................................................9 2.1 NAČRTOVANJE STATISTIČNEGA RAZISKOVANJA............................................9 2.2 STATISTIČNO OPAZOVANJE......................................................................................9 2.2.1 Izvajanje statističnega opazovanja..............................................................................10 2.3 OBDELAVA ZBRANIH PODATKOV..........................................................................10 2.4 PRIKAZOVANJE STATISTIČNIH PODATKOV......................................................12 2.4.1 Prikazovanje podatkov s tabelami...............................................................................12 2.4.2 Zgradba tabele...............................................................................................................13 2.4.3 Prikazovanje podatkov z grafikoni..............................................................................13 2.5 STATISTIČNA ANALIZA OPAZOVANEGA POJAVA............................................15 3. RELATIVNA ŠTEVILA...................................................................................................19 3.1 STRUKTURE ...................................................................................................................19 3.1.1 Enorazsežna struktura..................................................................................................19 3.1.2 Grafično prikazovanje enorazsežnih struktur...........................................................20 3.1.3 Večrazsežna struktura..................................................................................................21 3.1.4 Grafično prikazovanje dvorazsežnih struktur...........................................................23 3.2 STATISTIČNI KOEFICIENTI......................................................................................23 3.2 STATISTIČNI KOEFICIENTI......................................................................................24 3.2.1 Grafično prikazovanje statističnih koeficientov.........................................................25 3.3 INDEKSI...........................................................................................................................27 3.3.1 Grafično prikazovanje indeksov..................................................................................28 3.4 KAZALCI RASTI............................................................................................................30 3.5 STOPNJE..........................................................................................................................31 4. FREKVENČNE PORAZDELITVE.................................................................................41 4.1 OPREDELITEV RAZREDOV.......................................................................................41 4.2 OPIS FREKVENČNE PORAZDELITVE.....................................................................43 4.2.1 Grafični prikaz frekvenčne porazdelitve....................................................................45 5. SREDNJE VREDNOSTI...................................................................................................51 5.1 ARITMETIČNA SREDINA (M)....................................................................................51 5.2 MEDIANA (Me)...............................................................................................................53 5.3 MODUS (Mo)....................................................................................................................56 5.3.1 Odnosi med aritmetično sredino, mediano in modusom...........................................57 6. LITERATURA...................................................................................................................60 PREDGOVOR Učbenik Statistična analiza pojavov je namenjen dijakom srednješolskega programa ekonomski tehnik in je usklajen s katalogom znanj za statistično analizo pojavov v okviru modula Ekonomika poslovanja. Učbenik naj bi bil dijakom v začetno pomoč pri pridobivanju osnovnega znanja iz statistike, ki omogoča lažje razumevanje strokovne literature z različnih področij ter spremljanje aktualnih novic s področja gospodarstva. Poznavanje statistike zmanjša možnost zavajanja in zlorabe statističnih podatkov. Podana snov se navezuje tudi na ostale ekonomske module (npr. Sodobno gospodarstvo) in predpostavlja osnovno računalniško pismenost (poznavanje delovanja programa Excel). Strokovno je učbenik pregledala mag. Monika Terceglav Klemenc, za odpravo jezikovnih napak pa je poskrbela Vesna Fabjan. Obema iskrena hvala za pomoč in za strokovne nasvete. Učbenik je razdeljen na pet poglavij, v katerih teoretičnim osnovam sledijo praktični primeri in vaje z rešitvami. Ob prebiranju gradiva vam želim veliko vedoželjnosti. Viktorija Pirš Kamnik, 15.10.2010 1. STATISTIKA IN STATISTIČNA ANALIZA POJAVOV 1.1 POMEN BESEDE STATISTIKA Pojem statistika se v vsakdanjem življenju pogosto pojavlja. Omenja se predvsem v dnevnem časopisju, poročilih, ekonomiji in podobno. Beseda statistika (lat. »status«) pomeni stanje, razmere, državo. Najstarejši ohranjen zapis prikazovanja podatkov, razvrščanja s štetjem, je primer rovaša iz paleolitika, na kosti mladega volka so izrezane različne črtice. Podobne »rovaše« so kasneje uporabljali gostilničarji za štetje popitega vina. Kot veda se je statistika začela razvijati v 17. stoletju. Pojem statistika označuje: • sistematično zbrane številske podatke o najrazličnejših pojavih; • dejavnost, ki se ukvarja z opazovanjem množičnih pojavov, zbiranjem podatkov o pojavih, z obdelavo zbranih podatkov, s prikazovanjem in analiziranjem; • posebno vejo znanosti, ki razvija metode zbiranja statističnih podatkov, njihove analize in predstavitve. Področje statistične dejavnosti ureja država z ustreznimi predpisi. Dejavnost državne statistike pri nas izvaja Statistični urad Republike Slovenije. Statistični urad sodeluje z mednarodnimi strokovnimi institucijami, z Evropsko centralno banko in je del evropskega statističnega sistema EUROSTAT. Pri svojem delovanju upošteva zakonodajo, ki jo predpisuje Evropska unija. V ogled priporočam spletno stran http://epp.eurostat.ec.europea.eu. Statistični urad Republike Slovenije izdaja številne statistične publikacije, ki vsebujejo sistematično zbrane številske podatke. Najobsežnejša publikacija je Statistični letopis Slovenije, ki se poleg tiskane oblike nahaja tudi na spletni strani http://www.stat.si/letopis/index_letopis.asp. Statistični letopis vsebuje statistične podatke za vsa pomembnejša področja družbenoekonomskega dogajanja. V prvem delu se nahajajo podatki po področjih (prebivalstvo, zaposlenost za celotno državo, sledijo podatki, urejeni po statističnih regijah in občinah. Mesečno se izdaja Mesečni statistični pregled, vsi glavni podatki o Sloveniji pa se najdejo v publikaciji Slovenija v številkah, ki je dostopna na spletni strani http://www.stat.si/publikacije/pub_slovenija.asp. Poleg tega se izdajajo še rezultati posameznih raziskav za različna področja, ki jih najdemo na naslovu http://www.stat.si/publikacije/pub_regije.asp. 1.2 OSNOVNI STATISTIČNI POJMI Pri analizi statističnih podatkov se srečamo z naslednjimi temeljnimi statističnimi pojmi: • populacija, • enota, • spremenljivka in • parameter. Populacija je skupina enot oz. končna ali neskončna množica, ki jo statistično preučujemo. Populacijo lahko sestavljajo živa bitja, dogodki, predmeti ... Populacijo opredelimo po treh vidikih: krajevno, časovno in vsebinsko. • Pri krajevni opredelitvi določimo geografsko območje (npr. kraj rojstva, bivališče). • Časovna opredelitev zajema določitev časa opazovanja. Čas opazovanja je lahko določen trenutno (npr. 1.7.2009) ali intervalno (npr. leta 2010). • Vsebinska opredelitev pa zajema natančen vsebinski opis pojava. Enota je posamezen element populacije (npr. gospodinjstvo, podjetje). Spremenljivka je lastnost enote, ki jo preučujemo. Spremenljivka ima za posamezne enote iz populacije različne vrednosti. Lahko je izražena s številom ali opisom. Glede na to ločimo: 1. Opisne (atributivne) spremenljivke. Tu vrednost izražamo opisno, z besedami (npr. spol, poklic) ali s številko (npr. telefonska številka, EMŠO). 2. Številske (numerične) spremenljivke. Pri teh vrednost izražamo s števili (npr. število točk na testu, teža). Številske spremenljivke ločimo na zvezne in diskretne. Zvezne imajo na določenem razmaku poljubno vrednost (npr. cena), diskretne pa imajo le določene vrednosti, to so cela števila (npr. število družinskih članov). Parameter izraža lastnost celotne populacije. Parameter je število oziroma delež enot, ki ga dobimo s sortiranjem enot glede na vrednost spremenljivke. ZGLED 1 Določite in opredelite temeljne statistične pojme za naslednji pojav: udeleženci predavanja iz statistike enote Izobraževanja odraslih na ŠCRM Kamnik, spomladi leta 2009 glede na spol in starost. Populacija so udeleženci predavanja enote Izobraževanja odraslih iz statistike na ŠCRM Kamnik, spomladi 2009. Opredelitev: krajevna: ŠCRM Kamnik; časovna: spomladi 2009 (gre za intervalno opredelitev); vsebinska: podatki se nanašajo na udeležence enote Izobraževanja odraslih. Enota je posamezen udeleženec predavanja. Spremenljivki sta spol in starost. Spol je opisna spremenljivka. Vrednost je izražena opisno (moški in ženski). Starost je posebnost med spremenljivkami. Gre za zvezno številsko spremenljivko, ki pa se izraža kot diskretna, saj njeno vrednost izražamo v dopolnjenih letih. Parametri so: skupno število vseh slušateljev, število slušateljev po posameznih starostnih skupinah, povprečna starost slušateljev ipd. V poglavju statistika in statistična analiza pojavov smo na kratko spoznali zgodovinski razvoj statistike, njen spekter delovanja danes, ter poudarili pomembnost razlikovanja osnovnih statističnih pojmov. To znanje predstavlja temelje za nadaljnjo uspešno izvedbo statističnega raziskovanja, ki ga bomo spoznali v naslednjem poglavju. VAJE 1. Določite in opredelite temeljne statistične pojme za naslednje pojave: a) prebivalci v občini Nova Gorica na dan 23.2.2009 po spolu; b) izplačani osebni dohodki v Republiki Sloveniji januarja 2010 po višini osebnega dohodka; c) dijaki prvega letnika Srednje ekonomske šole Kamnik v šolskem letu 2010/2011 po učnem uspehu v osmem razredu (ki je izražen z ocenami do 5) in oddaljenosti od doma do šole. Rešitve 1. a) Populacija je množica prebivalcev v občini Nova Gorica na dan 23.2.2009. Opredelitev: krajevna: Nova Gorica; časovna; 23.2.2009 (trenutna opredelitev), vsebinska: stalni prebivalci občine. Enota je posamezen prebivalec. Spremenljivka je spol. Gre za opisno spremenljivko. Parametri so npr. skupno število prebivalcev istega spola. b) Populacija je množica izplačanih osebnih dohodkov v Republiki Sloveniji januarja 2010. Opredelitev: krajevna: Slovenija; časovna: januar 2010 (intervalna opredelitev); vsebinska: izplačani osebni dohodki. Enota je posamezen osebni dohodek. Spremenljivka je višina osebnega dohodka. Gre za zvezno številsko spremenljivko. Parametri so: skupni znesek izplačanih osebnih dohodkov, število izplačanih osebnih dohodkov, povprečna višina osebnega dohodka itd. c) Populacija je množica dijakov prvega letnika Srednje ekonomske šole Kamnik v šolskem letu 2010/2011. Opredelitev: krajevna: Kamnik; časovna: šolsko leto 2010/2011 (intervalna opredelitev); vsebinska: dijaki prvega letnika Srednje ekonomske šole. Enota je posamezen dijak. Spremenljivki sta učni uspeh v osmem razredu in oddaljenost od doma do šole. Učni uspeh je številska diskretna spremenljivka, oddaljenost pa zvezna številska spremenljivka. Parametri so skupno število dijakov prvega letnika ekonomske šole, najpogostejši uspeh dijaka v osmem razredu, povprečna oddaljenost od doma do šole itd. 2. STATISTIČNO RAZISKOVANJE Statistično raziskovanje je postopek, s katerim zberemo podatke o množičnem pojavu in analiziramo njegove značilnosti. Statistično raziskovanje izvajajo temu namenjene strokovne institucije, ustrezni oddelki znotraj podjetij, posamezniki ipd. Faze statističnega raziskovanja so naslednje: 1. načrtovanj e stati sti čnega razi skovanj a, 2. statistično opazovanje, 3. obdelava zbranih podatkov, 4. prikazovanje statističnih podatkov, 5. statistična analiza opazovanega pojava. 2.1 NAČRTOVANJE STATISTIČNEGA RAZISKOVANJA Z načrtovanjem predvidimo potek celotnega raziskovanja. Načrtujemo v štirih smereh: a) vsebinsko načrtovanje zajema opredelitev populacije in določitev spremenljivk, ki jih bomo opazovali; b) v okviru organizacijsko-tehničnega načrtovanja moramo odgovoriti na vprašanje, kako bo izvedeno opazovanje populacije, kako bo potekala obdelava zbranih podatkov in kako bodo ti podatki prikazani; c) pri analitičnem načrtovanju predvidimo postopke in določimo parametre, ki jih bomo izračunali; d) finančno načrtovanje pa zajema ocenitev stroškov statističnega raziskovanja. 2.2 STATISTIČNO OPAZOVANJE Z opazovanjem zberemo podatke o vseh opazovanih spremenljivkah pri enotah populacije. Rezultat opazovanja je množica statističnih podatkov, ki so osnova za analizo pojava. Statistično opazovanje delimo na popolno in delno opazovanje ter na neposredno in posredno opazovanje. 1. a) Popolno opazovanje zajema vse enote preučevanega pojava. V okviru popolnega opazovanja ločimo popise, pri katerih opazujemo pojav v danem trenutku, ki ga imenujemo »kritični trenutek«, in sprotno spremljanje oziroma registracijo dogodkov ob njihovem nastanku (npr. rojstva). Najstarejši zapis o popisu prebivalstva najdemo v Bibliji, ko je cesar August izdal ukaz, naj se popiše ves svet. Leta 14 so našteli nekaj manj kot 5 milijonov prebivalcev. Prvo štetje prebivalcev na ozemlju današnje Slovenije je bilo leta 1754, prvi pravi popis pa 1857. Od leta 1921, ko smo imeli prvi pravi popis v Kraljevini Jugoslaviji, si popisi praviloma sledijo na 10 let. b) Delno opazovanje izvedemo, kadar bi popolno opazovanje zahtevalo preveč časa in sredstev. Delno opazovanje ali vzorčenje zajema le del populacije, ki ga imenujemo vzorec. Na podlagi vzorca dobimo oceno parametrov. Enote so lahko v vzorec izbrane slučajno in pri tem govorimo o slučajnem vzorcu, pri čemer morajo vse enote iz populacije imeti enako verjetnost za izbor v vzorec. Če pa enote izberemo v vzorec po subjektivni presoji, govorimo o neslučajnem vzorcu. 2. a) Pri neposrednem opazovanju opazovalec sam ugotavlja vrednosti spremenljivk pri enotah z meritvami. b) Pri posrednem opazovanju pa izvajalec opazovanja dobi podatke od osebe, ki podatke pozna, ali iz določenega vira, kjer so podatki že zbrani. 2.2.1 Izvajanje statističnega opazovanja Sestava statističnega vprašalnika Statistični vprašalnik, s pomočjo katerega zbiramo informacije o statistični enoti, ki jo popisujemo, mora biti čim preprostejši. Vprašane mora seznaniti s cilji vprašalnika. Vprašalnik mora vsebovati čim manjše število vprašanj in navodila za izpolnjevanje. Prav tako je potrebno predhodno preizkusiti vprašalnik na ciljni skupini, da se izognemo morebitnim nejasnostim. Vprašani lahko odgovarjajo na različne načine: • z da ali ne, • z obkroževanjem ustreznega odgovora od več navedenih, • z navajanjem določenih podatkov. Napake in kontrola pri statističnem opazovanju Pri zbiranju podatkov se lahko pojavita dve vrsti napak, slučajne in sistematične. Slučajne napake se pojavijo pri posameznih enotah različno in niso pomembne, ker se učinek pri velikem številu enot izravna. Npr. eden ali nekaj anketiranih napačno interpretira zastavljeno vprašanje in nanj nepravilno odgovori ali pa namenoma poda napačen odgovor. Sistematične napake pa se pojavljajo pri vseh enotah z enakim učinkom, ki se ne izravna. Do takih napak lahko na primer pride, če je vprašanje neustrezno oziroma dvoumno zastavljeno. Običajno se jim lahko izognemo s predhodnim testiranjem vprašalnika na majhni skupini ciljne populacije. 2.3 OBDELAVA ZBRANIH PODATKOV Dobro poročilo ali analiza poleg tekstovnega dela vsebuje tudi pravilne in ustrezno oblikovane tabele ali grafikone, ki prikazujejo značilnosti pojava in ki morajo biti pravilno oblikovani. To delo lahko opravimo ročno ali pa s pomočjo računalniškega programa Excel, za uporabo katerega prav tako potrebujemo ustrezno predznanje statistike. Ker bi torej radi dosegli preglednost nad zbranimi podatki, enote razvrstimo v skupine po vrednosti opazovane spremenljivke. Pri opredeljevanju skupin morata biti izpolnjena dva pogoja: • enoličnost skupine, kar pomeni, da so meje skupine določene tako, da vsaka enota spada v natančno eno skupino, • enovitost (homogenost) skupine, ki je odvisna od cilja, saj skupine opredelimo v skladu s cilji raziskovanja in z vsebinskega vidika vključujejo sorodne enote. Skupino pri številskih spremenljivkah imenujemo razred. Pri opisnih spremenljivkah, kjer je opredelitev skupin zahtevnejša, si pomagamo z decimalnimi in drugimi klasifikacijami ali nomenklaturami. To so sistematično po skupinah ali podskupinah urejene vrednosti opisnih spremenljivk. Statistična vrsta je vrsta istoimenskih podatkov, od katerih se vsak nanaša na eno od skupin. Ločimo dve skupini statističnih vrst: • številske statistične vrste delimo na zvezne (tu se podatki nanašajo na vrednosti zveznih številskih spremenljivk) in diskretne (podatki se nanašajo na vrednosti diskretnih spremenljivk); • opisne statistične vrste, ki jih dobimo, če podatke razvrstimo po opisni spremenljivki; ločijo se na krajevne (podatke razvrstimo po vrednostih krajevne spremenljivke) in časovne (podatki se nanašajo na posamezne časovne trenutke ali intervale), ki so lahko trenutne in intervalne. ZGLED 1 Za podatke v tabeli določite statistično vrsto in utemeljite odgovor. a) Tabela 1: Prepeljani potniki z zračnim prevozom v Sloveniji po letih (Vir: Statistični letopis 2008, str. 373) Leto St. potnikov 2004 885 2005 944 2006 1018 2007 1136 Tabela prikazuje opisno časovno statistično vrsto. Podatki se nanašajo na intervale posameznih let, zato je časovna vrsta intervalna. b) Tabela 2: Število proizvedenih in prvič javno predvajanih slovenskih kinematografskih filmov v letu 2006 po vrsti filma (Vir: Statistični letopis 2008, str. 182) Vrsta filma Število filmov Dolgometražni igrani filmi 5 Kratkometražni igrani filmi 5 Kratkometražni dokumentarni filmi 10 Kratkometražni animirani filmi 3 Tabela prikazuje opisno statistično vrsto, ker je vrsta kinematografskega filma opisna spremenljivka. 2.4 PRIKAZOVANJE STATISTIČNIH PODATKOV Podatke prikazujemo s tabelami in z grafikoni. 2.4.1 Prikazovanje podatkov s tabelami Tabelarični prikaz uporabljamo, ko hočemo podatke prikazati natančno in celovito. Poznamo: a) Enorazsežne (enostavne) tabele prikazujejo eno statistično vrsto. Tabela 3: Zaposleni v Sloveniji, 2. četrtletje 2000 po sektorjih dejavnosti (Vir: Ženske in moški v Sloveniji 2000, str. 42) Sektorji dejavnosti St. zaposlenih (v 1000) Kmetijske dejavnosti 10 Nekmetijske dejavnosti 311 Storitvene dejavnosti 425 b) Sestavljene tabele prikazujejo več statističnih vrst, vendar so vse vrste oblikovane po vrednostih iste spremenljivke. Tabela 4: Zaposleni in samozaposleni v Sloveniji, 2. četrtletje 2000 po sektorjih dejavnosti (Vir: Ženske in moški v Sloveniji 2000, str. 42) Sektorji dejavnosti St. zaposlenih (v 1000) St. samozaposlenih (v 1000) Kmetijske dejavnosti 10 34 Nekmetijske dejavnosti 311 23 Storitvene dejavnosti 425 42 c) Večrazsežne tabele prikazujejo populacijo po dveh ali več spremenljivkah hkrati in več statističnih vrst. Tabela 5: Zaposleni v Sloveniji, 2. četrtletje 2007 po sektorjih dejavnosti in po spolu (Vir: Statistični letopis 2008, str. 222) Sektorji dejavnosti St. zaposlenih (v 1000) Skupaj Ženske Moški Kmetijske dejavnosti 101 47 54 Nekmetijske dejavnosti 340 103 237 Storitvene dejavnosti 542 296 246 2.4.2 Zgradba tabele Tabela mora imeti naslov, iz katerega je razvidno, kateri podatki so v njej prikazani, navajati pa mora tudi vir, iz katerega so bili črpani podatki. Slika 1: Zgradba tabele (Vir: lastni) GLAVA TABELE ZBIRNA VRSTICA ČELO TABELE ZBIRNI STOLPEC VRSTICA STOLPEC POLJE V glavi tabele pojasnimo, kaj bo prikazano v posameznih stolpcih. V čelu tabele opišemo, kaj bodo prikazovale posamezne vrstice. Zbirna vrstica vsebuje vsote podatkov za stolpce, zbirni stolpec pa nasprotno vsote podatkov za vrstice. Posamezni podatek zapišemo v polje. 2.4.3 Prikazovanje podatkov z grafikoni Z grafikoni najpogosteje dopolnimo tabelarični prikaz. Prednost grafičnega prikaza je v nazornosti oziroma preglednosti. Vrste grafikonov: a) Linijski grafikon je prikaz podatkov v pravokotnem koordinatnem sistemu. Primeren je za prikaz številskih in časovnih vrst. Slika 2: Linijski grafikon (Vir: lastni) Količina ali vrednost Čas 0 Obe osi, abscisno in ordinatno, ustrezno opišemo tako, da označimo, kaj prikazujemo in v katerih merskih enotah. Skali na obeh oseh imata začetek v izhodišču, ki ga označimo z 0. Če prikazujemo vrednosti, ki so zelo različne od 0, skalo prekinemo. Pri intervalnih časovnih vrstah točko vrišemo na sredino časovnega intervala (razmika), pri trenutnih pa označimo točko na mestu opazovanega trenutka. V linijski grafikon lahko vrišemo tudi več časovnih vrst in s tem prikazujemo več med seboj primerljivih in povezanih pojavov. S tem se poveča analitična vrednost grafičnega prikaza. b) S stolpci prikazujemo predvsem opisne statistične vrste, posebej krajevne. Primerni so za prikazovanje dveh ali več vsebinsko povezanih statističnih vrst. Pri prikazovanju s stolpci je pomembno, da so enako široki. c) S kartogrami prikazujemo geografsko razširjenost pojava tako, da vrišemo krajevne statistične vrste v geografsko karto. č) Figure uporabljamo, kadar želimo na poenostavljen način s pojavom seznaniti čim širši krog prebivalcev. Tu obravnavane pojave predstavljamo s predmeti ali slikami. Uporabljeni znaki morajo biti v vsebinski povezavi s pojavom (npr. slike oseb, knjig). d) Krogi in kvadrati. Ploščina geometrijskih likov mora biti v sorazmerju z velikostjo pojava. Znotraj lika skupini z večjim številom enot pripada sorazmerno večja ploščina. ZGLED 2 Določite vrsto tabele in statistično vrsto ter podatke prikažite z linijskim grafikonom tako, da skalo na ordinatni osi začnete pri 480. Tabela 6: Radijski naročniki v Sloveniji po letih (Vir: Slovenija v številkah 2002, str. 26) Leto Št. radij skih naročnikov 1990 604 1995 530 1999 533 2000 548 Tabela je enostavna. Prikazuje intervalno časovno vrsto. Slika 3: Število radijskih naročnikov v Republiki Sloveniji po letih (Vir: Slovenija v številkah 2002, str.26) 620 600 ^ 580 H ^ 560 H li 540 H 520 -500 -480 1990 1995 1999 Leto 2000 2.5 STATISTIČNA ANALIZA OPAZOVANEGA POJAVA Množične pojave analiziramo tako, da s posebnimi metodami obdelujemo osnovne podatke. Metode bomo podrobneje obravnavali v naslednjih poglavjih. V omenjenem poglavju smo se podrobneje seznanili s fazami statističnega raziskovanja. Navedena pravila glede prikaza podatkov v tabeli in grafu ter ustrezne opremljenosti z naslovom in virom, nam bodo v pomoč pri pisanju raznih projektnih nalog in pri predstavitvi statističnih podatkov, do katerih bomo prišli sami. Pri prikazovanju podatkov z grafikoni se srečamo z znanjem matematike, prav tako pa se tema navezuje na modul Informacijsko komunikacijska tehnologija. S tabelaričnim in grafičnim prikazovanjem se bomo srečali tudi v nadaljnjih delih gradiva. VAJE 1. Za podatke v tabelah določite statistično vrsto in utemeljite odgovore. a) Tabela 7: Število ekoloških kmetij v Sloveniji (Vir: Skupaj za zdravje človeka in narave, september 2010, str. 15) Leto Število ekoloških kmetij 2001 1000 2002 1160 2003 1415 2004 1582 2005 1718 2006 1876 2007 2000 2008 2067 2009 2096 b) Tabela 8: Očetje z otroki po starostnih skupinah očeta, popis 1991 (Vir: Ženske in moški v Sloveniji 2000, str. 16) Starostne skupine Št. očetov z otroki (v 1000) Pod 20 0 20 - 29 1 30 - 39 2 40 - 49 4 50 - 59 3 60 - 69 2 70 + 2 c) Tabela 9: Branost dnevnih publikacij po številu bralcev, 2007 (Vir: Statistični letopis 2008, str. 170) Dnevniki Št. bralcev od vseh 7623 anketiranih Delo 1246 Direkt 308 Dnevnik 903 Ekipa 219 Finance 241 Primorske novice 326 Slovenske novice 1793 Večer 908 2. a) Podatke iz tabele 7 prikažite z linijskim grafikonom. Za kakšno vrsto tabele gre? b) Prikažite podatke v tabeli 10 s stolpci. Tabela 10: Povprečno mesečno število oseb, upravičenih do nadomestila plače med porodniškim dopustom (Vir: Ženske in moški v Sloveniji, 2000, str. 33) Leto Povprečno mesečno št. oseb Matere Očetje 1995 17111 131 1996 16941 127 1997 16793 112 1998 16223 131 1999 16026 145 Rešitve 1. a) Tabela prikazuje opisno časovno statistično vrsto. Podatki se nanašajo na intervale posameznih let, zato je časovna vrsta intervalna. b) Tabela prikazuje zvezno številsko statistično vrsto, ki pa se izraža kot diskretna. Starost očeta je zvezna številska spremenljivka, vendar starost obravnavamo v dopolnjenih letih. c) Tabela prikazuje opisno statistično vrsto, ker je dnevnik opisna spremenljivka. 2. a) Tabela je enostavna. b) Tabela je dvorazsežna. Upravičence do nadomestila plače med porodniškim dopustom prikazuje po času in spolu. o ň >o B o o o ň r:^ >o sS iS Slika 5: Povprečno mesečno število oseb, upravičenih do nadomestila plače med porodniškim dopustom po letih (Vir: Ženske in moški v Sloveniji 2000, str.33) 18000 16000 -14000 -12000 -10000 -8000 -6000 -4000 -2000 -0 □ matere □ očetje 1995 1996 1997 Leto 1998 1999 3. RELATIVNA ŠTEVILA Podatke o nekem pojavu imamo lahko prikazana na različne načine. Lahko npr. zapišemo, da je na neki šoli ta hip 850 dijakov. Morda pa ravnatelj kolektivu pove, da je v tekočem šolskem letu vpisanih 8 % dijakov manj kot v preteklem šolskem letu. V prvem primeru imamo opravka z absolutnim podatkom, v drugem pa z relativnim. Ekonomista poleg absolutnih količin in zneskov samih zanimajo tudi velikostni odnosi med njimi. Zato bomo temu namenili celotno poglavje. Relativna števila dobimo, če posamezni pojav primerjamo z drugim pojavom ali z istovrstnim pojavom v drugem kraju oz. drugem času. Smiselna je tudi primerjava posameznih delov množičnega pojava s celoto ali posameznih delov med seboj. Glede na vrsto podatkov, za katere lahko izračunavamo razmerje, poznamo tri vrste relativnih števil: • Strukture so razmerja med dvema istovrstnima pojavoma. Pri tem se podatek, ki ga primerjamo, nanaša na del, podatek, s katerim ga primerjamo, pa na celoto obravnavanega pojava • Statistični koeficienti so razmerja med dvema raznovrstnima pojavoma, ki sta v vsebinski povezavi. • Indeksi izražaj o razmerj a med istovrstnima pojavoma v različnem času. • Stopinje so primerjave istovrstnih pojavov. Z njimi merimo porast oz. padec pojava. 3.1 STRUKTURE Struktura je primerjava podatkov za del pojava s podatki za celoto pojava. Izrazimo jo lahko v obliki deleža, odstotka ali odtisočka. Del pojava označimo z Yj, celoto pa z Y. Tako izračunamo: Y strukturni delež P = Y strukturni odstotek P, % = ■ 100 ; Y Y Kadar opazovani pojav razčlenjujemo le po vrednosti ene spremenljivke, govorimo o enorazsežnih strukturah. Ko pa pojav razčlenjujemo po vrednostih za več spremenljivk hkrati, je struktura večrazsežna. Pri večrazsežni strukturi lahko izračunamo: • stolpno strukturo - tu celoto predstavlja vsota po stolpcu; • vrstično strukturo - celota je vsota po vrstici; • kotno strukturo - celoto dobimo kot vsoto po vrsticah in stolpcih skupaj. 3.1.1 Enorazsežna struktura Pri enorazsežni strukturi razčlenimo pojav po vrednostih ene spremenljivke. ZGLED 1 Izračunajte enorazsežno strukturo in razložite rezultate. Tabela 11: Družine v Sloveniji leta 1991 po tipu (Vir: Ženske in moški v Sloveniji 2000, str. 15) Tipi družin Število družin (v 1000) Zakonski pari brez otrok 110 Zakonski pari z otroki 326 Matere z otroki 85 Očetje z otroki 14 Neporočeni pari z otroki 12 Neporočeni pari brez otrok 5 Skupaj 552 bela 12: Družine v % v Sloveniji po tipu (Vir: Ženske in moški v Tipi družin Število družin (v %) Zakonski pari brez otrok 20 Zakonski pari z otroki 59 Matere z otroki 15 Očetje z otroki 3 Neporočeni pari z otroki 2 Neporočeni pari brez otrok 1 Skupaj 100 Glede na celotno število družin je 20 % zakonskih parov brez otrok, 59 % zakonskih parov z otroki, 15 % mater z otroki, 3 % očetov z otroki, 2 % neporočenih parov z otroki in 1 % neporočenih parov brez otrok. 3.1.2 Grafično prikazovanje enorazsežnih struktur Strukture grafično prikazujemo z različnimi vrstami grafikonov, med njimi so najpogostejši strukturni stolpci in krogi. • Strukturni stolpci. Strukturni stolpec, visok 100 enot, razdelimo (v razmerju strukturnih odstotkov) po višini na več delov. Posamezne dele stolpca šrafiramo ali pobarvamo. Ob stolpcu vrišemo skalo in v legendi pojasnimo pomen šrafur oz. barv. • Krogi. Za prikazovanje v krogu preračunamo odstotke v kotne stopinje po obrazcu: Pj° = 3,6 • Pj %. Rezultat je kot v stopinjah, ki ustreza posameznemu odstotku. Celoto pa predstavlja polni kot (360°). ZGLED 2 Izračunano enorazsežno strukturo za podatke iz tabele 11 prikažite v stolpcu in krogu. Slika 6: Družine v Sloveniji leta 1991 po tipu (Vir: Ženske in moški v Sloveniji 2000, str. 15) □ Zakonski pari brez otrok □ Zakonski pari z otroki □ Matere z otroki □ Očetje z otroki ■ Neporočeni pari z otroki □ Neporočeni pari brez otrok 3.1.3 Večrazsežna struktura Izmed večrazsežnih struktur bomo obravnavali le dvorazsežne strukture. Dvorazsežno strukturo dobimo, če pojav razčlenimo hkrati po vrednostih za dve spremenljivki. ZGLED 3 Tabela 13: Dolžina državne meje Republike Slovenije v kilometrih (Vir: Slovenija v številkah 2002, str. 4) Mejna država Skupaj Suhozemna Rečna Morska Skupaj 1382 921 413 48 Avstrija 330 251 79 - Hrvaška 670 380 290 - Italija 280 201 31 48 Madžarska 102 89 13 - Izračunajte dvorazsežno strukturo (strukturni odstotek) na tri načine: a) vrstično (po vrsti meje), b) stolpno (po državi) in c) kotno (po vrsti meje in državi hkrati) in razložite odebeljene rezultate. a) Tabela 14: Dolžina državne meje Republike Slovenije v % po vrsti meje (Vir: Slovenija v številkah 2002, str. 4) Mejna država Skupaj % Suhozemna % Rečna % Morska % Skupaj 100 66,6 29,9 3,5 Avstrija 100 76,1 23,9 0 Hrvaška 100 56,7 43,3 0 Italija 100 71,8 11,1 17,1 Madžarska 100 87,3 12,7 0 Izmed celotne meje Republike Slovenije z Avstrijo je 76,1 % suhozemne. b) Tabela 15: Dolžina državne meje Republike Slovenije v % po državi (Vir: Slovenija v številkah 2002, str. 4) Mejna država Skupaj % Suhozemna % Rečna % Morska % Skupaj 100 100 100 100 Avstrija 23,9 27,3 19,1 0 Hrvaška 48,5 41,3 70,2 0 Italija 20,3 21,8 7,5 100 Madžarska 7,4 19,7 3,2 0 Izmed celotne meje Republike Slovenije, ki poteka po suhem, pripada 21,8 % meji z Italijo. c) Tabela 16: Dolžina državne meje Republike Slovenije v % po vrsti meje in državi hkrati (Vir: Slovenija v številkah 2002, str. 4) Mejna država Skupaj % Suhozemna % Rečna % Morska % Skupaj 100 66,6 29,9 3,5 Avstrija 23,9 18,2 5,7 0 Hrvaška 48,5 27,5 21,0 0 Italija 20,3 14,5 2,2 3,5 Madžarska 7,4 6,4 0,9 0 Izmed celotne meje Republike Slovenije s sosednjimi državami je 21,0 % rečne meje s Hrvaško. 3.1.4 Grafično prikazovanje dvorazsežnih struktur Večrazsežne strukture najpogosteje grafično prikazujemo z enako širokimi stolpci za vsako spremenljivko posebej. Strukturo v vsakem stolpcu v tem primeru prikažemo kot enorazsežno. ZGLED 4 Prikažite strukturo državne meje v % v Republiki Sloveniji po državi (tabela 13, str. 22). o T3 O Slika 7: Državna meja Republike Slovenije po državi 100% n 80% -60% -40% -20% -0% - llill □ Morska % □ Rečna % ■ Suhozemna % □ Skupaj % # # # Država (Vir: Slovenija v številkah 2002, str. 4) 3.2 STATISTIČNI KOEFICIENTI Koeficient je razmerje med raznovrstnima podatkoma. Ta morata biti v neki vsebinski povezavi, nanašati pa se morata na isti časovni trenutek ali časovni interval (razmik). Le tako je koeficient, ki ga računamo, vsebinsko smiseln (npr. primerjamo število zobozdravnikov v Sloveniji leta 2009 s številom prebivalcev Sloveniji leta 2009). Koeficient je imenovano število. Izračunamo ga po naslednjem obrazcu: K = I Če zamenjamo števec in imenovalec, dobimo recipročni ali obratni koeficient. kr = X = 1 R Y K Vendar pa statističnih koeficientov ni vedno smiselno računat na oba načina. V praksi se mnogokrat uveljavi le eden, tisti, ki je bolj razumljiv. Hkrati pa je pomembna tudi pravilna interpretacija dobljenih rezultatov. Pomen koeficientov je v izražanju intenzivnosti dogajanja v času in prostoru. Pri poslovanju je pomemben koeficient obračanja zalog, ki nam pove, kolikokrat se povprečne zaloge surovin ali blaga obrnejo v enoti časa. Recipročna vrednost tega koeficienta pa izraža čas, v katerem se zaloge enkrat obrnejo. ZGLED 5 V Sloveniji je bilo leta 2000 54 bolniških postelj na 10000 prebivalcev. Iz navedenega koeficienta lahko sklepamo na raven zdravstvenega varstva. Koeficient bi izračunali po sledeči enačbi: K = št. bolniških postelj / št. prebivalcev • 10000 Ker je število bolniških postelj v Sloveniji seveda manjše, kot je število prebivalcev, bi bila vrednost koeficienta manjša od ena. V tem primeru zaradi lažje predstavljivosti ulomek pomnožimo z ustrezno vrednostjo (100, 1000 _), da dobimo rezultat, ki je večji od ena. Recipročni koeficient bi dobili po naslednji enačbi (pri čemer množenje ni potrebno): Kr = št. prebivalcev / št. bolniških postelj ZGLED 6 V šolskem letu 2000/01 je bilo v Sloveniji 104845 dijakov in 9351 srednješolskih učiteljev (Vir: Slovenija v številkah 2002, str. 23). Izračunajte število dijakov na enega učitelja v Sloveniji za šolsko leto 2000/01 in njegov recipročni koeficient. Kaj nam pove izračunani recipročni koeficient? 104845 K = št. dijakov / št. učiteljev =-= 11,2 dijaka na učitelja Kr = št. učiteljev / št. dijakov = 9351 9315 = 0,089 učitelja na dijaka 104845 Bolj nazorno lahko izrazimo vrednost drugega koeficienta tako, da ga pomnožimo s 100. Kr = št. učiteljev / št. dijakov • 100 = 8,9 učitelja na 100 dijakov 3.2.1 Grafično prikazovanje statističnih koeficientov Koeficiente prikazujemo grafično običajno s stolpci, pri čemer je dolžina stolpca premo sorazmerna z vrednostjo koeficienta. ZGLED 7 Prikažite koeficiente iz tabele s stolpci. Tabela 17: Povprečno število živorojenih otrok na eno žensko v Sloveniji od 1985 do 2000 (Vir: Slovenija v številkah 2002, str. 14) Leto Povprečno število živorojenih otrok na eno žensko 1985 1,68 1990 1,46 1995 1,29 1999 1,21 2000 1,26 Slika 8: Povprečno število živorojenih otrok na eno žensko (Vir: Slovenija v številkah 2002, str. 14) 1,8 1,6 -1,4 1,2 - ii 1 iS0,8 ^ 0,6 0,4 - 0,2 - 0 1985 1990 1995 Leto 1999 2000 3.3 INDEKSI Indeksi so relativna števila, ki jih dobimo z razmerjem dveh podatkov, ki se nanašata na istovrstna pojava, pomnoženim s 100. Indeks je neimenovano število. Lahko ga izračunavamo za absolutne podatke in za relativna števila. Računamo ga po osnovnem obrazcu: Y 0=100• Yj primerjalni podatek Yo osnova ali baza indeksa Osnova indeksa je lahko fiksna ali pa se spreminja. Indeks zavzema naslednje vrednosti: I = 100 (pomeni, da sta podatka enaka) I > 100 (pomeni, da je primerjalni podatek večji od osnove) I < 100 (pomeni, da je primerjalni podatek manjši od osnove) Poznamo krajevne in časovne indekse. a) Krajevni indeksi prikazujejo primerjave krajevno opredeljenih podatkov. v b) Časovni indeksi kažejo relativne spremembe pojavov v času. O njih govorimo, če primerjamo dva istovrstna podatka, ki se nanašata na dva časovna trenutka ali dva časovna razmika. Ločimo: • Indekse s stalno osnovo - tu posamezne podatke v časovni vrsti primerjamo vedno z istim podatkom Yo (osnova ali baza). Y IH0 =100• j 0 Y 0 • Verižne indekse, ki so indeksi s spremenljivo osnovo. Izražajo relativno spremembo med zaporednimi časovnimi trenutki oz. zaporednimi časovnimi obdobji. Izračunavamo jih tako, da pojav v posameznem časovnem trenutku (oz. obdobju) Yj primerjamo z istim pojavom v predhodnem trenutku (oz. obdobju) Yj-1. = Vj = 100 • Pomen izračunavanja indeksov: - prikažejo nazorno sliko o velikosti pojava, - omogočajo analizo dinamike pojava, - omogočajo primerjavo raznovrstnih podatkov. 3.3.1 Grafično prikazovanje indeksov Indekse s stalno osnovo grafično prikazujemo z linijskim grafikonom, verižne indekse pa s stolpci. ZGLED 8 Izračunajte indekse s stalno osnovo 2007 in verižne indeks za podatke v tabeli, grafično jih prikažite in izračunane indekse za leto 2009 razložite. Tabela 18: Število ekoloških kmetij v Sloveniji (Vir: Skupaj za zdravje človeka in narave, september 2010, str. 15) Leto Število ekoloških kmetij 2001 1000 2002 1160 2003 1415 2004 1582 2005 1718 2006 1876 2007 2000 2008 2067 2009 2096 bela 19: Število ekoloških kmetij v Sloveniji ptember 2010, str. 15) (Vir: Skupaj za zdravje Leto Število ekoloških kmetij Ij/2007 Vj 2001 1000 50 / 2002 1160 58 116 2003 1415 71 122 2004 1582 79 112 2005 1718 86 109 2006 1876 94 109 2007 2000 100 107 2008 2067 103 103 2009 2096 105 101 120 JU 100 o > o s M o o ň M -a s Slika 9: Indeks s stalno osnovo leta 2007, ekološke kmetije v Sloveniji od leta 2001 do leta 2009 (Vir: Skupaj za zdravje človeka in narave, september 2010, str. 15)_ o o ctí (N M 80 60 40 20 2001 2002 2003 2004 2005 2006 2007 2008 2009 Leto Slika 10: Verižni indeks, ekološke kmetije v Sloveniji od leta 2001 do leta 2009 (Vir: Skupaj za zdravje človeka in narave, september 2010, str. 15) 140 120 ^ 100 u T3 •la 80 60 40 20 0 ^ ^ ^ ^ ^ ^ Leto I2009/2007 : Leta 2009 je bilo 5 % več ekoloških kmetij kot leta 2007. V2009 : Leta 2009 je bilo 1 % več ekoloških kmetij kot leta 2008. 0 3.4 KAZALCI RASTI Kazalci rasti so povezani z indeksi. Uporabljamo jih pri preučevanju sprememb v dveh zaporednih časovnih obdobjih. Poleg že omenjenega verižnega indeksa nam dinamiko pojava prikažejo naslednji kazalci: razlika D-, koeficient rasti (koeficient dinamike) K- in stopnja rasti (relativna razlika) Sj. Razlika Dj lahko zavzema pozitivno in negativno vrednost. Pozitivna razlika pove, za koliko enot se je pojav povečal glede na predhodno leto, negativna pa, za koliko enot se je pojav zmanjšal glede na predhodno leto. = - Y--1 Koeficient rasti Kj pove, kolikokrat je pojav večji (Kj > 1) oziroma manjši (Kj < 1) od predhodnega leta. Če je koeficient rasti enak 1, potem ni sprememb glede na predhodno leto. K = Y- Y --1 100 Stopnja rasti Sj zavzema vrednost, ki je manjša, večja ali enaka 0. Pozitivna vrednost pove za koliko odstotkov se je pojav povečal glede na predhodno leto, negativna pa za koliko odstotkov se je pojav zmanjšal glede na predhodno leto. Y, - Y, , D, S = 100 -^ = 100 = V - 100 = 100 ■ K - 100 Y --1 Y --1 ZGLED 9 Za podatke iz tabele 18 (str. 29) izračunajte razliko, koeficient rasti in stopnjo rasti ter jih za leto 2009 razložite. Tabela 20: Število ekoloških kmetij v Sloveniji (Vir: Skupaj za zdravje človeka in narave, september 2010, str. 15) Leto Stevilo ekoloških kmetij Dj Kj Sj 2001 1000 / / / 2002 1160 160 1,16 16 2003 1415 255 1,22 22 2004 1582 167 1,12 12 2005 1718 136 1,09 9 2006 1876 158 1,09 9 2007 2000 124 1,07 7 2008 2067 67 1,03 3 2009 2096 29 1,01 1 D2009 = 29: Leta 2009 se je število ekoloških kmetij v Sloveniji povečalo za 29 glede na predhodno leto. K2009 = 1,01: Leta 2009 se je število ekoloških kmetij v Sloveniji povečalo v primerjavi s prejšnjim letom 1,01-krat. S2009 = 1 : Leta 2009 je bilo za 1 % več ekoloških kmetij v Sloveniji kot leta 2008. 3.5 STOPNJE Stopnje so posebna vrsta relativnih števil, ki jih uporabljamo pri analizi sprememb pojavov v času. Najbolj znane so stopnje s področja demografske statistike, stopnje natalitete, mortalitete in naravnega prirasta. Stopnja natalitete (stopnja rodnosti) pove število živorojenih na 1000 prebivalcev. Sn = 1000 • št. živorojenih otrok / srednje št. prebivalcev Stopnja mortalitete (stopnja umrljivosti ali smrtnosti) nam pove število umrlih na 1000 prebivalcev. SM = 1000 • št. umrlih / srednje št. prebivalcev Naravni prirast je razlika med stopnjo rodnosti in smrtnosti. ZGLED 10 Iz podatkov v tabeli izračunajte stopnje natalitete, mortalitete in naravni prirast po letih. Tabela 21: Število prebivalcev in naravno gibanje prebivalstva v Republiki Sloveniji (Vir: Statistični letopis 2008, str. 83) Leto Prebivalstvo po stanju na dan 31.12. Živorojeni Umrli 2003 1996773 17321 19451 2004 1997004 17961 18523 2005 2001114 18157 18825 2006 2008516 18932 18180 2007 2019406 19823 18584 Tabela 22: Naravno gibanje prebivalstva v Republiki Sloveniji (Vir: Statistični letopis 2008, str. 83) Leto Stopnja rodnosti Stopnja umrljivosti Naravni prirast 2003 8,7 9,7 - 2130 2004 9,0 9,3 - 562 2005 9,1 9,4 - 668 2006 9,4 9,1 752 2007 9,8 9,2 1239 Ponovimo, da smo spoznali štiri vrste relativnih števil, to so strukture, koeficienti, indeksi in stopnje. Na primerih sodeč smo spoznali, da je pri izračunih potrebna matematična natančnost, da računalniški program Excel ni namenjen le risanjiïtortic", da je ustrezna analiza dobljenih rezultatov še kako pomembna, predvsem pa moramo ohrôxditriavo" pamet in izračunavati le kar je smiselno. VAJE ) a) Tabela 23: Zaposleni po sektorjih dejavnosti in spolu, 2. četrtletje 2000 (Vir: Ženske in moški v Sloveniji 2000, str. 42) Sektorji Zaposleni (v 1000) Ženske Moški Kmetijske dejavnosti 4 6 Nekmetijske dejavnosti 113 198 Storitvene dejavnosti 241 184 Nerazvrščeni 1 3 Izračunajte dvorazsežno strukturo po vrsti sektorja, po spolu in po obeh spremenljivkah hkrati. Katere statistične vrste prikazuje tabela? b) Tabela 24: Vzgojitelji, pomočniki vzgojiteljev v vrtcih in učitelji v podaljšanem bivanju, 1998 (Vir: Ženske in moški v Sloveniji 2000, str. 32) Vrsta zaposlenih Spol Ženske Moški Vzgojitelji in pomočniki vzgojiteljev 6935 77 Učitelji v podaljšanem bivanju 1113 69 3. Izračunajte strukturne odstotke zaposlenih pri varstvu otrok po vrsti zaposlenih, po spolu in po obeh spremenljivkah hkrati. Interpretirajte vse dobljene rezultate. a) a) Strukturo zaposlenih po spolu iz tabele 23 prikažite s stolpci, strukturo zaposlenih po sektorju pa v krogu. b) Prikažite strukturo po vrsti zaposlenih iz tabele 24 s stolpci. a) Iz tabele 10 (str. 18) izračunajte število očetov, upravičenih do nadomestila med porodniškim dopustom na 1000 mater, upravičenih do nadomestila plače med porodniškim dopustom. b) Prikažite izračunane koeficiente s stolpci. Leta 2007 je bilo v Sloveniji 19823 živorojenih otrok. V tem letu je bilo v državi skupaj 1025242 žensk. Izračunajte in interpretirajte koeficient števila žensk na enega otroka. Tabela 25: Vrednost prodaje in zalog v 1000 EUR v trgovini Zapravljivček (Vir: podatki so izmišljeni) 4. 5. Mesec Vrednost prodaje (v 1000 EUR) Vrednost zalog blaga Januar 1560 960 Februar 1670 1010 Marec 1540 890 April 1490 900 Izračunajte koeficient obračanja zalog za vsak mesec. 6. Tabela 26: Gibanje prebivalstva (Vir: Ženske in moški v Sloveniji 2000, str. 32) Leto Prebivalstvo 30. junij (v 1000) Ženske Moški 1970 894 833 1975 929 871 1980 978 923 1985 1016 957 1990 1029 969 1995 1022 966 1999 1017 968 a) Izračunajte indekse s stalno osnovo 1970 za ženske, indekse s stalno osnovo 1999 in verižne indeks. Za moške izračunajte indekse s stalno osnovo 1985 in verižne indekse. b) Vse izračunane indekse za leto 1980 razložite. 7. Za podatke iz tabele 26 izračunajte razliko, koeficient rasti in stopnjo rasti (za ženske in moške) ter jih za leto 1999 razložite. 8. Napišite z verižnim indeksom in koeficientom rasti, da se je nek pojav leta 2009 v primerjavi z letom 2008: a) zmanjšal za 1,5 %, b) povečal za 0,45 %, c) se ni spremenil v primerjavi s prejšnjim letom. 9. Pridelek pšenice leta 2009 na nekem območju je znašal 11 ton. Koliko je znašal pridelek pšenice eno leto prej, če za leto 2009 velja verižni indeks 93,6 %? 10. Za podatke v tabeli izračunajte stopnjo rodnosti, stopnjo umrljivosti in naravni prirast po letih. Tabela 27: Naravna gibanja prebivalstva v Republiki Sloveniji (Vir: Ženske in moški v Sloveniji 2000, str. 32) Leto Prebivalstvo (v 1000) Živorojeni (v 1000) Umrli (v 1000) 1970 1727 28 17 1975 1800 30 19 1980 1901 30 19 1985 1973 26 20 1990 1998 22 19 1995 1988 18 19 1999 1985 17 19 11. Izračunajte indekse in kazalce rasti za podatke v tabeli ter izpolnite tabelo. Indekse s stalno osnovo 1901 in verižne indekse grafično prikažite. Razložite izračunane indekse za leto 1905. Tabela 28: Obisk Prašnikarjevega zdravilišča v Kamniku v letih od 1901 do 1906 (Vir: Kamnik 1229 - 1979, str. 114) Leto Št. gostov Ij/1901 Ij/1906 VJ DJ KJ Sj 1901 153 1902 155 1903 117 1904 123 1905 85 1906 89 Rešitve 1. a) Tabela prikazuje opisne statistične vrste. Tabela 29: Struktura zaposlenih v % po vrsti sektorja (Vir: Ženske in moški v Sloveniji 2000, str. 42) Sektorji Zaposleni v % Ženske Moški Kmetijske dejavnosti 1 2 Nekmetijske dejavnosti 32 50 Storitvene dejavnosti 67 47 Nerazvrščeni 0 1 Skupaj 100 100 Tabela 30: Struktura zaposlenih v % po spolu (Vir: Ženske in moški v Sloveniji 2000, str. 42) Sektorji Skupaj Zaposleni v % Ženske Moški Kmetijske dejavnosti 100 40 60 Nekmetijske dejavnosti 100 36 64 Storitvene dejavnosti 100 57 43 Nerazvrščeni 100 25 75 Tabela 31: Struktura zaposlenih v % po vrsti sektorja in spolu (Vir: Ženske in moški v Sloveniji 2000, str. 42) Sektorji Skupaj Zaposleni v % Ženske Moški Kmetijske dejavnosti 2 1 1 Nekmetijske dejavnosti 41 15 26 Storitvene dejavnosti 57 32 25 Nerazvrščeni 0 0 0 Skupaj 100 48 52 b) Tabela 32: Struktura zaposlenih v % po vrsti zaposlenih (Vir: Ženske in moški v Sloveniji 2000, str. 32) Vrsta zaposlenih Spol Ženske Moški Vzgojitelji in pomočniki vzgojiteljev 86 53 Učitelji v podaljšanem bivanju 14 47 Skupaj 100 100 - Izmed vseh vzgojiteljic, pomočnic vzgojiteljev in učiteljic v podaljšanem bivanju jih je 86 % vzgojiteljic in pomočnic vzgojiteljev. - Izmed vseh moških vzgojiteljev, pomočnikov vzgojiteljev in učiteljev v podaljšanem bivanju jih je 47 % učiteljev v podaljšanem bivanju. Tabela 33: Struktura zaposlenih v % po spolu (Vir: Ženske in moški v Sloveniji 2000, str. 32) Vrsta zaposlenih Skupaj Spol Ženske Moški Vzgojitelji in pomočniki vzgojiteljev 100 99 1 Učitelji v podaljšanem bivanju 100 94 6 - Izmed vseh vzgojiteljev in pomočnikov vzgojiteljev jih je 1 % moškega spola. - Izmed vseh učiteljev v podaljšanem bivanju jih je 94 % žensk. Tabela 34: Struktura zaposlenih v % po vrsti zaposlenih in spolu (Vir: Ženske in moški v Sloveniji 2000, str. 32) Vrsta zaposlenih Skupaj Spol Ženske Moški Vzgojitelji in pomočniki 86 85 1 vzgojiteljev Učitelji v podaljšanem bivanju 14 13 1 Skupaj 100 98 2 - Izmed vseh vzgojiteljev, pomočnikov vzgojiteljev in učiteljev v podaljšanem bivanju je 13 % učiteljic v podaljšanem bivanju. - Izmed vseh vzgojiteljev, pomočnikov vzgojiteljev in učiteljev v podaljšanem bivanju je 1 % moških vzgojiteljev in pomočnikov vzgojiteljev. 2. a) Slika 11: Struktura zaposlenih oseb v % po spolu v Sloveniji, 2. četrtletje 2000 (Vir: Ženske in moški v Sloveniji 2000, str. 42) 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% ^ ^ ^ ^ ^ xó?' ^^^ □ moški □ ženske Tabela 35: Struktura zaposlenih v stopinjah po vrsti sektorja (Vir: Ženske in moški v Sloveniji 2000, str. 42) Sektorji Zaposleni v stopinjah Ženske Moški Kmetijske dejavnosti 4 7 Nekmetijske dejavnosti 115 180 Storitvene dejavnosti 241 169 Nerazvrščeni 0 4 Skupaj 360 360 Slika 12: Struktura zaposlenih oseb v % po vrsti sektorja v Sloveniji, 2. četrtletje 2000 Ženske □ Kmetijske dejavnosti □ Nekmetijske dejavnosti □ Storitvene dejavnosti □ Nerazvrščeni Moški (Vir: Ženske in moški v Sloveniji 2000, str. 42) b) Ženske Moški Slika 13: Struktura zaposlenih oseb v % po vrsti zaposlenih (Vir: Ženske in moški v Slovenij 2000, str.32) 100% n 80% -60% -40% -20% -0% — □ Učitelji v podaljšanem bivanju □ Vzgojitelji in pomočniki vzgojiteljev 3. a) Tabela 36: Primerjava števila mater in očetov, upravičenih do nadomestila plače med porodniškim dopustom v Sloveniji od 1995 do 1999 (Vir: Ženske in moški v Sloveniji 2000, str. 42) Leto Št. očetov na 1000 mater 1995 8 1996 8 1997 7 1998 8 1999 9 b) Slilcaa. 14: Očet_jej, upraviččeni do na^doie^e;;3tilp pliiče med porodnišlišini d ojjustom na 1000 miiter, upai-iivičenili do nadomestila pl^če m^d porodiiiškimim dojsusto m (V^ir: .Ženslce in moški v Sllovenij :>000, str.4)2) ■ig 1995 1999 4. K = 51,7 žensk/živorojenega otroka Pravilna interpretacija bi bila, da je leta 2007 v Sloveniji približno vsaka dvainpetdeseta ženska rodila živorojenega otroka. 5. Tabela 37: Koeficient obračanja zalog v trgovini Zapravljivček (Vir: podatki so izmišljeni) Mesec Koeficient obračanja zalog Januar 1,625 Februar 1,653 Marec 1,730 April 1,656 6. a) Tabela 38: Indeks gibanja prebivalstva (Vir: Ženske in moški v Sloveniji, 2000, str. 32) Leto Ženske Moški Ij/1970 Ij/1999 Vj Ij/1985 Vj 1970 100,0 87,9 / 87,0 / 1975 103,9 91,3 103,9 91,0 104,6 1980 109,4 96,2 105,3 96,4 106,0 1985 113,6 99,9 103,9 100,0 103,7 1990 115,1 101,2 101,3 101,1 101,3 1995 114,3 100,5 99,3 100,9 99,7 1999 113,8 100,0 99,5 101,1 100,2 b) Ženske: I1980/1970 = 109,4 Leta 1980 je bilo v Sloveniji 9,4 % več žensk kot leta 1970. 1^1980/1999 = 96,2 Leta 1980 je bilo v Sloveniji 3,8 % manj žensk kot leta 1999. V1980 = 105,3 Leta 1980 je bilo v Sloveniji 5,3 % več žensk kot leta 1975. Moški: I1980/1985 = 96,4 Leta 1980 je bilo v Sloveniji 3,6 % manj moških kot leta 1985. V1980 = 106,0 Leta 1980 je bilo v Sloveniji 6 % več moških kot leta 1975. 7. Tabela 39: Kazalci rasti prebivalstva (Vir: Ženske in moški v Sloveniji, 2000, str. 32) Ženske Moški Leto DJ v 1000 Kj Sj Dj v 1000 Kj Sj 1970 / / / / / / 1975 35 1,039 3,9 38 1,046 4,6 1980 49 1,053 5,3 52 1,060 6,0 1985 38 1,039 3,9 34 1,037 3,7 1990 13 1,013 1,3 12 1,013 1,3 1995 - 7 0,993 - 0,7 - 3 0,997 - 0,3 1999 - 5 0,995 - 0,5 2 1,002 0,2 - Ženske D1999 = - 5000 Leta 1999 se je število žensk zmanjšalo za 5000 glede na leto 1995. K1999 = 0,995 Leta 1999 se je število žensk zmanjšalo v primerjavi z letom 1995 0,995-krat. S1999 = - 0,5 Leta 1999 je bilo za 0,5 % manj žensk kot leta 1995. - Moški D1999 = 2000 Leta 1999 je bilo 2000 moških več kot leta 1995. K1999 = 1,002 Leta 1999 je bilo 1,002-krat več moških kot leta 1995. S1999 =0,2 Leta 1999 se je število moških povečalo za 0,2 % glede na leto 1995. 8. a) V2009 = 98,5; K2009 = 0,985 b) V2009 = 100,45; K2009 = 1,0045 c) V20039 = 100; K2009 = 1 9. Y2008 = 11,75 ton 10. Tabela 40: Naravno gibanje prebivalstva v Republiki Sloveniji (Vir: Ženske in moški v Sloveniji 2000, str. 32) Leto Stopnja rodnosti Stopnja umrljivosti Naravni prirast 1970 16,2 9,8 6,4 1975 16,7 10,6 6,1 1980 15,8 10,0 5,8 1985 13,2 10,1 3,1 1990 11,0 9,5 1,5 1995 9,6 9,6 0,0 1999 8,6 9,6 - 1,0 11. Tabela 41: Obisk Prašnikarjevega zdravilišča v Kamniku v letih od 1901 do 1906 (Vir: Kamnik 1229 - 1979, str. 114) Leto St. gostov Ij/1901 Ij/1906 Vj Dj Kj Sj 1901 153 100 171,9 / / / / 1902 155 101,3 174,2 101,3 2 1,013 1,3 1903 117 76,5 131,5 75,5 - 38 0,755 - 24,5 1904 123 80,4 138,2 105,1 6 1,051 5,1 1905 85 55,6 95,5 69,1 - 38 0,691 - 30,9 1906 89 58,2 100 104,7 4 1,047 4,7 I1905/1901 - 55,6 Leta 1905 je bilo 44,4 % gostov manj kot leta 1901. I1905/1906 - 95,5 Leta 1905 je bilo 4,5 % gostov manj kot leta 1906. V1905 - 69,1 Leta 1905 je bilo 30,9 % gostov manj kot leta 1904. D1905 - - 38 Leta 1905 je bilo 38 gostov manj kot leta 1904. K1905 - 0,691 Leta 1905 je bilo 0,691-krat manj gostov kot leta 1904. S1905 - - 30,9 Leta 1905 je bilo 30,9 % gostov manj kot leta 1904. 4. FREKVENČNE PORAZDELITVE Če bi obiskovalce spletne strani www.unisvet.si vodili po starosti in bi jih nato združili v skupine, katere bi tvorili člani neke starostne skupine, bi dobili frekvenčno porazdelitev. Frekvenčna porazdelitev nam omogoči večjo preglednost nad zbranimi podatki in nam marsikdaj olajša nadaljnjo statistično raziskavo. Frekvenčno porazdelitev ali porazdelitev pogostosti dobimo, če enote razvrstimo po vrednostih izbrane številske spremenljivke (y) v skupine, ki jih imenujemo razredi. Od raziskave je odvisno število razredov. Dobro sliko gostitev dobimo, če imamo od 8 do 16 razredov. Pri oblikovanju frekvenčnih porazdelitev je potrebno upoštevati enoličnost pri opredelitvi razredov, kar pomeni, da je vsaka vrednost vključena natanko v en razred. Drugi pogoj je preglednost nad zbranimi podatki. 4.1 OPREDELITEV RAZREDOV Pri številčnih spremenljivkah določimo razrede tako, da določimo spodnjo mejo razreda (yj, min) in zgornjo mejo razreda (yj, max). Spodnja in zgornja meja razreda sodita med obdelovalne meje razreda, ki se uporabljajo pri izračunih in grafičnih prikazih. Obdelovalne meje se določijo iz delovnih mej razreda. Delovne meje morajo biti določene tako, da je upoštevana enoličnost razredov. Pri tem moramo upoštevati, da so številske spremenljivke lahko zvezne ali diskretne. Iz mej razredov naprej izračunamo širino razreda (dj) in sredino razreda (Yy). d = ^ - ^ - y - ,max y - ,min Y y-,max + y-,min - = 2 Poleg tega za vsak razred določimo število enot v razredu ali frekvenco (fj) in celotno velikost populacije (N). -=1 ZGLED 1 Za podatke v tabeli določi obdelovalne meje razredov in sredine ter širine razredov. a) Opredelitev razredov za zvezne spremenljivke Tabela 42: Frekvenčna porazdelitev dijakov po oddaljenosti od doma do šole v km (Vir: podatki so izmišljeni) Oddaljenost v km fj yj, min yj, max yj dj Do 2 4 - ^ 2 Nad 2 do 4 5 2 M ^ 4 3 2 Nad 4 do 6 10 4 6 5 2 Nad 6 9 6 - - - Skupaj 28 - - - - V danem primeru ima prvi razred določeno le zgornjo mejo, zadnji razred pa le spodnjo mejo. Govorimo o odprtih razredih, pri čemer je prvi razred odprt navzdol, zadnji pa navzgor. b) Opredelitev razredov za diskretne spremenljivke Tabela 43: Frekvenčna porazdelitev dijakov po številu članov v gospodinjstvu (Vir: podatki so izmišljeni) Št. članov v gospodinjstvu fj yj, min yj, max yj dj 1 - 2 3 0,5 1,5 2 3 - 4 22 2,5 if 4,5 3,5 2 5 - 6 5 4,5 6,5 5,5 2 7 - 8 1 6,5 8,5 7,5 2 Skupaj 31 - - - - c) Starost - poseben primer zvezne spremenljivke, pri kateri vrednosti v posameznih razredih zaokrožujemo na dopolnjena leta. Tabela 44: Frekvenčna porazdelitev dijakov po starosti (Vir: podatki so izmišljeni) Dopolnjena leta fj yj, min yj, max yj dj 14 - 15 151 14 16 15 2 16 - 17 169 16 28 17 2 18 - 19 138 18 20 19 2 Skupaj 458 - - - - 4.2 OPIS FREKVENČNE PORAZDELITVE V frekvenčni porazdelitvi se srečamo z različnimi vrstami frekvenc. 1. FREKVENCA (fj), imenovana tudi absolutna frekvenca, ali število enot v posameznem razredu. Vsota frekvenc vseh razredov (k) ustreza številu enot populacije (N). 2. RELATIVNO FREKVENCO (fjo) dobimo, če frekvenco v posameznem razredu primerjamo s številom enot populacije. Relativna frekvenca izraža delež enot, ki so v posameznem razredu. Vsota vseh relativnih frekvenc je 1. f^ k fo = N Z fo =1 j=1 3. KUMULATIVA FREKVENC (Fj) v razredu je vsota frekvenc v tem razredu in v vseh prejšnjih razredih. Kumulativa v prvem razredu je enaka frekvenci v tem razredu, kumulativa v zadnjemu razredu pa je enaka skupnemu številu enot. V vseh drugih razredih pa jo določimo po obrazcu: Fj = + fj F1 = f1 ................................................... frekvenc v vsakem razredu pove, koliko je enot, ki imajo nižjo vrednost od zgornje meje danega razreda. 4. KUMULATIVO RELATIVNIH FREKVENC (Fjo) dobimo podobno kot kumulativo frekvenc, le da v tem primeru seštevamo relativne frekvence. Kumulativa relativnih frekvenc je v prvem razredu enaka relativni frekvenci prvega razreda, v zadnjem razredu pa je enaka 1. Fjo = f;_1 + fo F1o = f1o Kumulativa relativnih frekvenc v vsakem razredu pove, kakšen je delež enot, ki imajo nižjo vrednost od zgornje meje danega razreda. ZGLED 2 Za podatke iz tabele 43 (str. 43) izračunajte relativne frekvence, kumulative frekvenc in kumulative relativnih frekvenc. Frekvence 3. razreda razložite. Tabela 45: Izračun relativnih frekvenc, kumulativ frekvenc in kumulativ relativnih frekvenc za frekvenčno porazdelitev dijakov po številu članov v gospodinjstvu (Vir: podatki so izmišljeni) Št. članov v gospodinjstvu fj fjo Fj Fjo 1 - 2 3 0,097 3 0,097 3 - 4 22 0,710 25 0,807 5 - 6 5 0,161 30 0,968 7 - 8 1 0,032 31 1,000 Skupaj 31 1,000 fj = 5: 5 dijakov živi v gospodinjstvu, ki šteje 5 do 6 članov. fjo - 0,161: Vsega skupaj je 16,6 % dijakov, ki živijo v gospodinjstvu s 5 - 6 člani. Fj = 30: 30 dijakov živi v gospodinjstvu, ki šteje manj kot 7 članov. Fjo = 0,968: 96,8 % dijakov živi v gospodinjstvu, ki šteje do vključno 6 članov. 4.2.1 Grafični prikaz frekvenčne porazdelitve Frekvenčno porazdelitev lahko prikažemo s histogramom (stolpci), s poligonom (linijski grafikon), porazdelitev z enako širokimi razredi pa lahko prikazujemo tudi s strukturnim krogom. Kumulativo frekvenc in kumulativo relativnih frekvenc prikazujemo z linijskim grafikonom. Slika 15: Prikaz frekvenčne porazdelitve s stolpci oz. z linijskim grafikonom (Vir: lasten) fj 0 Vrednost spremenljivke (meje razredov) V histogramu je višina stolpcev sorazmerna s številom enot v posameznem razredu. V poligonu označimo točke nad sredinami razredov, pri prikazovanju kumulative pa na mejah razredov. Ob desni strani prikažemo skalo za kumulativo relativnih frekvenc. Slika 16: Prikaz kumulative frekvenc (Vir: lasten) Fj Fj o 0 Vrednost spremenljivke (meje razredov) Kumulative frekvenc in kumulative relativnih frekvenc prikazujemo grafično z OGIVO. Ta specifični graf je podrobno opisan v gradivu, ki je dosegljivo na spletni strani http://moodle.sc-rm.net. S soavtorjema vas vabim, da jo obiščete, kliknete na E-gradiva in se nato postavite na predmet statistika. S prijavo "gost" lahko aktivno sodelujete pri nalogah, ki so priložene. ZGLED 3 Narišite histogram, poligon in strukturni krog ter obe kumulativi frekvenc za dijake po številu članov v gospodinjstvu (tabela 43, str. 43 ). a) Prikaz s histogramom 25 n 20 ^ 15 ctí 10- 5 0 — 0,5 Slika 17 : Dijaki po št. družinskih članov (Vir: podatki so izmišljeni) 2,5 4,5 6,5 Število družinskih članov 5 b) Prikaz s poligonom 25 1 20 15 ^ 10 5 Slika 18 : Dijaki po št. družinskih članov (Vir: podatki so izmišljeni) 0,5 2,5 4,5 6,5 Število družinskih članov a) Prikaz s strukturnim krogom 8,5 Slika 19 : Dijaki po št. družinskih članov (Vir: podatki so izmišljeni) mr □ 1 do 2 O 3 do 4 □ 5 do 6 □ 7 do 8 Pridobljeno znanje o frekvenčnih porazdelitvah nam bo predstavljalo izhodišče izračunavanje srednjih vrednosti, ki jih bomo spoznali v naslednjem poglavju. za 0 VAJE 1. Za podatke v tabeli določite obdelovalne meje razredov in sredine ter širine razredov. Tabela 46: Dokončane stanovanjske stavbe po številu stanovanj 2007 (Vir: Statistični letopis RS 2008, str. 363) Stevilo stanovanj Stevilo stavb 1 - 2 3547 3 - 10 219 11 - 20 48 21 - 50 40 51 - 100 15 Skupaj 3869 2. a) Za podatke iz tabele 46 izračunajte relativne frekvence, kumulative frekvenc in kumulative relativnih frekvenc (zaradi majhne vrednosti v nekaterih poljih je smiselni izračun na tri decimalna mesta natančno). b) Razložite frekvence tretjega razreda. c) Za podatke iz omenjene tabele narišite histogram in poligon. 3. Tabela 47: Razveze zakonskih zvez po starosti žene v letu 2007 (Vir: Statistični letopis RS 2008, str. 94) Starost žene Stevilo razvez Pod 20 1 20 - 40 67 25 - 29 247 30 - 34 461 35 - 39 486 40 - 44 480 45 - 49 375 50 - 54 265 55 - 59 142 60 - 64 52 65 + 41 Skupaj 2617 a) Iz podatkov iz tabele 47 izračunajte relativne frekvence, kumulative frekvenc in kumulative relativnih frekvenc (na štiri decimalna mesta natančno). b) Razložite frekvence petega razreda. Rešitve 1. Tabela 48: Frekvenčna porazdelitev dokončanih stanovanjskih stavb po številu stanovanj 2007 (Vir: Statistični letopis RS 2008, str. 363) Število stanovanj yj,min yj,max yj dj 1 - 2 0,5 2,5 1,5 2 3 - 10 2,5 10,5 6,5 8 11 - 20 10,5 20,5 15,5 10 21 - 50 20,5 50,5 35,5 30 51 - 100 50,5 100,5 75,5 50 2. a) Tabela 49: Izračun relativnih frekvenc, kumulativ frekvenc in kumulativ relativnih frekvenc za frekvenčno porazdelitev dokončanih stanovanjskih stavb po številu stanovanj 2007 (Vir: Statistični letopis RS 2008, str. 363) Število stanovanj fj fjo Fj Fjo 1 - 2 3547 0,917 3547 0,917 3 - 10 219 0,057 3766 0,974 11 - 20 48 0,012 3814 0,986 21 - 50 40 0,010 3854 0,996 51 - 100 15 0,004 3869 1,000 Skupaj 3869 1,000 f3 = 48 Izmed vseh zgrajenih stavb leta 2007 v Sloveniji jih je bilo 48 takih, ki so imela od 11 do vključno 20 stanovanj. f30 = 0,012 Izmed vseh zgrajenih stavb leta 2007 v Sloveniji je bil delež stavb z 11 do vključno 20 stanovanji 0,012. Ali: Leta 2007 je bilo v Sloveniji zgrajenih 1,2 odstotka stavb z 11 do vključno20 stanovanji. F3 = 3814 Leta 2007 je bilo v Sloveniji zgrajenih 3814 stavb, ki so vsebovale do vključno 20 stanovanj. F30 = 0,986 Izmed vseh zgrajenih stavb leta 2007 v Sloveniji je bil delež stavb z do vključno 20 stanovanji 0,986. Ali: Leta 2007 je bilo v Sloveniji izmed vseh zgrajenih stavb 98,6 odstotkov takšnih z do vključno 20 stanovanji. b) Tabela 50: Frekvenčna porazdelitev razvez zakonskih zvez po starosti žene v letu 2007 (Vir: Statistični letopis RS 2008, str. 94) Starost žene fj fjo Fj Fjo Pod 20 1 0,0004 1 0,0004 20 - 40 67 0,0256 68 0,0260 25 - 29 247 0,0944 315 0,1204 30 - 34 461 0,1762 776 0,2966 35 - 39 486 0,1857 1262 0,4823 40 - 44 480 0,1834 1742 0,6657 45 - 49 375 0,1433 2117 0,8090 50 - 54 265 0,1013 2382 0,9103 55 - 59 142 0,0543 2524 0,9646 60 - 64 52 0,0199 2576 0,9845 65 + 41 0,0157 2617 1,0002* Skupaj 2617 1,0002* * Končna vsota vseh relativnih frekvenc oziroma kumulativa relativne frekvence zadnjega razreda naj bi bila 1 (kar predstavlja celotno populacijo). Zaradi zaokroževanja pa včasih prihaja do malenkostnega odstopanja. f5 - 486 Izmed vseh razvez zakonskih zvez leta 2007 v Sloveniji jih je bilo 486 pri starosti žene od 35 do 39 let. f50 - 0,18 5 7 Izmed vseh razvez zakonskih zvez leta 2007 v Sloveniji je bil delež razvez pri starosti žene od 35 do 39 let 0,1857. Ali: Leta 2007 je bilo v Sloveniji izmed vseh razvez zakonskih zvez 18,57 odstotka pri starosti žene od 35 in 39 let. F5 - 1262 Leta 2007 je bilo v Sloveniji 1262 razvez zakonskih zvez pri starosti žene od 35 do 39 let. F50 - 0,4823 Izmed vseh razvez zakonskih zvez leta 2007 v Sloveniji je bil delež razvez pri starosti žene od 35 do 39 let 0,4823. Ali: Leta 2007 je bilo v Sloveniji izmed vseh razvez zakonskih zvez 48,23 odstotka pri starosti žene do 39 let. 5. SREDNJE VREDNOSTI Vas zanima zakaj je možno, da vam na razgovoru za delovno mesto povedo, da je povprečni neto osebni dohodek na zaposlenega 1200 EUR, največ zaposlenih pa prejema neto osebni dohodek v znesku 900 EUR. Takšna in podobna razhajanja bomo spoznali v poglavju o srednjih vrednostih. Iz frekvenčne porazdelitve vidimo, da se večina vrednosti spremenljivke le malo razlikuje od neke osrednje vrednosti in da lahko določimo predstavnika vseh opazovanih enot, tako imenovano srednjo vrednost. Spoznali bomo naslednje srednje vrednosti: aritmetično sredino, mediano, modus, harmonično in geometrijsko sredino. 5.1 ARITMETIČNA SREDINA (M) Aritmetična sredina je najbolj prepoznavna in uporabljena srednja vrednost, ki jo imenujemo tudi povprečje. a) Izračun aritmetične sredine iz posamičnih podatkov Aritmetično sredino dobimo iz posamičnih podatkov tako, da vsoto vseh vrednosti spremenljivke Y delimo s številom vseh enot N. M = 1 Y N■ (yi + y2 +...+yN) N M ■ N = Y Če bi bile vse vrednosti za številsko spremenljivko Y pri vseh opazovanih enotah enake, bi bile njihove vrednosti enake aritmetični sredini. ZGLED 1 V tabeli so zbrani podatki o starosti udeležencev izobraževanja odraslih na šoli Učenjak v šolskem letu 2009/10. Iz podatkov izračunajte povprečno starost udeležencev izobraževanja odraslih. Tabela 51: Udeleženci izobraževanja odraslih, prijavljeni na spomladanski rok poklicne mature, na šoli Učenjak v šolskem letu 2009/10 po starosti (Vir: podatki so izmišljeni) Zap. št. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Starost 20 33 19 22 27 35 43 25 31 40 19 22 24 30 ,, 20 + 33 +19 +... + 24 + 30 M =-= 27,86 14 Povprečna starost udeležencev izobraževanja odraslih, ki so prijavljeni na spomladanski rok poklicne mature v šolskem letu 2009/10, je 27,86 let. b) Izračun aritmetične sredine iz frekvenčne porazdelitve Pri frekvenčni porazdelitvi so vrednosti spremenljivke zajete v razredih, zato z izračunom dobimo oceno aritmetične sredine, ki se malce razlikuje od aritmetične sredine, dobljene iz posamičnih podatkov. Imenujemo jo tehtana ali ponderirana aritmetična sredina, frekvence pa teže ali ponderi. M * = v* s y ifi Y _ 1=1 N Z f^ i=1 ZGLED 2 Iz podatkov v tabeli 43 (str. 43) izračunajte aritmetično sredino za število družinskih članov v gospodinjstvih dijakov. Tabela 52: Frekvenčna porazdelitev dijakov po številu članov v gospodinjstvu (Vir: podatki so izmišljeni) Št. članov v gospodinjstvu fj yj fj yj 1 - 2 3 1,5 4,5 3 - 4 22 3,5 77,0 5 - 6 5 5,5 27,5 7 - 8 1 7,5 7,5 Skupaj 31 - 116,5 M. = i: = HM = 3,76 N Z f. i=1 31 Ocena aritmetične sredine je 3,76 članov v gospodinjstvu. To pomeni, da je povprečno število članov v gospodinjstvu dijakov 3,76. Slabost aritmetične sredine je v tem, da nanjo vplivajo skrajne vrednosti. 5.2 MEDIANA (Me) Mediana je srednja vrednost, od katere ima polovica enot manjše vrednosti, polovica pa večje. Mediana leži točno na sredini ranžirne vrste, ki prikazuje podatke, zapisane po velikosti. Rang (R) nam pove mesto posameznega podatka v ranžirni vrsti. V ranžirni vrsti opazujemo N enot populacije, ki so razvrščene po velikosti spremenljivke Y: R 1 2 3 N Y Ymin y2 y3 ymax Rang mediane izračunamo po obrazcu: N +1 R = 2 a) Izračun mediane iz posamičnih podatkov Vrednost mediane je odvisna od števila opazovanih enot. - Če je število opazovanih enot liho, je mediana enaka podatku na sredini vrste. Me = yR ZGLED 3 Iz podatkov v tabeli izračunajte mediano in interpretirajte dobljeni rezultat. Tabela 53: Udeleženci izobraževanja odraslih, prijavljeni na spomladanski rok poklicne mature, na šoli Učenjak v šolskem letu 2009/10 po starosti (Vir: podatki so izmišljeni) Zap. št. 1 2 3 4 5 6 7 8 9 10 11 12 13 Starost 20 33 19 22 27 35 43 25 31 40 19 22 24 Podatke najprej razvrstimo v ranžirno vrsto (uredimo jih po velikosti). R 1 2 o 3 4 5 6 7 8 9 10 11 12 13 Y 19 19 20 22 22 24 25 27 31 33 35 40 45 R = 13+1 = 7 2 Me = y7 = 25 Polovica udeležencev izobraževanja odraslih, prijavljenih na spomladanski rok poklicne mature, je mlajših od 25 let, polovica pa starejših. Če je število opazovanih enot sodo, izračunamo mediano kot povprečje obeh podatkov na sredini vrste. Me = yR-0,5 + yR +0,5 2 ZGLED 4 Iz podatkov v tabeli izračunajte mediano in interpretirajte dobljeni rezultat. Tabela 54: Udeleženci izobraževanja odraslih, prijavljeni na spomladanski rok poklicne mature, na šoli Učenjak v šolskem letu 2009/10 po starosti (Vir: podatki so izmišljeni) Zap. št. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Starost 20 33 19 22 27 35 43 25 31 40 19 22 24 30 R 1 2 o 3 4 5 6 7 8 9 10 11 12 13 14 Y 19 19 20 22 22 24 25 27 30 31 33 35 40 45 R = 14+1 = 7,5 ,,, 25 + 27 ,,, Me =-= 26 2 Polovica udeležencev izobraževanja odraslih, prijavljenih na spomladanski rok poklicne mature, je mlajših od 26 let, polovica pa starejših. b) Izračun mediane iz frekvenčne porazdelitve Rang mediane izračunamo po že znanem obrazcu. Mediana se nahaja v tistem razredu, ki je prvi z večjo kumulativo od ranga. Razred imenujemo medialni razred in ga označimo z indeksom o. Oceno mediane izračunamo po naslednjem obrazcu: R - F Me* = yo,min + do fo yo, min spodnj a mej a medialnega razreda do širina medialnega razreda fo frekvenca medialnega razreda F-1 kumulativa frekvenc pred medialnim razredom 2 ZGLED 5 Iz frekvenčne porazdelitve izračunajte mediano in jo interpretirajte. Tabela 55: Frekvenčna porazdelitev dijakov po oddaljenosti od doma do šole v km (Vir: podatki so izmišljeni) Oddaljenost v km fj Fj Do 2 4 4 Nad 2 do 4 IVT^J /1 J ^ ^ 5 1 A 9 1 Nad 6 10 9 19 28 Skupaj 28 - R = N±1 = 29 = 14,5 2 2 Medialni razred vsebuje nad 4 do 6 kilometrov. Ocena mediane bo torej med tema dvema vrednostma. * ^ R - Fy. r, 14,5 - 9 ,, Me = yo + d^--=1 = 4 + 2 ^^-= 5,1 o,min of 10 o Polovica dijakov je od šole oddaljena manj kot 5,1 km, polovica pa več. Prednost mediane pred aritmetično sredino: če imamo odprte razrede, ne moremo izračunati aritmetične sredine, mediano pa lahko. 5.3 MODUS (Mo) Modus je najpogostejša vrednost. a) Izračun modusa iz posamičnih podatkov Pri neurejenih podatkih modus preprosto razberemo iz podatkov. Lahko se tudi zgodi, da ima ena množica več modusov. ZGLED 6 Iz podatkov v tabeli 51 (str. 48) določite modus (najpogostejšo starost udeležencev izobraževanja odraslih) in interpretirajte dobljeni rezultat. V našem primeru sta modusa dva, 19 in 22. Najpogosteje so udeleženci izobraževanja odraslih, ki so se prijavili na spomladanski rok poklicne mature, stari 19 in 22 let. b) Izračun modusa iz frekvenčne porazdelitve Pri izračunu modusa za populacijo, ki je grupirana v frekvenčni porazdelitvi, izhajamo iz razreda z največ enotami (fmax). Imenujemo ga modusni razred in ga označimo z indeksom o. Mo* = yo,min + do fo f-1 2 ■ fo f-\ f+1 yo, min spodnj a mej a modusnega razreda do širina razreda fo frekvenca v modusnem razredu f-1 frekvenca v prej šnj em razredu f+1 frekvenca v naslednj em razredu ZGLED 7 Za podatke iz tabele 43 (str. 43) ocenite modus in interpretirajte rezultat. Tabela 56: Frekvenčna porazdelitev dijakov po številu članov v gospodinjstvu (Vir: podatki so izmišljeni) Št. članov v gospodinjstvu y fj 1^,2---- 3 ^ 5 - 6 5 7 - 8 1 Skupaj 31 Modusni razred šteje od 3 do 4 družinske člane. Mo* = yomin + do--io-f-l-= 2,5 + 2 ■—— = 3,56 o,min o 2 ■ - /_1 - f+1 ' 2 ■ 22 - 3 - 5 ' Največ dijakov živi v gospodinjstvih z 3,56 družinskimi člani. 5.3.1 Odnosi med aritmetično sredino, mediano in modusom Aritmetična sredina, mediana in modus imajo lahko različne ali enake vrednosti, kar je odvisno od oblike frekvenčne porazdelitve. Porazdelitve delimo na: a) Unimodalne porazdelitve - te porazdelitve imajo en modus. Odvisno od gostitve vrednosti so lahko: - simetrične - tu je upadanje gostitve od modusa v levo in desno enakomerno (Mo = Me = M). - asimetrične - če je upadanje gostitve počasnejše na desno kot na levo, je porazdelitev asimetrična v desno (Mo < Me < M); če pa je upadanje gostitve od modusa v levo počasnejše kot na desno, je porazdelitev asimetrična v levo (Mo > Me > M). Pri asimetričnih porazdelitvah je aritmetična sredina manj primerna za predstavitev vseh opazovanih enot, kot sta mediana in modus. b) Polimodalne porazdelitve imajo več modusov. Naj vas opozorim, da v tem poglavju nismo spoznali vseh srednjih vrednosti, celotno gradivo pa predstavlja le osnovo za bolj poglobljen in celosten pristop statističnega raziskovanja. Morda pa se boste s tem srečali pri nadaljnjem izobraževanju. VAJE 1. Katera srednj a vrednost izraža povprečno vrednost? 2. V čem je prednost mediane pred drugimi srednjimi vrednostmi? 3. Srednj a vrednost, ki populacij o razpolovi, se imenuje: • modus, • mediana, • aritmetična sredina. 4. Konec 19. in v začetku 20. stoletja je bilo mesto Kamnik poznano po zdravilišču. V letih od 1901 do 1910 je zdravilišče letno obiskalo naslednje število gostov: 153, 155, 117, 123, 85, 89, 100, 67, 51, 60. a) Koliko znaša aritmetična sredina? b) Koliko znaša mediana? 5. Tabela 57: Slovenski kinematografi po številu sedežev, 2003) (Vir: http://www.stat.si/letopis/2005/08_05/08-20-05.htm?j ezik-si) St. sedežev St. kinematografov 1 - 100 1 101 - 200 26 201 - 300 21 301 - 400 16 401 - 500 8 501 in več 4 Skupaj 76 a) Kaj je v danem primeru statistična enota? b) Kaj je v danem primeru spremenljivka? c) Kakšne vrste je spremenljivka? d) Ali lahko izračunamo povprečno število sedežev slovenskih kinematografov? e) Katero je tisto število sedežev, od katerega ima polovica kinematografov več, polovica pa manj sedežev? f) Katero je najpogostejše število sedežev v slovenskih kinematografih, zajetih v tabeli? 6. Cene neretvanskih mandarin so na tržnicíHruška" osem sobot zapored bile naslednje: 2,50 EUR/kg, 2,50 EUR/kg, 2,50 EUR/kg, 2,40 EUR/kg, 2,00 EUR/kg, 2,00 EUR/kg, 2,00 EUR/kg, 1,90 EUR/kg. Koliko je znašala najpogostejša cena mandarin? Rešitve 1. Povprečno vrednost izraža aritmetična sredina. 2. Prednost mediane pred drugimi srednjimi vrednostmi je v tem, da jo lahko izračunamo tudi v nekaterih primerih, ko nimamo vseh znanih podatkov (npr. niso znane ekstremne vrednosti). 3. Mediana. 4. a) 100 gostov b) 94,5 gostov 5. a) Kinematograf. b) Število sedežev. c) Diskretna številska spremenljivka. d) Aritmetične sredine ne moremo izračunati, ker je zadnji razred odprt in zanj ne moremo izračunati širine razreda. e) Me = 244,7 f) Mo = 183,8 6. Mo1= 2,50 EUR/kg, Mo2= 2,00 EUR/kg 6. LITERATURA http://www.stat.si/letopis/2005/08 05/08-20-05.htm?jezik=si Kamnik 1229 - 1979 Zbornik razprav s simpozija ob 750-letnici mesta. Kulturna skupnost Kamnik in Sekcija za krajevno zgodovino zgodovinskega društva za Slovenijo, 1985. Košmelj, Blaženka. 1996. Statistika. Ljubljana: Državna založba Slovenije. Košmelj, Blaženka in drugi. 1993. Statistični terminološki slovar. Ljubljana: Statistično društvo Slovenije, in Društvo matematikov, fizikov in astronomov Slovenije. Skupaj za zdravje človeka in narave, september 2010. Društvo Ognjič, 2010. SURS-Statistični urad Republike Slovenije. 2008. Statistični letopis RS 2008. SURS-Statistični urad Republike Slovenije. 2002. Slovenija v številkah 2002. SURS-Statistični urad Republike Slovenije. 2000. Ženske in moški v Sloveniji 2000.