17 Inforniatica št. 1 letnik 1977 nekateri vidiki uporabe računalnikov v sociolo - giji in politologiji C. tnannpuz a. ferligoj UDK 681.3:(301 + 32) Fakulteta za sociologijo, politične vede in novinarstvo Univerze v LJubljani Podan je kratek pregled problemov pri uporabi raCunjilnikov v sociologiji in politologiji. Opisane so smeri razvoja bank podatkov in metod. SOME ASPECTS OF COMPUTER APPLICATION IN SOClAL SCIENCES, A short survey of the problems in- volved in the appllcation of computers in social sclences ie glven and some perspectlves In the concepts of data archives and methods are described. Ena izmed karakterističnih posebnosti sedanje znan- stveno-tehnične revolucije je rastoča uporaba mate­ matičnih metod na različnih področjih znanosti in tehnike. Ta proces, ki Je upravičeno dobil naziv matematizacija znanstveno tehničnega znanja, obse­ ga sedaj tudi taka področja znanosti, za katera je veljalo, da zaradi težavnosti in kompleksnosti prob­ lematike, raziskave z matematičnimi metodami niso možne (biologija, llngvlstika, ekonomija,...). De­ jansko pa težavnost proučevanja pojavov v takih znanostih ne le, da ne izključuje, temveč nasprotno, zahteva oziroma predpostavlja uporabo točnih In abstraktnih matematičnih metod (Ruzavln, 1977). V zadnjem času Je tudi v družboslovju vedno bolj čutiti potrebo po kvantitativnem preverjanju pred­ postavk o družbenih zakonitostih. Še do nedavnega je bilo empirično raziskovanje v sociologiji in po­ litologiji omejeno le na zelo preproste statistične obdelave na maloštevilnih podatkih, saj bi kompleks­ ne analize večjega Števila informacij zahtevale og­ romno naporov in časa. UgodneJSe pogoje za kvan­ titativno proučevanje pojavov v družbenih znanostih nudi Šele sodobna račuhalniSka tehnologija, ki omo­ goča: a. sistematično urejanje in izmenjavo velikega Šte­ vila informacij, ki se pojavi;^jo vzporedno z vsakdanjim delom ljudi in se lahko zbirajo več let ali celo desetletij; b. uporabo ustreznih računalniško orientiranih ma­ tematičnih metod. Problemi pri uporabi računalnikov Družbene znanosti se ukvarjajo z realnimi vsakda­ njimi pojavi, ki Jih Je težko prevesti Iz vsakdanje­ ga nedoločenega Jezika v natančni jezik znanosti. "Meritve", v kolikor so sploh mogoče, so obreme­ njene z vrsto slučajnosti in mnogimi napakami, ki jih je potrebno oceniti. To Je zelo težka naloga, saj naletimo na vrsto omejitev pri izvedbi ekspe­ rimentov in Jih v večini primerov ne moremo po­ noviti pod enakimi pogoji. Poleg tega se družbeni pojavi spreminjajo s časom in so v svoji medseboj­ ni povezanosti in raznovrstnosti manifestiranja "nes­ končni". Neposredno je pri raziskovanju določenih pojavov mogoče opazovati le majhne Izseke, za kar pa Je največkrat potrebno zbrati veliko Število po­ datkov (od katerih se nekateri izkažejo kot nepo­ membni), da dobimo relevantne informacije v naj­ večji možni meri. Obilje računalnikov, različnih matematičnih metod za statistično obdelavo podatkov in podatkov samihi lahko pripelje do formalne uporabe matematičnih metod in do situacij, ko raziskovalec izgubi iz vi­ da osnovni namen numerlčnih manipulacij. Obdela­ va empiričnega gradiva ne more nadomestiti globo­ kega poznavanja raziskovanih družbenih pojavov. Predstavlja le dopolnilo k premišljeno postavljeni nalogi o proučevanem pojavu in Izboru ustreznih metod. Žal so te teze v družboslovnih raziskavah včasih neupravičeno pozabljene (AJvazjan, 1974). 18 vanje skupine sorodnih problemov iz določenega po­ dročja. Za statistične analize v družboslovju je v svetu in pri nas že vrsta "programskih paketov" kot so na primer: SPSS, STATJOB. P-STAT, SS, OSIRIS itd. Večina naštetih programov omogoča raznovrstne transformacije in izbiro podatkov; pogojno, brez­ pogojno in slučajno, izbiro enot in vrsto statistič­ nih in drugih analiz, ki so natančnejše nažtete v naslednjem poglavju. Natančen pregled drugih pro­ gramov, primernih za družboslovne raziskave je podan v reviji; Social Science Information 13(1974)3 na straneh 105-146. 2. Metode in progrannl za obdelavo podatkov v druž­ boslovju Analiza podatkov brez uporabe razvitejših matema­ tičnih metod, omejena le na tabele in grafične pona­ zoritve, največkrat ne izčrpa vse informacije v po­ datkih o proučevanih družbenih pojavih. Zato si ved­ no več družboslovcev prizadeva poiskati primernej­ še tehnike za kvantitativno analizo podatkov. Raču­ nalnik omogoča uporabo postopkov z zahtevnejšimi numeričnlml prijemi (določitev lastnih vrednosti, reševanje enačb, ...) pa tudi uporabo postopkov, ki 80 osnovani na heuristlCnlh metodah, kjer je potreb­ no pregledati veliko možnih izidov. Statistične metode, ki so primerne za analizo podat­ kov v družboslovju, je mogoče urediti v skupine po­ dobnih metod. Tak Izčrpen pregled metod primernih za analizo podatkov v političnih vedah je podal Alker (1975). Podobna klasifikacija je bila Izdelana v letu 1976 na Mednarodnem delovnem seminarju SOECO v Ljubljani in na Simpoziju računalniške statistike COMPSTAT v Berlinu, Na grobo lahko metode em­ piričnega proučevanja v družboslovju razdelimo na dve skupini: metode za merljive spremenljivke In metode za kvalitativne značilnosti. a. Metode za analizo merljivih spremenljivk Statistična analiza ene ali dveh merljivih spremen­ ljivk je poznana iz klasičnih učbenikov statistike (Blejec, 1973, Jamnlk, 1976). Vse pogosteje se v družboslovju za preverjanje zapletenejSih trditev o povezanostih večih merljivih spremenljivk uporab­ ljajo multlvarlatne metode kot parcialna in multipla korelaclja, multipla linearna regresija, analiza va­ riance, faktorska analiza, kancnska korelacijska analiza In diskriminacijska analiza (Anderson, 1958, Coolejr In Lohnes, 1971, ...). Za omenjene analize Imamo na voljo v Računskem centru na FSPN nekaj računalniških programov kot SPSS, SS, STATJOB, P-STAT,BMD, .. . Testiranje razlik faktorskih struktur in podobnih zapletenejSili hipotez (JOreskog, 1970) omogočata programa SIFASP in ACOVS. Po­ memben dosežek za empirično proučevanje v druž­ boslovju so vzročni linearni modeli (Blalock, 1964, 1971, Golderfeer in Duncan, 1973,,.i), s katerimi je mogoče preverjati zapletenejSe vzročne zakonitosti v družboslovju. Tak, dokaj splošen vzročni model, ki vključuje kot posebne primere rekurzivni, ne- rekurzlvnl In faktorski model, je vgrajen v program LISREL. b. ftfetode.za analizo kvalitativnih lastnosti Empirično proučevanje družboslovnih zakonitosti je za razliko od naravoslovnih težavnejše predvsem zato, ker so ponavadi proučevane lastnosti le kva­ litativnega značaja (ordlnalne ali nominalne lestvice) in zanje povečini še niso izdelani primerni matema­ tični pristopi. Nekaj klasičnih neparametriCnih tes­ tov za take lastnosti je vključenih v paketih' SPSS, STATJOB in P-STAT. V zadnjem času pa je tudi na tem področju predlaganih nekaj pomembnih reši­ tev. Psihologi Togerson (1958), Coombs (1964) in drugi so izdelali metode lestvlčenja (SPSS, SCALE). Tem so sledile metode večrazsežnostnega lestvlče­ nja (Torgerson, 1958, Shepard„ 1962. Kruskal, 1964), ki iz danih podobnosti med enotami določijo lego teh enot v Evklidskem prostoru s čim manj razsežnostmi tako, da je napetost med njuc: ;j. manjSa. Za te metode sta dostopna programa MDSCAL In MINISSA. 2to družboslovne raziskave je še posebej zanimiva splošnejša metoda večrazsež­ nostnega lestvlčenja Carolla In Changa (1970), ki analizira spremembe v zaporedju matrik podobnosti (INDSCAL). Za proučevanje kvalitativnih značilnosti se vse bolj uveljavljajo tudi metode določanja sku­ pin (Cluster metode). Programi zanje so ponavadi hitri in jih lahko uporabljamo za večje količine po­ datkov. Najpogosteje se uporabljajo postopki hierar­ hičnega določanja skupin, pri katerih je mogoče proces združevanja enot v skupine grafično predsta­ viti z drevesom - dendrogramom. Za te postopke so dostopni trije programi: HICLA, HCAJOHN In CLUSE. Slednji temelji na Lance-WilliamsovetM 19 pregled in perspektive razvoja banke podatkov In metod Izkušnje kažejo, da se razvija uporaba računalnikov v družbenih vedah med drugim tudi v naslednjih smereh: 1. Formiranje računalniško vodenih bank podatkov Dosedanja praksa v svetu in posebno pri nas kaže, da so podatki iz večine raziskav neurejeni, neu­ strezno arhivirani in niso na razpolago vsem upo­ rabnikom na tem področju. Ker ostajajo tako po­ datki kot rezultati (pri tem zlasti številni materia­ li, ki niso vključeni oz. upoštevani v tekstovnih interpretacijah) raztreseni med številnimi posamez­ niki, institucijami in disciplinami, prihaja do po­ navljanja istovrstnih vprašanj v raznih anketah in do medsebojno nepovezanega proučevanja teh vpra­ šanj, kar vodi do nesmiselnega trošenja energije raziskovalcev. Sistematizacija podatkov vodi k več­ ji selektivnosti tako, da se jasneje nakazujejo pred­ vsem tista vprašanja, ki so Se nepojasnjena in tis­ ta področja, pri katerih bi ponovno zbiranje infor­ macij pomenilo dodatno trošenje finančnih sredstev. Urejeni arhivi naj bi napravili korak naprej k temu, da bi tudi empirične ugotovitve lahko privedle do po­ membnejših teoretičnih posploSitev tj. do sinteze empiričnega in teoretičnega obravnavanja posamez­ nih vprašanj. Sedanja rmzprSenoat in izredno težka dostopnost rezultatov in podatkov iz že opravljenih raziskav obenem določa meje možnega teoretičnega posploševanja. Vpogled v rezultate dosedcmjega de­ la je odvisen povsem od številnosti osebnih stikov in poznanstev, ne naslanja pa se na kakršen koli sistematično organiziran in preverjen fond podatkov. Posamezen raziskovalec mor« torej nesorazmerno veliko količino časa posvetiti povsem slučajnostne- mu neorganiziranemu iskanju in preverjanju rele­ vantnih virov. Poseben vidik, ki zaostruje potrebo po standardiza­ ciji podatkov in njihovem slstemlzlranju predstavlja proučevanje dinamičnih sistemov, ugotavljanje raz­ ličnih trendov oz, zakonitosti glede povezemostl med pojavi oz, procesi v času in prostoru. Dinamičnih sistemov ni mogoče obravnavati brez kontinuitete virov Informacij oz. načinov konceptualizaclje v po­ sameznih časovnih točkah. Tudi s tega vidika in zlasti z vidika marksističnega metodološkega pris­ topa se pojavlja upravičena kritika sedanje razis­ kovalne prakse, ki se predvsem omejuje na statič­ ne preseke družbenega dogajanja in s tem vodi do enostranskih Interpretacij. Sistematično urejeni in dosegljivi podatki predstav­ ljajo skupaj z računalniško vodeno dokumentacijo tudi študijsko gradivo pri pouku sociologije in poli­ tičnih ved ter informacijsko bazo za druge uporab­ nike. Nadaljnja naloga arhivov podatkov je standardizaci­ ja informacij na področju sociologije, politologije in komunikologlje. Za razliko od sedanjega stanja, ho vsak raziskovalec po svoje opredeljuje pojme in spremenljivke, ki jih uporablja, naj bi v prihodnje poiskuSall vsaj do neke mere standardizirati tiste spremenljivke, ki se najpogosteje pojavljajo v em­ pirično raziskovalnem delu. Le v tej meri lahko iščemo možnosti zagotavljanja širših teoretičnih pos­ ploševanj na osnovi pri nas ugotovljenih empiričnih podatkov. Urejeni arhivi bodo prispevali k zmanjša­ nju količine potrebnih informacij tudi glede na to, ker bodo evidentirali uporabljena kompleksna in sia- tetlčna merila posameznih sklopov medsebojno pove­ zanih pojavov in pomembnost posameznih indikator­ jev oz. spremenljivk. Selektivnost v tej smeri bo torej pomenila, da bi z manjšim Btevilom podatkov dosegli enako ali celo pomembnejše znanje in lažjo možnost obravnave dinamičnih sistemov oz. predvi­ devanja sprememb v prihodnosti. Nadaljnji razvoj naj bi šel v smeri tesnejšega povezovanja Številnih podatkov iz anketnih raziskav (predvsem informacij o različnih percepcijah in dispozicijah posameznikov) z obsežnim gradivom, ki ga nudi bodisi redna sta­ tistična služba v posameznih sektorjih, bodisi občas­ ne statistične akcije in drugi arhivi pri nas in v Inozemstvu. V razširjeni koncept arhivov podatkov spadajo tudi priprave in razvoj sistemov za shranjevanje in iz­ kazovanje podatkov. Posebno važna nadaljna naloga arhivov Je zbiranje in razvoj programov za računal­ nike, tako za manipulacije s podatki, kot tudi za reševanje statističnih in drugih obdelav podatkov. Programi morajo biti pripravljeni tako, da so na naj­ enostavnejši način dostopni vsem interesentom kot so npr. učitelji In raziskovalci, študentje in drugi. V zadnjem času teži razvoj k izdelavi In.izpopolnje­ vanju že obstoječih programov, ki omogočajo rese- 20 (1967) Obrazcu in vsebuje zmožnosti prvih dveh pro­ gramov (Johnson, 1967) kot poseben primer. Obeta­ joči so postopki, ki temeljijo na razpoznavanju vzorcev (Žuravljov, Kamilov in Tuljaganov, 1974), za katere je v pripravi precej sploSen računalniški program, katerega del je dostopen tudi pri nas (PARE). Ti postopki reSujejo za kvalitativne podat­ ke podobne probleme kot znani multivariatni postopki za merljive spremenljivke. Z obema skupinama metod se delno prepletajo §e druge metode, kot na primer slučajni procesi (Co- leman, 1964, Kemeney in Sneli, 1962, Bartholomew, 1967, Fararo, 1973), simulacije (Dutton in Starbuck, 1971), . . . Li teratura; Ajvazjan C.A., Bežaeva Z.I., Staroverov O.V.: Klasifikacija mnogomernlh nabljudenij. Statistika, Moskva 1974 Alker Jr. H.R.: An overview of polimetrics, Hand- book of political science, Volume 7, 1975 Anderson T.W.: Ah Introduction to Multivariate Statistical AnalyBi8. John Wlley, New York, 1958 Blalock H. M.: Causal Inferences in Non-experlmen- tal Research, Chapel Hill: Univer8ity of North Ca- rollna Press, 1964 Blalock, H.M.: Causal Models in the Social Scien­ ces, Aldine Publishing Company, Chicago, 1971 Blejec M.: Statistične metode za ekonomiste. Uni­ verza v Ljubljani, Ljubljana, 1973 Caroll, J.D., Chang, J,J,: Analysis of Indivldual differences in multidimensional scallng via a K-way generalization of "Eckart-Young" decomposltion, Psychometrika, 1970 Coleman, J. S.: An Introduction to Mathematical Sociology, The Free Press, New York, 1964 Cooley W.W., Lohnea P,R.: Multivariate Data Ana- lysis, John Wiley, New Vork, 1971 COMPSTAT 1976 Proceedings in Computational Statistics, Physica-Verlag, Wien 1976 Coombs, C.H.: A Theory of Data, John Wlley, New York, 1964 Dutton, J,M., Starbuck, W.H.: Computer simula- tion of human behaviour, New York, Jflhn Wiley, 1971 Fararo, T. J.: Mathematical SocIology, John Wlley, New York, 1973 Goldberger, A.S., Duncan, O.D.: Structural Equa- tion Models in the Social Sciences, Seminar Press, New York, 1973 Jamnik R,: Uvod v matematično statistiko, DMFA, Ljubljana, 1976 Johnson, S,C: Hierarchical Clusterlng Schemes, Psychometrika, 1967 Lance, G.M., Williams, W.T.: A general theory of classificatory sorting strategies, 1. Hierarchical systems, The Computer Journal, 9 (1967) 4, 373 - 380 Kemeney, J. G., Sneli, J. L.: Mathematical Models in the Social Sciences, Gtnn, Boston, 1962 Kruskal, J.B.: Multidimensional scallng by optiml- zing goodness of flt to a nonmetric hypothesi8, Psychometrika (I in II), 1964 Mlinar Z,: Dialektika, emplrizem in špekulacija v socioloških in politoloških raziskavah. Referat na posvetovanju; "TeoretiCno-metodoloSke osnove raz­ iskovanja v družbenih vedah", ki ga je organiziral Marksistični center CK ZK Srbije v Beogradu, de­ cembra 1976 Ruzavln, G.I.: Matematizacija nauCnogo znanlja, "Znanie" (Serije "Filozofija"), Moskva 1977 aiepard, R.N.: The AnalysiB of proxlmlties: Mul­ tidimensional scallng wlth an unknown distance function. Psychometrika (I in II). 1962 SOECO, Report of the methodological Group, FSPN, Ljubljana 19(f6 Torgerson, W.S.: Theory and Methods of Scallng, John Wlley, New York, 1958 Toš N.: Metode družboslovnega raziskovanja, FSPN, 1975 Žuravljov, Ju,I., • Kamilov, M.M., Tuljaganov, Š.E.: Algoritmi vičislenija ocenok 1 Ih primenenle, "Fan" Tagkent,1974 Bartholomew, D.J.: Stochastlc Models for Social Processea, John Wlley, New York, 1967 JJJreskog, K. G.: Simultaneous Factor AnalyBis in Several Populations, Research BuUetln 70-61, Prin- ceton, N. J. : Educational Testing Service, 1970