INFORMATICA MEDICA SLOVENICA Arm Orthosis Modeling for Exploration of Human-Robot Interaction Q Assistive Technology and Its Role among the Elderly - a Survey 1 6 Zaključki kongresa MI'2012 19 Povzetek razprave na okrogli mizi "Storitve zdravja na daljavo v Sloveniji" QQ Pregled opravljenih pogovorov z nekaterimi ključnimi deležniki v zdravstvu 25 Poročilo o jesenskem srečanju članov Sekcije za informatiko v zdravstveni negi 29 Poissonova porazdelitev - osnove, uporaba, nadgradnja SDMI Journal of the Slovenian Medical Informatics Association Revija Slovenskega društva za medicinsko informatiko Informatica Medica Slovenica VOLUME / LETNIK 17, NO. / ŠT. 2 ISSN 1318-2129 ISSN 1318-2145 on line edition http://ims.mf.uni-lj.si Editor in Chief / Glavni urednik Gaj Vidmar Associate Editors / Souredniki Riccardo Bellazzi Bjoern Bergh Jure Dimec Brane Leskošek Blaž Zupan Technical and Web Editor / Tehnični in spletni urednik Peter Juvan Editorial Board Members / Člani uredniškega odbora Gregor Anderluh Janez Demšar Emil Hudomalj Izet Mašic Marjan Mihelin Mojca Paulin Uroš Petrovič Primož Ziherl Former Editors in Chief / Bivši glavni uredniki Martin Bigec Peter Kokol Janez Stare About the Journal Informatica Medica Slovenica (IMS) is an interdisciplinary professional journal that publishes contributions from the field of medical informatics, health informatics, nursing informatics and bioinformatics. Journal publishes scientific and technical papers and various reports and news. Especially welcome are the papers introducing new applications or achievements. IMS is the official journal of the Slovenian Medical Informatics Association (SIMIA). It is published two times a year in print (ISSN 1318-2129) and electronic editions (ISSN 1318-2145, available at http://ims.mf.uni-lj.si). Prospective authors should send their contributions in Slovenian, English or other acceptable language electronically to the Editor in Chief Assist.Prof. Gaj Vidmar, PhD. Detailed instructions for authors are available online. The journal subscription is a part of the membership in the SIMIA. Information about the membership or subscription to the journal is available from the secretary of the SIMIA (Mrs. Mojca Paulin, marija.paulin@zzzs.si). O reviji Informatica Medica Slovenica (IMS) je interdisciplinarna strokovna revija, ki objavlja prispevke s področja medicinske informatike, informatike v zdravstvu in zdravstveni negi, ter bioinformatike. Revija objavlja strokovne prispevke, znanstvene razprave, poročila o aplikacijah ter uvajanju informatike na področjih medicine in zdravstva, pregledne članke in poročila. Se posebej so dobrodošli prispevki, ki obravnavajo nove in aktualne teme iz naštetih področij. IMS je revija Slovenskega društva za medicinsko informatiko (SDMI). Izhaja dvakrat letno v tiskani (ISSN 1318-2129) in elektronski obliki (ISSN 13182145, dostopna na naslovu http://ims.mf.uni-lj.si). Avtorji člankov naj svoje prispevke pošljejo v elektronski obliki glavnemu uredniku doc.dr. Gaju Vidmarju. Podrobnejša navodila so dosegljiva na spletni strani revije. Revijo prejemajo vsi člani SDMI. Informacije o članstvu v društvu oziroma o naročanju na revijo so dostopne na tajništvu SDMI (Mojca Paulin, marija.paulin@zzzs.si). Informatica Medica Slovenica 2012; 17(2) 17 Contents Research Papers 1 Matjaž Zadravec, Zlatko Matjačic Arm Orthosis Modeling for Exploration of HumanRobot Interaction in Arm Reaching Trajectory Formation 9 Julija Ocepek, Zdenka Prosič, Gaj Vidmar Assistive Technology and Its Role among the Elderly — a Survey SIMIA Bulletin 16 Tomaž Marčun, Dejan Dinevski, Jasmin Džaferovič, Ivan Eržen, Brane Leskošek, Jožica Leskovšek, Matic Meglič, Andrej Orel, Vesna Prijatelj, Drago Rudel Cunclusions from the MI'2012 Congress 19 Drago Rudel, Tomaž Marčun Summary of Round Table Discussion on "Telehealth Services in Slovenia — National Strategy and Faster Implementation of Up-to-Date Solutions in Telemedicine and Telecare" 22 Drago Rudel, Ivan Eržen Overview of Talks Held with Some Key Stakeholders in the Health Care System on the SIMIA Document "Starting Points for the National Telehealth Strategy" 25 Ema Dornik, Vesna Prijatelj Report from the Autumn Meeting of the SIMIA Nursing Informatics Section, SIZN 2012 Tutorial 29 Gaj Vidmar Poisson Distribution — Fundamentals, Applications, Extensions Vsebina Izvirna znanstvena članka 1 Matjaž Zadravec, Zlatko Matjačic Modeliranje ortoze za raziskovanje interakcije med človekom in robotom pri gibanju roke 9 Julija Ocepek, Zdenka Prosič, Gaj Vidmar Vloga medicinsko tehničnih pripomočkov pri starostnikih — rezultati ankete Bilten SDMI 16 Tomaž Marčun, Dejan Dinevski, Jasmin Džaferovič, Ivan Eržen, Brane Leskošek, Jožica Leskovšek, Matic Meglič, Andrej Orel, Vesna Prijatelj, Drago Rudel Zaključki kongresa MI'2012 19 Drago Rudel, Tomaž Marčun Povzetek razprave na okrogli mizi "Storitve zdravja na daljavo v Sloveniji — nacionalna strategija in pospešitev uvajanja sodobnih rešitev zdravljenja in oskrbe na daljavo" 22 Drago Rudel, Ivan Eržen Pregled opravljenih pogovorov o dokumentu SDMI "Izhodišča za nacionalno strategijo zdravja na daljavo" z nekaterimi ključnimi deležniki v zdravstvu 25 Ema Dornik, Vesna Prijatelj Poročilo o jesenskem srečanju članov Sekcije za informatiko v zdravstveni negi, SIZN 2012 Studijsko gradivo 29 Gaj Vidmar Poissonova porazdelitev — osnove, uporaba, nadgradnja Informatica Medica Slovenica 2012; 17(2) 1 Research Paper ■ Arm Orthosis Modeling for Exploration of Human-Robot Interaction in Arm Reaching Trajectory Formation Matjaž Zadravec, Zlatko Matjačic Abstract. Arm reaching robotic training is usually programmed in a way to assist patients by facilitating movements along a straight line from the chosen starting to the target point. But if we take into account the muscular condition of the patient's upper limb, the trajectories might be different. The key is to find an optimal trajectory. The article presents experimental planar arm reaching movement trajectories obtained by instructing one healthy subject to move the hand from the selected starting to the target point in a relatively narrow workspace. The subject carried an arm orthosis to which we attached elastic bands emulating muscle tightness condition. The results show clear deviations of the trajectories when elastic bands were attached to the orthosis as compared to the uninhibited ones. Clear understanding of human arm motion will aid in better human-machine interaction. Modeliranje ortoze za raziskovanje interakcije med človekom in robotom pri gibanju roke Institucija avtorjev / Authors' institution: Univerzitetni rehabilitacijski inštitut Republike Slovenije - Soča. Kontaktna oseba / Contact person: Matjaž Zadravec, Univerzitetni rehabilitacijski inštitut Republike Slovenije -Soča, Linhartova 51, SI-1000 Ljubljana. e-pošta / e-mail: matjaz.zadravec@ir-rs.si. Izvleček. Običajni vzorec robotsko podprtega gibanja roke iz točke v točko je ravna trajektorija. Če upoštevamo tudi bolnikovo mišično stanje, pa taka trajektorija ni nujno optimalna. Optimalna trajektorija ima lahko tudi drugačno obliko ali hitrostni profil. V študiji smo pri nevrološko zdravi osebi eksperimentalno zajeli vzorce seganja roke iz točke v točko. V ta namen smo izdelali ortozo za roko, na katero smo pripeli elastične trakove, ki so oteževali delo flektornih mišičnih skupin roke pri gibanju, s čimer smo posnemali okvare mišičja pri boleznih oziroma poškodbah živčevja. Rezultati kažejo na razlike v obliki trajektorij v primerih, ko so bili elastični trakovi nameščeni oziroma odstranjeni z ortoze. Jasnejše razumevanje gibanja roke bo pripomoglo k boljši interakciji med robotom in človekom. ■ Infor Med Slov: 2012; 17(2): 1-8 Prejeto / Received: 21.09.2012. Sprejeto / Accepted: 30.10.2012. 2 Zadravec M et al.: Arm Orthosis Modeling for Exploration of Human-Robot Interaction Introduction In the recent years, rehabilitation robots have made their way into clinical practice because they can apply high-intensity, task-specific, interactive treatment with an objective and reliable means of monitoring patient progress. Rehabilitation robots can also evaluate patients' movement performance and assist them in moving the upper extremity through predetermined trajectories in a given motor task. When doing arm reaching training with the robot device, the robots are usually programmed in a way to assist patients by facilitating movements along a straight line from the chosen starting to the target point. Selection of a straight line between two selected points with bell-shaped velocity profile is based on predictions of the minimum hand jerk model for trajectory formation.1,2 However, this might only be valid under certain circumstances in practice: short-distant trajectories in narrow workspace with no constraints in movement space (i.e., boundaries of range of motion — ROM), and no constraints in musculo-skeletal system (e.g., spastic arm or any other disorders). On the other hand, there are several studies proposing the approaches incorporating dynamic features (minimum torque change, minimum torque) when trajectories are slightly curved.3,4 All of these approaches are usually studied in healthy subjects. However, the trajectories might be different if we take into account the subject's upper extremity muscular condition. The key is to find an optimal trajectory where the patient could perform better during rehabilitation-robotic training. Optimal trajectories with appropriate robotic support should be essential in stroke rehabilitation. There are also many studies presenting performance-based adaptive algorithms that minimize robotic support during training,5,6 but these studies focus only on support algorithms (e.g. assist-as-needed algorithms) while trajectories stay predetermined. Furthermore, several motor control studies have been offered as evidence for the hand trajectory formation during arm reaching movements of neurologically unimpaired participants.7,8 The aim of our study was to capture and compare planar movements of the upper limb of one healthy subject under two different arm conditions: unimpaired and emulating flexor muscles stiffness. For this purpose, an upper limb orthosis was made, to which we could attach elastic bands. The elastic bands were emulating the arm's stiffness (similarly to tonic spasticity). When recording the unimpaired arm trajectories, the elastic bands were removed from the orthosis. Methods Experimental setup The experimental paradigm was chosen in such a way as to simplify the problem as much as possible in the sense that only two degrees-of-freedom (DOF) were allowed: even wrist movements were prevented by means of an orthosis, and the influence of gravity was kept constant by working in the horizontal plane. Hence, the movements of the arm were reduced to flexion-extension of the elbow and flexion-extension of the shoulder. One health man, aged 28, participated in the experiment. He was right-handed and free of any known musculoskeletal or neurological abnormalities. Figure 1 shows the experimental setup. The subject was seating in a straight-backed chair in front of the table, which was raised to a shoulder level to allow only planar reaching movements. We used a wide girdle connecting the shoulder and the straight-back of the chair to minimize the displacement of the shoulder joint center. The girdle was not restricting or feeling uncomfortable when moving the arm in the selected working area. We placed six white rectangle spots on the table in the relatively narrow workspace in front of the Informatica Medica Slovenica 2012; 17(2) 3 subject, to mark the starting and target points. The subject carried the two-link orthosis on which three elastic bands were attached. The details of the orthosis are presented in the following subsection. To record the arm movement in space, we used a Vicon MX motion capture camera system, where six cameras were positioned in the laboratory and five wireless markers were used. Two markers were placed on the table, which is shown in top left corner of Figure 1, to determine the coordinate system. The origin of the Cartesian coordinate system was then moved and positioned in the shoulder joint, where the horizontal axis (abscissa) was defined as a vector between these two markers. The vertical axis (ordinate) was then positioned perpendicular to the abscissa. For the arm motion capture, three markers were attached to the arm at the positions of shoulder joint, elbow joint of the orthosis, and the center of the hand (the end of orthosis). The measured data was exported to MATLAB (MathWorks, Inc.) for further analysis. I' Figure 1 Experimental setup for recording movement trajectories. X [m] Figure 2 Schematic view of trajectory directions in the arm's workspace and subject with the arm orthosis to which the flector elastic bands are attached. Orthosis model To emulate flexor muscle stiffness, the two-link plastic orthosis was made with a single rotation at elbow joint, which is shown in Figure 1 and 2. The orthosis permits moving the arm only in flexion/extension of the elbow joint in the horizontal plane. For this reason, we used three elastic bands — two monoarticular and one biarticular. First elastic band (indexed 1) has its origin at the mounting point fixed on the subject's upper chest, while the other end of elastic band is attached on the orthosis at the link L1. This elastic band emulates the muscle tightness of monoarticular flexor muscles (especially pectoralis major), and causes the fatigue during arm reaching movements of the shoulder extensor muscles (i.e. posterior deltoid and others). Second elastic band (indexed 2), emulating the brachialis muscle stiffness, connects the arm (link L1) and forearm (link L2). It causes the fatigue to the lateral head of triceps brachii. The third elastic band (indexed 3) connects mounting point on the subject's upper chest and the forearm orthosis (link L2), while its 4 Zadravec M et al.: Arm Orthosis Modeling for Exploration of Human-Robot Interaction intention is to emulate biarticular flexor muscle tightness (i.e. biceps brachii) that causes the fatigue of the biarticular extensor muscles (i.e. long head of triceps) during arm reaching movements. The schematic view of the flexor elastic bands attached is shown in Figure 2. All three elastic bands are from the same material with the elastic coefficient of 2.3 N/cm. Figure 3 shows the force-stretch relation of the elastic band, where the 1st order polynomial (linear characteristic) and the 4th order polynomial were fitted on the measured data. For the further calculation of the orthosis characteristics, we used the 4th order polynomial data fit, because it is more accurate than linear fit and it is still simple to differentiate, when we needed to. Figure 3 Force-length characteristics of elastic band with polynomial fitting. Table 1 Segment lengths and orthosis parameters. Parameter Value [m] Li 0.280 L2 0.330 ai 0.110 bi 0.080 a2 0.152 b2 0.055 a3 0.152 b3 0.040 After the experiment trial, the segment lengths L1 and L2 of the arm were measured on the basis of shoulder, elbow and hand markers. The hand marker position of the two-link arm model is expressed by forward kinematics: x L1 cos 01 + L2 cos(01 + 02) _ y _ L1sin 01 + L2sin(01 + -02) (1) The vector of elastic bands' lengths, which depends on the shoulder and elbow joint angles (2) are defined by orthosis parameters a1, b1, a2, b2, a3, b3 and L1 (Appendix, Table 1). l(0) =[1,(6,} l2(02) ¡3(9,, 92)]T The moment lever matrix can be expressed as follows (2) W(0) = d0 ' (3) which represents the Jacobian matrix from the joint space to the elastic bands' space, and has the following form: WT = w1 0 w13 0 w2 w23 (4) The elastic band force vector F(l) =[Fj(li) F2(l2) F3 (I3 ) ]T (5) is determined from the linear length-dependent characteristics as shown in Figure 3 and (6), where the force begins to work at the nominal elastic band length l0 onwards with the 4th order polynomial, while it remains zero up to this length. F(l) =• P4l4 + P3l3 + P2l2 + Pi1 + Po l < lo 1 > lo (6) The polynomial coefficients describing the characteristics of elastic bands and the nominal lengths are given in Table 2. The 4th order polynomials are representative only in the selected narrow workspace of the experiment. Here, the relation between elastic band force vector and Informatica Medica Slovenica 2012; 17(2) 5 joint torques due to elastic bands stiffness can be represented as follows ^stiff = WTF. (7) Table 2 Polynomial coefficients and nominal lengths of elastic bands' characteristics. P4 P3 P2 Pi Po I0 [105] [105] [105] [104] [102] [m] F, -5.665 4.210 -1.122 1.31 -5.606 0.105 F, -4.161 3.414 -9.820 1.224 -5.500 0.108 F3 -0.717 0.892 -0.388 0.731 -4.962 0.161 Elastic bands' static field To represent the characteristics of the orthosis with elastic bands attached, the joint torques Tstiff were calculated from (7) in order to compose the static field. At each point (x,y) in the arm's workspace the joint angles were calculated by inverse kinematics (see Appendix). On the basis of joint angles we calculated elastic bands' lengths, corresponding forces and joint torques. Thereby, the value of stiffness-based orthosis was calculated by (8) and located at (x,y). Tstatic field (X>y) = VTstiff Tstiff (8) Starting and target points Six starting/target points were chosen in the relatively narrow workspace in front of the subject as shown in Figure 1 and 2. On the basis of these points, six movement directions were selected: AB, AC, AD, FB, ED and EF. Movement distances between a set of starting and target points are shown in Table 3. Procedure The subject was asked to perform a task necessitating arm reaching movements in the horizontal plane. To ensure a comparable movement time durations, we used a metronome, which was set to 50 beats per minute (50 BPM, i.e. 1.2 seconds per beat). Every direction was repeated from 15 to 25 times meaning that the beats represent doing movements and resting alternately, for example: movement AB, rest at B, movement BA, rest at A, etc. We analyzed only the directions which are presented in Figure 1 and in Table 3. Table 3 Movement directions and its distances. Direction Distance [m] AB 0.39 AC 0.33 AD 0.28 FB 0.42 ED 0.47 EF 0.44 Note: The selected starting and target points are A=(-0.20, 0.24), B=(0.02, 0.56), C=(-0.19, 0.57), D=(-0.35, 0.48), E=(0.05, 0.34), F=(-0.39, 0.33) [m]. Results The results of our experiment are shown in Figure 4, where all hand trajectories and its velocity profiles are collected. Figure 4a shows hand trajectories in the case the elastic bands were not attached (intact trajectories) on the orthosis, but the subject also carried the orthosis. It could be seen that the intact trajectories are slightly curved. Different situation is shown in Figure 4b, where hand trajectories are significantly more curved (stiff trajectories). In this case, the elastic bands were attached on the orthosis. Hand tangential velocities are mostly bell-shaped, but there are some small differences between them. Hand tangential velocities for intact trajectories exhibit smooth single-peaked profiles, where peak is moved slightly to the left, while hand tangential velocities for stiff trajectories shows somewhat distorted bell-shaped pattern with one or two peaks. The latter velocity profiles do not have its peak moved strictly to one side. The trajectories are highly repeatable, which is a good indicator for the trajectories' optimality, especially in stiff trajectories, which we were investigating. Therefore, all groups of trajectories were averaged and shown as bold trajectories. Zadravec M et al.: Arm Orthosis Modeling for Exploration of Human-Robot Interaction Figure 4 Experimentally obtained arm reaching trajectories and velocity profiles under (a) normal and (b) stiff arm conditions. Below the X-Y graphs in Figure 4, there are corresponding normalized velocity profiles for each direction collected. Also, the average of velocity profiles were calculated and shown in bold. During movement recording the shoulder marker stayed most of the time within the circle with approximately 1 cm in diameter. It could be seen that starting and target positions of the recorded trajectories are not always reaching the marked positions (A~F), because it is hard to locate the exact marker position with the motion marker on the top of the hand. By setting the metronome to 50 BPM, the trajectory durations of experimental movements were 1.11 s in average with standard deviation of 0.19 s. Figure 5 shows the static field, which was calculated on the basis of human arm model with orthosis by (8). As an example, the experimental average trajectories of intact and stiff arm conditions of movement ED (direction 5) are shown on the top of the elastic bands' static field. The stiff trajectory is significantly more curved than the intact trajectory. The minimum zone of the static field is located on the near left side of the subject and its higher values are spreading with the elbow and shoulder extension to the right side of the subject. The values in the upper right zone are higher than 13 Nm. 6 Informatica Medica Slovenica 2012; 17(2) 7 Figure 5 Comparison of intact (dashed line) and stiff (solid line) experimental trajectory with the elastic bands' static field in the background. Discussion This paper reports the results of experiment in which one subject was instructed to move the hand from selected starting to target point of the relatively narrow workspace in front. Two different arm conditions were considered. First, the trajectories of normal/intact arm were recorded (Figure 4a) and second, as an emulation of flexor contracture of the human arm, the subject carried orthosis, to which we attach elastic bands and then the i.e. stiff trajectories were recorded. Since we investigated the arm point-to-point reaching movements from the phenomenological point of view, the exact characteristics of elastic bands were not essential. As shown by the overlapping of the hand for the same movement directions, the subject produced relatively consistent movements, which was a sufficient reason to averaging the trajectories. The obtained trajectories between intact and stiff condition were significantly different. From the Figure 4b and Figure 5 it could be seen that the gradient of the trajectories' curvature were in the direction of minimum torques static field. As shown in Figure 4a, intact hand trajectories are not quite straight, but slightly curved with the bell-shaped velocity profiles. This is also evidenced by many other experimental7,8 and minimum torque/torque-change simulation studies.3, 4 However, when we add the elastic bands, these trajectories become significantly different. This finding might be useful in rehabilitation after stroke. Conclusion The studies of human arm motion are essential for developing robot arms that interact with human subject. A clear understanding of human arm motion will aid for better interaction in between a machine and a human subject.2 To promote effective rehabilitation after brain injury, a key element is intensive training, which is also facilitated by upper extremity rehabilitation robots such as many commercial devices.9 In addition to the rehabilitation methods such as constraint induced movement therapy, functional electrical therapy, and assist-as-needed algorithms for rehab-robots, the planning trajectories, which take into account the patient's condition, are as much important. By knowing the characteristics of the impaired upper extremity (e.g. static field in Figure 5), we may also select the appropriate starting and target points, and then the calculation or optimization process to find the optimal trajectory between them. Eventually, the starting and target points and optimal trajectories could be properly planned over the several-weeks rehabilitation training. Acknowledgements We thank the Center for Prosthetics and Orthotics of the University Rehabilitation institute, Republic of Slovenia, for producing the the arm orthosis. The study was supported by the grant of the Slovenian Research Agency - ARRS research project P2-0228 and L2-2259. References 1. Flash T, Hogan N: The Coordination of Arm Movements: An Experimentally Confirmed 8 Zadravec M et al.: Arm Orthosis Modeling for Exploration of Human-Robot Interaction Mathematical Model. J Neurosci 1985; 5: 16881703. 2. Amirabdollahian F, Loureiro R, Harwin R: Minimum Jerk Trajectory Control for Rehabilitation and Haptic Applications. IEEE Conf. on Robotics and Automation — ICRA 2002; 4: 3380-3384. 3. Uno Y, Kawato M, Suzuki R: Formation and control of optimal trajectories in human multijoint arm movements: Minimum torque-change model. Biol Cybern 1989; 61: 89-101. 4. Ohta K, Svinin MM, Luo Z, et al.: Optimal trajectory formation of constrained human arm reaching movements. Biol Cybern 2004; 91: 23-36. 5. Emken JL, Bobrow JE, Reinkensmeyer DJ: Robotic movement training as an optimization problem designing a controller that assists only as needed. 9th International Conf. on Rehabil. Robotics — ICORR 2005; 307-312. 6. Zadravec M, Matjacic Z: The influence of haptic support algorithm dynamics on the efficacy of motor learning. Zdrav Vestn 2011; 80: 561-570. 7. Suzuki M, Yamazaki Y, Mizuno N, et al.: Trajectory formation of the center-of-mass of the arm during reaching movements. Neuroscience 1997; 76(2): 597-610. 8. Morasso P: Spatial Control of Arm Movements. Exp Brain Res 1981; 42: 223-227. 9. Hesse S, Schmidt H, Werner C, et al.: Upper and lower extremity robotic devices for rehabilitation and for studying motor control. Curr Opin Neurol 2003; 16: 705-710. Appendix The kinematics of elastic bands is expressed by orthosis parameters given in Table 1. Here, the lengths l1, l2 and l3 are joint angular dependent parameters and defined as follows: lj =,JAj2 + Bj - 2AjBj cos A, aj + bj Bj =V aj + bj m, =%- arctan—- arctan — - 9, t! a, aj 1 lj =vAj + Bj - 2A2B2 cosm Aj =^/(L, - aj )2 + bj B2 = Vaj + bj m2 = rc - arctan T-bj— arctan — - 9 2 ' 2 Lj —aj a3 2 (9) (10) l3 =sjAj + Bj - 2AjB3 cos m3 B3 Lj + Bj - 2LjB2 cos m4 m3 = rc - arctan- arcsin ((B^sin m4) m4 =rc- arctan -92 The inverse kinematics are defined as arctan 2(y, x) - arccos(r +2LL'irL2) (11) *-arccos(i^) (12) where r = yfx2 + y2 ; arctan 2(y,x) = arctan(^y) + sgn(y) (1 - sgn(x) )f' (13) (14) Informatica Medica Slovenica 2012; 17(2) 9 Research Paper ■ Assistive Technology and Its Role among the Elderly - a Survey Julija Ocepek, Zdenka Prosic, Gaj Vidmar Abstract. Health professionals are aware of the fact that people nowadays live longer and that the elderly have more need for using assistive technology (AT). Our study aimed to find out whether the members of a local pensioners association are informed about AT and if the use of AT has impact on their quality of life. A questionnaire was mailed to 160 randomly selected members of the association. The results showed that the use of AT and/or home adaptation improved quality of life of the majority of the participants. About half of the participants are only partly acquainted with the right to have AT prescribed, and the majority of the participants want to get more information about AT and home adaptation. This is a great opportunity for occupational therapists, who can inform and recommend appropriate solutions to the elderly to help them maintain independence in the home. Vloga medicinsko tehničnih pripomočkov pri starostnikih -rezultati ankete Institucija avtorjev / Authors' institution: Univerzitetni rehabilitacijski inštitut Republike Slovenije - Soča Kontaktna oseba / Contact person: Julija Ocepek, Univerzitetni rehabilitacijski inštitut Republike Slovenije -Soča, Linhartova 51, SI-1000 Ljubljana. e-pošta / e-mail: julija.ocepek@ir-rs.si. Prejeto / Received: 30.10.2012. Sprejeto / Accepted: 31.11.2012. Izvleček. Zdravstveni delavci se zavedamo, da ljudje danes živijo dlje in da imajo starejši večje potrebe po uporabi medicinsko tehničnih pripomočkov (MTP). Namen raziskave je bil ugotoviti kolikšna je informiranost članov Društva upokojencev Bled glede MTP in ali uporaba MTP vpliva na njihovo kakovost življenja. Anketni vprašalnik smo poslali 160 naključno izbranim članom Društva upokojencev Bled. Rezultati kažejo, da je uporaba MTP in/ali arhitektonska prilagoditev večini sodelujočih izboljšala kakovost življenja. Skoraj polovica sodelujočih je le delno seznanjena s pravicami do predpisa MTP in velika večina si želi pridobiti več informacij o MTP in arhitektonskih prilagoditvah okolja. Pri tem lahko delovni terapevti s strokovnim znanjem starejšim nudimo pomembno pomoč in svetujemo pri izbiri ustreznih rešitev za ohranjanje samostojnosti. ■ Infor Med Slov: 2012; 17(2): 9-15 10 Ocepek J et al.: Assistive Technology and Its Role among the Elderly - a Survey Introduction We live in an ageing world — the share of the elderly people amongst us is increasing rapidly in most of the world, especially the more developed countries, including Slovenia. In the year 2010, people aged 65 years or more represented 16.5% of Slovenian population, and projections show that almost every third Slovenian resident in 2060 will be in that age group.1 Longer living age and the factors of the aging process influence health problems, which limit functioning of the elderly in everyday life and therefore negatively impact on their quality of life. According to the Institute of Public Health of Slovenia,1 the most frequent chronic diseases in old age are high blood pressure, high cholesterol, angina pectoris and heart insufficiency, and also spinal cord injuries and diseases. Elderly people often suffer from fractures, which negatively impact on their independence, mobility and quality of life.1 Consequently, they have larger needs regarding hospitalization and other health care services, and application of assistive technology is also more frequent.2 Assistive technology can be defined as "any item, piece of equipment, or product system whether acquired commercially off the shelf, modified or customized, that is used to increase, maintain, or improve functional capabilities of individuals with disabilities".3 Other authors4 described AT as "a broad range of devices, services, strategies, and practices that are conceived and applied to ameliorate the problems faced by individuals who have disabilities". In summary, assistive technology can include devices and solutions hich help to overcome functional limitations and prolongate independent living.5 In Slovenia, provision of assistive technology is defined by the legislation, in particular by the Law on Health Care and Health Insurance and by the Rules of Compulsory Health Insurance.6 Older adults prefer to live their later years in their own homes, but the capacity to "age in place" is often threatened by environmental barriers. The removal of physical barriers has enhanced the individual's mobility and ability to carry out personal care and social activities.7 Older adults are willing to accept home modifications,8 and some form of modifications occurs in an estimated 38% of homes of older adults with disabilities.9 Few studies, however, have systematically evaluated the effectiveness of home modifications in reducing excess disability or improving daily activity performance of older adults.10 For occupational therapists it is essential to identify environmental facilitators and barriers that have an impact on an individual's everyday functioning.11 Occupational therapists' role is to work with environmental issues to facilitate the achievement of the clients' goals or to remove the barriers that thwart realisation of these goals.12 The removal or modification of environmental barriers with usage of assistive technology enables elderly to maximise their occupational performance.13 Findings of a study conducted by Wielandt et al14 suggest that occupational therapists need to ensure that assistive technology and home modifications are recommended using a client-centred approach. The time of application and appropriateness of assistive technology prescribed by the occupational therapist or other health care professionals is also a very important factor. Appropriate assistive technology and home modification should be provided at the right time, considering the context, activity demands, and client factors (e.g. nature and prognosis of disease/disability).15 Assistive technology and home modifications could provide caregivers immediate relief, reduce stress and help them provide care more easily and safely.16 Another study17 found that assistive technology and home modifications can reduce home care costs for older adults and help delay institutional placement. The aim of our study was to find out if the members of a local pensioners association are informed about assistive technology, and if the use of assistive technology has impact on their quality of life. Informatica Medica Slovenica 2012; 17(1) 11 Methods We obtained co-operation for this study from the Bled Association of Pensioners from northern Slovenia. The Association has 960 active members of different age. To recruit the participants for the study, stratified random sampling was used: within each of the four age groups (less than 64 years, from 65 to 74 years, from 75 to 84 years, and 85 years and more), 40 members were selected randomly for a total of 160 members. To each of them, a survey questionnaire on information about the assistive technology and its impact on user quality of life was sent by surface mail (including a return envelope). The questionnaire was designed for the purpose of this study by the first two authors (JO, ZP). It was divided in two parts. The first part included participant's demographic characteristics and medical diagnoses. The second part consisted of 10 questions. Six of those were closed-response questions (multiple choices), and two were 5-points Likert-type scales. Using the latter, the participants assessed how well they are informed about their right to provision of assistive technology and in to what extent does the use of assistive technology and home modification impact their quality of life. The last two questions were open-ended so that the participants could write down which assistive technology or home modification they use. Results We received and analysed 50 filled-in questionnaires, yielding a 31% response rate. Twenty-seven respondents were women and 23 men, which corresponds to the gender ratio in the entire Association. The mean age was 73 years, range 51-100 years, which is also close to the sampled population, where the 65-74 years and 75-84 years age groups are by far the largest. Educational level was relatively high, because nearly one fifth of the respondents had a college or university degree (Figure 1). Figure 1 Educational level of the participants (N=50). Figure 2 Medical diagnoses of the participants (N=50). The participants had various medical diagnoses (Figure 2). The most frequent diagnoses were visual impairment (36%), cardiovascular disease (34%), rheumatic disease (26%) and spinal cord injury (22%), followed by orthopaedic disease (18%), hearing impairment (14%) and diabetes (12%). On average, each participant had two medical diagnoses. Almost half of the participants stated that they (46%) were only partly informed about the right to provision with assistive technology; being not informed (18%), a little informed (18%) or mostly informed (14%) were about equally frequent answers, whereas only 4% of the participants answered that they were are thoroughly informed about the right of provision (Figure 3). 12 Ocepek J et al.: Assistive Technology and Its Role among the Elderly - a Survey recommended by a general practitioner, a consultant physician, a nurse or by relatives. Agreements with the statement that the "Use of assistive technology and home modification improved quality of my life" is depicted in Figure 4. The last question offered an opportunity to the participants to express their need for additional information about assistive technology and home modification, and the majority of the participants (64%) answered that they wish to get more information. Figure 3 Responses to the question "How are you informed about the right to provision with assistive technology?" (N=50%). Figure 4 Agreement with the statement "Use of assistive technology and home modification improved quality of my life" (N = 50%). Further questions revealed that 24% of the participants had home modifications (either removal or modification of environmental barriers), and that half of the participants (50%) used one or more assistive technologies. The most frequent assistive technologies were eyeglasses, hearing aids, blood glucose metres, crutches, wheelchairs, nursing beds, shower seats, toilet seats and incontinence aids. The majority of the participants (56%) had received that assistive technology by referral from physician; many (37%) had bought it, others received it from relatives or friends. The assistive technology was Discussion We conducted a mail survey of a local pensioners association. Although the response rate was relatively low (31%), the gender and age structure of the respondents corresponded to the parent population. The survey responses showed that the acquaintance with the right to have assistive technology prescribed was low because only 18% of participants answered that they were informed about that right, and more than one third of the participants were not informed or just a little informed. This is a reason for concern because underuse of assistive technology and home modification can impact on less independent and safety living in participants' homes. There are several reasons for such low acquaintance rate: occupational therapists are not employed in the health care system on the primary level; general practitioners, who are first in contact with the patient who enquires about prescription of assistive technology, do not have adequate knowledge; and the suppliers of assistive technology do not invest much in its promotion. Half of the participants reported on using assistive technology, which should be viewed in the light of their health problems (which, in turn, are reflected by their medical diagnoses). In agreement with the most frequent diagnosis being visual impairment, the majority of participants used eyeglasses. Informatica Medica Slovenica 2012; 17(2) 13 Similarly, many participants have hearing impairment and therefore used a hearing aid. In summary, based on the medical diagnosis or self-reported health problems health professionals can anticipate which assistive technology or home modification a user will need. However, assistive technology and home modification should be recommended and prescribed using a client-centred approach at the right time and considering the users' factors and roles, and characteristic of the home environment. Home modifications were implemented by a relatively small proportion of the participants (one fourth). Most of the modifications were smaller/easier, such as removing barriers between rooms, fitting grasp rails, and installing a shower instead of a bathtub. The reasons for such decisions should be researched in more detail, but an unquestionable reason is that home modifications are expensive and are not funded by insurance companies. Assistive technology was mostly recommended by to the user by a general practitioner or a consultant physician, a nurse or by relatives. One of the possible answers was also occupational therapist, but it was not choosen by any of the participants. One reason for this is that — as already noted — occupational therapists are not employed in primary health care in Slovenia. Furthermore, occupational therapy as a profession is still little known in Slovenia. However, it should also be recognised that the prevalent assistive technologies were specific to medical specialties (eyeglasses, hearing aids, blood glucose metres). More than a half of participants agreed with the statement that the usage of assistive technology and home modification improved their quality of life. This is very important for health professionals who work in the field of assistive technology and should stimulate them to do further research. Because the majority of the participants expressed a wish/need for additional information about assistive technology and home modifications, four months after the survey the authors held a workshop for all the interested members of the Bled Association of Pensioners. The purpose of the workshop was to inform and to acquaint the participants with their rights and the process of prescribing assistive technology. During the workshop, different fields of assistive technology (e.g., mobility, daily activities, communication) and home modifications were presented in detail. The members who attended the workshop also posed questions about information-communication technology, mainly on usage of mobile phones, computers and alarms in home environment (e.g., smoke detectors, flood detectors, SOS call). The workshop was also an opportunity for promotion of occupational therapy profession and services. Our study had notable limitations, which calls for caution when interpreting the results. The results may have limited generalizability due to the small sample size as a consequence of the relatively low response rate which. Furthermore, participation was voluntary and normally people who had experienced a positive outcome in connection with the subject matter are more likely to volunteer than those who had not seen any benefit.18 Despite the limitations, the results of the survey contribute some new findings to the limited body of occupational therapy evidence that supports the use of assistive technologies and home modifications. The survey improved the current lack of evaluation to some extent, and set the scene for further studies which could influence the political initiatives towards assistive technology development in Slovenia. Such initiatives present a key opportunity for occupational therapists, who can inform and recommend appropriate solutions to the elderly to help them maintain independence in their home. Conclusion Assistive technology can make life easier for persons of all ages who may need help carrying out 14 Ocepek J et al.: Assistive Technology and Its Role among the Elderly - a Survey their daily activities through home modification and adaptation. Health professionals must be aware that persons with disability nowadays live longer, therefore assistive technology and home modification should be provided earlier in the aging process in order to slow down the progress of decline. Our survey of a local pensioners association in Slovenia showed that the participants did not have enough information about their right of provision of assistive technology and that the majority of wanted additional information. Occupational therapists and other health care professionals are encouraged to suggest and recommend the use of appropriate assistive technology and home modifications to the elderly, their family members and caregivers. Acknowledgements We are grateful to the respondents for their time and willingness to participate, and to the president and co-ordinator of the Bled Association of Pensioners for supporting our research. References 1. Tomšič S: Zdravje pri starejših [Health in the elderly]. Ljubljana 2011: Institute of Public Health of the Republic of Slovenia. http://www.ivz.si/Mp.aspx?ni = 63&pi=5&_5_id = 1797&_5_PageIndex = 0&_5_groupId = 238&_5_n ewsCategory=&_5_action=ShowNewsFull&pl=6 3-5.0 2. Toth M: Health services usage by life periods and especially after age of 65. Zdrav Vestn 2004; 73(10): 731-735. 3. Scherer MJ: The change in emphasis from people to person: introduction to the special issue on assistive technology. Disabil Rehabil 2002; 24(1-3): 1-4. 4. Cook AM, Hussey SM: Assistive Technologies. Principles and Practice, 2nd ed. St. Louis, USA 2002: Mosby. 5. Lansley P, McCreadie C, Tinker A: Can adapting the homes of older people and providing assistive technology pay its way? Age Ageing 2004; 33 (6): 571-576. 6. Health Insurance Institute of Slovenia: Seznam državnih predpisov [List of legal acts]. Ljubljana 2012: Health Insurance Institute of Slovenia. http://www.zzzs.si/zzzs/intemet/zzzs.nsf/vrstagradiva /513D473A63C6E16FC1256E97003581CC 7. Björkman Randström K, Asplund K, Svedlund M: Impact of environmental factors in home rehabilitation — a qualitative study from the perspective of older persons using the International Classification of Functioning, Disability and Health to describe facilitators and barriers. Disabil Rehabil 2012; 34(9): 779-787. 8. Trickey F, Maltais D, Gosselin C, Robitaille Y: Adapting older persons' homes to promote independence. Phys Occup Ther Geriatr 1993; 12(1): 1-14. 9. U. S. Department of Housing and Urban Development, Office of Policy Development and Research: Home modifications among households with physical activity limitations. U.S. Housing Market Conditions 2001; 1st Quarter. http://www.huduser.org/periodicals/USHMC/spring 2001/summary-2.html 10. Fange A, Iwarsson S: Challenges in the development of strategies for housing adaptation evaluations. Scand J Occup Ther 2007; 14(3): 140149. 11. Stucki G, Reinhardt JD, Grimby G: Organizing human functioning and rehabilitation research into distinct scientific fields. Part II: Conceptual descriptions and domains for research. J Rehab Med 2007; 39(4): 299-307. 12. Sumsion T (ed): Client-centred practice in occupational therapy. A guide to implementation, 2nd ed. Edinburgh 2006: Churchill Livingstone. 13. O'Brien P, Dyck I, Caron S, Mortenson P: Environmental analysis: insights from sociological and geographical perspectives. Can J Occup Ther 2002; 69(4): 229-238. 14. Wielandt T, Mckenna K, Tooth L, Strong J: Factors that predict the post-discharge use of recommended assistive technology (AT). Disabil Rehabil Assist Technol 2006; 1(1-2): 29-40. 15. Wilson DJ, Mitchell JM, Kemp BJ, Adkins RH, Mann W: Effects of assistive technology on functional decline in people aging with disability. Ass Tech 2009; 21(4): 208-217. 16. Gitlin LN, Mann WC, Tomit M, Marcus SM: Factors associated with home environmental problems among community-living older people. Disabil Rehabi 2001; 23(17): 777-787. Informatica Medica Slovenica 2012; 17(2) 15 17. Mann WC, Ottenbacher KJ, Fraas L, Tomita M, Granger CV: Effectiveness of assistive technology and environmental interventions in maintaining independence and reducing home care costs for the frail elderly. Arch Family Med 1999; 8(3): 210-217. 18. Bowling A: Research methods in health. Investigating health and health services. Berkshire 2002: Open University Press. 16 Marčun T et al.: Zaključki kongresa MI'2012 Bilten SDMI ■ Zaključki kongresa MI'2012 O kongresu Slovensko društvo za medicinsko informatiko je 18. in 19. oktobra 2012 v Zrečah izvedlo tradicionalni kongres medicinske informatike, ki vsaki dve leti predstavi najnovejše dosežke na področju zdravstvene informatike v Sloveniji in izpostavi priložnosti za nadaljnji razvoj. Kongresa se je udeležilo več kot 110 udeležencev — predstavnikov politike, managementa glavnih deležnikov v zdravstvu, različnih zdravstvenih strok, akademske in raziskovalne sfere, industrije, informatikov v zdravstvu in ostalih. Kongres so uvodoma nagovorili predsednik društva, generalni direktor Zavoda za zdravstveno zavarovanje Slovenije, predstavniki Inštituta za varovanje zdravja RS, Združenja zdravstvenih zavodov Slovenije in Zbornice zdravstvene in babiške nege. Poudarili so velik pomen informatike za doseganje kakovosti in učinkovitosti zdravstvenih storitev. V plenarnem delu sta bila predstavljena prispevka o inovativnih rešitvah zdravstvene informatike v tujini, ki sta ju podala Catherine Chronaki iz HL7 in François Commagnac iz IBM. Izpostavila sta zlasti nove priložnosti, ki jih informacijska orodja prinašajo za širše uvajanje zdravstvenih storitev na daljavo in zagotavljanje koordinirane oskrbe pacientov. Predstavljena je bila tudi raziskava o uporabi informacijske tehnologije v slovenskem javnem zdravstvu. Pokazala je, da imajo zdravstveni delavci zelo pozitiven odnos do informacijskih orodij, da pa si želijo nekoliko boljše delovanje informacijskih sistemov v organizacijah. Program kongresa sta popestrili okrogli mizi o storitvah zdravja na daljavo in dostopih Tomaž Marčun, Dejan Dinevski, Jasmin Džaferovič, Ivan Eržen, Brane Leskošek, Jožica Leskovšek, Matic Meglič, Andrej Orel, Vesna Prijatelj, Drago Rudel zdravstvenih delavcev ter posameznika do osebnih zdravstvenih podatkov ter delavnica o standardih HL7. Okrogla miza o storitvah zdravja na daljavo je pokazala, da uvajanje teh storitev podpirajo tako politika, deležniki v zdravstvu in stroka, da pa imamo težave pri implementaciji tovrstnih projektov zaradi nezadostnih virov za celovito pripravo in izvedbo nalog. Preostali program je bil namenjen predstavitvam projektov, dobre prakse in raziskavam. Avtorji so v 24 prispevkih predstavili napredovanje projektov nacionalnih institucij zdravstvenega varstva in zdravstvenega zavarovanja, dobre prakse uporabe informacijskih orodij pri izvajalcih zdravstvenih storitev ter različne raziskovalne projekte. Z motom kongresa Povezani za več inovacij je društvo izpostavilo pomen sodelovanja deležnikov in strok za uspešno uresničevanje razvojnih projektov in uvajanje najsodobnejših informacijskih orodij v slovenskem zdravstvu, med katerimi so bila največkrat izpostavljena ravno orodja za zagotavljanje storitev zdravja na daljavo. Zaključki S sodelovanjem do novih rešitev Primeri dobre prakse, predstavljeni na konferenci, in izkušnje dosedanjih projektov kažejo, da le s tvornim sodelovanjem deležnikov in strok lahko zgradimo uspešne inovativne informacijske rešitve v zdravstvu. Zato pozivamo vodstva zdravstvenih organizacij, da spodbujajo in omogočajo sodelovanje strokovnjakov različnih strok pri razvoju in Informatica Medica Slovenica 2012; 17(2) 17 uvajanju informacijskih rešitev v zdravstvenih organizacijah. Pozivamo Ministrstvo za zdravje, Zavod za zdravstveno zavarovanje Slovenije in Inštitut za varovanje zdravja RS, da nacionalne rešitve razvijajo v čim širšem sodelovanju z deležniki, ki zastopajo uporabnike rešitev, raziskovalnimi organizacijami ter v sodelovanju s strokami v zdravstvu. Zdravje na daljavo Storitve zdravja na daljavo se uveljavljajo pri: 1. diagnostiki (učinkovitejša uporaba virov), 2. strokovnih konzultacijah zdravstvenih delavcev, 3. spremljanju kroničnih bolnikov na domu s čemer se zmanjša število potrebnih obiskov pacienta v ambulantah, 4. socialni oskrbi starejših oseb. Primeri iz tujine in doma kažejo, da informacijsko podprte storitve zdravja na daljavo omogočajo prijaznejše, dostopnejše in učinkovitejše zdravstvene storitve. Pozivamo vodstva izvajalcev zdravstvenih dejavnosti in zdravstvene delavce, da spremljajo, načrtujejo in širše uvajajo postopke zdravja na daljavo. Rešitve omogočajo večjo učinkovitost in varnost ter boljšo kakovost zdravstvene oskrbe. Prihranke je mogoče usmeriti v izvajanje novih programov oziroma za okrepitev posameznih dejavnosti glede na potrebe bolnikov. Pozivamo partnerje splošnega dogovora, da ustrezno sistemsko pripravljene rešitve zdravja na daljavo prioritetno uvrstijo v program, financiran iz javnih sredstev. Projekt eZdravje Pri dosedanjem izvajanju projekta eZdravje je prihajalo do številnih zamud in sprememb v projektnih načrtih. Pozivamo Ministrstvo za zdravje, da čim prej uresniči načrtovane projekte eZdravje, ki bodo zagotovili prepotrebno infrastrukturo in elektronske storitve za nacionalne rešitve, vse na standardni način in v skladu z nacionalno vizijo. Analize podatkov Podrobni podatki, ki jih bodo izvajalci pošiljali pri obračunu zdravstvenih storitev v breme obveznega zdravstvenega zavarovanja, bodo zelo dobra podlaga za različne analize podatkov. Pozivamo Ministrstvo za zdravje in Zavod za zdravstveno zavarovanje Slovenije, da zbrane podatke uporabita tudi kot podlago za načrtovanje uvajanja sodobnih informacijsko podprtih zdravstvenih storitev. Pozivamo Ministrstvo za zdravje in Zavod za zdravstveno zavarovanje Slovenije, da omogočita dostop do zbranih podatkov v neosebni obliki subjektom, ki se ukvarjajo z raziskovalno dejavnostjo, saj je z uporabo teh podatkov mogoče priti do spoznanj o možnih nadaljnjih razvojnih korakih. Dostopi do podatkov V zdravstvu se količina osebnih podatkov v elektronski obliki eksponentno povečuje. Ob tem morajo upravljavci zbirk osebnih podatkov krepiti zaščito teh podatkov v skladu z zahtevami zakonodaje. Kakovost podatkov je temeljnega pomena za zaupanje v podatke in njihovo učinkovito uporabo. Zagotavljanje razumljivosti podatkov je nepogrešljivo za aktivnejše vključevanje pacienta v proces zdravstvene oskrbe. 18 Marčun T et al.: Zaključki kongresa MI'2012 Pozivamo upravljavce zbirk osebnih podatkov v zdravstvu, da navedena priporočila upoštevajo pri gradnji in upravljanju informacijskih sistemov. Standardi SDMI je ustanovilo sekcijo Podružnica HL7 Slovenija, katere namen je v sodelovanju z domačimi strokovnjaki in z drugimi tujimi podružnicami HL7 ter glede na dobre prakse v tujini pomagati slovenski industriji, državnim organom in ostalim zainteresiranim pri oblikovanju enotnih priporočil o uporabi standardov v (nacionalnih) rešitvah ter dostopu do gradiv in izobraževanju v zvezi s standardi HL7 in tudi ostalimi zdravstveno informacijskimi standardi. Pozivamo Ministrstvo za zdravje, da predpiše sistematično uporabo tako dogovorjenih standardov v vseh nacionalnih rešitvah in priporoči uporabo standardov za izmenjevanje podatkov in interoperabilnost med informacijskimi sistemi v zdravstvu. ■ Infor Med Slov: 2012; 17(2): 16-18 Informatica Medica Slovenica 2012; 17(2) 19 Bilten SDMI ■ Povzetek razprave na Drago Rudel' Tomaž okrogli mizi "Storitve zdravja na daljavo v Sloveniji - nacionalna strategija in v« , • • pospesitev uvajanja sodobnih reSitev zdravljenja in oskrbe na daljavo" Slovensko društvo za medicinsko informatiko (SDMI) je v okviru kongresa MI'2012 dne 18.10.2012 organiziralo v Termah Zreče okroglo mizo z naslovom Storitve zdravja na daljavo v Sloveniji — nacionalna strategija in pospešitev uvajanja sodobnih rešitev zdravljenja in oskrbe na daljavo, s katero je želelo pridobiti dodatno mnenje nekaterih ključnih deležnikov v slovenskem zdravstvu o novih storitvah, ki se izvajajo na daljavo. Tovrstne storitve so za Slovenijo nove in predstavljajo izziv za obstoječi sistem zdravstvene in socialne oskrbe. Okrogle mize so se udeležili naslednji panelisti: • mag. Lejla Hercegovac — predsednica Odbora za zdravstvo v Državnem zboru Republike Slovenije, • mag. Mirjana Kregar — Zavod za zdravstveno zavarovanje Slovenije (ZZZS), • mag. Ivan Gracar, Adriatic Slovenica, Zavarovalna družba d.d., • g. Metod Mezek — direktor Združenja zdravstvenih zavodov Slovenije (ZdZZ), • g. Franc Dolenc — član ISTAG, posvetovalnega organa EU. Izhodišče za pogovor je bil dokument z naslovom »Izhodišča za pripravo nacionalne strategije zdravja na daljavo v RS«, ki ga je pripravil SDMI in so ga udeleženci prejeli že nekaj tednov pred tem dogodkom. Okroglo mizo je moderiral dr. Drago Rudel kot predstavnik SDMI, prisotnih pa je bilo še okoli 60 udeležencev konference MI'2012. Živahna razprava, v kateri so sodelovali tudi poslušalci, je potekala o dveh glavnih temah: o stanju v slovenskem zdravstvu v odnosu do novih storitev ter o tem, kako omogočiti razvoj teh storitev v slovenskem prostoru. Opis stanja v slovenskem zdravstvu 1. Zdravstvene organizacije so v finančni krizi., manj je denarja. 2. Soočamo se z zelo velikim pritiskom pacientov na zdravstveni sistem. 3. Z uvedbo zdravja na daljavo že zamujamo, v tujini so prišli mnogo dlje. 20 Rudel D et al.: Povzetek razprave na okrogli mizi "Storitve zdravja na daljavo v Sloveniji" 4. V obstoječem sistemu zagotavljanja zdravstvene oskrbe se soočamo s številnimi ovirami (administrativne, procesne, formalne idr.). 5. V slovenskem zdravstvu manjka krovni strokovni management. Potrebujemo odgovorno upravljanje zdravstva. 6. Veliko imamo nepotrebnih obiskov pri zdravnikih. 7. ZdZZ podpira prizadevanja za uvedbo novih storitev na daljavo. 8. Zdravje na daljavo ne bo uresničeno jutri, je pa treba začeti s tem. 9. Vse prevečkrat investiramo v infrastrukture, ne razvijemo pa vsebin. 10. Zavarovanci pričakujejo sodobnejše rešitve. Zlasti mlajši so vešči uporabe sodobnejših tehnologij. 11. Zdravstvene zavarovalnice so bile vedno zraven, ko so se uvajale novosti. 12. Zgledi iz tujine za storitve na daljavo so vzpodbudni. 13. EU veliko vlaga v razvoj, a med najnaprednejšimi in najuspešnejšimi svetovnimi podjetji ni nobenega evropskega. Iz razvoja ne znamo narediti posla in socialnega učinka. 14. Informatiki morajo biti kot cisterna vode, ki jo razlijemo v puščavi — steče pod površje in nato prične rasti zelenje. ZZZS in zavarovalnice bi morale videti priložnosti. 15. Politiki so zainteresirani predvsem za kratkoročne rešitve/projekte. 16. Drobno gospodarstvo je v zelo težkem položaju, zato težko podpira neučinkovito zdravstvo. Kako omogočiti razvoj storitev zdravja in oskrbe na daljavo v slovenskem prostoru? 1. Podpreti je potrebno nove tehnološke možnosti, potrebni so preboji, ki prinesejo nove rešitve. 2. Izkoristimo moramo domače znanje in potencial industrije. 3. V prihodnosti bodo nastale nacionalne digitalne platforme, kjer bodo vse najpogosteje uporabljene vsebine in elektronske storitve na enem mestu. Potrebno je jasno definirati storitve zdravja na daljavo. 4. Pacient ne bo plačal, če ne ve, kaj bo za to dobil. Potrebno je jasno definirati storitve zdravja na daljavo. 5. Velikokrat se sprašujemo, kje dobiti denar. Če dovolj dobro premislimo, ga za uvedbo niti ne potrebujemo. Ugotoviti moramo, kako oblikovati poslovni model storitev, da bo zasebni kapital našel svojo pot. 6. Identificirati in odpraviti številne ovire (administrativne, procesne) v obstoječem sistemu zagotavljanja zdravstvene oskrbe. 7. Uvedimo minimalno participacijo pri zdravstveni storitvi, da bomo zmanjšali število obiskov v zdravstvenih institucijah. 8. Potrebno je uvesti dolgoročno strateško načrtovanje z ustreznimi nacionalnimi strategijami in njihovim doslednim izvajanjem. 9. Politika ne sme zamenjevati strateških kadrov z vsako zamenjavo vlade. 10. ZZZS naj najde notranje rezerve za tehnološki zagon storitev na daljavo. 11. V obvezno zdravstveno zavarovanje je potrebno uvesti nove zdravstvene storitve na daljavo. Določiti je potrebno sistem plačevanja storitev zdravja na daljavo. Informatica Medica Slovenica 2012; 17(2) 21 12. Potrebna bi bila reorganizacija ZZZS. ZZZS mora prilagoditi obračun storitev novim tehnološkim možnostim. 13. Zdravstvene zavarovalnice morajo iskati priložnosti za nove storitve. 14. Uporabo storitev, ki temeljijo na IKT, je potrebno omogočiti predvsem mlajšim osebam, saj so vešče uporabe sodobnejših tehnologij. 15. Zdravstvene storitve na daljavo naj bodo prijazne, ker je to ključnega pomena. 16. Omogočiti je potrebno svetovanje zdravnikov na daljavo brez obiska pacienta. ■ Infor Med Slov: 2012; 17(2): 19-21 22 Rudel D et al.: Pregled opravljenih pogovorov z nekaterimi ključnimi deležniki v zdravstvu Bilten SDMI ■ Pregled opravljenih Drago Rudel' Ivan Eržen pogovorov o dokumentu SDMI "Izhodišča za nacionalno strategijo zdravja na daljavo" z nekaterimi ključnimi deležniki v zdravstvu V obdobju od julija do novembra letošnjega leta sta Drago Rudel in Ivan Eržen opravila 12 pogovorov o izhodiščih za nacionalno strategijo zdravja na daljavo (ZnD), ki jih je pripravilo SDMI. V spodnji tabeli je prikazan njihov povzetek. Podporo predstavljenemu dokumentu so izrazile naslednje institucije oziroma organizacije: • Ministrstvo za zdravje RS (MZ), • Ministrstvo za izobraževanje, znanost, kulturo in šport — Direktorat za informacijsko družbo (MIZKŠ-DID), • Zavod za zdravstveno zavarovanje Slovenije (ZZZS), • Inštitut za varovanje zdravja RS (IVZ), • Skupnost socialnih zavodov Slovenije (SSZS), • Zbornica zdravstvene in babiške nege — Zveza strokovnih društev medicinskih sester, babic in zdravstvenih tehnikov Slovenije (Zbornica-Zveza) • Vzajemna d.v.z., • Zavod za transfuzijsko medicino (ZTM), • predsednica Odbora za zdravstvo Državnega zbora RS. • Združenje zdravstvenih zavodov Slovenije (ZdZZ), Informatica Medica Slovenica 2012; 17(2) 23 Datum Naziv organizacije Sogovorniki Predstavnik SDMI Opombe 23.11.2012 Združenje zdravstvenih zavodov Slovenije, Posvet poslovodnih delavcev javnih zdravstvenih zavodov okoli 100 članov ZdZZ Drago Rudel Predstavitev dokumenta z demonstracijo priprave izobraževalnih multimedijskih vsebin za zdravje. Uvedba storitev je nujnost. 18.10.2012 Kongres SDMI MI'2012 — okrogla miza z gosti Lejla Hercegovac — DZ RS, Drago Rudel Ivan Gracar — Adriatic-Slovenica, Mirjana Kregar -ZZZS, Metod Mezeg - ZdZZ, Franc Dolenc- ISTAG&APEK Udeleženci so izrazili podporo dokumentu ZnD. Za razvoj storitev je potrebno sodelovanje vseh deležnikov. Institucije gostov nimajo velikih možnosti za odločilno vlogo. Ključni akter mora biti MZ, ki se okrogle mize ni udeležilo. 16.10.2012 Združenje zdravstvenih člani Komisije za zavodov Slovenije informacijske sisteme pri ZdZZ Drago Rudel Predstavitev dokumenta ZnD z razpravo. Zavedanje o novih storitvah v ZO je pomanjkljivo. _Potrebna je promocija._ 10.10.2012 Združenje zdravstvenih Metod Mezeg, Sara Rozman Ivan Eržen, _zavodov Slovenije_Drago Rudel ZdZZ podpira prizadevanja SDMI pri pripravi dokumenta ZnD._ 10.10.2012 Zavod za zdravstveno Samo Fakin — gen. direktor, Ivan Eržen, zavarovanje Slovenije Tomaž Marčun, Boris Drago Rudel Kramberger Direktor vidi pozitivne finančne učinke storitev ZnD. Podpira prizadevanja SDMI pri pripravi dokumenta ZnD. Podprl bo predlog Telekap. Strateški investicijski fond ZZZS za storitve ZnD je v prerazporejanju porabe sredstev. 3.10.2012 Zavod za transfuzijsko Igor Velušček — direktor, Ivan Eržen, medicino Marko Breskvar - vodja Drago Rudel telemedicine Direktor podpira pripravo dokumenta ZnD ter razvoj storitev ZnD in bo še naprej razvijal telekonzultacije TM. Pripravljen je pomagati drugim. 23.8.2012 Vzajemna d.v.z. Marija Milojka Kolar, Irena Tiselj-Kaluža, Polona Tihelj-Kalan, Andrej Sercer Ivan Eržen, Drago Rudel Vzajemna še ne vidi svoje vloge v storitvah ZnD. Imajo pa ideje, kako spreminjati stvari. 23.8.2012 Skupnost socialnih zavodov Slovenije Boris Koprivnikar, preds. uprav. odbora Ivan Eržen, Drago Rudel Podpira pripravo dokumenta ZnD in razvoj storitev. Vlogo članov SSZS vidi v razvoju in izvajanju storitev. 21.8.2012 Ministrstvo za zdravje RS Brigita Cokl — drž. sekretarka, Jasmin Džaferovič — pisarna eZdravje Ivan Eržen, MZ podpira prizadevanja SDMI pri Drago Rudel pripravi dokumenta ZnD. Do konča leta 2012 mora MZ pripraviti dokument Program 2020 za EU, v katerem bo tudi ZnD 12.7.2012 Ministrstvo za izobraževanje, znanost, kulturo in šport — Direktorat za informacijsko družbo Marjan Turk, v.d. generalnega direktorja, Simona Kralj Zatler, Maruška Damjan Ivan Eržen, MIZKS-DID podpira prizadevanja Drago Rudel SDMI pri pripravi dokumenta ZnD. V strategijo eZdravja je potrebno vključiti uredbe, ki so v pripravi v EU glede čezmejnih storitev na vseh področjih, tudi eZdravja. Pripravi _M.Damjan_ 24 Rudel D et al.: Pregled opravljenih pogovorov z nekaterimi ključnimi deležniki v zdravstvu Datum Naziv organizacije Sogovorniki Predstavnik Opombe SDMI 5.7.2012 Zbornica zdravstvene in Darinka Klemene — preds., Drago Rudel Zbornica-Zveza podpira prizadevanja babiške nege Monika Ažman — izv.dir., Gordana Lokajner — za področje zdravstvene nege, Gordana Njenjic — za področje babiške nege SDMI pri pripravi dokumenta ZnD. Pripravili bodo dopolnilo za dokument za področje "telenursinga". julij 2012 Inštitut za varovanje zdravja RS Marija Seljak — v. d. direktorice Ivan Eržen Direktorica je v osebnem pogovoru, v katerem ji je bilo predstavljeno prizadevanje SDMI, izrazila podporo IVZ dokumentu. ■ Infor Med Slov: 2012; 17(2): 22-24 Informatica Medica Slovenica 2012; 17(2) 25 Bilten SDMI ■ Poročilo o jesenskem Ema Dornik Vesna Prijatelj srečanju članov Sekcije za informatiko v zdravstveni negi, SIZN 2012 Na Jelenovem grebenu v Olimju se je 30. 11. 2012 odvijalo tradicionalno srečanje članov Sekcije za informatiko v zdravstveni negi (SIZN), ki deluje pri Slovenskem društvu za medicinsko informatiko (SDMI). Vabilu na srečanje, ki je namenjeno tako druženju kot strokovni rasti, se je odzvalo 14 članov. V uvodnih besedah je predsednica Vesna Prijatelj predstavila poročilo o delu SIZN v letu 2012 ter načrt dela za naslednje leto. Vsako leto znova se izpostavljajo aktualna vprašanja, povezana s tematiko dela v in za SIZN. Strokovni del druženje je pričela Ema Dornik s predstavitvijo Spletni arhiv Obzornika zdravstvene nege. Uredništvo Obzornika zdravstvene nege je 12. maja 2008 posodobilo spletno stran, dostopno na: http://www.obzornikzdravstvenenege.si/, z namenom večje uporabnosti, prepoznavnosti ter podpore pri strokovnem in/ali znanstvenem delu medicinskim sestram, babicam, študentom zdravstvene in babiške nege ter ostalim strokovnjakom. Digitalni arhiv je dograjen, vsa objavljena celotna besedila so dostopna v obliki PDF. Leta 1967 je izšla prva številka Zdravstvenega obzornika (ISSN 0350-9516), strokovnega glasila medicinskih sester in zdravstvenih tehnikov, ki se je leta 1994 preimenoval v Obzornik zdravstvene nege. Kot predhodnica Zdravstvenega obzornika je od leta 1954 do 1961 izhajalo strokovno-informacijsko glasilo Medicinska sestra na terenu (ISSN 22325654) v izdaji Centralnega higienskega zavoda v Ljubljani. Na voljo so vsa objavljena besedila člankov, vse do leta 1954. Celotna besedila člankov, izdanih zadnja 4 leta, pa so dostopna le naročnikom (fizičnim osebam) na tiskano izdajo, a je potrebna registracija naročnika. Na spletni strani so v ta namen v letu 2011 uvedli Uporabniške strani. Obzornik zdravstvene nege je dostopen tudi v Digitalni knjižnici Slovenije (dLib.si). Uredništvo od leta 2009 spremlja uporabo spletne strani s pomočjo storitev Google Analytics. V obdobju od 15. 10. 2010 do 15. 11. 2012 je spletno stran obiskalo 50.662 obiskovalcev; 51 % je vračajočih (Returning Visitor), 49 % pa novih obiskovalcev (New Visitor). Skupaj so opravili 294.842 ogledov strani. Beležijo obiske iz 57 držav sveta (Slovenije, Hrvaške, Združenih držav Amerike, Srbije, Nemčije, Makedonije, Črne Gore, Avstralije, Velike Britanije, Italije, Kanade in drugih), ki pokrivajo 48 govornih področij. Uredništvo s spletno metriko meri učinkovitost in obiskanost spletnih strani in poroča o spletnem vedenju obiskovalcev, kar je postalo del procesa stalnih izboljšav, ki jih načrtuje in izvaja uredništvo. Uredništvo je z gradnjo digitalnega arhiva naredilo korak v digitalno dobo in dalo Obzorniku novo razsežnost. 26 Dornik E et al.: Poročilo o jesenskem srečanju članov Sekcije za informatiko v zdravstveni negi Slika 1 Udeleženci SIZN 2102. Blanka Pust se je v soavtorstvu z Vladislavom Rajkovičem in Marijo Zaletel lotila vprašanja Kaj lahko pričakujemo od e-dokumentacije klinične poti za srčno operacijo? Učinkovito dokumentiranje procesov zdravstvene nege je ključna sestavina celovitega sistema zdravstvenega varstva. Ustreznost dokumentiranja se nanaša na obvladovanje velikega števila informacij. V zdravstvu je potreben enoten informacijski sistem. Predstavila je predlagani model računalniško podprte dokumentacije, ki omogoča prenovo klasične dokumentacije klinične poti za srčno operacijo v e-dokumentacijo, ki prispeva k celoviti in kakovostnejši obravnavi pacienta, zaposlenim pripomore k natančnejši in celoviti dokumentaciji pri zdravstveni oskrbi. Izdelan je model e-dokumentacije. Sistem je oblikovan modularno z možnostjo dodajanja polj ali večjih sklopov polj v bazo. Omogoča čim bolj neopazno integracijo kliničnih poti v samo klinično delo. Poleg samega vnašanja podatkov sistem vsebuje orodje za oblikovanje poizvedb za ekstrakcijo podatkov potrebnih pri raziskovalnem delu ali pri oblikovanju letnih in drugih poročil o delu. Na osnovi implementacije in testiranj ter njenih rezultatov so ugotovitve s pomočjo analize SWOT strnjene v prednosti, slabosti, priložnosti in nevarnosti. Priložnosti so predvsem v izboljšanju varnosti pri procesu zdravljenja pacienta od sprejema do odpusta iz bolnišnice, transparentnosti in sledljivosti opravljenega dela, hitrem dostopu do potrebnih podatkov ob pacientu, razvoju raziskovalne dejavnosti in pridobivanju novih znanj ter zmanjšanju administrativnega dela. Ob tem se seveda zavedajo nevarnosti, ki jih prinaša sodobna informacijsko-komunikacijska Informatica Medica Slovenica 2012; 17(2) 27 tehnologija. Dejstvo je, da za organizacijo dela potrebujemo sprotno in zanesljivo zbiranje, obdelavo in prikaz podatkov, ki so pomembni za zdravstveno obravnavo pacienta. Ustrezna elektronska dokumentacija prestavlja ne le izziv, ampak tudi konkreten prispevek. Klinične poti kot orodje izhajajo iz ciljev e-zdravja. Predlagani e-model dokumentacije klinične poti za srčno operacijo predstavlja le en korak k dvigu kakovosti pri zagotavljanju kontinuirane zdravstvene nege. O čem odloča medicinska sestra? se je spraševal Vladislav Rajkovič. Ena temeljnih kompetenc človeka je, da ocenjuje in odloča. Na osnovi naših vrednot in znanja dajemo nečemu prednost. Tu leži tudi odgovor na zastavljeno vprašanje. Medicinska sestra odloča predvsem o zdravstveni negi posameznika, družine oziroma skupnosti, ki poteka po korakih procesa zdravstvene nege. Zahtevna je odločitev o vrsti in stopnji negovalnega problema. Na osnovi opazovanja vitalnih znakov pacienta se mora odločiti o tem, kdaj in kako obvesti zdravnika. Odloča o negovalnih ciljih, negovalnih intervencijah in njihovi prioriteti. Za vse te odločitve potrebuje teoretično in praktično znanje stroke, zdravstvene nege in drugih s tem povezanih ved. Za kakovostno odločanje moramo zajemati iz globoke in široke sklede znanja. Pravilne in utemeljene strokovne odločitve opredeljujejo mesto in vlogo zdravstvene nege. Utemeljujejo njen pomen in jo napravijo vidno. Slika 2 Mojca Paulin in Vesna Prijatelj. /. I SJKÊlt*' h*< -v Slika 3 Sladica Jelenov greben. V imenu Katje Razinger je predstavitev Informatizacija — Koordinator odpusta podal Peter Benedik. Skrajševanje ležalnih dob, povečevanje intenzivnosti obravnave hospitaliziranih pacientov in višanje starosti pacientov povečujejo kompleksnost zdravstvene problematike in skrajšujejo čas hospitalizacije, kar privede do večje obremenite služb in izvajalcev zdravstvene dejavnosti na terenu ter ostalih služb, ki nudijo pomoč pri izvajanju dnevnih in podpornih življenjskih aktivnosti. Koordinator odpusta predstavlja vezni člen med bolnišnično in nadaljnjo obravnavo v domačem okolju ali institucionalnem varstvu ter s tem zagotavlja nadaljnjo vodenje tovrstnih bolnikov na bolnikovem domu. SRC Infonet je v ta namen izdelal modul Koordinator odpusta, ki informacijsko podpira različne vrste aktivnosti, ki omogočajo komunikacijo, informiranje o aktivnostih, vezanih na odpust, ter svetovanje in povezovanje s preostalim zdravstvenim timom, z namenom zagotavljanja kontinuirane obravnave in 28 Dornik E et al.: Poročilo o jesenskem srečanju članov Sekcije za informatiko v zdravstveni negi boljše informiranosti bolnika, njegove družine ter izvajalcev zdravstvene in socialne oskrbe. Slika 4 Program SIZN 2012. Brane Leskošek je v soavtorstvu s Polonco Ferk zbranim predstavil prispevek Telefarmakologija. Eden izmed izzivov zdravstvene informatike je optimirati vlogo farmakologa v zdravstvenem timu ter izboljšati znanje o primernem predpisovanju zdravil in uporabi podatkovnih zbirk o zdravilih. V ta namen so za testiranje svetovalne vloge farmakologa pri ambulantnem delu zdravnika specialista preko oddaljene multimedijske telefarmakološke povezave zasnovali posebno programsko opremo ter pripravili načrt postavitve informacijskega okolja v simulacijskem centru. Razvijajo spletno informacijsko rešitev DRUGbp, ki bo na enostaven način zdravnika specialista opozarjala ter mu svetovala pri odločanju o predpisovanju in optimalnem režimu odmerjanja zdravil, zlasti v primeru bolnikov z okvarjeno ledvično ali jetrno funkcijo, pri nosečnicah in doječih materah, geriatričnih in pediatričnih bolnikih. Osnovo predstavljajo podatki iz različnih obstoječih podatkovnih zbirk o zdravilih in interakcijah med zdravili (npr. Baza podatkov o zdravilih, Drugs.com, Lexicomp). V kompleksnih primerih imajo zdravniki v ambulanti možnost konzultacije s farmakologom preko oddaljene in varne telefarmakološke povezave. V prvi fazi so pripravili opremo za osnovno namestitev informacijske rešitve v simulacijskem centru. Predvideli so dva različna scenarija za testiranje: enostavnega, v katerem zdravnik zgolj uporablja sistem DRUGbp, ter zahtevnega, v katerem mora zdravnik še dodatno komunicirati oziroma se posvetovati z oddaljenim farmakološkim timom. Za ovrednotenje uporabnosti telefarmakologije v klinični praksi bo potrebno izvesti nadaljnja testiranja v simulacijskem centru ter preveriti možnosti za celovito vključitev telefarmakologije v klinično okolje. Ob zaključku strokovnega dela srečanja je Uroš Rajkovič podal kratko informacijo o dogajanju na kongresu, ki je potekal v Montrealu v Kanadi med 23. in 27. junijem 2012, na katerem so sodelovali tudi trije člani SIZN (11th International Congress of Nursing Informatics, NI 2012: Advancing Global Health Through Informatics). Več o kongresu je dostopno na spletišču http://www.ni2 012.org/. Zaključna razprava je bila živahna, saj so predstavitve spodbudile k oblikovanju novih idej in smernic v nadaljnjem strokovnem, izobraževalnem in raziskovalnem delu. Veselimo se druženja na naslednjem tradicionalnem srečanju SIZN 2013. Zahvaljujemo se SDMI, ki je omogočilo naše srečanje, ter avtorjem, ki so posredovali povzetke predstavitev. ■ Infor Med Slov: 2012; 17(2): 25-28 Informatica Medica Slovenica 2012; 17(2) 29 Študijsko gradivo ■ Poissonova porazdelitev -osnove, uporaba, nadgradnja Gaj Vidmar Izvleček. Gradivo celovito predstavlja Poissonovo porazdelitev. Izpeljana je iz limite binomske porazdelitve. Predstavljene so njene temeljne lastnosti — oblika, momenti, rodovna funkcija in konvolucija. Sledijo primeri uporabe s prostorskega in časovnega vidika, ocenjevanje parametra, preverjanje prileganja empiričnim podatkom (s statističnimi testi in grafično), pojem nad- in podrazpršenosti ter zgodovinski pregled. V zadnjem delu gradiva so kratko predstavljene izbrane nadgradnje: povezane porazdelitve; zmesi Poissonovih slučajnih spremenljivk; dvo- in večrazsežna Poissonova porazdelitev; statistični test za primerjavo dveh vrednosti iz Poissonove porazdelitve; Poissonova regresija; in kontrolne karte, povezane s Poissonovo porazdelitvijo. Gradivo spremlja obsežen interaktiven delovni zvezek v obliki Excel 2007/2010. Poisson Distribution -Fundamentals, Applications, Extensions Instituciji avtorja / Author's institutions: Univerzitetni rehabilitacijski inštitut Republike Slovenije - Soča; Univerza v Ljubljani, Medicinska fakulteta, Inštitut za biostatistiko in medicinsko informatiko. Kontaktna oseba / Contact person: Gaj Vidmar, URI - Soča, Linhartova 51, SI-1000 Ljubljana. e-pošta / e-mail: gaj.vidmar@ir-rs.si. Prejeto / Received: 30.10.2012. Sprejeto / Accepted: 17.12.2012. Recenzenta / Reviewers: prof. dr. Primož Ziherl in dr. Tim Vidmar. Abstract. The tutorial comprehensively introduces the Poisson distribution. It is derived as a limit of the binomial distribution. Its fundamental properties are presented — shape, moments, moment generating function and convolution. Examples of its application in spatial and time framework are given, followed by parameter estimation, goodness-of-fit (via statistical tests and graphical methods), the concepts of under- and overdispersion, and a historical overview. The final part of the tutorial briefly presents selected extensions: related distributions; bi- and multivariate Poisson distribution; mixtures of Poisson random variables; a statistical test for comparing two Poisson counts; Poisson regression; and control charts related to the Poisson distribution. The tutorial is accompanied by a comprehensive and detailed interactive workbook in Excel 2007/2010 format. ■ Infor Med Slov: 2012; 17(2): 29-55 30 Vidmar G: Poissonova porazdelitev - osnove, uporaba, nadgradnja Uvod Poissonova porazdelitev je ena od osnovnih diskretnih verjetnostnih porazdelitev. V ogromni množici učnega gradiva s področja verjetnosti in statistike ter ved, kjer se verjetnost in statistiko uporablja, je praviloma na vrsti takoj za binomsko porazdelitvijo. Iz nje jo bomo kmalu tudi izpeljali, a da ne bi začeli s "suhoparno" matematiko, si najprej zastavimo dve vprašanji iz vsakdanjega življenja. — Kakšne rezultate bi dobili, če bi • sedeli ob cesti (najsi bo prometni v mestu ali samotni v gozdu) in šteli, koliko vozil pripelje mimo na izbrano časovno enoto (npr. minuto v mestu ali uro v gozdu)? • na travnik narisali kvadratno mrežo in šteli, koliko je v vsakem kvadratu neke cvetlice (najsi bo pogoste, kot je marjetica, ali redke, kot je štiriperesna deteljica)? Izkazalo se bo, da nam na obe vprašanji pomaga odgovoriti Poissonova porazdelitev. Njena zgodovina je dolga, pestra in pomembna, a da bi jo lahko razumeli, moramo najprej spoznati matematične osnove. Še prej pa napotki za branje oziroma nadaljnje delo: • gradivo spremlja dinamičen interaktiven delovni zvezek v obliki Excel 2007/2010 s prikazi porazdelitev in podatkovji. Dostopen je v obliki arhiva (ZIP) na naslovu http://ims.mf.uni-lj.si/archive/17(2)/31_s.zip. V njem je posebna pozornost namenjena pogojnemu oblikovanju (Conditional Formatting) s paličnimi grafikoni v celicah (Data Bars) in barvnimi merili (Color Scales), kar je priročno in učinkovito za prikaz podatkov s tabelografi. Formule, uporabljene v funkcijah, so izbrane tako, da se da delovni zvezek skoraj brez izgube funkcionalnosti uporabljati tudi z brezplačno elektronsko preglednico Calc iz odprtokodne zbirke LibreOffice; vsakega sklopa so navedeni po abecednem vrstnem redu. Kot je navada pri učbenikih in drugem pedagoškem gradivu, se besedilov obliki referenc sklicuje le na nekatere vire; oštevilčene so le enačbe [v oglatih oklepajih], na katere se besedilo kasneje sklicuje. Izpeljava Poissonova porazdelitev je limitna oblika binomske, pri kateri je število poskusov (n) zelo veliko, verjetnost uspeha v vsakem posameznem poskusu (p) pa zelo majhna (zato je znana tudi kot porazdelitev redkih dogodkov). Če v obrazcu za binomsko porazdelitev (natančneje rečeno: verjetnostno funkcijo binomsko porazdeljene slučajne spremenljivke X , ki lahko zavzame vrednosti k = 0,1,2,...) X ~ Bin(n, p)• p(X = k ) = k! nl(n - k)' (( - P) j-k vpeljemo / = np in torej p = X/n , z nekaj preurejanja dobimo P(k) = n n -1 n - 2 n - k +1 ■ Če sedaj n pošljemo v neskončnost, pri čemer ostaneta k in 2 nespremenjena, bodo šli vsi ulomki v prvem oglatem oklepaju proti 1, izraz v drugem oglatem oklepaju pa bo šel proti e. Iz definicije Eulerjevega števila e kot limite izraza (l +1/n)n namreč izhaja, da če gre n ^ 0 : k n n n n n n n n • viri so navedeni v treh sklopih: učbeniki, članki iz Wikipedije in dodatni viri. Znotraj e-X/k X ~ Pois(/) • P(X = k) = . [1] k! Informatica Medica Slovenica 2012; 17(2) 31 Pred predahom še dokažimo, da gre res za verjetnostno porazdelitev, torej da je vsota posameznih verjetnosti enaka 1. Iz definicije eksponentne funkcije ex = V— sledi, da je n=0 n! tt tt Qk Z )=«-2l2==1 • k=0 k=0 k! Lastnosti Oblika Kakšne oblike je Poissonova porazdelitev? Za različne vrednosti parametra 2 je prikazana na sliki 1 in na 1. delovnem listu priloženega Excelovega delovnega zvezka. Nakazuje se, kar bodo kmalu potrdili izračuni: • Poissonova porazdelitev je desno asimetrična (a vse manj z večanjem 2); • Poissonova porazdelitev z večanjem 2 (kmalu) postane podobna normalni; • modus Poissonove porazdelitve je (približno) enak 2 . 0,40 P(X=k) 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 2=1 2=4,5 2=10 J lil I Mm h.. 10 15 k Poglejmo si obrazec [1] za prve štiri vrednosti k : P(0) = e "2 P(i) = 2e"2 =2P(0) P(2) = 22 e "2/2 = (2/ 2)2e ~2 = (2/ 2)p() ' P(3) = 2e "7(3 • 2) = (21e~-2 ji) = (2/ 3)p(2) Hitro uvidimo splošno pravilo (ki ga sicer ni težko dokazati). Ker je celo za sodobne računalnike težko računati fakultete velikih števil, si je zato za računske potrebe potrebno zapomniti le, da verjetnost za k = 0 znaša e "2, in obrazec P(k - 0=¿rP(k). Ta rekurzivni obrazec nam tudi pojasni obliko 2 Poissonove porazdelitve. Dokler je faktor k +1 Slika 1 Verjetnostna funkcija Poissonove porazdelitve za tri izbrane vrednosti parametra 2. večji od 1, z naraščanjem k naraščajo tudi verjetnosti, ko pade pod 1, pa začno padati (in to vse hitreje). Porazdelitev je torej unimodalna, pri čemer je modus en, če 2 ni naravno število, če je, pa sta modusa dve sosednji vrednosti k . Momenti Povprečje (pričakovano vrednost, matematično upanje, prvi moment) in varianco (disperzijo, drugi centralni moment) Poissonove porazdelitve je najpreprosteje izpeljati na enak način kot samo porazdelitev — z limito binomske porazdelitve: • ker je povprečje binomske porazdelitve np , je v skladu z uvodno vpeljavo povprečje Poissonove porazdelitve enako 2 ; • ker je varianca binomske porazdelitve np(l - p) in ker gre (l - p) proti 1, če gre p proti 0, je varianca Poissonove porazdelitve tudi enaka 2 (standardni odklon pa je -J2). Tudi izpeljava iz definicij ni pretežka. Pri izpeljavi povprečja upoštevamo že omenjeno definicijo eksponentne funkcije, dejstvo, da je k/k!= 1/(k -1)!, 0 5 20 25 32 Vidmar G: Poissonova porazdelitev - osnove, uporaba, nadgradnja in dejstvo, da je šteti x od 0 dalje enako kot šteti x -1 od 1 dalje. Pri izpeljavi variance poleg tega upoštevamo, da je kA = (k - 1)A + A , in zaradi preglednosti označimo k - 2 z i , k -1 pa z j : to to ok E(X )=£ kP(k )=£ ke—X — = k=0 k=1 = X k—1 = Xe-XeX =X 1 (k-1)! E X 2 )=Ž q k to q k—1 = y k 2e—X — = Xe —XV k—-^ k! k=1 (k — 1) k=0 C = ——(k — 1) k=1 — k—1 — k—1 A (k — 1) (k — 1)! i=0 j=0 j! = —e—X(—eX + e —X) = )=—(— +1)^ Var(X ) = e(x 2)— E(X )2 =—(— +1) —X2 = X. [2] Dejstvo, da je varianca Poissonovo porazdeljene slučajne spremenljivke enaka njenemu povprečju, je najbolj znana lastnost Poissonove porazdelitve. Je tudi osnovno merilo za prepoznavanje Poissonove porazdelitve oziroma prvi kriterij pri presojanju, ali je Poissonova porazdelitev ustrezen model za dane empirične podatke. Tretji in četrti centralni moment navedimo brez izpeljave (da prihranimo nekaj matematičnega zagona še za naslednji razdelek), vseeno pa nam bosta s svojim limitnim obnašanjem pomagala razjasniti obliko Poissonove porazdelitve. Asimetričnost je m3 = l/-J~ž (torej vedno pozitivna oziroma desna, a se z večanjem 2 približuje 0), sploščenost pa m4 = 3 + (l/ 2) (torej večja kot 3, kolikor znaša pri normalni porazdelitvi, a z večanjem 2 razlika od normalne porazdelitve izginja). Rodovna funkcija in konvolucija Rodovna funkcija ni splošno znan pojem, saj presega gimnazijsko matematiko, ki smo se je doslej držali, a že angleški izraz (moment generating function) ga pomaga razjasniti. Rodovna funkcija je definirana kot pričakovana vrednost eksponentne funkcije produkta slučajne spremenljivke X in pomožne spremenljivke t. Uporabna je zato, ker če jo r-krat odvajamo glede na t in postavimo t = 0 , dobimo r-ti moment (surovi, tj. okrog nič) porazdelitve X . V primeru Poissonove porazdelitve je rodovna funkcija M (() = E (etX )= e— =e——vM k=0 k! k=0 k! Z njo smo se spoznali zato, da bi ugotovili, kakšna je porazdelitev vsote (tj. v jeziku fizikov in inženirjev: konvolucija) Poissonovih slučajnih spremenljivk. To pot smo ubrali, ker za rodovno funkcijo vsote dveh neodvisnih slučajnih spremenljivk (X in Y) velja, da je enaka zmnožku rodovnih funkcij posameznih spremenljivk: M (t ) = E[et(x+Y ) = E (eXetY ) = = E(eX )• E(etY )=M (t)• M2 (t) Rodovna funkcija vsote dveh Poissonovih slučajnih spremenljivk (s parametroma 2 in v) je zato —X — —v ve' —(—+v) (X+vV e e e e =e v >eK ' kar je rodovna funkcija Poissonove slučajne spremenljivke s parametrom 2 +v . Tako smo prišli do še ene zanimive in pomembne lastnosti Poissonove porazdelitve: vsota dveh (in torej tudi več) Poissonovih slučajnih spremenljivk je zopet Poissonova slučajna spremenljivka: X ~ Pois(2) a Y ~ Pois(v) => X + Y ~ Pois(2 + v) .[3] Morda je koga zaskrbelo, da je to v nasprotju s centralnim limitnim izrekom, ki (poenostavljeno rečeno) pravi, da če vzamemo veliko slučajnih k tk e Informatica Medica Slovenica 2012; 17(2) 33 vrednosti iz neke porazdelitve, se njihova vsota porazdeljuje normalno. A da je ta skrb odveč, nas prepriča premislek: čim več Poissonovih spremenljivk seštejemo, tem večja bo vsota njihovih parametrov, ki je hkrati povprečje porazdelitve vsote, in večje kot je povprečje Poissonove porazdelitve, bolj je ta podobna normalni. Prostorski in časovni vidik Prostorski vidik Premaknimo se od matematike v nekoliko oprijemljivejši svet (računalnikov, zlasti Excela) oziroma celo nazaj k naravi (na travnik s cvetlicami). Tri tipične možnosti dvorazsežne prostorske porazdelitve (npr. cvetlic, ki jih predstavljajo krožci, na travniku) prikazujeta slika 2 in 2. delovni list v priloženem Excelovem delovnem zvezku. V vseh treh primerih je zraslo 100 cvetlic s koordinatami med 0 in 1, mreža meja kvadrantov pa ima vodoravni in navpični razmik 0,1 (torej je kvadrantov 100 in je povprečje števila cvetlic na kvadrant 1). • Pri naključni porazdelitvi smo vsako dvojico koordinat izžrebali iz enakomerne porazdelitve (matematično rečeno: x ~ U(0;l), y ~ U(0;i); po Excelovo rečeno: s funkcijo RAND). • Pri enakomerni porazdelitvi smo cvetlice razporedili na mrežo kvadrantov in jih nato malo premaknili po naključju (ang. jittering). • Pri gručasti porazdelitvi smo izhajali iz petih središč na glavni diagonali in nato uporabili naključne majhne premike. 1,0 0,8 0,6 0,4 0,2 0,0 Naključna porazdelitev Enakomerna porazdelitev O o 00 1,0 o U nC ^ <0 n o— C 1,0 1 o CTO O o O ° OO « c 0,8 ° °o n o_ o 0 o 0,8 o O ® J o ■N O. - o uc OO 0° o d oo o 0 o <9 0,6 J O C 0,6 n )Q> o * O W "l. 0 oc o VJ o o® D o j C ° o o ° e 00 0,4 ou OO CP O 0 o C 0 0,4 o vJ s On oO ° o o o c % > <>° O o o 0,2 o OO oe o o 0,2 > o O o o o OC O 3 o o 0 o C §D o 0 o D 0 1 0,0 5 o O 0 O ,- o o o o 0,0 0,0 0,2 0,4 0,6 0,8 1,0 povprečje = 1,000 varianca = 1,091 0,0 0,2 0,4 0,6 0,8 1,0 povprečje = 1,000 varianca = 0,323 Slika 2 Trije primeri dvorazsežnih prostorskih porazdelitev: naključna (kjer za štev Poissonova porazdelitev), enakomerna (ki je v primerjavi s Poissonovo podrazpršena Poissonovo nadrazpršena). Simulacija v Excelu je dinamična, saj se spremeni ob vsakem ponovnem izračunu (tj. če datoteko shranimo ali pritisnemo tipko F9). Poleg tega so razsevnim grafikonom dodani toplotni zemljevidi (ang. heat maps), v katerih so kvadranti obarvani po barvni lestvici glede na to, koliko cvetlic vsebujejo (od modre barve za najmanjše število preko sive za povprečno do rdeče za največje). Pri naključni poraze cvetlic na kvadrant enakost povprečja i barvno asociacijo pc enakomerni porazd« manj, kot bi pričakc (na kar nas v Excel kar označujemo s p 1,0 0,8 0,6 0,4 0,2 0,0 Gručasta porazdelitev - d w m » 8> fi & 9 l L 0 0,0 0,2 0,4 0,6 0,8 1,0 povprečje = 1,000 varianca = 6,667 za število enot na kvadrant velja zpršena) in gručasta (ki je primerjavi s i 1 i porazdelitvi je porazdelitev števila adrant Poissonova, o čemer priča prečja in variance (ki ga v Excelu z acijo podkrepljuje zelena barva). Pri porazdelitvi so cvetlice razpršene pričakovali po Poissonovi porazdelitvi j Excelu asociira živo modra barva), mo s pojmom podrazpršenost (ang. 34 Vidmar G: Poissonova porazdelitev - osnove, uporaba, nadgradnja underdispersion). Pri gručasti porazdelitvi pa je varianca mnogo večja od povprečja (na kar nas v Excelu asociira živo rdeča barva), čemur z vidika Poissonove porazdelitve pravimo nadrazpršenost (ang. overderdispersion). Za Poissonovo porazdelitev v času je bistveno, da verjetnost za število dogodkov, ki se zgodijo v določenem časovnem obdobju, ki obsega t časovnih enot, izračunamo po obrazcu [1], v katerega namesto A vstavimo At: Časovni vidik Poissonova porazdelitev izraža verjetnost števila dogodkov, ki se zgodijo v danem časovnem intervalu, če vemo, da se ti dogodki pojavljajo z znano povprečno pogostnostjo in neodvisno drug od drugega. Medsebojna neodvisnost dogodkov pomeni, da je čas od zadnjega dogodka do naslednjega neodvisen od časa, ki je pretekel od predzadnjega dogodka do zadnjega. Primerov iz sodobnega sveta je na pretek: • s področja storitev, proizvodnje oziroma poslovanja — število avtomobilov, ki pridejo na uro v avtopralnico; število strank, ki pridejo na uro na bančno okence; število kupcev, ki pokličejo servis zaradi okvare gospodinjskega aparata v garanciji, na mesec; število predlogov za stečajni postopek, vloženih na določeno sodišče, na mesec; število letal določenega modela v lasti določenega letalskega prevoznika, pri katerih pride do okvare motorja, na 100.000 ur letenja; število turističnih potovanj, na katera so se odpravili člani gospodinjstva v enem letu; • s področja medicine — število pacientov, ki pridejo v nočnem času v ambulanto ali na kliniko, kjer ni naročanja (dežurna, urgenca ipd.), na uro; število mutacij določenega sklopa DNK na časovno enoto; • s področja računalništva in telekomunikacij — število okvar določenega omrežja na dan; število okužb z virusi na določenem podatkovnem strežniku na 24 ur; število obiskov priljubljene spletne strani na minuto; število telefonskih klicev v klicni center na minuto ... P(k ) = - -At (At )k k! [4] To lahko hitro uporabimo na primeru iz biologije. Denimo, da ujeda ujame v povprečju eno miš na dan. Ge na opazovanem območju živi 10 miši, kolikšna je verjetnost, da bo ujeda vse polovila v enem tednu? V obrazec [4] vstavimo k = 10, A = 1, t = 7 in izračunamo, da znaša verjetnost dobrih 7%: P(7) = e -7710 10! = 0,071. Nekoliko zahtevnejši in za urbanizirani svet nekoliko bolj življenjski je primer s komercialno telefonsko linijo, ki lahko zaradi omejenega števila zaposlenih in narave dela sprejme največ dva klica v petih minutah. V povprečju prejme 0,5 klica na minuto. Kolikšen je ocenjeni delež klicev, na katere osebje ne bo moglo odgovoriti? Ge računamo "peš", po obrazcu [4] izračunamo verjetnosti za 0, 1 in 2 klica v petih minutah (k = 0, 1, 2;A = 0,5/min; t = 5min) ter jih seštejmo, s čimer dobimo verjetnost, da bo osebje kos klicem (tj. da bo prejelo največ 2 v 5 minutah), nato pa to verjetnost odštejmo od 1: P(< 2) = P(0) + P(1) + P(2) = = e-At + (At )e-At + e (At )2 = 2 ( = e -At 1 + At + A 2 ,2 A ( =e -2,5 1 + 2,5 + 2,5 2 A v v / = 0,082085 • 6,625 = 0,544 ^ P(> 2) = 1 - P(< 2) = 0,456. V Excelu 2007/2010 je najpreprosteje, če v klicu funkcije POISSON.DIST uporabimo zadnji argument TRUE, s čimer takoj dobimo verjetnost za največ dva klica, kot je prikazano na 3. e 2 Informatica Medica Slovenica 2012; 17(2) 35 delovnem listu priloženega Excelovega delovnega zvezka. Drugače povedano, gre za porazdelitveno funkcijo (pred katero je pridevnik "kumulativna" pri matematično natančnem izražanju odveč, za nematematike pa dobrodošla komunikacijska redundanca, ki zmanjšuje verjetnost napačnega razumevanja). Če smo že pri časih med dogodki, se lahko vprašamo, kako so ti porazdeljeni? Odgovor, ki nas vodi k eni od osnovnih zveznih porazdelitev, ni zelo zapleten in sledi, a ker je povezan s pomembnimi raziskavami in znanimi ljudmi iz preteklosti, se bomo prej posvetili uvodoma obljubljeni zgodovini. Še prej pa si poglejmo, kako sploh ocenimo Poissonov parameter in kako ugotavljamo, ali se opažena porazdelitev sklada s Poissonovo. Ocenjevanje in prileganje Ocenjevanje parametra Ker smo dokazali, da je povprečje Poissonove porazdelitve enako njenemu parametru 2 , je naravno sklepati tudi v nasprotni smeri, torej da je najboljša cenilka za parameter Poissonove porazdelitve, ki se najbolje prilega opaženim podatkom, povprečje opaženih podatkov. Potrdimo to z metodo največjega verjetja (ang. maximum likelihood). Verjetje opaženih vrednosti ki,i = l..n kot niza n realizacij Poissonove slučajne spremenljivke X s parametrom 2 je verjetnost, da bi v slučajnem poskusu dobili opažene podatke. Ker gre za skupno verjetnost, posamezne verjetnosti, ki jih za vsak ki izračunamo po obrazcu [1], med seboj zmnožimo: Odvod logaritma verjetja po parametru 2 je L = e -n2 2ki+^+kn ki!-kn! Namesto verjetja je ekvivalentno, a lažje maksimirati njegov logaritem: ln L = -n2 + (k i+... +kn )ln 2- ln(k!... kn!). 3 ln L k, +... + kn -= -n + - 1 n 32 2 "J kk-2, cenilka I po metodi največjega verjetja pa je vrednost, za katero je odvod enak nič, torej X (kot smo slutili). Hkrati smo (v skladu z zahtevno matematiko, ki jo bomo izpustili — Rao-Cramerjevo oceno in teorijo učinkovitosti cenilk) dobili varianco cenilke, ki je obratna vrednost izraza pred tistim (X -ij, v katerem nastopa cenilka. Standardna napaka (tj. koren variance) ocene povprečja Poissonove porazdelitve je torej yjIn . Isto dobimo iz splošnega obrazca za standardno napako ocene povprečja, vsem znanega u/\fn , če v skladu z [2] za standardni odklon vstavimo a/I . Kot pri vsaki cenilki po metodi največjega verjetja (za tem je spet zahtevna teorija, ki jo bomo izpustili), ima tudi naša cenilka za I (asimptotično) normalno vzorčno porazdelitev. Zato lahko ocenimo interval zaupanja z množenjem standardne napake z vrednostjo iz standardne normalne porazdelitve, ki ustreza želeni stopnji zaupanja (1,96 za 95% interval zaupanja itd.). Opisani pristop k ocenjevanju intervalov zaupanja je znan kot Waldova metoda (po Abrahamu Waldu, 1902-1950, pionirju statistične teorije odločanja in operacijskih raziskav). V primeru Poissonove porazdelitve je ustrezna le za velike vrednosti I (vsaj 30), a k sreči je eksaktna metoda zelo preprosta za uporabo (če že ne izpeljavo, ki je še nekoliko zahtevnejša od izpeljave asimptotične metode). Temelji na enakosti Poissonove kumulativne porazdelitvene funkcije (tj. vsote verjetnosti v levem repu Poissonove porazdelitve) in komplementarne kumulativne porazdelitve %2 (tj. ploščine, ki bi jo izračunali z integralom, pod desnim repom porazdelitve ). Ker je enota, na katero štejemo število dogodkov (v prostoru: osebkov ali predmetov), praviloma arbitrarna, torej lahko s spremembo enote v opazovano obdobje (v prostoru: področje) 36 Vidmar G: Poissonova porazdelitev - osnove, uporaba, nadgradnja izenačimo 2 z opaženim k , oziroma ker 2 dostikrat ocenimo na podlagi enega samega poskusa (štetja), se v praksi eksaktni interval zaupanja največkrat nanaša na opaženo število dogodkov (osebkov, predmetov). Meji intervala zaupanja (SM — spodnja, ZM — zgornja) za 2 = k sta odvisni le od stopnje zaupanja (a) in znašata: SM =■ j2 |P = f; df = 2k ZM = 2 X2 \P = 1 -f, df = 2(( +1) 2 [5] Za izračun po eksaktni metodi torej potrebujemo le tabelo porazdelitve j2 (ki jo najdemo bodisi na koncu vsakega učbenika statistike bodisi na spletu) oziroma uporabimo programje, ki ima tabelo "vgrajeno" (v Excelu 2007/2010 uporabimo funkcijo CHISQ.INV). Eksaktni 95% interval zaupanja je za 0 do 7 opaženih dogodkov naveden v tabeli 1. Izračunan je po obrazcu [5] na 4. delovnem listu priloženega Excelovega delovnega zvezka, ki omogoča izračun za poljubno stopno zaupanja in poljubno število dogodkov (vnos v oranžno osenčeni celici). Tabela 1 Eksaktni 95% interval zaupanja za Poissonovo porazdeljeno število dogodkov. k oz. 2 spodnja meja zgornja meja 0 0 3,6889 1 0,0253 5,5716 2 0,2422 7,2247 3 0,6187 8,7673 4 1,0899 10,2416 5 1,6235 11,6683 6 2,2019 13,0595 7 2,8144 14,4227 Eksaktna metoda je znana že dolgo,34 a to — kot je v statistiki običajno — še zdaleč ni konec zgodbe. Najnovejši članek o intervalih zaupanja za povprečje Poissonove slučajne spremenljivke med seboj primerja kar devetnajst metod,48 a za začetek bosta dve dovolj. Preverjanje prileganja s statističnimi testi Če imamo podatke iz več poskusov, jih lahko uredimo v frekvenčno porazdelitev, tj. ugotovimo opažene frekvence fo za vse opažene vrednosti k . Če hkrati ocenimo 2 , lahko izračunamo Poissonovo verjetnost, s tem pa tudi pričakovano frekvenco fp za vsakega od možnih izidov. Na podlagi tega lahko ocenimo oziroma statistično testiramo prileganje (ang. goodness-of-fit) teoretične porazdelitve empirični (oziroma obratno — s praktičnega vidika je vseeno, kako rečemo, z epistemološkega pa ne, a v to razpravo se tu ne bomo spuščali). Ker gre za diskretno slučajno spremenljivko, je običajna izbira test j2 , pri katerem se testna statistika x2 =!k (fo - fp )2 fp [6] pod ničelno domnevo porazdeljuje (asimptotično) po porazdelitvi j2 z dvema prostostnima stopnjama manj, kot je opaženih različnih vrednosti k . Eno prostostno stopnjo pobere dejstvo, da je pri danem skupnem številu podatkov (n) ob poznavanju ostalih frekvenc za eno celico tabele frekvenca v naprej določena; drugo pa pobere dejstvo, da smo na podlagi opaženih podatkov ocenili en parameter porazdelitve, ki jo prilegamo podatkom (2). Upoštevati je potrebno še, da morajo izidi pokriti celotno zalogo vrednosti opazovane spremenljivke in da naj ne bi bilo celic s pričakovano frekvenco pod 5 (oziroma naj bi jih bilo čim manj, sicer porazdelitev j2 ni dober približek za [6]), zato se najvišje vrednosti pogosto združi (oblikuje en izid oziroma celico za k > neki vrednosti). Računski primer je predstavljen v tabeli 2 in na 5. delovnem listu priloženega Excelovega delovnega zvezka. Vidimo, da se porazdelitev števila nesreč, ki jih je imel posamezni pilot zaradi lastne napake,46 praktično povsem ujema s Poissonovo, kar pomeni, da je naključje smiseln model za tovrstne nesreče. To govori v prid postopkov izbora, šolanja Informatica Medica Slovenica 2012; 17(2) 37 in razporejanja pilotov, saj podatki kažejo, da med piloti ni bilo razlik v usposobljenosti in izpostavljenosti nesrečam. Tabela 2 Primer preverjanja prileganja Poissonove porazdelitve opaženim podatkov s testom £ — število nesreč zaradi napak pri vojaških pilotih. k fo PP fp = nPp (o f p ) /f p 0 662 0,691 661 0,001 1 242 0,256 245 0,026 2 47 0,047 45 0,069 3 6 0,006 *6 0,003 n = = 957 Ž PP =1 Ž fp = n X2 = 0,010 k = 0,370 df = 4 - 2= 2 sk = 0,369 p = 0,951 * za k > 3 Sorodna statistika je indeks razpršenosti (ang. index of dispersion). Izpeljavo bomo izpustili, ker je predolga (čeprav ni težka), bistveno pa je, da indeksa razpršenosti ne računamo iz podatkov, urejenih v frekvenčno porazdelitev, pač pa iz vsake realizacije opazovane slučajne spremenljivke posebej (tj. iz posameznih ki,i = l..n ). V primeru Poissonove porazdelitve ga imenujemo Poissonov indeks razpršenosti (z ang. kratico PID) in ima obliko Ž (ki - k) PID = ■ Ker se indeks razpršenosti (asimptotično) pod ničelno domnevo porazdeljuje kot z n -1 prostostnimi stopnjami, z izračunom PID izvedemo test Poissonove razpršenosti (ang. Poisson dispersion test). Z njim primerjamo razpršenost opaženih podatkov z razpršenostjo, ki bi jo pričakovali pri Poissonovi porazdelitvi. Tudi pri tem testu velja omejitev glede asimptotičnega približka — primeren je le, če je povprečje opazovanj (k kot cenilka 2 ) večje od 3 (ali še raje od 5), je pa že Sir Ronald Aylmer Fisher (pionir statistike tudi glede permutacijskih metod) razvil njegovo eksaktno obliko (ki se jo najde v učbenikih in statističnem programju). Računski primer asimptotične oblike testa Poissonove razpršenosti je predstavljen v tabeli 2 in na 6. delovnem listu priloženega Excelovega delovnega zvezka. Podatki o številu prometnih nesreč v enem mesecu ne odstopajo statistično značilno od Poissonove porazdelitve, kar govori v prid interpretaciji, da se nesreče dogajajo slučajno. Tabela 3 Primer preverjanja prileganja Poissonove porazdelitve opaženim podatkov s testom Poissonove razpršenosti — število prometnih nesreče v nekem mestu za zaporedne mesece. k (( - k))k 11 0,397 8 0,133 9 0,001 4 2,858 12 0,924 10 0,089 16 5,232 9 0,001 6 1,056 6 1,056 =9,100 PID = 1,747 df = 10 - 1 = 9 p = 0,228 Podobno kot je veliko metod za ocenjevanje intervala zaupanja, je tudi testov prileganja Poissonove porazdelitve še mnogo in posvečene jim je veliko statistične literature.29,40 Eden od tovrstnih testov temelji na testni statistiki Kolmogorova in Smirnova (tj. največji absolutni razliki med opaženo in pričakovano verjetnostjo izida). Skupina testov, ki je prav tako izpeljana iz testa za zvezne spremenljivke, temelji na testni statistiki Cramerja in von Misesa (tj. uteženi vsoti kvadriranih razlik med opaženo in teoretično pričakovano kumulativno porazdelitveno funkcijo). Nadaljnja možnost so testi na podlagi testa razmerja verjetij (ang. likelihood ratio test). Testov prileganja Poissonove porazdelitve empiričnim podatkom je še nekaj skupin, a bodi dovolj naštevanja — raje si oglejmo grafične metode (saj vsi poznamo tisto o sliki in tisoč besedah ali pa številkah). i=l k 38 Vidmar G: Poissonova porazdelitev - osnove, uporaba, nadgradnja Grafično preverjanje prileganja Malo je področij sodobne statistike, ki niso povezana z imenom in delom Johna Wilderja Tukeya, 1915-2000, po mnenju mnogih (vključno z avtorjem tega gradiva) enega najpomembnejših in najbolj vsestranskih znanstvenikov vseh časov (med drugim je skoval izraza bit in software ter razvil hitro Fourierovo transformacijo — FFT). Med njegovimi prispevki k prikazu podatkov je najbolj znan škatlasti grafikon kvantilov (ang. box-and-whiskers plot ali skrajšano boxplot), za jasnejši pogled na Poissonovo porazdelitev pa si je Tukey izmislil obešeni korenogram (ang. hanging rootogram). Predstavil ga je v dveh epohalnih delih — članku o metodah za prikaz oziroma grafično analizo podatkov59 in monografiji o eksploratorni analizi podatkov.60 Gre za stolpčni grafikon, ki je "obešen" zato, ker dolžine stolpcev ne odmerimo od nič navzgor, pač pa od pričakovane frekvence navzdol (torej se stolpci končajo nad vodoravno osjo, če je opažena frekvenca manjša od pričakovane, in pod njo, če je večja). Na ta način so odstopanja jasnejša, saj vidimo njihov vzorec okoli vodoravne osi namesto okoli krivulje. Ge grafikon uporabimo za Poissonovo porazdelitev, izračunamo pričakovane frekvence v skladu z njo, sicer pa gre za splošen princip, ki je uporaben za primerjavo dveh poljubnih porazdelitev (lahko tudi dveh vzorcev). "Korenskost" pomeni, da je navpična os v kvadratnokorenskem merilu (tj. potenčnem s potenco 0,5), kar poudari odstopanja v repih (tj. pri manjših pričakovanih frekvencah — podobno kot test j2 ). Tudi tu gre za splošni princip, za katerega je Tukeya sicer navdahnila Poissonova porazdelitev, a je uporaben za katerikoli prikaz porazdelitve s stolpci (kar vključuje histogram) ali s krivuljo (frekvenčni poligon, zglajeni grafikon gostote). Obešeni korenogram na sliki 3 prikazuje podatke iz tabele 4, ki jih bomo kmalu spoznali v okviru zgodovinskega pregleda. Izdelava v Excelu (7. delovni list priloženega delovnega zvezka) zahteva nekaj "trikov" (trije podatkovni nizi namesto enega za prikaz opaženih frekvenc, "umetna" navpična os) in naprednejših veščin (kombinacija treh vrst grafikonov, spremenjene oznake podatkov). Večjih oziroma sistematičnih odstopanj od Poissonove porazdelitve ni opaziti. 2 3 k Slika 3 Obešeni korenogram za preverjanje ujemanja empiričnih podatkov s Poissonovo porazdelitvijo (podatki iz tabele 4 — smrti zaradi konjskih brc v pruski vojski; povezane črne pike — teoretična porazdelitev, sivi stolpci — opažene frekvence). Tukeyev študent in dolgoletni sodelavec David Caster Hoaglin (1944-) je razvil grafikon poissonskosti (ang. Poissonness plot).37 Izhaja iz odnosa, ki ga dobimo iz obrazca [1] z logaritmiranjem obeh strani in nekaj preurejanja ob predpostavki, da so vse opažene frekvence (f0t j enake pričakovanim: k! f0 ln—= -A + k lnl. Ge levo stran zgornje enačbe označimo kot funkcijo q>[f0t j = ln(k! f0k jnj, dobimo pravilo, da je za Poissonovo porazdelitev graf 11 Slika 8 Opažena porazdelitev števila celic kvasovk na kvadratek hemocitometra (z mrežo 200x200) in najbolje prilegajoča se Poissonova porazdelitev za štiri Studentove vzorce (A-D). 42 Vidmar G: Poissonova porazdelitev - osnove, uporaba, nadgradnja Radioaktivni razpad Ernest Rutherford (1871-1937; slika 9), na Novi Zelandiji rojeni britanski kemik in fizik, ki velja za očeta jedrske fizike, si je prislužil Nobelovo nagrado (1908 za za kemijo), visok plemiški naziv in še mnoge druge najvišje časti, bil pa je tudi mentor štirim nobelovcem. S Poissonovo porazdelitvijo je povezano njegovo odkritje delcev, žarkov oziroma radioaktivnega razpada a in p. Slika 9 Ernest Rutherford, 1. (in zadnji) baron Rutherford Nelsonski (levo), in shematičen prikaz radioaktivnega razpada alfa (desno). Leta 1910 so Rutherford, Geiger in Bateman šteli število delcev a , ki jih je oddala tanka plast polonija v 2608 zaporednih intervalih dolžine V minute.53 Menili so, da mora dobljena porazdelitev slediti Poissonovi (ki je sicer niso poznali in so jo izpeljali na novo), saj je bilo radioaktivnih atomov veliko, za vsakega od njih pa je verjetnost, da razpade v osmini minute, zelo majhna. Podatke in njihovo prileganje Poissonovi porazdelitvi (preverjeno s testom %2) prikazujeta tabela 6 in 11. delovni list priloženega Excelovega delovnega zvezka. Omenimo še, da če namesto števila radioaktivnih razpadov na časovno enoto spremljamo čase med razpadi, dobimo eksponentno porazdelitev, a o tem več nekoliko kasneje. Tabela 6 Porazdelitev števila izsevanih delcev a na osmino minute v poskusu Rutherforda, Geigerja in Batemana iz leta 1910 in njeno ujemanje s Poissonovo porazdelitvijo (tabelograf in test ^2). Št. delcev a Opaženo Pričakovano (O-P)2/P 0 ■ 57 54 0,167 1 203 210 0,233 2 383 407 1,415 3 525 525 0,000 4 532 508 1,134 5 408 394 0,497 6 273 254 1,421 7 ■ 139 141 0,028 8 ■ 45 68 7,779 9 1 27 29 0,138 10 1 10 11 0,091 11 4 4 0,000 12 0 13 1 3 0,333 14 1 15+ 0 Skupaj 2608 X2 = Test Povprečje 3,872 13,238 Varianca 3,695 p (df =13-2=11) = 0,278 Leteče bombe V-1 Pomemben in znan primer uspešne uporabe Poissonove porazdelitve je povezan z letečimi bombami V-1 (zaradi srhljivega hrupa pulznega reaktivnega motorja so jih Angleži poimenovali buzz bombs), s katerimi je nacistična Nemčija v 2. svetovni vojni napadala London (in še nekaj drugih mest, zlasti Antwerpen v Belgiji) od poletja 1944 do pomladi 1945 (slika 10). \J Slika 10 Nemška leteča bomba V-1 iz 2. svetovne vojne (levo) in primer razdejanja, ki ga je padec take "hrupne bombe" povzročil v Londonu (desno). Ključno vprašanje obrambe je bilo, ali V-1 padajo po naključju ali so vodene k določenim ciljem. Če bi veljalo prvo, bi morala biti dvorazsežna prostorska porazdelitev krajev zadetkov naključna, torej porazdelitev števila zadetkov na enoto Informatica Medica Slovenica 43; 18(1-2) i ploščine zelo podobna Poissonovi, v drugem primeru pa bi bila prostorska porazdelitev krajev zadetkov gručasta (kot je pojasnjeno v razdelku o prostorskem vidiku in prikazano na sliki 2). Razdelitev 144 km2 velikega področja južnega Londona na 576 kvadrantov velikosti % km2 je potrdila naključnost oziroma Poissonovo porazdelitev,32 kar je bilo zelo pomembno za strategijo obrambe (vključno z dezinformacijami o učinkih bomb, ki so jih dostavljali Nemcem preko mreže dvojnih agentov). Podatke in njihovo prileganje Poissonovi porazdelitvi prikazujeta tabela 7 in 12. delovni list priloženega Excelovega delovnega zvezka. Tabela 7 Porazdelitev števila nemških letečih bomb V-1, ki so padle na južni London v zadnjem obdobju 2. svetovne vojne, po kvadrantih in njeno ujemanje s Poissonovo porazdelitvijo (tabelograf in test j2). * za 5+ Skupaj 576 Test Povprečje 0,932 X = 1,169 Varianca 0,969 p (df=6-2=4) = 0,883 Nadgradnja Povezavo Poissonove porazdelitve z binomsko porazdelitvijo in porazdelitvijo j2 smo že spoznali, v nadaljevanju pa bomo spoznali še nekaj zahtevnejših porazdelitev, povezanih s Poissonovo, vključno s porazdelitvami zmesi in večrazsežnimi porazdelitvami. Nato bomo spoznali, kateri statistični test velja za najpreprostejšega in zakaj. Dotaknili se bomo tudi točkovnih procesov, napovednih (regresijskih) modelov in kontrolnih kart. virov. Poissonova porazdelitev namreč predstavlja le ena vratca za vstop (ali vsaj okence za pogled) v ogromni svet statistike. Povezane porazdelitve Če kje, potem v svetu verjetnostnih porazdelitev nedvomno velja, da je (skoraj) vse povezano s (skoraj) vsem,42 zato je s Poissonovo povezanih veliko porazdelitev. Začnimo pri časovnem vidiku in napovedjo, da je s Poissonovo neločljivo povezana ena od temeljnih zveznih porazdelitev. To je eksponentna porazdelitev (imenovana tudi negativna eksponentna ali porazdelitev Poissonovega toka). Njena gostota verjetnosti je X ~ Exp(2) » f (x) = 2e, x > 0 , (kumulativna) porazdelitvena funkcija pa F(x) = P(x < X)= Jye-2udu = [- eJ = 1 - e. [8] 0 Oblika eksponentne porazdelitve je vedno enaka, le njena razpršenost pada z naraščanjem 2 (slika 11 in 13. delovni list priloženega delovnega zvezka). Njeno povprečje izračunamo iz definicije to E(x) = Jxf (x)dx s substitucijo y = 2x , s čimer 0 dobimo E(x) = 1/2 . Povprečje torej narašča z manjšanjem parametra 2 . Modus je vedno pri x = 0 (kjer je f (x) = 2 ), mediana pa je pri F(x) = 1/2 , torej pri (- ln1/2)/2 = ln 2/2 = 0,693/2 , kar je približno na dveh tretjinah razdalje med modusom in povprečjem. Momente eksponentne porazdelitve bi lahko izračunali z uporabo rodovne funkcije, a kar povejmo, da je varianca 1/ 22 , asimetričnost pa +2. Izrazita desna asimetričnost se sklada s vrstnim redom mer srednje vrednosti (modus < mediana < aritmetična sredina). Bomb v sektorju Opaženo Pričakovano (O-P)2/P 0 229 226,7 0,022 1 211 211,4 0,001 2 93 98,5 0,311 3 ■ 35 30,6 0,626 4 1 7 7,1 0,003 5 0 6 0 *1,6 0,206 7 1 Imen in pojmov, ki jih bomo pri tem srečali, bo veliko, navedeni pa so predvsem kot spodbuda, napotek in pripomoček za lažje iskanje nadaljnjih 44 Vidmar G: Poissonova porazdelitev - osnove, uporaba, nadgradnja Slika 11 Eksponentna porazdelitev za tri vrednosti parametra A. In kako je eksponentna porazdelitev povezana s Poissonovo? Vrnimo se k radioaktivnemu razpadu in se spomnimo, da se število razpadov v t sekundah porazdeljuje po Poissonovi porazdelitvi s parametrom At. Po obrazcu [1] je verjetnost, da v t sekundah ne bo nobenega razpada, P(o) = e -At, to pa je hkrati verjetnost, da bomo morali čakati več kot t sekund, da bo prišlo do razpada. Verjetnost, da bomo v času t dočakali radioaktivni razpad, je torej P(T < t) = 1 - e-At, kar pa je isto kot [8], tj. porazdelitvena funkcija eksponentne porazdelitve. Za čas med dvema razpadoma (T) torej velja eksponentna porazdelitev s parametrom A . Jasen je tudi pomen parametra A , ki je skupen obema porazdelitvama: več, ko je dogodkov, večje je povprečje njihovega števila na časovno enoto (tj. povprečje Poissonove porazdelitve) in manj časa v povprečju mine med dvema dogodkoma (manjše je povprečje eksponentne porazdelitve, ki je 1/A). Eksponentni porazdelitvi smo namenili več pozornosti kot je bomo ostalim v nadaljevanju, saj s Poissonovo porazdelitvijo predstavljata "dve plati iste medalje" (ena v diskretnem svetu števila dogodkov, druga v zveznem svetu časov). Lahko bi rekli, da podobna dvojnost velja za statistiko in stohastične procese (imenovane tudi slučajni procesi, ang. stochastic processes oziroma random processes) kot pristopa k slučajnim pojavom. Podmnožica slučajnih procesov so točkovni procesi (ang. point processes), med katere sodi tudi Poissonov proces, ki smo ga pravkar spoznali. Zanj je namreč značilno, da je čas med dvema točkama eksponentno porazdeljen. Praktično vse, kar smo spoznali doslej v zvezi z Poissonovo porazdelitvijo, bi lahko izpeljali in tolmačili tudi z vidika slučajnih procesov, a za večino nematematikov (ne pa za tehnike, inženirje in računalničarje, ki jim je ta pristop bolj domač od statističnega) bi bilo to mnogo bolj zahtevno, saj ne bi šlo brez diferencialnih enačb. Z eksponentno — in torej tudi s Poissonovo — je povezana Erlangova porazdelitev, ki si jo lahko zapomnimo kot porazdelitev vsote neodvisnih eksponentno porazdeljenih slučajnih spremenljivk. V jeziku čakalnih vrst to pomeni, da opisuje porazdelitev časa, ki preteče, da opazimo k dogodkov. Erlangova porazdelitev predstavlja poseben primer porazdelitve gama (r), pri kateri je parameter oblike (ang. shape parameter; taisti k) pozitivno celo število. Pri prostorskem vidiku Poissonove porazdelitve smo spoznali pojem nadrazpršenosti. V resnici je bolj kot pri cvetlicah na travniku prisoten pri porazdelitvi nečesa oziroma nekoga mnogo manj prijetnega za ljudi in nam bližje sorodne živali — zajedavcev. Na področju parazitologije je namreč že dolgo znano, da se v nekaterih gostiteljih zadržuje mnogo več zajedavcev, kot bi jih pričakovali, če bi se zajedavci med gostitelje razporejali po naključju (in hkrati so potencialni gostitelji, prosti nadležne zalege, številčnejši, kot bi na ta način pričakovali). Kot model porazdelitve števila zajedavcev v različnih populacijah se zato uporablja negativna binomska porazdelitev (ang. negative binomial distribution), pri čemer parazitologi posebno pozornost namenjajo gručenju (ang. crowding).51 Obrazec za verjetnostno funkcijo negativne binomske porazdelitve je podoben kot za binomsko porazdelitev, opisuje pa število uspešnih izidov (tj. enk) v nizu Bernoullijevih poskusov preden dosežemo določeno število neuspešnih izidov (ničel). Njen odnos do binomske porazdelitve je torej analogen odnosu eksponentne porazdelitve do Poissonove. Ena od alternativnih definicij negativne binomske porazdelitve pa pravi, da je to Informatica Medica Slovenica 2012; 17(2) 45 Poissonova porazdelitev, katere parameter 2 je slučajna spremenljivka, porazdeljena po posebni obliki porazdelitve gama. Na področju aktuarstva je pomembna sestavljena Poissonova porazdelitev (ang. compound Poisson distribution). Definirana je kot porazdelitev vsote medsebojno neodvisnih in enako porazdeljenih (poljubno, čeprav praviloma z omejitvijo, da so nenegativne) slučajnih spremenljivk, pri čemer je število slučajnih spremenljivk, ki jih seštejemo, Poissonovo porazdeljena slučajna spremenljivka. Uporabna je pri ocenjevanju tveganja zaradi predvidenih odškodnin in s tem pri določanju zavarovalnin.41 Zanimivo je, da je poseben primer sestavljene Poissonove porazdelitve negativna binomska porazdelitev, ki jo dobimo, če so slučajne spremenljivke, ki jih seštevamo, porazdeljene po logaritemski porazdelitvi (ki sodi med manj znane diskretne porazdelitve). Mimogrede, porazdelitve imajo res "gosto socialno mrežo", mar ne? Ampak s porazdelitvijo števila povezav v analizi omrežij, ki je sicer včasih vsaj teoretično lahko Poissonova, se ne bomo ubadali. Pač pa spoznajmo neposredno razširitev Poissonove porazdelitve, ki sliši na ime Conway-Maxwell-Poissonova porazdelitev (skrajšano COM-Poissonova porazdelitev). V primerjavi s Poissonovo ima dodaten parameter v , ki si ga lahko predstavljamo kot faktor, ki omogoča, da se hitrost (npr. radioaktivnega) razpada spreminja. Njena posebna primera sta Poissonova porazdelitev (če je v = i) in geometrična porazdelitev (če je v = 0 ), limitni primer pa Bernoullijeva porazdelitev (če gre v ^ x). O aktualnosti COM-Poissonove porazdelitve se bomo prepričali v zadnjih dveh razdelkih — o Poissonovi regresiji in o kontrolnih kartah. Poissonove zmesi Najpreprostejši primer Poissonove zmesi je porazdelitev slučajne spremenljivke, ki jo dobimo tako, da se pri vsakem poskusu po slučaju — tj. z realizacijo Bernoullijeve slučajne spremenljivke z danim parametrom p e (0;l) — odločimo, ali bomo izžrebali slučajno vednost iz ene Poissonove porazdelitve (s parametrom 2A) ali iz druge (s parametrom 2B). Verjetnostna funkcija take slučajne spremenljivke C je P(( = k ) = Pe 22 + (1 - P > , [9] k! povprečje in varianca pa 43 E(C )= p2a +(l - P ) , Var(C) = p2a2 + l) + (l - p22 +1)-[p(2a-2b )+2b]2 . ,1 lil... h... 2a = 10; 2b = 12; p = 0,1 2a = 16;2b = 32; p = 0,5 Slika 12 Dva primera porazdelitve zmesi dveh Poissonovih porazdelitev [9]. 0,14 0,06 0,05 0,04 0,08 0,03 0,06 0,02 0,04 0,01 0,02 0,00 0,00 k k 46 Vidmar G: Poissonova porazdelitev - osnove, uporaba, nadgradnja Z interaktivnim izračunom in prikazom na 14. delovnem listu priloženega Excelovega delovnega zvezka lahko ugotavljamo, kako se spreminja oblika porazdelitve C za različne kombinacije vrednosti Aa (dopuščen je vnos med 0 in 20), AB (med 0 in 40) in p . Na sliki 12 sta prikazana primera, ki ilustrirata, da postaja z manjšanjem razlike med Aa in AB porazdelitev zmesi unimodalna (zlasti, če je p blizu 0 ali 1), z večanjem razlike med Aa in AB pa vse bolj izrazito bimodalna (zlasti pri p « 0,5). Modus porazdelitve zmesi ni analitično izračunljiv, zato ga je potrebno ugotoviti s pregledom P (k) za možni razpon modalnega k , ki je med round (min (Aa ,Ab ))-1 in round (max (Aa , Ab))+1. Zmes dveh (ali nekaj) Poissonovih porazdelitev je najpreprostejši primer rezultata nehomogenega Poissonovega procesa, tj. Poissonovega procesa, ki se mu parameter A s časom spreminja. Taki procesi se sicer uporabljajo kot modeli številnih stohastičnih pojavov, npr. klicev v klicni center za nujno pomoč ali priletov letal v zračni prostor določenega letališča (kjer se gostota toka spreminja tekom dneva, pa tudi sezonsko v tednu in skozi leto). Bivariatna Poissonova porazdelitev Doslej smo se ves čas držali enorazsežnega sveta in obravnavali le enorazsežne slučajne spremenljivke. Seveda pa obstaja tudi dvorazsežna Poissonova porazdelitev, tj. skupna porazdelitev dveh Poissonovih slučajnih spremenljivk. Če imamo tri Poissonove slučajne spremenljivke (X0,X1,X2 s parametri A0, Aj, A2) in jih seštejemo v dve novi slučajni Poissonovi spremenljivki X = X + x0 7 = X2 + X0 , je skupna porazdelitev teh dveh spremenljivk bivariatna Poissonova (X, 7 )~ BP (A, ¿2, A ) z verjetnostno funkcijo P(X = x,7 = y ) = = e -(VA+a )AL Aimi|,y) (x y y ^ 1 A 1 Robni porazdelitvi sta X ~ Pois(A1 + A0 ) in Y ~ Pois(A2 + A0 ), kovarianca X in Y pa je A0 . Bivariatna Poissonova porazdelitev je uporabna kot model za napovedovanje športnih izidov, zlasti nogometnih tekem (kjer števili zadetkov, ki ju dosežeta moštvi na tekmi, med seboj nista neodvisni).39 Za napovedovanje modeliranje (in napovedovanje) športnih izidov je pomembna tudi porazdelitev razlike med X in Y . Verjetnostna funkcija spremenljivke Z = X - Y , ki predstavlja verjetnost za zmago (oziroma neodločen izid ali poraz) z določeno razliko zadetkov, je neodvisna od A0 in lažje izračunljiva (če uporabimo prilagojeno Besselovo funkcije prve vrste reda z , Iz; BESSELI v Excelu). Porazdelitev, ki jo dobimo, je znana kot Skellamova porazdelitev: P(Z = z ) = e(f)Z'2 Iz (2A2). [10] V A2 ) Ge postavimo z = 0 , dobimo z obrazcem [10] verjetnost neodločenega izida glede na pričakovano število zadetkov (kar pomeni "moč") obeh moštev. Ge obdržimo konstantno moč nasprotnega moštva (A2 , tj. pričakovano število zadetkov, ki jih bo prvo moštvo prejelo), pa dobimo z obrazcem [10] verjetnosti za posamezne razlike v zadetkih glede na moč prvega moštva (Aj, tj. pričakovano število zadetkov, ki jih bo doseglo prvo moštvo). Ta dva trirazsežna grafikona, izdelana s 15. delovnim listom priloženega Excelovega delovnega zvezka, sta prikazana na slikah 13 in 14. • Na sliki 13 vidimo, da je verjetnost neodločenega izida manjša pri večjem pričakovanem številu zadetkov, in manjša pri Informatica Medica Slovenica 2012; 17(2) 47 večji razliki v moči med moštvoma. Porazdelitev "deluje" tudi za robni primer, ko sta obe povprečji 0, saj je tedaj neodločen izida neizbežen (P = l). • Na sliki 14 je primer (22 = 4) ,ki da med možnostmi v delovnem zvezku (za 22 lahko izberemo vrednost 1, 2, 3 ali 4; 21 je tabelirana od 1 do 6, z pa od -2 do 3) najnižje vrednosti P . Pri manjših vrednostih 22 se vrh pomakne proti levemu zgornjemu kotu slike in največji P naraste do 0,3. Slika 13 Verjetnost neodločenega izida (P) med nogometnima moštvoma glede na povprečno število zadetkov, ki jih dosegata na tekmo (21, 22; Skellamova porazdelitev). Slika 14 Verjetnost izida (P) z razliko v zadetkih z med nogometnim moštvom, ki v povprečju dosega 21 zadetkov, in moštvom, ki v povprečju dosega 4 zadetke na tekmo (Skellamova porazdelitev). Tako kot do običajnih (enorazsežnih) porazdelitev vodijo običajni slučajni processi, vodijo do večrazsežnih porazdelitev slučajna polja (ang. random fields). To zelo zahtevno in hkrati široko uporabno področje se je močno razvilo v zadnjih letih (npr. na področju slikanja možganov oziroma nevroznanosti, matematičnih modelov v ekologiji in računalniške grafike). Tu ga omenimo zaradi zanimive uporabe dvorazsežnih Poissonovih slučajnih polj na področju tekstilne tehnologije, kjer so z njimi razrešili zapleteni (tudi dobesedno) problem števila križanj vlaken v netkanih mrežah vlaken.58 Posplošitev bivariatne na skupno porazdelitev več Poissonovih slučajnih spremenljivk je večrazsežna Poissonova porazdelitev. Že bivariatna je dovolj zapletena in zahtevna, zato verjetnostne funkcije za multivariatno Poissonovo porazdelitev sploh ne bomo zapisali (in itak ni primerna za izračun, ocenjevanje njenih parametrov pa je še težje). A kljub temu ji je sodobna statistika kos — ne le posamezni, pač pa tudi zmesem večrazsežnih Poissonovih porazdelitev, ki se uporabljajo npr. za združevanje v skupine (clustering). Primer s področja trženja je prepoznavanje tipov kupcev glede na to, koliko izdelkov katere vrste kupijo, pri čemer je število kupljenih izdelkov posamezne vrste ob enem obisku trgovine Poissonovo porazdeljeno.28 Najpreprostejši statistični test Vrnimo se k preprostejšim problemom in si oglejmo primerjavo dveh ocenjenih Poissonovih parametrov na najpreprostejši način. Na področju biomedicine je sicer pereč problem nepotrebna uporaba starejših (predračunalniških) biostatističnih metod in zaostanek raziskovalne prakse za statističnimi dognanji se iz dneva v dan povečuje, a v tem primeru je drugače. Izkazalo se bo namreč, da je metoda, ki jo nekateri imenujejo najpreprostejši statistični test, presenetljivo praktično uporabna. 48 Vidmar G: Poissonova porazdelitev - osnove, uporaba, nadgradnja Najpomembnejši izid (ang. primary outcome) v številnih raziskavah v medicini, zlasti kliničnih poskusih, je izid bolezni. Praviloma gre za to, ali se je izbrani dogodek (npr. ozdravitev) zgodil ali ne. Predstavljajmo si randomiziran (to pomeni, da so udeleženci v eksperimentalne pogoje oziroma skupine razporejeni po naključju) klinični poskus z dvema (vsaj približno) enako velikima skupinama udeležencev, v katerem je izid, ki nas zanima, določen klinični dogodek. Za naš test moramo poznati le število udeležencev, ki jih je doletel dogodek — v eni skupini x, , v drugi pa x2 . Skupini sta zaradi randomizacije neodvisni. Tedaj lahko testno statistiko za primerjavo med skupinama (natančneje: testiranje ničelne domneve o enaki pogostnosti dogodka v obeh populacijah, iz katerih smo vzorčili skupini) izračunamo po preprostem obrazcu61 vedno vzamemo večje izmed obeh števil dogodkov, s čimer se izognemo negativnim vrednostim z . Če sta x1 in x2 enaka, pa seveda brez računanja sklenemo, da ničelno domnevo obdržimo (p = 1). Poudariti je potrebno, da informacija znotraj vsake skupine leži le v števcu deleža dogodkov, torej zgolj v številu udeležencev z dogodkom. Imenovalec ni pomemben — vseeno je, ali smo isto število dogodkov opazili v poskusu z večjima ali z manjšima skupinama. Od števila dogodkov pa je odvisna moč testa, ki je seveda večja pri večjem številu dogodkov. Poleg tega je test seveda pristranski, če se imenovalca deležev (t.j. velikosti skupin, ki ju primerjamo) nezanemarljivo razlikujeta.45 Če je pogostnost dogodkov velika, postane test konservativen — daje vrednosti p, ki so večje, kot bi morale biti. i [11] x, + x „ Izpeljava je prav tako preprosta: • najboljša cenilka razlike med populacijskima povprečjema je razlika vzorčnih povprečij; • varianca razlike dveh neodvisnih slučajnih spremenljivk je vsota njunih varianc; • varianca Poissonove slučajne spremenljivke je enaka njenemu povprečju [2]. Dobljena vrednost z se pod ničelno domnevo, da imata obe zdravljenji enak učinek na tveganje za nastop dogodka, porazdeljuje približno po standardni normalni porazdelitvi, tj. Gaussovi porazdelitvi s povprečjem 0 in varianco 1. Izračun je še preprostejši — zanj zadošča že računalo, ki je vgrajeno v vsak pametni telefon. Ker gre za približen test, ga lahko dodatno poenostavimo tako, da iskanje po statističnih tabelah oziroma klikanje nadomestimo s pravilom, da razlika po vsej verjetnosti ni slučajna, če smo (pri dvosmernem testiranju) dobili z večji od 2 (oziroma manjši od —2). Še preprosteje je, če za x1 Kljub približnosti in omejitvam daje test v praksi večinoma zanesljive rezultate. Pri randomizaciji je namreč število udeležencev v obeh skupinah praviloma (skoraj) enako, kar velja tudi za čas spremljanja. Pogostnost kliničnega dogodka je praviloma majhna (manjša od 20%, pogosto pa še mnogo manjša), torej lahko predpostavimo, da se število udeležencev v izbrani skupini, ki jih doletel dogodek, porazdeljuje po Poissonovi porazdelitvi. Če skupno število dogodkov (x1 + x2 j ni premajhno (zadošča že okoli 20), približek z normalno porazdelitvijo dobro deluje. Pogosto ta preprosti test vodi do praktično popolnoma enakih sklepov kot bolj zapleteni statistični testi oziroma modeli.49 Tak primer je randomizirana študija učinkovine moksonidin v primerjavi s placebom pri srčnem popuščanju (objavljena leta 2004), pri kateri so preučevali umrljivost. Ob vmesni analizi je med 1860 pacienti prišlo do 46 smrti v skupini z moksonidinom in 25 smrti v skupini s placebom. Vrednost z = (46 - 25)/7(46 + 25j = 2,49 ^ p = 0,013 nudi močan dokaz za večjo umrljivost v skupini z monksonidinom. Zaradi tega ključnega podatka so klinični poskus predčasno ustavili. Z vključenimi dodatnimi 73 pacienti in skupaj 15 smrtmi so v končni analizi primerjali 54 smrti pri z = Informatica Medica Slovenica 2012; 17(2) 49 monksonidinu z 32 pri placebu in s testom log rank (za primerjavo preživetja — za krnjene podatke) dobili praktično enako statistično značilnost (p = 0,012j .V tovrstnih študijah je za vmesno analizo pogosto nemogoče veljavno uporabiti metode analize preživetja, saj za nekatere udeležence sploh ni na voljo podatka o zadnjem datumu od vključitve, ko so bili še živi, zato je preprosti test še posebej priročen. Podobno se je izkazalo v metaanalizi šestih študij revaskularizacije (objavljeni leta 2000). Študije so primerjale stente, ki izpirajo sirolimus ali paklitaksel. Grobo združeni podatki o 3669 pacientih iz vseh šestih študij skupaj so pokazali, da je do revaskularizacije prišlo pri 95 pacientih v skupini s sirolimusom in 142 pacientih v skupini s paklitakselom. S preprostim testom dobimo z = (142 - 95j(142 + 95j = 3,05 ^ p = 0,002 . Rezultat se praktično povsem ujema z objavljenim stratificiranim testom Mantela in Haenszela, s katerim so dobili p = 0,001. Geprav ne upoštevamo imenovalcev deležev v posameznih študijah in na "primitiven" način združimo vse podatke, nam da t.i. najpreprostejši test vseeno ustrezen odgovor. Omenimo še, da lahko iz istovrstnih podatkov oziroma predpostavk kot za najpreprostejši test pridemo tudi do McNemarjevega testa razlike med odvisnima deležema, ki je številsko ekvivalenten. McNemarjev test izhaja iz dejstva, da se pod ničelno domnevo število dogodkov, ki od danega skupnega števila dogodkov odpade na vsako od skupin, porazdeljuje kot binomska slučajna spremenljivka z verjetnostjo posameznega dogodka 0,5. Testna statistika McNemarjevega testa je kvadrat obrazca [11]. Ekvivalentnost obeh testov uvidimo, če upoštevamo normalno porazdelitev kot asimptotični približek binomske ter vemo, da za kvadrat standardno normalno porazdeljene slučajne spremenljivke velja porazdelitev j2 z eno prostostno stopnjo. Poissonova regresija Področje statistike, kamor spada Poissonova regresija, so posplošeni linearni modeli (ang. generalised linear models).33 Ker je zelo obsežno in matematično zahtevno, se ga bomo tu le dotaknili. Kot vsak regresijski model je tudi Poissonov lahko preprost, torej z eno neodvisno spremenljivko (prediktorjem, napovednim dejavnikom), ali multipli (z več neodvisnimi spremenljivkami); tu bomo zaradi splošnosti obravnavali slednjega. Seveda so lahko Poissonovi (in sorodni) regresijski modeli tudi multivariatni, kar pomeni, da napovedujemo multivariatno Poissonovo (ali sorodno) porazdeljeno skupino spremenljivk, a tako zapletenih stvari se ne bomo niti dotaknili. Uvodoma povejmo še, da se — kot pri vseh posplošenih linearnih modelih — pri Poissonovi regresiji parametre (tj. regresijske koeficiente) ocenjuje po metodi največjega verjetja. Poissonov regresijski model predpostavlja, da je vzorec n vrednosti (opazovanj) yi vzet iz medsebojno neodvisnih Poissonovih slučajnih spremenljivk Yi s povprečji u . Očitno je, da za tak model predpostavka običajne linearne regresije o enakosti varianc med opazovanji (t.i. homoscedastičnosti) ne drži, saj je za vsako Yi varianca enaka njenemu povprečju. Zato je za napoved yi na podlagi vektorja vrednosti neodvisnih spremenljivk xi (ki vsebuje dodatno vrednost 1 zaradi regresijske konstante, ki je dodatna vrednost v vektorju regresijskih koeficientov P) ustreznejši model log) = xT p . [12] Pri Poissonovi regresiji gre torej za posplošeni linearni model z logaritemsko vezjo (ang. link function) in Poissonovo porazdeljeno napako. Ge obrazec [12] preuredimo z eksponentno funkcijo na obeh straneh enačaja, uvidimo, da gre za multiplikativen model. Povečanje neodvisne spremenljivke x}- za eno enoto prinese množenje Pj y j z e 1 : H = e P 50 Vidmar G: Poissonova porazdelitev - osnove, uporaba, nadgradnja Podatki, za katere je primerna Poissonova regresija, so pogosto na voljo le v združeni (agregirani) obliki. A to ne predstavlja težave, saj lahko zaradi lastnosti [3] podatke analiziramo bodisi v posamični (individualni, kakršne smo navajeni v uporabni statistiki), bodisi v združeni obliki. To si najlažje pojasnimo s primerom. Denimo, da imamo podatke o skupnem številu otrok po skupinah mater, ki so definirane glede na trajanje zakonske zveze (0-4 leta, 5-9 let itd.), okolje bivanja (urbano ali ruralno) in izobrazbo matere (stopnje od I do IX). Z Yi]kl označimo število otrok, ki jih je rodila l-ta mati v skupini (i; j;k), pri čemer i označuje trajanje zakonske zveze, j okolje bivanja in k stopnjo izobrazbe. Oznaka Yijk• jYijkl torej označuje skupno število otrok v posamezni celici tabele s podatki. Če je vsako posamezno opazovanje (tj. število otrok dane matere) realizacija Poissonove slučajne spremenljivke s povprečjem /uijk , je skupinska vsota realizacija Poissonove slučajne spremenljivke s povprečjem nijk/uijk , pri čemer je nijk število mater v ustrezni skupini, tj. celici (i; j; k) v podatkovni tabeli. V Sloveniji smo Poissonovo regresijo za agregirane podatkov uporabili npr. pri analizi povezanosti prezgodnje umrljivosti (smrti so redke, t.i. prezgodnje — tj. tiste pred starostjo za upokojitev — še bolj, živih ljudi pa je tudi v majhni Sloveniji dovolj, da s statističnega vidika predstavljajo zelo veliko množico) s socioekonomskimi dejavniki (regija, zakonski stan, materni jezik, stopnja izobrazbe).25 Nadaljevali ne bomo, saj si Poissonova regresija zasluži svoje gradivo. Omenimo le še njene razširitve oziroma alternative za primer pod-oziroma nadrazpršenosti odvisne spremenljivke. Prva možnost je regresijski model za napoved spremenljivke, ki ustreza Poissonovi porazdelitvi, le da ne more zavzeti vrednosti nič (ki je "odrezana" — ang. zero-truncated Poisson model). Druga možnost je negativna binomska regresija, o kateri je lani izšla obsežna monografija.36 Tretja možnost je COM-Poissonova regresija, ki je v zadnjih letih zelo "vroča" statistična tema zlasti tam, kjer gre za izredno množične pojave, s katerimi je povezano izredno veliko denarja, npr. spletno oglaševanje (modeliranje števila obiskov spletnih strani), nakupovalne centre (modeliranje števila kupcev) ali spletne dražbe (modeliranje števila dražiteljev).56 Za konec dodajmo, da spada Poissonova porazdelitev v široko družino Tweediejevih porazdelitev, ki kot posebne primere združuje različne zvezne (npr. normalno in gama) in diskretne porazdelitve (npr. Poissonovo) in se uporablja kot najsplošnejša porazdelitev napovedovanega odgovora v posplošenih linearnih modelih. Kontrolne karte Kontrolne karte (in celotno področje statističnega nadzora procesov oziroma kakovosti — ang. s kratico SPC oziroma SQC) po eni strani ne sodijo v "glavni tok" verjetnosti in statistike (in potemtakem tudi ne v to gradivo), po drugi strani pa bi jih mirne duše lahko umestili že v razdelek o grafičnem preverjanju ujemanja podatkov s Poissonovo porazdelitvijo. Na koncu gradiva jih obravnavamo kot kompromis med tema pogledoma, pa tudi zato, da z vidika matematične zahtevnosti zaključimo nekoliko bolj lahkotno. S Poissonovo porazdelitvijo sta povezni dve od osnovnih (Shewhartovih) kontrolnih kart za atribute (ang. attributes control charts): c-karta in u-karta. C-karta je namenjena nadzoru števila (ang. count) okvar (defektov, odstopanj od specifikacij). Za razliko od p-karte (za delež okvarjenih enot) dopušča več okvar na enoto, po drugi strani pa zahteva stalno velikost vzorca (za razliko od p-karte ali u-karte), da je središčna črta lahko konstantna. Primerna je za podatke, ki nastajajo s Poissonovim procesom (npr. število izdelkov, vrnjenih v trgovino zaradi reklamacije, na dan). Za vsak vzorec zabeležimo stopnjo (ang. rate) okvar Cj (ki je število okvar v izbrani enoti pregleda; enota pregleda je navadno en izdelek, lahko pa tudi več izdelkov). Središčna črta grafikona je pri vrednosti C , ki je bodisi v naprej znana bodisi jo izračunamo kot povprečje vrednosti cj . Ker predpostavimo Poissonovo porazdelitev podatkov, je standardni odklon Informatica Medica Slovenica 2012; 17(2) 51 števila okvar yfč , torej narišemo 3