Kompyuter simulyatsiyasi nima?

Kompyuter simulyatsiyasi - bu statistik amaliyotga rahbarlik qilish uchun tez -tez ishlatiladigan kuchli vosita. Simulyatsiyalar bizga murakkab tizimlarni tushunish imkonini beradi, ularning xatti -harakatlarini nazariy jihatdan bashorat qilish juda murakkab. Masalan, statistiklar statistik testni idealizatsiya qilingan ma'lumotlarga (masalan, odatda taqsimlangan, etishmayotgan va mukammal o'lchangan) qanday bajarilishini matematik tarzda ishlab chiqishlari mumkin, lekin ular testning notinch, real holatida ishlashini bashorat qilish uchun simulyatsiyaga muhtoj bo'lishi mumkin. dunyo ma'lumotlari. Simulyatsiyalar murakkab matematik derivatsiyalardan qochganligi uchun ular intuitiv, bajarilishi oson va tushunarli. Afsuski, ko'pgina klinik tadqiqotchilar kompyuter simulyatsiyasi va uning ko'pgina ilovalari bilan deyarli tanish emaslar. Ushbu maqola kompyuter simulyatsiyasi qanday ishlashini va nima uchun foydali ekanligini ko'rib chiqadi.

Kompyuter simulyatsiyasi haqida umumiy ma'lumot

  • 1. O'zgaruvchilarning taqsimlanishi va o'zaro bog'liqligi kabi ma'lumotlarning xususiyatlarini ko'rsating.
  • 2. N o'lchamdagi virtual ma'lumotlar to'plamini yaratish uchun ushbu taqsimotlardan tasodifiy qiymatlarni yarating (yoki yuklashda bo'lgani kabi mavjud ma'lumotlardan tasodifiy namuna oling).
  • 3. Virtual ma'lumotlar to'plami bo'yicha statistik test o'tkazing.
  • 4. Tasodifiy o'zgarishning ta'sirini olish uchun (1) - (3) bosqichlarni o'zboshimchalik bilan ko'p marta (masalan, 1000) takrorlang.
  • 5. Muayyan statistik savolga javob berish uchun simulyatsiya qilingan natijalarni umumlashtiring.

Kompyuter simulyatsiyasi ko'plab ilovalarga ega, jumladan: (1) statistik testlarning mustahkamligini nodavlat sharoitda tekshirish; (2) muqobil statistik yondashuvlar samaradorligini solishtirish; (3) statistik bahslarga javob berish; (4) namuna hajmi va statistik kuchini hisoblash; (5) haqiqiy bo'lmagan ma'lumotlar uchun Pqiymatlari va ishonch intervallarini hisoblash ; (6) statistik tushunchalarni o'rgatish; va (7) statistik sezgini rivojlantirish. Qachonki men yangi statistik testni o'tkazmoqchi bo'lsam yoki tanish testni yangi usulda qo'llasam, men birinchi navbatda kompyuter simulyatsiyasini ishlataman, bu statistikaning e'lon qilinganidek ishlashiga ishonch hosil qilish va test haqidagi sezgiimni rivojlantirish uchun. Quyida kompyuter simulyatsiyasining foydaliligini ko'rsatadigan 3 ta aniq misol keltirilgan.

1 -misol: ehtimollarni hisoblash

  • 1. 0 dan 1 gacha bo'lgan tasodifiy sonni yarating. Agar bu raqam 0,5 dan kam bo'lsa, natija boshlar; agar 0,5 dan katta bo'lsa, natija quyruq bo'ladi. 100 ta tanga tashlashni simulyatsiya qilish uchun bu jarayonni 100 marta takrorlang. 100 ta zarbadan boshlar sonini yozib oling.
  • 2. (1) qadamni 100000 marta takrorlang.
  • 3. Natijasi 40 boshdan kam yoki 60 boshdan ortiq bo'lgan 100000 dan necha marta hisoblang. Natijalarni grafik tarzda tekshiring (1 -rasm).

Ushbu gistogramma kompyuter simulyatsiyasi natijalarini ko'rsatadi, ular 100 ta tanga tashlashda kutilgan boshlar sonini o'rganadi. Kompyuter bir necha bor 100 ta virtual tanga tashlashda boshlar sonini qayd etdi. Kutilganidek, 50 boshi eng keng tarqalgan natija bo'lib, 100000 yugurishning 8016 tasida yoki taxminan 8% ni tashkil qiladi.

Men simulyatsiyani 100 000 marta takrorlashni tanladim. Takrorlashlar soni hodisaning uzoq davom etadigan xatti-harakatlarini aks ettirish uchun etarlicha katta bo'lishi kerak, lekin u shunchalik katta emaski, u mening kompyuterimni o'chirib qo'yadi. Men bu oddiy simulyatsiyani ish stoli kompyuterimda 1 soniyadan kamroq vaqt ichida 100000 marta ishga tushirishim mumkin. Aksincha, simulyatsiyani 100 million marta takrorlash, natijalarni sezilarli darajada o'zgartirmasdan, ishlov berish vaqtini 10 daqiqagacha oshiradi. Keyinchalik murakkab simulyatsiyalar uchun, quyida keltirilgan 2 va 3 -misollarda, men odatda kompyuterda ishlash vaqtini qisqartirish uchun takrorlashlar sonini 1000 ga kamaytiraman.

1 -rasmda mening simulyatsiya natijalarim ko'rsatilgan. Kutilganidek, eng keng tarqalgan natija 50 bosh edi. Bu natija 100000 marta 8016 marta yoki 8,016% sodir bo'lgan. Bizning qiziqishimiz - 40 dan kam yoki 60 dan ortiq bosh - 3512 marta yoki 3,512%. Shunday qilib, bu natijani olishning empirik ehtimoli 3,512%ni tashkil qiladi. Bu empirik ehtimollik nazariy ehtimollik 3,52%ga juda yaqin, men buni matematik hisobladim. Ko'p takrorlash bilan bizning empirik ehtimolligimiz aniqlik oshib borishi bilan nazariy ehtimollikka yaqinlashadi (masalan, 100 million takrorlash bilan empirik ehtimollik 3,522%).

2 -misol: Namuna hajmini yoki quvvatini hisoblash

Tadqiqotchilar, mavjud formulalar va onlayn kalkulyatorlar yordamida oddiy tadqiqotlar uchun, masalan, 2 guruhli oddiy taqqoslashlar uchun, namuna hajmini yoki statistik kuchini hisoblashlari mumkin. Biroq, murakkabroq dizayn loyihalari yanada murakkab hisob -kitoblarni talab qiladi. Yaxshiyamki, kompyuter simulyatsiyasi 1 yordamida quvvat va namuna hajmini baholash oson. Quvvat - bu ta'sir haqiqiy bo'lsa, statistik jihatdan muhim natijaga erishish ehtimoli, uni statistik ahamiyatga ega bo'lgan simulyatsiya qilingan tadqiqotlarning foizi sifatida baholash mumkin.

  • 1.
  • Amalga oshirish tafsilotlari:Har bir virtual ob'ektning ikkilamchi ekspozitsiyasi bor yoki yo'qligini aniqlash uchun virtual tanga aylantiring. Har bir sub'ektning doimiy ta'sir qilish qiymatini aniqlash uchun standart oddiy taqsimotdan tasodifiy sonni yarating.
  • Amalga oshirish tafsilotlari:Har bir sub'ektning natija qiymatini (a) ularning ekspozitsiya qiymatlari, (b) natijaga ta'sir qilish uchun 2 ta ta'sir bir -biri bilan qanday ta'sir qilishi haqidagi taxminlarga va (v) tasodifiy tasodifga asoslanib yarating.
  • Amalga oshirish tafsilotlari:2 ta ta'sir qilish o'zgaruvchisi o'rtasidagi o'zaro ta'sir muddatini o'z ichiga olgan chiziqli regressiya modelini o'rnating. Agar o'zaro ta'sir muddati uchun Pqiymati
  • Amalga oshirish tafsilotlari:(1) dan (3) gacha bo'lgan amallarni 1000 marta takrorlang.
  • Amalga oshirish tafsilotlari:O'zaro ta'sir muddati muhim bo'lgan 1000tadan virtual tadqiqotlar sonini hisoblang.
  • Amalga oshirish tafsilotlari:N = 100, N = 150, N = 200, N = 250 va shunga o'xshash N = 1000 gacha bo'lgan namunaviy o'lchamlar uchun (1) dan (5) gacha bo'lgan qadamlarni takrorlang.
  • Amalga oshirish tafsilotlari:Zaif, o'rtacha va kuchli o'zaro ta'sirlarni nazarda tutgan holda (1) - (6) bosqichlarni takrorlang.

Ushbu simulyatsiya uchun men kompyuterda ishlashini ta'minlash uchun takroriy sonini 1000 bilan chekladim. 2 -rasmda natijalar grafik tarzda ko'rsatilgan. O'zaro ta'sir kuchliroq bo'lsa, bu o'zaro ta'sirni aniqlash uchun kamroq ishtirokchilar kerak bo'ladi. Namunaviy o'lchami N = 50 bo'lgan zaif o'zaro ta'sir (ko'k yulduzlar) uchun, 1000 ta virtual tadqiqotlarning 101 tasida o'zaro ta'sir muddati muhim edi. Bu topilma bizga shuni ko'rsatadiki, ushbu stsenariy bo'yicha statistik kuch atigi 10,1%. Zaif o'zaro ta'sirlar uchun (ko'k yulduzlar), biz 600% namuna olmagunimizcha, 80% quvvatga erisha olmaymiz. O'rtacha ta'sir effekti uchun (yashil uchburchaklar), 80% quvvatga erishish uchun 400 ishtirokchi kerak; kuchli ta'sir o'tkazish effekti uchun (qizil doiralar) atigi 200 ta ishtirokchi kerak.

Bu grafik mumkin bo'lgan namuna o'lchamlari (N = 50 dan N = 1000 gacha) va 3 ta o'zaro ta'sir kuchlari (kuchli, o'rtacha va zaif) uchun statistik quvvatni baholash uchun simulyatsiya natijalarini ko'rsatadi. Ampirik kuch virtual tadqiqotlar foizi sifatida hisoblanadi (1000 ta), bunda o'zaro ta'sir statistik ahamiyatga ega bo'ldi. O'zaro ta'sir kuchliroq bo'lganda, o'zaro ta'sirni aniqlash uchun kamroq ishtirokchilar kerak bo'ladi.

3-misol: Statistik yondashuvning haqiqiy dunyodagi cheklanishlarini sinab ko'rish

Kompyuter simulyatsiyasi, shuningdek, real ma'lumotlarga nisbatan statistik yondashuvlar qanday ishlashi haqidagi savollarga javob berishi mumkin. Masalan, tadqiqotchilar tez -tez regressiyani muhim chalkash o'zgaruvchilarni statistik jihatdan to'g'rilash uchun ishlatishadi, lekin agar o'zgaruvchilar nomukammal o'lchangan bo'lsa, buning natijasida ba'zi qoldiq yoki "qoldiq" birikmalar paydo bo'ladi. Muhim savollardan biri: qoldiq aralashmalar qanchalik katta ta'sir ko'rsatishi mumkin? Kompyuter simulyatsiyasi ilgari bu savol 2 ga javob berish uchun ishlatilgan va bu kompyuter simulyatsiyasi qanday ishlashini ko'rsatish uchun ajoyib misol bo'ladi.

  • 1.
  • Amalga oshirish tafsilotlari:tasodifiy normal taqsimotdan 100 ta qiymat hosil qiling.
  • Amalga oshirish tafsilotlari:Har bir sub'ektga, ehtimol , aralashtiruvchi uchun ushbu sub'ekt qiymatining funktsiyasi bo'lgan Pehtimolini belgilang. O'zgaruvchan o'zgaruvchining yuqori darajalari P.uchun yuqori qiymatlarga aylanadi, bu ob'ekt ta'sir qilish ehtimoli va natijaga ega bo'lish ehtimoli.
  • Amalga oshirish tafsilotlari:0 dan 1 gacha bo'lgan tasodifiy sonni yarating. Agar qiymat Pdan kichik bo'lsa , u holda ob'ekt ta'sir qiladi (ta'sir qilish = 1); agar qiymat Pdan katta bo'lsa ,u holda ob'ekt ta'sir qilmaydi (ta'sir qilish = 0). Natija uchun takrorlang.
  • Amalga oshirish tafsilotlari:(1) dan (3) gacha bo'lgan amallarni 1000 marta takrorlang.
  • Amalga oshirish tafsilotlari:1000 ta simulyatsiya qilingan ma'lumotlar to'plamida 1000 ta ekspozitsiya-natija koeffitsientini yaratish uchun 1000 ta logistika regressiyasini ishga tushiring. Oddiy koeffitsient nisbati uchun bitta qiymatni olish uchun natijalarni o'rtacha. Aralashtiruvchini to'g'rilamaslik, aralashtiruvchini doimiy o'zgaruvchi sifatida o'zgartirish va ikkilamchi o'zgaruvchi sifatida sozlashni ta'sirini o'rganing.
  • Amalga oshirish tafsilotlari:(1) dan (5) gacha bo'lgan qadamlarni 10 marta takrorlang. Har safar, aralashtiruvchi va ta'sirchan munosabatlarning kuchini oshirish uchun , aralashtiruvchi va P nibog'laydigan funktsiyani o'zgartiring .

3 -rasmda simulyatsiya natijalari ko'rsatilgan. Biz chalkashliklarni (qizil nuqta) moslashtirmaganimizda, biz ta'sir qilishning natijasi bilan aralashtirish kuchiga mutanosib bo'lgan soxta aloqalarni kuzatamiz. Biz o'zgaruvchini doimiy o'zgaruvchi sifatida o'zgartirganda (ko'k yulduzlar), biz chalkashlik ta'sirini butunlay olib tashlaymiz, natijada ta'sir va natija o'rtasida hech qanday bog'liqlik yo'q (odds nisbati = 1.0). Biroq, biz ikkilamchi o'zgaruvchiga (yashil uchburchaklar) moslashganda, biz aralashtirish kuchiga qarab 1,0 dan 1,8 gacha bo'lgan koeffitsientlarni kuzatamiz, bu bizga qoldiq aralashuvning potentsial ta'sirini sezadi. Haddan tashqari holatda, biz 1,8 ga teng bo'lgan soxta koeffitsientlarni kuzatishimiz mumkin edi, lekin qoldiq chalkashliklar bundan kattaroq ta'sirlarni tushuntirishi dargumon.Bu ma'lumotlar aniq bo'lmagan o'lchovlar bilan tadqiqotlarni talqin qilishda yordam beradi. O'quvchilar 1,8 dan past bo'lgan koeffitsientlar uchun qoldiqlarni aralashtirishning rolini diqqat bilan o'ylab ko'rishlari kerak, lekin ishonish mumkinki, 1,8 dan yuqori bo'lgan koeffitsientlar qoldiq aralashtirish bilan izohlanmaydi.

Qoldiq aralashuvning ekspozitsiya-natija nisbati ta'sirini o'rganadigan simulyatsiya natijalari. Natijalar 10 darajali chalkashlik uchun ko'rsatiladi (zaif aralashishdan juda kuchli aralashtirishgacha). Qizil nuqta sozlanmagan natijalarni ko'rsatadi; yashil uchburchaklar ikkilamchi o'zgaruvchi sifatida aralashtiruvchini sozlash ta'sirini ko'rsatadi; va ko'k yulduzlar o'zgaruvchini doimiy o'zgaruvchi sifatida sozlash ta'sirini ko'rsatadi. Qoldiqlarni aralashtirish (yashil uchburchaklar) 1,8 ga teng bo'lgan yolg'on koeffitsientlarni ishlab chiqardi. Bu natija shuni ko'rsatadiki, o'quvchilar kuzatuv tadqiqotlarida 1,8dan past koeffitsientlar bilan uchrashganda ehtiyot bo'lishlari kerak, chunki qoldiq chalkashliklar natijasida bu katta koeffitsientlarni olish mumkin.

Xulosa

Har doim ortib borayotgan hisoblash kuchi ko'plab statistik savollarga matematik nazariya emas, balki kompyuter simulyatsiyasi orqali javob berishga imkon berdi. Klinik tadqiqotchilar ushbu kuchli va ko'p qirrali vositadan xabardor bo'lishlari kerak. Klinik tadqiqotlar bilan bog'liq ko'plab statistik hujjatlar kompyuter simulyatsiyasini o'z ichiga oladi; va bu maqolalar ko'pincha minimal statistik va matematik tayyorgarlikka ega bo'lgan tadqiqotchilar uchun ochiqdir. Simulyatsiyalar, shuningdek, klinik tadqiqotchilar uchun ko'plab amaliy qo'llanmalarga ega, shu jumladan PM&Rda statistik quvvatni hisoblash, chalkashliklar yoki yo'qolgan ma'lumotlarning potentsial ta'sirini o'lchash va statistikani o'rganish. Statistik simulyatsiyani amalga oshirishdagi to'siqlar ham past - faqat SAS yoki R kabi statistik paket va bir necha qatorli kod kerak.Kompyuter simulyatsiyasini loyihalashtirish yoki uni Rda qanday amalga oshirish haqida ko'proq ma'lumot olish uchun mos ravishda 3 yoki 4, 3, 4 -bandlarga qarang.