Regressiya koeffitsientlarini talqin qilish

Chiziqli regressiya eng ommabop statistik usullardan biridir.

Mashhurligiga qaramay, eng oddiy modellardan har qandayining regressiya koeffitsientlarini talqin qilish ba'zan qiyin ....

Shunday qilib, doimiy va kategorik o'zgaruvchining koeffitsientlarini sharhlaylik. Bu erda misol chiziqli regressiya modeli bo'lsa-da, yondashuv har qanday regressiya modelidan koeffitsientlarni o'zaro ta'sirisiz, shu jumladan logistik va mutanosib xavflar modellarini talqin qilish uchun ishlaydi.

Ikkita taxminiy o'zgaruvchiga ega bo'lgan chiziqli regressiya modeli quyidagi tenglama bilan ifodalanishi mumkin:

Modeldagi o'zgaruvchilar quyidagilar:

  • Y, javob o'zgaruvchisi;
  • X 1 , birinchi bashorat qiluvchi o'zgaruvchi;
  • X 2 , ikkinchi bashoratchi o'zgaruvchi; va
  • e, qoldiq xatosi, bu o'lchovsiz o'zgaruvchidir.

Modeldagi parametrlar:

  • B 0 , Y-kesish;
  • B 1 , birinchi regressiya koeffitsienti; va
  • B 2 , ikkinchi regressiya koeffitsienti.

Bir misol, tuproqdagi bakteriyalar miqdori (X 1 ) va o'simlik qisman yoki to'liq quyoshda (X 2 ) joylashganligiga qarab, butaning balandligi (Y) modeli bo'lishi mumkin .

Balandligi sm bilan, bakteriyalar ming ml tuproq uchun o'lchanadi va quyosh turi = 0, agar o'simlik qisman quyoshda bo'lsa va quyosh to'liq bo'lsa, quyosh turi = 1.

Aytaylik, regressiya tenglamasi quyidagicha baholangan:

Interceptni talqin qilish

B 0 , Y-kesishish, agar X 1 = 0 va X 2 = 0 bo'lsa, siz Y uchun bashorat qiladigan qiymat sifatida talqin qilinishi mumkin .

Tuproqda bakteriyalar bo'lmagan qisman quyoshli butalar uchun o'rtacha 42 sm balandlik kutamiz. Biroq, agar bu X 1 va X 2 ning 0 bo'lishi mumkinligi oqilona bo'lsa va agar ma'lumotlar to'plami aslida X 1 va X 2 uchun 0 ga yaqin bo'lgan qiymatlarni o'z ichiga olgan bo'lsa , bu faqat mazmunli talqin .

Agar ushbu shartlarning ikkalasi ham to'g'ri bo'lmasa, unda B0 haqiqatan ham mazmunli talqinga ega emas. Bu faqat regressiya chizig'ini kerakli joyga bog'lab qo'yadi. Bizning holatlarimizda, X 2 ba'zida 0 ga teng bo'lishini ko'rish oson , lekin agar bizning bakteriyalar darajamiz X 1 , hech qachon 0 ga yaqinlashmasa, bizning tutilishimiz haqiqiy talqin qilinmaydi.

Uzluksiz prediktor o'zgaruvchilar koeffitsientlarini talqin qilish

X yildan 1 doimiy, B 1 X har bir birligi farq Y bashorat qiymati farqni ifodalaydi : 1 , agar X 2 qoldiqlari sobit.

Bu shuni anglatadiki, agar X 1 bitta birlikdan farq qilsa (va X 2 farq qilmasa) Y o'rtacha B 1 birlikdan farq qiladi .

Bizning misolimizda, 5000 ta bakteriya hisoblangan butalar o'rtacha 4000 / ml bakteriyalarga qaraganda 2,3 sm uzunroq bo'lar edi, xuddi shu kabi 3000 / ml bakteriyalarga qaraganda 2,3 sm uzunroq bo'ladi. bir xil quyoshda.

(Shuni unutmangki, bakteriyalar soni har bir ml tuproq uchun 1000 ga teng bo'lganligi sababli, 1000 ta bakteriya X 1 ning birligini anglatadi ).

Kategorik bashorat qiluvchi o'zgaruvchilar koeffitsientlarini talqin qilish

Xuddi shunday, B 2 , agar X 1 doimiy bo'lib qolsa , X 2 ning har bir birlik farqi uchun Ydagi taxmin qilingan qiymatning farqi sifatida talqin etiladi . Biroq, X 2 0 yoki 1 deb kodlangan kategorik o'zgaruvchidir , chunki bitta birlik farqi bir toifadan ikkinchisiga o'tishni anglatadi.

B 2 - bu X 2 = 0 (mos yozuvlar guruhi) va X 2 = 1 (taqqoslash guruhi) toifasi o'rtasidagi Y ning o'rtacha farqidir .

Qisman quyoshda bo'lgan butalar bilan taqqoslaganda, biz to'liq quyoshli butalar o'rtacha 11 sm balandlikda, tuproq bakteriyalarining balandligida bo'lishini kutardik.

Prediktor o'zgaruvchilar o'zaro bog'liq bo'lganda koeffitsientlarni talqin qilish

Shuni unutmangki, har bir koeffitsientga regressiya modelidagi boshqa o'zgaruvchilar ta'sir qiladi. Bashorat qiluvchi o'zgaruvchilar deyarli har doim bog'liq bo'lganligi sababli, ikki yoki undan ortiq o'zgaruvchilar Y ning bir xil o'zgarishini tushuntirishi mumkin.

Shuning uchun, har bir koeffitsient, mos keladigan Y o'zgaruvchisining umumiy ta'sirini o'lchamaydi, agar u modeldagi yagona o'zgaruvchi bo'lsa.

Aksincha, har bir koeffitsient ushbu o'zgaruvchini modelga qo'shishning qo'shimcha ta'sirini aks ettiradi , agar modeldagi barcha boshqa o'zgaruvchilarning ta'siri allaqachon hisobga olingan bo'lsa . (Bu 3 -toifa regressiya koeffitsientlari deb ataladi va ularni hisoblashning odatiy usuli hisoblanadi. Biroq, hamma dasturlar ham 3 -turdagi koeffitsientlardan foydalanmaydi, shuning uchun siz nimani qo'lga kiritayotganingizni bilish uchun dasturiy ta'minot qo'llanmasini tekshirib ko'ring).

Bu shuni anglatadiki, modelga boshqa o'zgaruvchilar qo'shilganda yoki o'chirilganda har bir koeffitsient o'zgaradi.

Modellarning koeffitsientlarini o'zaro ta'sir atamalari bilan qanday izohlash haqida munozara uchun , Regressiyadagio'zaro ta'sirlarni sharhlashbo'limiga qarang .