rmsOverview: rms paketiga umumiy nuqtai

rms - bu Regression Modeling Strategies kitobi bilan birga keladigan to'plam. rms regressiyani modellashtirish, sinovdan o'tkazish, baholash, tasdiqlash, grafikalar, bashorat qilish va matn terish usullarini moslashtirilgan dizayn xususiyatlarini saqlash orqali amalga oshiradi. rms - bu Dizayn paketining qayta yozilgan versiyasi bo'lib, u grafikani yaxshilagan va omon qolish paketidagi juda kam kodni takrorlagan.

Ushbu to'plam, ayniqsa biostatistik va epidemiologik dasturlar uchun modellashtirishga yordam beradigan va soddalashtiradigan 180 ga yaqin funktsiyalar to'plamidir. Shuningdek, u ikkilik va tartibli logistik regressiya modellari uchun funktsiyalarni va o'ng senzurali javoblar uchun Bakli-Jeyms ko'p regressiya modelini o'z ichiga oladi va logistika va oddiy chiziqli modellar uchun jazolangan maksimal ehtimollarni baholashni amalga oshiradi. rms deyarli har qanday regressiya modeli bilan ishlaydi, lekin u ayniqsa logistik regressiya, Koks regressiyasi, tezlashtirilgan ishdan chiqish vaqt modellari, oddiy chiziqli modellar, Bakli-Jeyms modeli, bo'ylama ma'lumotlar uchun umumiy ijara kvadratlari (nlme to'plamidan foydalangan holda), umumlashtirilgan chiziqli modellar va kvantil regressiya (kvantreg to'plami yordamida). rms Hmisc paketini o'rnatishni talab qiladi.Shuni esda tutingki, Hmisc-da ma'lumotlarni tahlil qilish uchun foydali bo'lgan bir nechta funktsiyalar mavjud (ayniqsa, ma'lumotlarni qisqartirish va hisoblash).

Dizayn paketi bo'yicha quyida keltirilgan eski ma'lumotnomalar rms bilan bog'liq.

Argumentlar

Amalga oshirilgan statistik usullar

Oddiy chiziqli regressiya modellari

Ikkilik va tartibli logistik modellar (mutanosib koeffitsientlar va davomiylik nisbati modellari, probit, log-log, qo'shimcha log-log, shu jumladan doimiy Y uchun tartibli yig'ma ehtimollik modellari, minglab aniq Y qiymatlarini to'liq ehtimollik usullaridan foydalangan holda)

Bayesiya ikkilik va tartibli regressiya modellari, qisman mutanosib stavkalar modeli va tasodifiy effektlar

Tezlashtirilgan qobiliyatsiz vaqt sinfidagi omon qolish parametrlarining modellari

Bakli-Jeyms eng to'g'ri kvadratik chiziqli regressiya modeli, ehtimol o'ng tsenzurali javoblar

Umumlashtirilgan chiziqli model

Umumiy kichkina kvadratchalar

Bootstrap modelini tasdiqlash, alohida tekshiruv namunasini talab qilmasdan model ishining xolis baholarini olish uchun

Parametrlashga bog'liq bo'lmagan modeldagi barcha effektlarni avtomatik ravishda Wald sinovlari (masalan, o'zgaruvchi boshqa o'zgaruvchilar bilan o'zaro ta'sir qilmasa, asosiy ta'sirlarning chiziqli bo'lmaganligi testlari, o'zaro ta'sirlarning chiziqli bo'lmaganligi testlari, bashorat qiluvchi muhim yoki yo'qligini tekshiradigan testlar) asosiy effekt yoki effektni o'zgartiruvchi sifatida)

Model taxminlarining grafik tasvirlari (effekt uchastkalari, koeffitsientlar / xavf nisbati uchastkalari, modelda chiziqli bo'lmagan ta'sirlar va o'zaro ta'sirlar mavjud bo'lganda ham model bashoratlarini qo'lda olishga imkon beruvchi nomogrammalar)

Turli xil tekislangan qoldiq uchastkalari, shu jumladan oddiy logistik model taxminlarini tekshirish uchun ba'zi yangi qoldiq uchastkalari

Lineer predictorni baholash uchun S funktsiyalarini tuzish (\ (X \ hat) \)), xavf funktsiyasi, omon qolish funktsiyasi, kvant funktsiyalari o'rnatilgan modeldan analitik ravishda

LaTeX yordamida o'rnatilgan modelni terish

Kovaryans matritsasini ishonchli baholash (Huber yoki bootstrap)

Chiziqli quyruq cheklovlari bilan kubik regressiya splini (tabiiy splinlar)

O'zaro ta'sirlar ikki baravar chiziqli bo'lmasligi uchun cheklangan

Oddiy chiziqli regressiya va logistika regressiya modellari uchun maksimal ehtimollik jazosi. Modelning turli qismlari har xil miqdorda jazolanishi mumkin, masalan, asosiy effektlar yoki chiziqli effektlardan ko'ra o'zaro ta'sirni yoki chiziqli bo'lmagan effektlarni jazolashni xohlashingiz mumkin.

Nolinearlik va o'zaro ta'sir mavjudligida xavf yoki ehtimollik nisbatlarini baholash

Ikkilik logistik modeldagi o'lchovsiz ikkilik konnektor uchun sezgirlikni tahlil qilish

Motivatsiya

rms quyidagi ehtiyojlar bilan rag'batlantirildi:

dizaynidan tuzilishi mumkin bo'lgan qiziqarli Wald testlarini avtomatik ravishda chop etish kerak

har bir taxmin qiluvchiga nisbatan chiziqli sinovlar

o'zaro ta'sirlarning lineerligini sinovlari

to'plangan o'zaro ta'sir sinovlari (masalan, irq bilan bog'liq barcha o'zaro ta'sirlar)

yuqori buyurtma effektlari bilan birlashtirilgan effektlarni sinovlari

asosiy ta'sir testi o'zaro ta'sirda ahamiyatga ega emas

asosiy effektning birlashtirilgan sinovi + o'zaro ta'sir effekti

2-darajali o'zaro ta'sirni sinash + shu omillarni o'z ichiga olgan har qanday 3-darajali o'zaro ta'sir

o'zgartirish parametrlarini mos ravishda saqlash kerak

misol: spline funktsiyalari uchun tugun joylari

bashoratlarni olishda, bular S yoki R standartlaridan farqli o'laroq "esda qoladi"

kategorik bashoratchilar uchun darajalarni tejang, shunda bashorat qilish uchun bir xil qo'g'irchoq o'zgaruvchilar hosil bo'ladi; model o'rnatilganida ma'lumotdan tashqari prognozlarning barcha darajalari mavjudligini tekshiring

yangi ma'lumotlarsiz prognoz qilishda yoki qoldiqdan foydalanishda NA tufayli o'chirilgan kuzatuvlarni bir xilda qayta kiritish zarurati

har qanday bashorat qiluvchining regressiya effektini osongina tuzish kerak

Masalan: yosh 40 va 60 yoshdagi tugunlari bo'lgan chiziqli spline bilan ifodalanadi, kasallikning log ehtimollariga yoshning syujet ta'siri, o'zaro ta'sir qiluvchi omillarni osonlikcha aniqlangan konstantalarga moslashtirish.

o'zgaruvchisi 2: x o'qi bo'yicha x1 chizig'i, diskret x2 uchun alohida egri chiziqlar yoki doimiy x2 uchun 3d istiqbolli chizmasi

agar bashorat qiluvchi modelda funktsiya sifatida ifodalangan bo'lsa, chizmalar asl o'zgaruvchiga nisbatan bo'lishi kerak: f

log (xolesterin) + yosh) uchastkasi (Bashorat qiling (f, xolesterin)) # x o'qida xolesterin, standart oraliq ggplot (Bashorat (f, xolesterin))) # ggplot2 plotp yordamida bir xil (Bashorat (f, xolesterin))) # bir xil to'g'ridan-to'g'ri hiyla ishlatishda

bashorat qiluvchilarning taqsimotining qisqacha mazmuni bilan mos kelishi kerak

cheklovlarni chizish (sukut bo'yicha: eng kichik 10, eng katta 10 qiymat yoki% -tiles)

ta'sir chegaralari (doimiy: .25 va .75 kvantillari doimiy vars uchun.)

boshqa taxminchilar uchun sozlash qiymatlari (sukut bo'yicha: doimiy prognozchilar uchun o'rtacha, toifalar uchun eng tez-tez)

diskret raqamli bashoratchilar: mumkin bo'lgan qiymatlar ro'yxati misol: x = 0,1,2,3,5 ->sukut bo'yicha x = 4 da bashorat qilmang

qiymatlar eng o'zgaruvchan, masalan, xolesterol, log (xol) emas.

asl ma'lumotlar to'plami o'chirilganidan ancha vaqt o'tgach, taxmin qilish / rejalashtirishga imkon beradi

Cox modellari uchun asosiy omon qolish ham mos ravishda saqlanadi, shuning uchun bashorat qilingan yashovchanlik egri chiziqlarini olish uchun asl ma'lumotlar kerak emas

chiziqli bo'lmaganligi va o'zaro ta'sirida avtomatik ravishda efir baholarini chop etish zarur

Masalan: yosh kvadratik, jinsiy aloqa bilan ta'sir o'tkazish kvartillar oralig'idagi xavf koeffitsientidir (Cox modeli uchun), jins uchun = mos yozuvlar darajasi

foydalanuvchi tomonidan boshqariladigan effektlar: xulosa (moslik, yosh = c (30,50), jins = "ayol") ->logistika modeli uchun koeffitsientlar koeffitsientlari, tezlashtirilgan qobiliyatsizlik vaqtining omon qolish modellari uchun nisbiy omon qolish vaqti

Barcha o'zgaruvchilar uchun effektlarni (masalan, koeffitsientlar nisbati) ko'p ishonchlilik satrlari bilan chizish mumkin

nashrlarda chiroyli va ixcham effekt nomlariga ehtiyoj, ayniqsa kengaytirilgan chiziqli bo'lmagan atamalar va o'zaro ta'sir qilish shartlari uchun

taxminchilarni aniqlash uchun ichki o'zgaruvchan nomdan foydalaning

masalan, pmin (x ^ 2-3,10) uchun qonuniy S-ismli faktorga murojaat qiling

to'siq har doim ham oddiy tushuncha emasligini anglash kerak

ba'zi modellarda (masalan, Koksda) hech qanday to'siq yo'q

ba'zi modellarda (masalan, tartibli logistika) bir nechta to'siqlar mavjud

o'rnatilgan matematik modelni avtomatik ravishda yuqori sifatli bosib chiqarishga bo'lgan ehtiyoj (qo'pol o'zgaruvchilar aniqlangan, regressiya spline atamalari soddalashtirilgan, o'zaro ta'sirlar "hisobga olingan"). Parametrik bo'lmagan silliqlash yoki tekislash splini o'rniga regressiya splinalariga e'tibor qaratiladi, shuning uchun S. rms dan tashqarida foydalanish uchun mos formulalar olinishi mumkin, shuningdek o'rnatilgan modeldan \ (X \ beta \) ni tahlil qilish uchun S funktsiyalarini tuzishi mumkin. Buning uchun SAS kodini yozing.

o'rnatilgan modelni namoyish qilish uchun nomogrammani avtomatik ravishda chizish zarurati

faqat bitta S buyrug'i bilan (o'rnatilgan kalibrlash va diskriminatsiya bo'yicha) o'rnatilgan modelni avtomatik yuklashni tekshirishni talab qilish.

kovaryans matritsasini ishonchli (Huber sendvichi) baholovchisiga ehtiyoj va boshqa barcha tahlillarni (masalan, chizmalar, CL) sozlangan kovaryanslar yordamida amalga oshirish

kovaryans matritsasini ishonchli (bootstrap) baholovchisiga ehtiyoj, boshqa tahlillarda o'zgarishsiz osonlikcha ishlatiladi

klaster namuna olish uchun sozlangan Huber sendvichi va bootstrap kovaryans matritsalariga ehtiyoj

har bir predictordagi etishmayotgan qiymatlar bilan qancha kuzatuvlar o'chirilganligi to'g'risida muntazam ravishda xabar berish zarurati (qarang: Hmisc-da na.delete)

har bir X ning holati bo'yicha tabaqalashtirilgan Y uchun tavsiflovchi statistik ma'lumotlarning ixtiyoriy hisobotiga ehtiyoj (qarang: na.detail.response)

parametrli va Cox modellari uchun bir xil buyruqlardan foydalangan holda, chiroyli, izohli omon qolish egri chiziqlariga ehtiyoj

tartibli logistik modelga ehtiyoj (mutanosib koeffitsientlar modeli, davom etish nisbati modeli)

o'zgaruvchan kodlash yoki parametrlarning tartibini bilmasdan umumiy qarama-qarshiliklarni baholash va sinash zarurati

O'rnatish funktsiyalari rms bilan mos keladi

rms turli xil mos keladigan funktsiyalar bilan ishlaydi, lekin bu ayniqsa quyidagilar uchun mo'ljallangan:

Funktsiya Maqsad Tegishli S
Vazifalar
Ols Oddiy eng kichik kvadratchalar chiziqli model lm
lrm Ikkilik va tartibli logistik regressiya glm
model kr.setup
orm Reginal regressiya modeli lrm
blrm Bayes ikkilik va tartibli regressiya \
psm Tezlashtirilgan xato vaqti parametrik omon qolish
omon qolish modeli
cph Koksning mutanosib xavflari regressiyasi coxph
npsurv Parametrik bo'lmagan omon qolish taxminlari survfit.formula
bj Bakli-Jeyms eng kichik kvadratlarni tsenzuraga oldi omon qolish
chiziqli model
Glm RMS bilan ishlatish uchun glm versiyasi glm
Gls RMS bilan ishlatish uchun gls versiyasi gls
Rq Rms bilan ishlatish uchun rq versiyasi rq

Rmsdagi usullar

Quyidagi umumiy funktsiyalar amaldagi rms bilan ishlaydi:

Funktsiya Maqsad Bog'liq
Vazifalar
chop etish Bosib chiqarish parametrlari va moslik statistikasi
koef O'rnatilgan regressiya koeffitsientlari
formula Formada ishlatiladigan formulalar
xususiyatlari Sog'ishning batafsil xususiyatlari
robkov Kovaryansning barqaror matritsasini taxmin qilish
bootcov Bootstrap kovaryans matritsasini taxmin qilish
xulosa Bashoratchilar ta'sirining qisqacha mazmuni
fitna.xulosa Doimiy soyali ishonchni rejalashtiring
xulosa natijalari uchun satrlar
anova Vald eng mazmunli gipotezalarni sinab ko'rmoqda
qarama-qarshilik Umumiy qarama-qarshiliklar, CL, testlar
fitna.anova Anova natijalarini grafik tasvirlang nuqta diagrammasi
Bashorat qilish Qisman taxminiy ta'sir bashorat qilish
fitna Panjara grafika yordamida taxminiy effektlarni tuzing bashorat qilish
ggplot Yuqoridagiga o'xshash, lekin ggplot2 dan foydalaniladi fitna
Yuqoridagiga o'xshash, ammo hiyla ishlatishda bplot Ikkala o'zgaruvchan effektlarning uch o'lchovli chizmasi
doimiy prognozlar
tasvir, persp, kontur jendata Bashoratli ma'lumotlar ramkasini yarating
kengaytirish.grid kombinatsiyalar (ixtiyoriy ravishda interaktiv ravishda)
bashorat qilish Bashorat qilingan qiymatlarni yoki dizayn matritsasini oling
fastbw Tez orqaga qarab pastga tushadigan o'zgaruvchi
qadam tanlov
qoldiqlar Qoldiqlar, statistikaga yaroqdan ta'sir qiladi
(yoki qoldiq)
qaysi ta'sir Qaysi kuzatuvlar haddan tashqari
qoldiqlar ta'sirchan
sensuk Bitta ikkilik bashoratchining sezgirligi
lrm va cph modellari o'lchovsiz
ikkilik konfonent
lateks O'rnatilgan LaTeX vakili
model yoki anova yoki xulosa jadvali
Funktsiya S funktsiyani analitik namoyish qilish
Funktsiya. Transkran o'rnatilgan regressiya modeli (\ (X \ beta \))
xavf S funktsiyani analitik namoyish qilish
rcspline.restate O'rnatilgan xavf funktsiyasi (psm uchun)
Omon qolish S funktsiyasining analitik namoyishi
omon qolish funktsiyasi (psm, cph uchun)
Quantile S funktsiyasining analitik namoyishi
ning kvantilalari uchun o'rnatilgan funktsiya
omon qolish vaqti (psm, cph uchun)
nomogramma O'rnatilgan model uchun nomogramma chizadi
lateks, fitna, ggplot, fitna terib olish Tirik qolish ehtimolligini taxmin qiling
omon qolish (psm, cph uchun)
omon qolish Omon qolish egri chiziqlari (psm, cph, npsurv)
fitna.survfit tasdiqlash Modelga mos keladigan indekslarni tasdiqlash
val.prob qayta namunalash
sozlang Model uchun kalibrlash egri chizig'ini taxmin qiling
resampling yordamida
vif Variantlar inflyatsiya omillari
naresid Yo'qolganlarga mos keladigan elementlarni keltiring
ma'lumotlar yana prognozlarga va qoldiqlarga
naprint Yo'qolgan qiymatlarning qisqacha mazmuni
pentras Jazolangan MLE uchun eng yaxshi jazoni toping
samarali.df Har bir turi uchun samarali df-ni chop eting
modeldagi o'zgaruvchan, jarimaga tortilishi uchun yoki
pentras natijasi
rm.impute Bilan takroriy o'lchovlar
transkan, tasodifiy bo'lmagan tashlab ketish
fit.mult.impute Funktsiya Maqsad

Misollar uchun fon

Quyidagi dasturlar rms paketining qismlari qanday ishlashini namoyish etadi. Datadist funktsiyasiga (odatda) bir martalik qo'ng'iroq qilish potentsial bashorat qiluvchi o'zgaruvchilar uchun tarqatish xulosalarini saqlash uchun butun ma'lumotlar doirasidan o'tishni talab qiladi. Ushbu xulosalar (sukut bo'yicha) doimiy .25 va .75 kvantilalarini o'z ichiga oladi (koeffitsientlar nisbati kabi ta'sirlarni baholash uchun), 10-eng kichik va 10-chi eng katta qiymatlar (yoki .1 va .9 kvantillar kichik \ (n \)) taxminiy egri chiziqlar va umumiy diapazonlarni chizish uchun. Diskret raqamli o'zgaruvchilar uchun (\ (\ leq 10 \) noyob qiymatlarga ega bo'lganlar) noyob qiymatlar ro'yxati ham saqlanadi. Bunday xulosalar Sumat.rms, Bashorat qilish va nomogram.rms funktsiyalari tomonidan qo'llaniladi. Siz vaqtni tejashingiz va datadistning ishlashini kechiktirishingiz mumkin. Bunday holda, tarqatish xulosasi mos keladigan ob'ekt bilan saqlanmaydi,lekin uni qisqacha bayon, syujet, ggplot yoki plotp ishlatishdan oldin to'plash mumkin.

d

x1 * x2) anova (f) fastbw (f) Bashorat qilish (f, x2) bashorat qilish (f, newdata)

In misollardabo'lim RMS, lrm (logistika regresyon modeli) bilan foydalanish uchun mo'ljallangan, bir uydirma funktsiyasidan foydalanib, uch batafsil misollar bor. In Mukammal Misol 1biz 500 predmeti bo'yicha 3 ta taxminiy o'zgaruvchini va ikkitomonlama javobni yaratamiz. Birinchi ikkilik javob uchun dz, haqiqiy model faqat jins va yoshni o'z ichiga oladi va ikkalasi o'rtasida chiziqli bo'lmagan o'zaro ta'sir mavjud, chunki log stavkalari ayollar uchun yoshdagi kesilgan chiziqli munosabatlar va erkaklar uchun kvadratik funktsiya. Ikkinchi ikkilik natija uchun dz.bp, haqiqiy populyatsiya modeli, shuningdek, kesilgan chiziqli munosabatlar orqali sistolik qon bosimini (sys.bp) o'z ichiga oladi. Birinchidan, o'zaro aloqalarni parametrsiz baholash Hmisc paketining plsmo funktsiyasi yordamida amalga oshiriladi, ikkilik javoblar uchun yuqori aniqlik o'chirilgan pastlikdan foydalaniladi. Keyin parametrli modellashtirish cheklangan kubik splinij yordamida amalga oshiriladi. Ushbu modellashtirish biz yosh yoki sys uchun haqiqiy o'zgarishlarni bilamiz deb o'ylamaydi.bp, ammo bu o'zgarishlarning silliq bo'lishi (bu aslida aholi orasida bunday emas).

Batafsil 2-misoluchun, kategorik o'zgaruvchan muolajaning "a", "b" va "c" qiymatlari, tartibli o'zgaruvchisi num.dastaliklari 0,1,2,3,4 qiymatlariga ega va ikkita doimiy o'zgaruvchi mavjud, masalan, yosh va xolesterin. yoshi cheklangan kubik spline bilan jihozlangan, xolesterin esa transformatsiya jurnali (xolesterin - 10) yordamida o'zgartiriladi. Uchta xolesterin etishmayapti va biz ularni umumiy o'rtacha xolesterin yordamida ta'sir qilamiz. Biz davolash va xolesterin o'rtasidagi o'zaro ta'sirga ruxsat berishni xohlaymiz. Quyidagi S dasturi logistik modelga mos keladi, dizayndagi barcha effektlarni sinab ko'radi, effektlarni taxmin qiladi va taxminiy o'zgarishlarni rejalashtiradi. Num.diseases-ga mos keladigan narsa, albatta, o'zgaruvchini 5 darajali kategorik o'zgaruvchi deb hisoblaydi. Faqatgina farq 3 dfo'zgaruvchanlikni "asis" ni qayta modellashtirish mumkinligini baholash uchun chiziqlilik sinovi o'tkaziladi. Bu erda biz rms paketini biriktirish va datadist-dan taxminiy xususiyatlarni saqlash uchun bayonotlarni ham ko'rsatamiz.

Batafsil 3-misol, Koksning mutanosib xavflari modeli bilan bog'liq bo'lgan ba'zi bir hayotni tahlil qilish imkoniyatlarini ko'rsatadi. Biz 2000 predmetlari uchun ma'lumotni 2 predikatori, yoshi va jinsi bilan taqlid qilamiz. Haqiqiy populyatsiya modelida log xavfliligi funktsiyasi yoshi bo'yicha chiziqli bo'lib, yoshi ((marta)) jinsiy aloqasi mavjud emas. Quyidagi tahlilda biz yoshdagi chiziqlilikdan foydalanmaymiz. rms Terri Therneau-ning S ga asoslangan ko'pgina omon qolish funktsiyalaridan foydalanadi.

Quyida Hmisc transcan funktsiyasi bilan birgalikda rms bilan ishlatilib, barcha NAlarni prediktorlarda bitta imputatsiyasini bajarish uchun foydalaniladigan odatiy qadamlar ketma-ketligi keltirilgan (bir nechta imputatsiya yaxshiroq bo'lar edi, lekin bootstrap modelini tekshirish kontekstida bajarish qiyinroq bo'ladi) ), modelga mos keling, modeldagi taxminchilar sonini kamaytirish uchun orqaga qarab qadam qo'ying (bu barcha jiddiy muammolarga olib kelishi mumkin) va ushbu bosqichli modelni tasdiqlash uchun bootstrap-dan foydalaning va har bir qayta namuna uchun o'zgaruvchan tanlovni takrorlang. Bu erda biz qisqartmani olamiz, chunki yuklash strapida imputatsiya takrorlanmaydi.

Keyinchalik, bizda (atipik ravishda) atigi 3 nomzodni bashorat qiladiganlar bor. Amalda tasdiqlash va kalibrlash funktsiyalari javob o'zgaruvchisidan foydalangan oldingi tahlillarda qatnashgan barcha taxminchilarni o'z ichiga olgan modelga mos ravishda ishlashiga ishonch hosil qiling. Bu erda imputatsiya zarur, chunki teskari qadam har qanday nomzod o'zgaruvchisida etishmayotgan kuzatuvlarni yo'q qiladi.

Quyidagi kodni ishlatish uchun x1, x2, x3, y ni belgilashingiz kerakligini unutmang.

x1 + x2 + x3, imputed = TRUE) impute (xt) # x1, x2, x3 # dagi har qanday NAni hosil qiladi # Endi to'ldirilgan ma'lumotlarga asl to'liq modelni joylashtiring f

x1 + rcs (x2,4) + x3, x = TRUE, y = TRUE) # x, y yuklashga imkon beradi. fastbw (f) # pastga tushirish modelini keltirib chiqaradi (standart to'xtash qoidasidan foydalangan holda) tasdiqlash (f, B = 100, bw = TRUE) # tezlikni 100 marta takrorlaydi kal

Qochishning umumiy muammolari

Y kabi formulangiz yo'q

yosh + yosh ^ 2. S-da pol yoki rcs kabi matritsani ishlab chiqaradigan funktsiya yordamida tegishli o'zgaruvchilarni ulashingiz kerak. Bu effektlarni baholashni (masalan, xavf koeffitsientlari) hamda birlashmaning bir nechta df sinovlarini hisoblashga imkon beradi.

Rmsda ishlatiladigan formulalar ichida poli yoki qatlamlardan foydalanmang. Buning o'rniga pol va strat dan foydalaning.

S-da o'zingizning qo'g'irchoq o'zgaruvchilaringizni yoki o'zaro ta'sir o'zgaruvchilaringizni deyarli hech qachon kodlamang. S buni avtomatik ravishda amalga oshirsin. Aks holda, anova o'z ishini bajara olmaydi.

Taxminiy modellarni deyarli hech qachon model formulasidan tashqariga o'zgartirmaydi, chunki bashorat qilingan qiymatlarga nisbatan prognoz qiymatlari va boshqa displeylar sxemalari asl o'lchovda amalga oshirilmaydi. Buning o'rniga y kabi bir narsadan foydalaning

log (cell.count + 1), bu cell.countning \ (x \) - o'qlarida paydo bo'lishiga imkon beradi. Siz xayolparastni olishingiz mumkin, masalan, y

rcs (log (hujayra Keyinchalik murakkab o'zgarishlarni amalga oshirish uchun f fit1

f (cell.count)) fit2

Formulalarda ishlatiladigan o'zgarmaydigan nomlarni ichiga $ qo'ymang. Yoki ma'lumotlar ramkalarini biriktiring yoki ma'lumotlardan foydalaning =.

Datadist-dan foydalanishni unutmang. Dasturingizning yuqori qismida uni ishlatishga harakat qiling, shunda barcha modellar avtomatik ravishda foyda keltirishi mumkin, agar uning bashoratchilar uchun taqsimlangan xulosalari bo'lsa.

"Ahamiyatsiz" bashoratchilarni tashlab qisqartirilgan modellarni tasdiqlamang yoki sozlamang. To'g'ri bootstrap yoki o'zaro tasdiqlash har bir qayta namuna uchun har qanday o'zgaruvchini tanlash bosqichlarini takrorlashi kerak. Shunday qilib, barcha nomzodlarning taxminchilarini o'z ichiga olgan modellarni tasdiqlang yoki sozlang va agar siz modellarni kamaytirishingiz kerak bo'lsa, tasdiqlash yoki kalibrlash uchun bw = TRUE parametrlarini ko'rsating.

"Ahamiyatsiz" bashoratchilarni tashlab qo'yish, regressiya modellari uchun odatiy statistik xulosalarning ko'pini buzadi (ishonch chegaralari, standart xatolar, \ (P \) - qiymatlar, \ (\ chi ^ 2 \), model ishlashining oddiy ko'rsatkichlari) va bu ham natijalar yomon prognozli diskriminatsiyaga ega modellarda.

To'plamga kirish

RMS va Regression Splines nashrlari

Spanos A, Harrell FE, Durack DT (1989): O'tkir menenjitning differentsial diagnostikasi: Dastlabki kuzatuvlarning taxminiy qiymatini tahlil qilish. JAMA 2700-2707.

Ohman EM, Armstrong PW, Christenson RH va boshq . (1996): O'tkir miokard ishemiyasida xavf tabaqalanishi uchun yurak troponin T darajasi. Yangi Eng J Med 335: 1333-1341.

Parametrik omon qolish modeli uchun yuklash chizig'ini kalibrlash egri chizig'i:

Knaus VA, Harrell FE, Fisher CJ, Vagner DP va boshq . (1993): sepsis uchun yangi dori-darmonlarni klinik baholash: omon qolish tahlili asosida tadqiqotning istiqbolli dizayni. JAMA 270: 1233-1241.

Splines, splinelar bilan o'zaro ta'sirlar, lateks.rms dan o'rnatilgan modelning algebraik shakli

Knaus VA, Harrell FE, Lin J va boshq. (1995): SUPPORT prognostik modeli: og'ir kasalxonaga yotqizilgan kattalar uchun yashashning ob'ektiv baholari. Ichki tibbiyot yilnomalari 122: 191-203.

Splinelar, chiziqli bo'lmagan va ta'sir o'tkazish shartlari bilan jihozlangan modeldan koeffitsientlar nisbati jadvali, transkutanni imputatsiya uchun ishlatish

Li KL, Woodlief LH, Topol EJ, Weaver WD, Betriu A. Col J, Simoons M, Aylward P, Van de Werf F, Califf RM. O'tkir miokard infarkti reperfuziyasi davrida 30 kunlik o'limni bashorat qiluvchilar: 41.021 bemorni xalqaro sinovdan o'tkazish natijasida. Muomalasi 1995; 91: 1659-1668.

Splines, logistik modellarning tashqi tekshiruvi, nuqta jadvallari yordamida bashorat qilish qoidalari

Steyerberg EW, Hargrove YV va boshq (2001): moyak saratonida qoldiq ommaviy gistologiya: klinik bashorat qilish qoidasini ishlab chiqish va tasdiqlash. Med 2001 yilgi statistika; 20: 3847-3859.

van Gorp MJ, Steyerberg EW va boshq (2003): Byork-Shiley konvekso-konkav qopqog'ini almashtirishda 30 kunlik o'limni klinik taxmin qilish qoidasi. J Klinik Epidemiologiya 2003; 56: 1006-1012.

Modelni o'rnatish, yuklash strapini tasdiqlash, etishmayotgan qiymatni hisoblash

Krijnen P, van Jaarsveld BC, Steyerberg EW, Man in t Veld AJ, Schalekamp, ​​MADH, Habbema JDF (1998): Buyrak arteriyasi stenozining klinik bashorat qilish qoidasi. Ichki kasalliklarning yilnomalari 129: 705-711.

Modelni o'rnatish, splinelar, bootstrapni tasdiqlash, nomogrammalar

Kattan MW, Eastham JA, Stapleton AMF, Wheeler TM, Scardino PT. Prostata saratoni uchun radikal prostatektomiyadan so'ng kasallik qaytalanishi uchun operatsiyadan oldingi nomogramma. J Natl Ca Inst 1998; 90 (10): 766-771.

Kattan, MW, Wheeler TM, Scardino PT. Prostata saratoni uchun radikal prostatektomiyadan so'ng kasallik qaytalanishi uchun operatsiyadan keyingi nomogramma. J Clin Oncol 1999; 17 (5): 1499-1507

Kattan MW, Zelefskiy MJ, Kupelian PA, Scardino PT, Fuks Z, Leybel SA. Prostata saratonida uch o'lchovli konformal radioterapiya natijasini bashorat qilish uchun oldindan davolash nomogrammasi. J Clin Oncol 2000; 18 (19): 3252-3259.

Eastham JA, May R, Robertson JL, Sartor O, Kattan MW. Anormal raqamli rektal tekshiruv va 0 dan 4 ng / ml gacha prostata o'ziga xos antijeni bo'lgan erkaklarda prostata bezining ijobiy biopsiyasi ehtimolini taxmin qiladigan nomogramma ishlab chiqish. Urologiya . (Matbuotda).

Kattan MW, Heller G, Brennan MF. Mahalliy takrorlanishdan so'ng sarkomaga xos bo'lgan o'limga olib keladigan raqobatchi nomogramma. Med 2003 yilgi stat ; 22; 3515-3525.

Bashorat qilingan maksimal ehtimollarni baholash, regressiya splini, taxmin qilingan qiymatlarni olish uchun veb-sayt

Smits M, Dippel DWJ, Steyerberg EW va boshq. Boshidan kichik jarohati olgan bemorlarda kompyuter tomografiyasida intrakranial travmatik topilmalarni bashorat qilish: CHIPni bashorat qilish qoidasi. Ann Int Med 2007; 146: 397-405.

2 va 5 yillik omon qolish ehtimoli va o'rtacha omon qolish vaqti bilan nomogramma (lekin o'zgarmas skriningdan foydalanishga e'tibor bering)

Klark TG, Styuart ME, Altman DG, Smit JF. Tuxumdon saratoni uchun prognostik model. Br J saraton kasalligi 2001; 85: 944-52.

Parametrik omon qolish modelini keng nomogramma, vaqt nisbati jadvali, anova diagrammasi, survplot yordamida hosil bo'lgan omon qolish egri chiziqlari, bootstrap kalibrlash egri chizig'ining to'liq namunasi.

Teno JM, Harrell FE, Knaus VA va boshq. Katta yoshdagi kasalxonaga yotqizilgan bemorlar uchun omon qolish bashorati: HELP omon qolish modeli. J Am Geriatrics Soc 2000; 48: S16-S24.

Modelga moslik, imputatsiya va jadval shaklida ifodalangan bir nechta nomogrammalar

Hasdai D, Xolms DR va boshq. O'tkir miokard infarktini murakkablashtiradigan kardiogen shok: O'limni bashorat qiluvchilar. Am Heart J 1999; 138: 21-31.

Bootstrap kalibrlash sxemasi bilan oddiy logistik model

Vu AW, Yasui U, Alzola CF va boshq . 80 va undan katta yoshdagi kasalxonaga yotqizilgan bemorlarning funktsional holati natijalarini taxmin qilish. J Am Geriatriya Jamiyati 2000 yil; 48: S6-S15.

Tibbiy tashxisni baholashda moyillikni modellashtirish, anova nuqta jadvali

Vayss JP, Gruver S va boshq. Chap qorincha faoliyatini baholash uchun ekokardiyogramga buyurtma berish: samarali foydalanish uchun zarur bo'lgan tajriba darajasi. J Am Soc Ekokardiyografi 2000; 13: 124-130.

Har xil modellashtirish strategiyalarining xususiyatlarini o'rganish uchun rms yordamida simulyatsiyalar

Steyerberg EW, Eijkemans MJC, Habbema JDF. Kichik ma'lumotlar to'plamida bosqichma-bosqich tanlash: Logistik regressiya tahlilida tarafkashlikni simulyatsion o'rganish. J Clin Epi 1999; 52: 935-942.

Steyerberg WE, Eijekans MJC, Harrell FE, Habbema JDF. Logistik regressiya tahlili bilan prognostik modellashtirish: Kichik ma'lumotlar to'plamlarida oqilona strategiyani izlash. Med qaror qabul qilish 2001 yil; 21: 45-56.

RMS bilan bog'liq statistik usullar va ma'lumotnomalar, shuningdek tahlillarni ishlab chiqargan rms kodini o'z ichiga olgan amaliy tadqiqotlar

Harrell FE, Li KL, Mark DB (1996): ko'p o'zgaruvchan prognostik modellar: modellarni ishlab chiqish, taxminlar va adekvatlikni baholash, xatolarni o'lchash va kamaytirish masalalari. Med 15-dagi holat: 361-387.

Harrell FE, Margolis PA, Gove S, Meyson KE, Mulholland EK va boshq. (1998): Tartibli natijalar uchun klinik prognoz modelini ishlab chiqish: Jahon sog'liqni saqlash tashkiloti ARI Multicentre Yosh chaqaloqlarda pnevmoniya, sepsis va meningitning klinik belgilari va etiologik agentlarini o'rganish. Med 17-dagi holat: 909-944.

Bender R, Benner, A (2000): SAS va S-Plus-da tartibli regressiya modellarini hisoblash. Biometrik J 42: 677-699.

Xatoliklar haqida hisobotlar

Muallif muammolar bilan yordam berishga tayyor. Elektron pochtani fh@fharrell.com elektron manziliga yuboring. Xatoliklar to'g'risida xabar berish uchun quyidagilarni bajaring:

Agar mos keladigan ob'ektda (masalan, anova) funktsiyani bajarishda xatolik yuzaga kelsa, mos keladigan narsaning matnli versiyasini yozuvingizga ilova qiling. Agar siz datadistdan foydalansangiz, lekin u yaratilguncha emas, shuningdek, datadist tomonidan yaratilgan ob'ektni yuboring. Misol: save (myfit, "/ tmp / myfit.rda") elektron pochtaga biriktirilishi mumkin bo'lgan R ikkilik saqlash faylini yaratadi.

Agar xato modelga mos kelganda yuzaga kelsa (masalan, lrm, ols, psm, cph bilan), xatoga yo'l qo'yadigan bayonotni mos kelishda ishlatilgan ma'lumotlar ramkasini saqlash versiyasi bilan yuboring. Agar ushbu ma'lumotlar doirasi juda katta bo'lsa, uni xatoni keltirib chiqaradigan kichik qismga kamaytiring.

Mualliflik huquqiga oid ogohlantirish

Umumiy ogohlantirish Ushbu dastur bepul dasturiy ta'minotdir; siz uni bepul tarqatish va / yoki bepul dasturiy ta'minot fondi tomonidan e'lon qilingan GNU umumiy jamoat litsenziyasi shartlari asosida o'zgartirishingiz mumkin; yoki 2-versiya, yoki (sizning xohishingizga ko'ra) har qanday keyingi versiya.

Ushbu dastur foydali bo'ladi degan umidda tarqatiladi, ammo hech qanday kafolat bermasdan; hattoki MAXSUS MAQSADGA SAVDO QILISh yoki MUVOFIQLIK kafolatisiz. Qo'shimcha ma'lumot uchun GNU umumiy jamoat litsenziyasiga qarang. Qisqacha aytganda: siz ushbu kodni xohlagan usulda ishlatishingiz mumkin, agar siz u uchun pul olmasangiz, ushbu xabarnomani olib tashlasangiz yoki uning natijalari uchun biron bir shaxs javobgar bo'lmasangiz. Iltimos, manbani tan oling va o'zgarishlarni muallifga etkazing.

Agar ushbu dastur ishlatilgan bo'lsa, nashr uchun taqdim etilgan ish bo'lsa, iltimos, unga murojaat qiling: Harrell FE (2009): rms: biostatistik / epidemiologik modellashtirish, sinash, baholash, tasdiqlash, grafikalar va bashorat qilish uchun S funktsiyalari. Https://hbiostat.org/R/rms/ saytidan mavjud bo'lgan dasturlar. R ning o'zi kabi ishlatilgan boshqa paketlarga ham murojaat qilganingizga ishonch hosil qiling.

Tafsilotlar

Avtomatik terish xususiyatlaridan foydalanish uchun siz LaTeX yoki uning variantlaridan birini o'rnatishingiz kerak.

C ("contr.treatment", "contr.poly") dan boshqa variantlar (kontrastlar =) ishlatilsa, rmsning ba'zi jihatlari (masalan, lateks) to'g'ri ishlamaydi.

Mayo klinikasi Terri Terno tomonidan yozilgan hayotni tahlil qilishning ko'plab funktsiyalariga tayanadi. Old qismlar Termoning bir nechta funktsiyalari uchun yozilgan va boshqa funktsiyalar biroz o'zgartirilgan.