# Työarkki 8. # Binomiregressio ja Poissonin regressio: kadonneiden henkilöiden aineisto # Aineisto julkaistiin The Independent-lehdessä 8.3.1994 otsikolla # "Tuhannet ihmiset katoavat jälkiä jättämättä". # Analysoidaan aineistoa. s <- scan() 33 63 157 38 108 159 r <- scan() 3271 7256 5065 2486 8877 3520 # r = vuoden aikana kadonneiksi rekisteröityjen lkm (vuosi ennen 31.3.1993) # s = vielä vuoden lopussakin kadoksissa olevien lkm sex <- c(1,1,1,2,2,2); age <- c(1,2,3,1,2,3) # sex = 1 miehet, sex = 2 naiset # age=1 13-vuotiaat, age=2 14-18-vuotiaat, age=3 yli 19-vuotiaat sex <- factor(sex); age <- factor(age) bin.add <- glm(s/r ~ sex + age,family=binomial,weights=r) summary(bin.add) # Mitä tuloksista voi päätellä? # # Kun binimijakaumassa n on suuri ja p pieni, on jakauma lähellä # Poissonin jakaumaa, jonka keskiarvo on np. # Kokeillaan Poissonin regressiota sopivaa "offset" mjaa käyttäen. l <- log(r) Poisson.add <- glm(s ~ sex + age, family=poisson,offset=l) summary(Poisson.add) # Esitä ja tulkitse tulokset. Selitä erot ja yhtäläisyydet # kahden eri regression välillä. # Havainnollistavat kuviot? par(mfrow=c(2,2)) plot(sex,s/r) plot(age,s/r) plot(sex,r) plot(age,r) names(bin.add) class(bin.add) residuals(bin.add) fitted.values(bin.add) coefficients(bin.add) family(bin.add) deviance(bin.add) #### # Huom! #### residuals(bin.add) bin.add$residuals residuals(bin.add, type = c("response")) x<- c(0.1,0,-0.3) sign(x) # residuals(bin.add, type = c("deviance", "pearson", "working", # "response", "partial"), ...) # # "deviance" # sign(y_i - hmu_i)*sqrt(d_i), # missä d_i on i. hav. lisäys devianssiin. # Devianssi on dev. residuaalien neliöitten summa # "pearson" # (y_i - hmu_i)/sqrt(V(hmu)) # NS on Pearsonin testisuure # "working" # (y_i - hmu)[ # # #