########################################## # Matemaattinen tilastotiede, syksy 2007 # ########################################## # Verrataan todennäköisyysfunktion arvoja HGeo- ja Bin-jakaumien välillä ################# # Harjoitus 6.6 # ################# # # # (a) N=100 # # # # viruksen kantajia voi olla 0,1,2,...,15 kun 15 ankan otos x <- 0:15 k <- 15; m <- 0.15*100; n <- 100-0.15*100 # hypergeometrisen jakauman mukaiset todennäköisyydet: dhyper(x,m,n,k) # binomijakauma vastaavassa tilanteessa: p <- 0.15; size <- 15 # binomijakauman mukaiset todennäköisyydet: dbinom(x,size,p) # tutkitaan HGeo- ja Bin-jakauman avulla laskettua eroa (itseisarvona): abs(dhyper(x,m,n,k)-dbinom(x,size,p)) # poimitaan maksimiero eri x:n arvoilla: max(abs(dhyper(x,m,n,k)-dbinom(x,size,p))) which.max(abs(dhyper(x,m,n,k)-dbinom(x,size,p))) # yllä oleva antaa sen kohdan todennäköisyyksien jonosta, missä ero on suurin # huom. ensimmäinen on todennäköisyys P(X=0), toinen on P(X=1), kolmas on P(X=2) jne. # # # (b) N=500 # # # k <- 15; m <- 0.15*500; n <- 500-0.15*500 dhyper(x,m,n,k) # a-kohdassa muodostettuja binomijakauman tn:iä voidaan hyödyntää edelleen max(abs(dhyper(x,m,n,k)-dbinom(x,size,p))) which.max(abs(dhyper(x,m,n,k)-dbinom(x,size,p))) # # # (c) N=1000 # # # k <- 15; m <- 0.15*1000; n <- 1000-0.15*1000 dhyper(x,m,n,k) # a-kohdassa muodostettuja binomijakauman tn:iä voidaan hyödyntää edelleen max(abs(dhyper(x,m,n,k)-dbinom(x,size,p))) which.max(abs(dhyper(x,m,n,k)-dbinom(x,size,p)))