Thuis
Contacten

    Hoofdpagina


Docent: drs. Rob Flohr

Dovnload 2 Mb.

Docent: drs. Rob Flohr



Pagina4/25
Datum05.12.2018
Grootte2 Mb.

Dovnload 2 Mb.
1   2   3   4   5   6   7   8   9   ...   25

> library(Bolstad)

> x=seq(0,1)

> curve(dbeta(x,1,1))

> binobp(5,20,1,1)

Posterior Mean : 0.2727273

Posterior Variance : 0.0086238

Posterior Std. Deviation : 0.0928643


Prob. Quantile

------ ---------

0.005 0.0801205

0.01 0.0924654

0.025 0.1128094

0.05 0.1324482

0.5 0.2657397

0.95 0.4369763

0.975 0.4716598

0.99 0.5119804

0.995 0.5392432

95% 'credible interval': zie rode getallen




Bij toename steekproefomvang:

> binom.test(50,200,0.5)


Exact binomial test
data: 50 and 200

number of successes = 50, number of trials = 200, p-value = 8.393e-13

alternative hypothesis: true probability of success is not equal to 0.5

95 percent confidence interval:



0.1916072 0.3159628

sample estimates:

probability of success

0.25
> binom.test(500,2000,0.5)


Exact binomial test
data: 500 and 2000

number of successes = 500, number of trials = 2000, p-value < 2.2e-16

alternative hypothesis: true probability of success is not equal to 0.5

95 percent confidence interval:



0.2311503 0.2695853

sample estimates:

probability of success

0.25
> local({pkg <- select.list(sort(.packages(all.available = TRUE)),graphics=TRUE)

+ if(nchar(pkg)) library(pkg, character.only=TRUE)})
Attaching package: ‘Bolstad’
The following object(s) are masked _by_ ‘.GlobalEnv’:
binodp
Warning message:

package ‘Bolstad’ was built under R version 2.15.3

> library(Bolstad)

> binobp(50,200,1,1)

Posterior Mean : 0.2524752

Posterior Variance : 0.0009297

Posterior Std. Deviation : 0.0304912
Prob. Quantile

------ ---------

0.005 0.1788719

0.01 0.1853667

0.025 0.1951307

0.05 0.2037389

0.5 0.251657

0.95 0.3040045

0.975 0.3144613

0.99 0.3267701



0.995 0.3352382

> binobp(500,2000,1,1)

Posterior Mean : 0.2502498

Posterior Variance : 9.37e-05

Posterior Std. Deviation : 0.0096784
Prob. Quantile

------ ---------

0.005 0.2257997

0.01 0.2281086

0.025 0.2315198

0.05 0.2344727

0.5 0.2501666

0.95 0.2663105

0.975 0.2694523

0.99 0.2731245



0.995 0.2756366

>


Huiswerkopgave voor les 2

In een onderzoek onder 1000 kinderen, uitgevoerd in het Verenigd Koninkrijk in juni 2005, voorafgaand aan het verschijnen van J.K. Rowlings’ Harry Potter and the Half Blood Prince, gaf 40 procent van de kinderen aan dat ze een exemplaar van het nieuwe boek tijdens het eerste weekend na publicatie zouden gaan bemachtigen.


De uitgever van de Harry Potter boeken was uitgegaan van een populatieproportie van 38%.

a) Vraag vanuit de klassieke statistiek:


Houdt de uitkomst van de steekproef onder 1000 kinderen in dat de verwachting van de uitgever te laag was? Verklaar je antwoord.

Omdat er al meerdere boeken in de Harry Potter-reeks verschenen waren, had de uitgever haar verwachting op basis van eerder verkregen informatie geformuleerd.


Stel dat de uitgever was uitgegaan van de volgende discrete prior kansen:

b) Vraag vanuit de Bayesiaanse statistiek:


Wat is de posterior kans op een proportie van 0.38 resp. 0.40 in de populatie van kinderen die een exemplaar van het nieuwe boek tijdens het eerste weekend na publicatie zouden gaan bemachtigen?

Uitwerking:


a)
> binom.test(400,1000,0.38)
Exact binomial test
data: 400 and 1000

number of successes = 400, number of trials = 1000, p-value = 0.1927

alternative hypothesis: true probability of success is not equal to 0.38

95 percent confidence interval:

0.3694690 0.4311216

sample estimates:

probability of success

0.4

Het antwoord is nee, omdat de steekproefuitkomst van 400 uit 1000 - gezien de relatief hoge p-waarde van 0.1927 - geen onwaarschijnlijke (uitzonderlijke of extreme) uitkomst is wanneer in werkelijkheid de populatieproportie 0.38 zou zijn.
Of. vanuit het 95% betrouwbaarheidsinterval redenerend: wanneer we dit experiment (telkens aan 1000 kinderen vragen of ze het boek wel of niet gaan bemachtigen) vele malen zouden herhalen, dan zal de echte populatieproportie in 95% van alle gevallen tussen 0.3694690 en 0.4311216 liggen. En we zien dat de waarde van de nulhypothese 0.38 binnen dat interval ligt.

b)
> local({pkg <- select.list(sort(.packages(all.available = TRUE)),graphics=TRUE)

+ if(nchar(pkg)) library(pkg, character.only=TRUE)})
Attaching package: ‘Bolstad’
The following object(s) are masked _by_ ‘.GlobalEnv’:
binodp
Warning message:

package ‘Bolstad’ was built under R version 2.15.3

> library(Bolstad)

> pi=c(0.36,0.38,0.40)

> pi.prior=c(0.05,0.75,0.20)

> results=binodp(400,1000,pi,pi.prior)

Conditional distribution of x given pi and n:

395 396 397 398 399 400 401 402 403 404

0.36 0.0019 0.0016 0.0014 0.0012 0.0010 0.0008 0.0007 0.0006 0.0005 0.0004

0.38 0.0160 0.0150 0.0140 0.0130 0.0120 0.0111 0.0102 0.0093 0.0084 0.0076

0.4 0.0245 0.0249 0.0253 0.0256 0.0257 0.0257 0.0257 0.0255 0.0252 0.0249

Joint distribution:


393 394 395 396 397 398 399 400 401 402

[1,] 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0000 0.0000 0.0000 0.0000

[2,] 0.0136 0.0128 0.0120 0.0113 0.0105 0.0098 0.0090 0.0083 0.0076 0.0070

[3,] 0.0047 0.0048 0.0049 0.0050 0.0051 0.0051 0.0051 0.0051 0.0051 0.0051

Marginal distribution of x:

396 397 398 399 400 401 402 403 404 405

[1,] 0.0163 0.0156 0.0149 0.0142 0.0135 0.0128 0.0121 0.0114 0.0107 0.0101

Prior Likelihood Posterior

0.36 0.05 4.206276e-05

1   2   3   4   5   6   7   8   9   ...   25

  • 0.1916072 0.3159628
  • 0.2311503 0.2695853

  • Dovnload 2 Mb.