Thuis
Contacten

    Hoofdpagina


Docent: drs. Rob Flohr

Dovnload 2 Mb.

Docent: drs. Rob Flohr



Pagina7/25
Datum05.12.2018
Grootte2 Mb.

Dovnload 2 Mb.
1   2   3   4   5   6   7   8   9   10   ...   25

> gezelsch=c(8.59,8.69,8.73,8.8,8.81,8.82,8.84,9.06,9.24,9.28)

> mean(alleen)

[1] 7.472105



> mean(gezelsch)

[1] 8.886



> var.test(alleen,gezelsch)
F test to compare two variances
data: alleen and gezelsch

F = 32.9206, num df = 18, denom df = 9, p-value = 9.002e-06

alternative hypothesis: true ratio of variances is not equal to 1

95 percent confidence interval:

8.893909 96.428242

sample estimates:

ratio of variances

32.92063


> t.test(alleen,gezelsch,var.equal=F)
Welch Two Sample t-test
data: alleen and gezelsch

t = -4.5185, df = 20.004, p-value = 0.0002094

alternative hypothesis: true difference in means is not equal to 0

95 percent confidence interval:

-2.0666060 -0.7611834

sample estimates:

mean of x mean of y

7.472105 8.886000


We gaan vervolgens de standaardfout schatten met behulp van de bootstrap. Daar is overigens ook alle reden toe aangezien er twijfel bestaat omtrent een van de aannamen voor de -toets (namelijk normaal verdeelde populaties) (Van Peet e.a. 2012: 229). De uitvoering van de bootstrap m.b.v. R gaat als volgt:
eerst zetten we de data in twee datavectoren, we noemen ze groep1 en groep2. Vervolgens laten we de computer, op basis van deze data, een groot aantal malen het verschil van beide steekproefgemiddelden uitrekenen en tenslotte bekijken we de hieruit resulterende verdeling van al die verschillen om onze conclusies te kunnen formuleren.

groep1=c(8.05,9.19,5.46,8.38,6.31,8.53,6.75,7.48,6.72,8,5.99,7.89,8.16,5.33,8.93,9.21,8.19,8.34,5.06)

> groep2=c(8.59,8.69,8.73,8.8,8.81,8.82,8.84,9.06,9.24,9.28)

> mean(groep1)

[1] 7.472105

> mean(groep2)

[1] 8.886

> u=c(replicate(10000,mean(sample(groep2,replace=T))-mean(sample(groep1,replace=T))))

> sd(u)

[1] 0.3049353


We zien dat:


a) de standaarddeviatie van de bootstrap-verdeling (0,3049) en de eerder langs theoretische weg berekende standaardfout (de standaarddeviatie van de steekproevenverdeling) (0,314 resp. 0.313) dicht bij elkaar liggen en
b) dat de bootstrap-verdeling de normale verdeling sterk benadert, zie figuur 1 en figuur 2
Op basis hiervan kunnen we een 95% betrouwbaarheidsinterval als volgt bepalen:


Figuur 1. Histogram van de bootstrapverdeling

Figuur 2. Normaal kwantieldiagram van de bootstrapverdeling


> mean(groep2)-mean(groep1)

[1] 1.413895

> 1.413895+(1.96*0.3049353)

[1] 2.011568

> 1.413895-(1.96*0.3049353)

[1] 0.8162218

Het 95% betrouwbaarheidsinterval (0.8162 / 2.0116) bevat de nulhypothesewaarde van nul (er is geen verschil tussen de twee populatiegemiddelden) bij lange na niet zodat we besluiten de nulhypothese te verwerpen. Dit is het equivalent van de verwerping van de nulhypothese op basis van de zeer lage p-waarde die hierboven naar voren kwam.3



1   2   3   4   5   6   7   8   9   10   ...   25

  • > t.test(alleen,gezelsch,var.equal=F)

  • Dovnload 2 Mb.