Thuis
Contacten

    Hoofdpagina


Docent: drs. Rob Flohr

Dovnload 2 Mb.

Docent: drs. Rob Flohr



Pagina19/25
Datum05.12.2018
Grootte2 Mb.

Dovnload 2 Mb.
1   ...   15   16   17   18   19   20   21   22   ...   25

node mean sd MC error 2.5% median 97.5% start sample

kappa 0.6982 0.08459 0.001583 0.5143 0.7044 0.8435 501 3500

pi[1] 0.06072 0.01513 2.566E-4 0.03418 0.05976 0.09355 501 3500

pi[4] 0.8937 0.02007 3.667E-4 0.8512 0.8948 0.9294 501 3500


Conclusie:

Het 95% credible interval voor kappa loopt van 0.5243 tot 0.8435 en op grond hiervan mogen we concluderen dat de goedkope grieptest bruikbaar is.
-------------------------------------------------------------------------------------------------------------------------------

Hiërarchische modellen

Op basisschool A wordt in groep 5 een rekentoets afgenomen. De cijfers worden beschreven door - 'for the sake of argument' - een normale verdeling (grote klas) met een bepaald gemiddelde en een bepaalde stand.dev. De cijfers van de leerlingen in de klas (de data) - en dus ook de variatie in de cijfers - worden dus beschreven door een kansverdeling en zijn een kansvariabele (stochast).

Als je de resultaten in groep 5 op verschillende basisscholen met elkaar vergelijkt, zie je dat de groepsgemiddelden van elkaar verschillen, men zegt: de leerlingen van groep 5 zijn 'geclusterd' in een bepaalde klas. Dat betekent dat het groepsgemiddelde voor groep 5 zelf varieert per school en een kansvariabele is die weer wordt beschreven door een (andere) kansverdeling met specifieke parameters.

Enz. enz. (Hiërarchisch model).

Omdat in de Bayesiaanse statistiek parameters als kansvariabelen worden opgevat waardoor er per definitie variatie in de parameter is (i.t.t. de frequentistische statistiek: parameter, bijv. populatiegemiddelde, als onbekende maar vaste/constante grootheid), is het uitvoeren van statistische analyses gebaseerd op hiërarchische modellen in feite een vanzelfsprekende zaak binnen de Bayesiaanse statistiek.

( N.B. Een voordeel van de Bayesiaanse statistiek is, dat je door het opvatten van parameters als kansvariabelen, meer onzekerheid in je analyses mee kunt nemen. Binnen de frequentistische statistiek wordt de variatie meegenomen door de steekproevenverdeling, alleen is het niet altijd mogelijk om zo'n steekproevenverdeling te construeren).

Voorbeeld:


Van vijf regio's is het aantal gevallen van .... (een bepaalde ziekte) vastgesteld (per tijdseenheid), namelijk: 6, 4, 3, 10 en 3. Het aantal mensen/dieren per regio is (bijv. in 100-tallen): 80, 50, 65, 130 en 40.
We gaan ervan uit dat de data beschreven worden door een Poisson-verdeling.

Hoe kan het corresponderende model er uitzien?

model

{

for (i in 1 : N) {



theta[i] ~ dgamma(alpha, beta)

lambda[i] <- theta[i] * t[i]

x[i] ~ dpois(lambda[i])

predict[i]~dpois(lambda[i])

}

alpha ~ dexp(1)



beta ~ dgamma(0.1, 1.0)

}

list(t = c(80.0, 50.0, 65.0, 130, 40.0),



x = c( 6, 4, 3, 10, 3), N = 5)

WinBUGS OUTPUT:

model is syntactically correct

data loaded

model compiled

initial values generated, model initialized


Time series
















Kernel density




























Node statistics


1   ...   15   16   17   18   19   20   21   22   ...   25


Dovnload 2 Mb.