Docent: drs. Rob Flohr

Dovnload 2 Mb.

Docent: drs. Rob Flohr

Grootte2 Mb.

Dovnload 2 Mb.
1   ...   17   18   19   20   21   22   23   24   25

node mean sd MC error 2.5% median 97.5% start sample

theta 5.484 0.0414 8.878E-4 5.402 5.484 5.565 1 2000

f) de kans dat de dichtheid ligt tussen 5.402 en 5.565 is 95%

Les 8

-citaat uit de American Scientist, May-June 2014 (Kevin Heng: 'Is numerical mimicry a third way of establishing truth?').

Het betreft een artikel over astronomie en astrofysica maar de overeenkomst met wat we op 10 juni besproken hebben (rationalisme, empirisme en de toenemende invloed van simulaties binnen de statistiek - WinBUGS is gebaseerd op MCMC-simulaties) is treffend.


"Empiricism lies at the heart of the scientific method. It seeks to understand the world through experiment and experience. This cycle of formulating and testing falsifiable hypotheses has amalgamated with a modern form of rationalism - the use of reasoning, mathematics, and logic to understand nature. These schools of thought are couched in centuries of history and, until recently, remained largely distinct.
Proponents of empiricism include the 18th-century Scottish philosopher David Hume, who believed in a ...sensory-based perception of the world.
Rationalism is the belief that the use of reasoning alone is sufficient to understand the natural world, without any recourse to experiment. Its roots may be traced to the Greek philosophers ... Plato and Pythagoras; its more modern proponents include Kant ....and Descartes.

A clear example of both practices at work is in the field of astronomy and astrophysics. Astronomers discover, catalog, and attempt to make sense of the night sky using powerful telescopes. Astrophysicists mull over theoretical ideas, form hypotheses, make predictions for what one expects to observe, and attempt to discover organizing principles unifying astronomical phenomena. Frequently, researchers are practitioners of both subdisciplines.


Multiscale problems, ...., do not lend themselves to such simplification. ...... Many real-life problems in biology, chemistry, physics, and the atmosferic and climate sciences are multiscale as well.

By necessity, a third, modern way of testing and establishing scientific truth - in addition to theory and experiment - is via simulations, the use of (often large) computers to mimic nature. It is a synthetic universe in a computer. One states an equation (or several) describing the physical system being studied, programs it into a computer, and marches the system forward in space and time. If all of the relevant physical laws are faithfully captured, then one ends up with an emulation - a perfect , The Matrix-like replicationof the physical world in virtual reality."


Voor informatie over Bayesiaanse statistiek, zie bijv.:

(A) Hoofdpunten Bayesiaanse statistiek:

1) kenmerk statistiek: je kunt iets niet met zekerheid zeggen. Vraag: hoe druk je die onzekerheid uit, preciezer: hoe kwantificeer je die onzekerheid?

de onzekerheid zit in de variabiliteit van hypothetisch ( 'stel dat de nulhypothese waar is en stel dat we ons experiment vele malen zouden herhalen, ...) gerepliceerde datasets, preciezer: in de variabiliteit van de steekproevenverdeling. Je hebt dus een steekproevenverdeling ('sampling distribution') nodig die langs theoretische weg (Centrale Limiet Stelling) of langs empirische weg (simulaties: Bootstrap) gevonden kan worden.

(onzekerheid : hoe verhoudt jouw steekproefuitkomst zich tot de verzameling van alle mogelijke steekproefuitkomsten uit dezelfde populatie?)

Op basis daarvan wordt de p-waarde gedefinieerd en vastgesteld.

De onzekerheid wordt uitgedrukt in de vorm van een directe kansuitspraak over het wel of niet optreden van een gebeurtenis of over een specifieke parameter-waarde. Een kans betreft een kwantificering/meting van een 'personal degree of belief'.

Over dit begrip zegt prof. Dennis Lindley4 het volgende (Dennis V. Lindley (2007). Understanding Uncertainty. Hoboken, New Jersey: Wiley, p. 12):

"A term is needed to describe what it is that you feel about the event. The phrase usually employed is "degree of belief"; and we will talk about your degree of belief in the truth of the event, so that you have the highest beliefwhen you think it is true, and least when false. Belief is a useful word because it does emphasize that the uncertainty we are talking about is a relationship between you, on the one hand, and an event on the other. Belief does not reside entirely with you because it refers to the world external to you. Belief is not a property of the world because your degree of belief may reasonably be different from mine. Rather, belief expresses a relationship between you and the world, in particular between you and an event in that world.
The word that will be used to measure the strength of your belief is probability, so that we talk about your probability that an event is true, or more succinctly, your probability for the event. One of the greatest experts on probability (Bruno de Finetti, RF), having written a two-volume work on the topic, calling it simply Theory of Probability, wanted an aphorism to include in his preface that would encapsulate the basic concept expressed therein. He chose

Probability does not exist

It was intended to shock, for having written 675 pages on a topic, it did not seem sensible to say that the topic did not exist. But having brought it to your attention by the shock, its meaning becomes apparent; probability does not exist as a property of the world in the way that distance does, for distance between two points, properly measured, is the same for all of us, it is objective, whereas probability depends on the person looking at the world, on you, as well as on the event, that aspect of the world under consideration.
Our task in this book is to measure beliefs through probability, to see how they combine and how they change with new information. This book is therefore about your beliefs in events. It is not about what those beliefs should be, instead it is solely about how those beliefs should be organized; how they need to relate, one to another."

2) het kansbegrip:
'probability is defined as the long-run frequency of events in hypothetical replicates'.

'probability is (the measurement of) the individual belief that an event happens or that a parameter takes a specific value'.
(zie ook onder punt 1)

Op basis hiervan kan de stelling verdedigd worden dat de Bayesiaanse statistiek probabilistisch van aard is, in tegenstelling tot de frequentistische statistiek (die immers parameters niet als kansvariabelen opvat).

Die probabilistische basis is er niet voor niets, getuige de volgende uitspraken:

...if this [ probability ] calculus be condemned, then the whole of the sciences must also be condemned. (Henri Poincaré)

Our assent ought to be regulated by the grounds of probability (John Locke)

Over het begrip objectiviteit: ideaal van objectiviteit (Fisher) versus de volgende opmerking van een andere grondlegger van de klassieke of frrequentistische statistiek, E.S. Pearson - de zoon van Karl Pearson)5:

"Of necessity, as it seemed to us [ him and neyman ] , we left in out mathematical model a gap for the exercise of a more intuitive process of personal judgement in such matters ..... as the choice of the most likely class of admissible hypotheses, the appropriate significance level, the magnitude of worthwhile effects and the balance of utilities."

(E.S. Pearson 1966: 'Some Thoughts on Statistical Inference', Cambridge University Press, geciteerd in C.Howson& P. Urbach (2006). Scientific Reasoning. The Bayesian Approach. Chicago: Open Court)

De tegenstelling objectief - subjectief moet dus met de nodige nuance bekeken worden!!

kansuitspraken van de vorm (is p-waarde) (frequentistisch)

N.B. Denk aan de Sally Clark case : een kleine p-waarde houdt niet noodzakelijkerwijs in dat de alternatieve hypothese waar is! !

4) onbekende grootheden (parameters) worden opgevat/behandeld als zijnde vaste grootheden (frequentistisch) resp. als kansvariabelen (stochasten) (Bayesiaans)

5) frequentistische hypothesetoetsing versus Bayesiaanse model selectie (Bayes factor): zie bijv. hoofdstuk 5 uit De Bayesiaanse benadering.

6) ..% betrouwbaarheidsinterval versus ..% 'credible interval' : let op verschil in betekenis!

7) Prior verdeling: biedt mogelijkheden om bestaande kennis in de analyse op te nemen maar het kan ook lastig zijn om een passende prior te vinden.

Aandacht voor verkeerde interpretaties van het significantiebegrip in de frequentistische statistiek en (interne) kritiek op het theoretisch kader van de
nulhypothese - significantietoetsing (zie bijlagen).

Bayesiaanse statistiek: het belang van kennis van kansverdelingen, zowel voor de priorverdeling als voor de likelihood (welke kansverdeling gebruik je om de data te genereren?).

We hebben in de loop van deze cursus een aantal kansverdelingen besproken:
beta-, gamma-, normale verdeling (voor de prior)
binomiale-, Poisson- en normale verdeling (voor de likelihood)

maar er zijn uiteraard nog veel andere kansverdelingen beschikbaar.


Ook voor de Bayesiaanse statistiek geldt:
hoe meer data, hoe minder onzekerheid (zie voorbeeld koala's)

Ter afsluiting een eenvoudig voorbeeld om nogmaals de Bayesiaanse redeneerwijze te illustreren:

Een onderzoeker bestudeert de ecologie van een populatie koala's. De aandacht gaat vooral uit naar de 'sex ratio' van koala's die zijn voortgebracht door vrouwtjes die onder slechte fysieke omstandigheden leven. De onderzoeker heeft voorafgaand aan het verzamelen van de data geen idee omtrent de 'sex ratio'.
De onderzoeker vindt 12 van dergelijke vrouwtjes met elk een jong in de buidel. Het blijkt dat 3 van die jonge koala's van het mannelijk en negen van het vrouwelijk geslacht zijn.
(a) Welke uitspraak kan de onderzoeker doen omtrent de 'sex ratio' van deze populatie?
(b) Wat verandert er in de uitspraak wanneer er 30 van 120 jonge koala's van het mannelijk geslacht blijken te zijn?
(c) Let ook op de vorm van de posteriorverdeling in beide situaties.
(Gebruik WinBUGS om de antwoorden te vinden)

(d) En wat verandert er (uitgaande van 3 mannelijke jongen op 12 jonge koala's) als de onderzoeker op grond van vorige studies, nog voordat ze de data gaat verzamelen, verwacht dat de proportie mannelijke jongen met een kans van 95% zal liggen tussen 0.20 en 0.40?


(a) 95% credible interval: 0.10 - 0.53

Node statistics

node mean sd MC error 2.5% median 97.5% start sample

r 0.2804 0.1154 0.004465 0.09786 0.2724 0.5297 1 1000

(b) 95% credible interval wordt 0.18 - 0.34 (hoe meer data -> hoe meer informatie -> hoe minder onzekerheid -> hoe meer precisie/nauwkeurigheid)

Node statistics

node mean sd MC error 2.5% median 97.5% start sample

r 0.2546 0.04013 8.962E-4 0.1833 0.2523 0.3372 1 2000

model is syntactically correct

(c) posterior kansdichtheid bij b) is vloeiender en daardoor eenduidiger

> local({pkg <- select.list(sort(.packages(all.available = TRUE)),graphics=TRUE)

+ if(nchar(pkg)) library(pkg, character.only=TRUE)})

> library(LearnBayes)

> quantile1=list(p=0.025,x=0.20)

> quantile2=list(p=0.975,x=0.40)

> help(

starting httpd help server ... done


[1] 23.18 55.41

> x=seq(0,1)

> curve(dbeta(x,23.18,55.41))

95% credible interval wordt 0.20 - 0.39 (o.a. de invloed van de rechtergrens 0.40 van de prior)

Merk op dat binnen de klassieke/frequentistische statistiek het (betrouwbaarheids-)interval steeds meer terrein wint ten opzichte van de significantietoets, vergelijk de volgende citaten uit de Publication Manual van de American Psychological Association (APA), zesde editie (2010):

"Because confidence intervals combine information on location and precision ..........they are, in general, the best reporting strategy. The use of confidence intervals is therefore strongly recommended." (p. 34)

"Historically, researchers in psychology have relied heavily on null hypothesis statistical significance testing (NHST) as a starting point for many ... of its analytic approaches. APA stresses that NHST is but a starting point and that additional reporting elements such as .....confidence intervals .....are needed to convey the most complete meaning of the results." (p. 33)


# Van zes kopieerapparaten is het aantal storingen per periode bekend (de lengte van de perioden verschilt per apparaat). het gaat om de volgende gegevens (het eerste getal is het aantal storingen, het tweede getal heeft betrekking op de lengte van de periode in dagen):

#apparaat 1 : 3 storingen in 44 dagen

#apparaat 2: 1 / 20

#app. 3: 5 / 60

#app. 4: 4 / 55

#app. 5: 2 / 33

#app. 6: 2 / 39

#Gebruik inferentiële statistiek om inzicht in het falen van de zes apparaten te verkrijgen.

model {

for(i in 1:6)

{ fail[i]~dpois(lambda[i])


lambda[i]<- theta[i]*time[i]






expected right parenthesis

model is syntactically correct

data loaded

model compiled

initial values generated, model initialized

Kernel density
Node statistics
1   ...   17   18   19   20   21   22   23   24   25

  • De tegenstelling objectief - subjectief moet dus met de nodige nuance bekeken worden!! 3)
  • node mean sd MC error 2.5% median 97.5% start sample
  • > library(LearnBayes) > quantile1=list(p=0.025,x=0.20) > quantile2=list(p=0.975,x=0.40) > help(

  • Dovnload 2 Mb.