Thuis
Contacten

    Hoofdpagina


3 Discrete kansverdelingen Inhoudsopgave

Dovnload 0.88 Mb.

3 Discrete kansverdelingen Inhoudsopgave



Pagina2/8
Datum25.10.2017
Grootte0.88 Mb.

Dovnload 0.88 Mb.
1   2   3   4   5   6   7   8

12 Zeg wat in opgave 11 de grootheid X is.

En wat is n? Wat zijn de waarden x1, x2, …? Wat zijn p1, p2, … ?


Verwachtingswaarde


In bovenstaande notatie is E(X) = p1x1p2x2  ...  pnxn de verwachtingswaarde van X.
Als je de tabel van de kansverdeling kent (zoals in opgave 11):

waarde

x1

x2



xn

kans

p1

p2



pn



kun je de verwachtingswaarde dus eenvoudig uitrekenen: vermenigvuldig elk van de mogelijke uitkomsten met de kans op die uitkomst en tel vervolgens de producten op.


E(X) kun je zien als een theoretisch gemiddelde: je neemt het gemiddelde van de mogelijke waarden, rekening houdend met de kansen waarmee ze voorkomen.

Als je het experiment bij herhaling uitvoert, zal de gemiddelde waarde (hoogst waarschijnlijk) dicht bij E(X) liggen.


De letter E komt van expectatio.
De redenering is als volgt.

Voer in gedachten het experiment een (groot) aantal keren uit, zeg N keer.

Dan zal naar verwachting p1N keer de waarde x1 optreden, p2N keer de waarde x2, enzovoort.

De gemiddelde uitkomst is (p1Nx1 + p2Nx2 + …) / N

en dat is gelijk aan p1x1p2x2  ... , de verwachtingswaarde van X.

13 Ga naar de digimap of naar VU-Statistiek, Simulaties, Dobbelstenen.



a. Werp 300 keer met één dobbelsteen. Noteer hoe vaak elk van de aantallen ogen optreedt.

Bereken met behulp van deze frequenties hoe groot de verwachtingswaarde van het aantal ogen is.



b. De verwachtingswaarde van het aantal ogen bij het werpen met een dobbelsteen kun je ook met de theoretische kansen berekenen. Doe dat.
Werp 300 keer met drie dobbelstenen en let op de som van de ogen bij een worp.

c. Welke waarden kan die som aannemen?

d. Elke mogelijke waarde komt een zeker aantal onder die 300 keer voor (eventueel 0 keer). Bereken met behulp van deze frequenties hoe groot de verwachtingswaarde van de som van de aantallen ogen is.
Merk op dat je nu niet zo gemakkelijk kunt zeggen wat de theoretische kansen op de verschillende ogensommen zijn. Dus is de verwachtingswaarde van de ogensom van drie dobbelstenen niet zo eenvoudig met de tabel van de kansverdeling te vinden. We komen hier verderop op terug.
14 Reisbureaus bieden vlak voor vertrek zogenaamde last minute-reizen aan. Ze proberen door de prijzen te verlagen het vliegtuig en/of hotel op die manier alsnog vol te krijgen. Reizen die normaal bijvoorbeeld €800 kosten, kunnen dan geboekt worden voor €550. Wie zou dat niet willen? Maar dit kan alleen als er nog plaatsen over zijn. Dus als je gokt op zo’n last minute-aanbieding, loop je het risico dat er geen plaats is.

Familie Jansen telt vier personen en wil komende zomer naar Turkije. Zo'n reis kan in april geboekt worden voor €800 per persoon. Vorig jaar zomer zag de familie een last minute-aanbieding van deze reis voor €550 per persoon. Neem aan dat de kans 0,60 is dat deze aanbieding dit jaar weer komt (met plaats voor vier personen). Als de aanbieding niet komt, zal de familie, om toch naar Turkije te kunnen, een duurdere lijnvlucht moeten boeken van €900 per persoon.




Welk advies zou jij de familie Jansen geven: in april boeken of wachten tot de zomer? Onder- steun je advies met verwachtingswaarden.

15 In een doos zitten zes ballen: twee witte en vier zwarte. Uit die doos nemen we aselect drie ballen. X is het aantal witte ballen als met terugleggen getrokken wordt, Y als er zonder terug-leggen getrokken wordt.



a. Geef in een tabel de kansverdeling van X en bereken E(X).

b. Geef in een tabel de kansverdeling van Y en bereken E(Y).

16 Anne speelt Mens-erger-je-niet. Ze heeft geen pionnen op het speelbord. Zodra ze een zes heeft gegooid met de dobbelsteen, mag ze een pion op het bord zetten. Daar zit ze dus op te wachten. Het kan zijn dat ze meteen de eerste beurt een zes gooit (dan heeft ze geluk), maar het kan ook zijn dat ze een heleboel beurten moet wachten alvorens haar dobbelsteen 6 ogen geeft.

Het aantal beurten dat Anne nodig heeft voordat ze een zes gooit noemen we X.

a. Wat is de kans dat X = 3?

b. Welke waarden kan X aannemen?

c. Maak een tabel van de kansverdeling van X voor de eerste vijf waarden.

d. Hoe groot is de kans dat X > 8?

e. Hoe groot schat jij dat E(X) is?

f. Controleer je schatting met een simulatie: ga naar de digimap of naar VU-Statistiek, Simulaties, Random Generator, Gooien tot (bij Verdeling).


Extra

In onderdeel f heb je een idee gekregen hoe groot de verwachtingswaarde E(X) ongeveer is. Het is niet eenvoudig E(X) exact te berekenen. Daarvoor gebruiken we een speciale truc.

Anne gaat beginnen; het duurt gemiddeld E(X) beurten voordat ze de eerste zes gooit. Er kunnen twee dingen gebeuren.

  • Anne werpt meteen een zes; dan duurt het 1 beurt. Dit gebeurt met kans .

  • Of Anne werpt niet meteen een zes; dan duurt het gemiddeld nog E(X) beurten, dus in totaal E(X)+1 beurten. Dit gebeurt met kans .

Dus is de gemiddelde duur · 1 + · (E(X)+1).

We hebben nu de vergelijking E(X) = · 1 + · (E(X)+1).

g. Bereken hieruit E(X).


De somregel voor de verwachtingswaarde
17 In twee warenhuizen is gedurende een doordeweekse dag bijgehouden hoe lang de mensen met hun boodschappen voor de kassa moesten wachten, afgerond op halve en hele minuten.


wachttijd

in minuten

0

0,5

1

1,5

2

percentage klanten

in winkel A

20

10

20

25

25

percentage klanten in winkel B

0

40

40

20

0


Zo moesten bijvoorbeeld in winkel A 20% van de klanten 1 minuut wachten. Met deze gegevens maken we een model: we nemen aan dat bovenstaande verdeling voor iedere doordeweekse dag geldt. Voor iedere klant geldt in dit model dus dat de kans dat hij 1 minuut in winkel A moet wachten 0,20 is. Voor de andere wachttijden en voor winkel B worden op dezelfde wijze de kansen gedefinieerd.




a. Bereken de verwachtingswaarde van de wachttijd voor winkel A.

Ook voor winkel B.

b. Een klant bezoekt beide winkels. Bereken de kans dat hij in de winkels even lang moet wachten.
De totale wachttijd W voor iemand die beide winkels bezoekt, varieert van 0,5 tot en met 3,5 minuut.

c. Maak een tabel van de kansverdeling van W.

d. Bereken de verwachtingswaarde van W.
De som van je twee antwoorden van a is – als het goed is – exact gelijk aan je antwoord van d. Als je daar even over nadenkt, is dat nogal logisch.

e. Waarom?

18 Op een dobbelsteen is de som van de ogen op twee tegenover elkaar liggende kanten 7.

Het aantal ogen dat boven komt noemen we X, het aantal ogen dat onder komt Y.

Verder bekijken we de som S = X + Y.

a. Hoe groot is Y, als X = 2?

b. Welke waarden kan X aannemen? En Y? En welke waarden kan S aannemen?

c. Bereken E(X), E(Y) en E(S).

d. Geldt: E(S) = E(X) + E(Y)?
19 Iemand werpt met twee dobbelstenen. X1 is het aantal ogen dat hij met de ene dobbelsteen werpt en X2 het aantal ogen met de andere dobbelsteen.

S = X1 + X2 is de som van de aantallen ogen. Zie opgave 7 voor de kanstabel voor S.

a. Hoe groot is E(X1)? En hoe groot is E(X2)?

b. Bere­ken E(S).

c. Geldt: E(S) = E(X1) + E(X2)?
Somregel voor de verwachtingswaarde

Bij een experiment worden twee aantallen geteld. De verwachtingswaarde van de som van twee aantallen is gelijk aan de som van de verwachtingswaarden van de twee afzonderlijke aantallen. Dit geldt ook als een uitkomst van het eerste aantal van invloed is op de uitkomst van het tweede (zie opgave 18). In opgave 88 staat een ander voorbeeld.

De regel geldt ook bij de som van meer dan twee aantallen; bijvoorbeeld:

als S = X1X2X3 , dan E(S) = E(X1)E(X2)E(X3).


Deze somregel maakt berekeningen vaak veel eenvoudiger. Bijvoorbeeld bij op­gave 13 wisten we dat E(X1) = E(X2) = 3,5; zonder de kans­verdeling van S = X1+X2 uit te rekenen, weten we dat E(S) = E(X1)  E(X2) = 3,5  3,5 = 7.

In opgave 13d hebben we door simulatie de verwachtingswaarde van de som van de ogen bij drie dobbelstenen kunnen schatten. Met de somregel weten we dat die verwachtingswaarde 10,5 is.



20 De verwachtingswaarde van het aantal geboortes per dag is in Nederland 554 (gegevens van 2004).

a. Wat is de verwachtingswaarde van het aantal geboortes in een week?

b. Wat heeft dit met bovenstaande somregel te maken?

21 Bridge wordt gespeeld met een pak van 52 kaarten, waaronder dertien hartenkaarten. Een speler krijgt hieruit dertien kaarten. Het aantal hartenkaarten dat hij bij de eerste kaart krijgt is natuurlijk 0 of 1.

a. Wat is de verwachtingswaarde van het aantal hartenkaarten bij de eerste kaart.

De verwachtingswaarde van het aantal hartenkaarten bij de zesde kaart is hetzelfde. Dat is logisch want de zesde kaart is met dezelfde kans een harten als de eerste.



b. Wat is de verwachtingswaarde van het aantal hartenkaarten bij de dertiende kaart.

c. Wat is de verwachtingswaarde van het aantal hartenkaarten die de speler krijgt?


Joyce bezoekt met 100 euro een braderie. Er is een loterij met duizend loten en met slechts één prijs: 1.000 euro. Een lot kost 15 euro. Aan het eind van de middag zal de notaris het winnende lot trekken.

Joyce heeft besloten op de braderie alleen geld aan de loterij te besteden.




  • Joyce koopt een lot.

Wat is de verwachtingswaarde van haar bezit na de braderie?


  • Joyce koopt vijf loten.

Wat is de verwachtingswaarde van haar bezit na de braderie?



 Spreiding


22 We kijken opnieuw naar opgave 17. Die ging over de wachttijden aan de kassa in twee warenhuizen op een doordeweekse dag.



wachttijd

in minuten

0

0,5

1

1,5

2

percentage klanten

in winkel A

20

10

20

25

25

percentage klanten in winkel B

0

40

40

20

0


De verwachtingswaarde van de wachttijd bleek in winkel A 1,125 te zijn; om die waarde liggen de wachttijden in winkel A gespreid. Voor winkel B was de verwachtingswaarde B 0,9; de wacht-tijden in winkel B liggen om 0,9 gespreid.

a. In welke winkel variëren de wachttijden het minst, in winkel A of in winkel B, vind je? Met andere woorden, in welke winkel is de spreiding van de wachttijden het kleinst? Licht je antwoord toe.
We vergelijken de klasseringen van twee wielrenners in vijf grote koersen. Renner A werd 3e, 4e, 20e, 1e en 17e. Renner B werd 6e, 12e, 9e, 15e en 3e.

b. Bereken het gemiddelde van de klasseringen van renner A. Ook van renner B.

c. De prestaties liggen om de gemiddelden gespreid. Welke renner presteert het wisselvalligst, vind je? Met andere woorden, van welke renner is de spreiding van de klasseringen het grootst? Licht je antwoord toe.


23 a. In welke politieke staatsvorm is de spreiding van het inkomen het grootst, in een communistische of in een kapitalistische?

Schets een globale grafiek van de inkomensverdeling in beide staatsvormen in één figuur.



b. In welk klimaat is de spreiding van de dagelijkse temperatuur het grootst, in een landklimaat of in een zeeklimaat?

Schets een globale grafiek van de temperatuursverdeling in beide klimaattypen in één figuur.



c. Bij welke sport is de spreiding van de lichaamslengte het grootst, bij basketbal of van bij voetbal?

Schets een globale grafiek van de lengteverdeling van beide groepen sporters in één figuur.



In de voorbeelden van de vorige twee opgaven kun je "op gevoel" wel zeggen in welk geval de spreiding het grootst is. Dat kan natuurlijk niet altijd, bijvoorbeeld als in eerste instantie de verdelingen niet zo veel verschillen. Dan hangt het er maar vanaf hoe je kijkt of hoe je rekent bij welke verdeling de spreiding het grootst genoemd zou moeten worden. Daarom moeten we precies zeggen wat we met spreiding bedoelen. Dat kan op verschillende manieren.

Eerder al hebben we ontmoet:



  • de spreidingsbreedte; dat is de grootste min de kleinste waarde,

  • de kwartielafstand; dat is het derde kwartiel min het eerste kwartiel,

  • de gemiddelde absolute afwijking,

  • de standaardafwijking.

Hiervan is de standaardafwijking de belangrijkste.

De standaardafwijking van een frequentieverdeling (databstand)


We herhalen wat we in hoofdstuk 1 – Verschillen hebben geleerd.

De standaardafwijking is .

Hierbij staat n voor het aantal waarnemingen en d voor de afwijkingen (= deviaties) van de waarnemingen van het gemiddelde.

In woorden: de standaardafwijking is de wortel van het gemiddelde van de kwadraten van de afwijkingen (van het gemiddelde).


Hiernaast staat nog eens hoe je de standaardafwijking berekent.

Bijvoorbeeld als er drie waarnemingen zijn: 1, 5 en 6, verloopt de berekening van de standaardafwijking als volgt:



  • het gemiddelde is 4,

  • de afwijkingen van het gemiddelde zijn -3, 1 en 2,

  • de kwadraten van deze afwijkingen zijn 9, 1 en 4,

  • het gemiddelde van deze kwadraten is ongeveer ,

  • de wortel hiervan is ongeveer 2,16 en dat is de sd.



24 Uit de set waarnemingen 1, 5, 6 van bovenstaand voorbeeld maken we op verschillende manieren een nieuwe set waarnemingen.

Ga voor elke van de volgende sets waarnemingen a stap voor stap na wat de sd is.



a. 2, 6, 7

b. 101, 105, 106

c. 2, 10, 12

d. 10, 50, 60

e. 1, 1, 5, 5, 6, 6

f. 1, 1, 1, 1, 1, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6

25 a. Vergelijk de sd van de set 1, 5, 6 met die van de sets in opgave 24a en 24b.

Welke conclusie trek je?



b. Vergelijk de sd van de set 1, 5, 6 met die van de sets in opgave 24c en 24d.

Welke conclusie trek je?



c. Vergelijk de sd van de set 1, 5, 6 met die van de sets in opgave 24e en 24f.

Welke conclusie trek je?

In de praktijk werk je met grote databestanden en dan bereken je de sd op de computer, bijvoorbeeld in Excel, in VuStatistiek of op de GR.

26 a. Bereken met een computer of de Grafische Rekenmachine de sd van de aantallen doelpunten per voetbalwedstrijd in de eredivisie, seizoen 2006-2007:




aantal doelpunten

0

1

2

3

4

5

6

7

8

9

aantal wedstrijden

18

46

63

58

53

35

19

10

3

2


b. Ga naar het bestand kinderen in de Digimap. Zie opgave 6 van hoofdstuk 2 - Verdelingen.

Bereken de sd van het gewicht van de kinderen.



c. Ga naar het bestand oldfaithful in de Digimap. Zie opgave 7 van hoofdstuk 2 - Verdelingen.

Bereken de sd van de duur van de erupties.



27 Van een databestand is het gemiddelde 187 cm en de standaardafwijking is 7,2 cm.

a. Wat zijn het gemiddelde en de sd als we in dm rekenen in plaats van in cm?

b. Wat zijn het gemiddelde en de sd als we in inches rekenen? 1 inch = 2,54 cm.

Van Dale over spreiding:

(statistische wiskunde) middelbare fout; mate van uiteenlopen van de uitkomsten van een waarneming, syn. standaarddeviatie, strooiing
In de wiskunde verstaan we onder spreiding een getal, dat aangeeft hoezeer de data in een bestand uit elkaar liggen.

Als de spreiding 0 is, dan zijn alle data gelijk. Kleiner kan de spreiding niet zijn.

Als de spreiding heel groot is, dan liggen de data ver uit elkaar.
De belangrijkste maat voor de spreiding van een databestand is de standaardafwijking sd. Van een databestand berekenen we die als volgt: ; hierbij zijn d de afwijkingen van het gemiddelde en is n het aantal waarnemingen.
Voorbeeld


waarde

3

4

5

6

7

8

frequentie

19

22

18

23

17

1



Stel dat er zes verschillende waarden voorkomen met de volgende frequenties:


Er zijn in totaal 100 waarnemingen, het gemiddelde is 5 en de afwijkingen van het gemiddelde zijn -2, -1, 0, 1, 2 en 3. Dan gaat de berekening van de sd als volgt:
.
Algemeen

gegeven is de frequentietabel:




waarde

x1

x2

x3



frequentie

f1

f2

f3






Er zijn n = f1 + f2 + f3 + … waarnemingen, het gemiddelde is en de afwijkingen van het gemiddelde zijn , , , … . Dan gaat de berekening van de sd als volgt:

.

.
De wortel is genomen om de kwadraten op te heffen. Dankzij de wortel is in bijvoorbeeld opgave 27 de sd in cm als de gegevens in cm zijn en is de sd in inch als de gegevens in inch zijn.

Zonder het wortelteken heb je dus sd2. Dat heet ook wel de variantie. In het vervolg zullen we zien dat het met de variantie gemakkelijker rekent dan met de sd.

28 De wachttijden aan de kassa in twee warenhuizen op een doordeweekse dag zijn (zie opgave 17)





wachttijd

in minuten

0

0,5

1

1,5

2

percentage klanten

in winkel A

20

10

20

25

25

percentage klanten in winkel B

0

40

40

20

0


De verwachtingswaarde van de wachttijd bleek in winkel A 1,125 te zijn en in winkel B 0,9.

a. Bereken de standaardafwijkingen van de wachttijden in beide winkels.

b. In opgave 19a heb je intuïtief gezegd in welke winkel de spreiding van de wachttijden het grootst is. Is het resultaat in a hiermee in overeenstemming?
In opgave 22b hebben we de klasseringen van twee wielrenners in vijf grote koersen opgevoerd. Renner A werd 3e, 4e, 20e, 1e en 17e, renner B werd 6e, 12e, 9e, 15e en 3e. Van beide klasseringen is 9 het gemiddelde.

c. Bereken de standaardafwijkingen van de klasseringen.

d. In opgave 22c heb je intuïtief gezegd van welke renner de spreiding van de klasseringen het grootst is. Is het resultaat in c hiermee in overeenstemming?

De standaardafwijking van een kansverdeling


De stap naar een kansverdeling is nu snel gemaakt.
1   2   3   4   5   6   7   8


Dovnload 0.88 Mb.