Stochastische variabele

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

Stochastische variabele (ook toevalsgrootheid, toevalsvariabele of stochast) is een begrip uit de kansrekening.

In veel kansexperimenten, zoals steekproeftrekkingen, wordt uit een populatie door toeval een element, bijvoorbeeld een willekeurige voorbijganger, aangewezen. We vragen deze voorbijganger naar zijn leeftijd, inkomen, e.d. Vooraf weten we niet wat we als antwoord zullen krijgen, achteraf wel, maar bij herhaling treffen we vermoedelijk een andere voorbijganger, met zeer waarschijnlijk andere antwoorden. Om in de theorie over 'de leeftijd van een willekeurige voorbijganger' te kunnen spreken is het begrip 'stochastische variabele' ingevoerd. Het toeval wijst een uitkomst aan - een of andere voorbijganger - en aan deze uitkomst wijzen we een getal toe - z'n leeftijd. Hieruit blijkt dat een 'stochastische variabele' een afbeelding is van de uitkomstenruimte naar de reële getallen.

Formele definitie[bewerken]

Een stochastische variabele X is een (meetbare) reële functie op de uitkomstenruimte Ω van een kansruimte.

X:\Omega \to \R

Omdat niet iedere deelverzameling van Ω een gebeurtenis hoeft te zijn, is ook niet noodzakelijk iedere functie op Ω een stochastische variabele. Daarom wordt geëist dat de functie meetbaar is, wat inhoudt dat het origineel van een interval een gebeurtenis is.

Zo kan door toeval een proefpersoon ω worden aangewezen (uitkomst van het kansexperiment) en stelt X(ω) diens gewicht voor. De waarden van de stochastische variabele X vormen eigenlijk weer een uitkomstenruimte, met daarop een "kans" bepaald door de kans op de oorspronkelijke uitkomstenruimte. Deze "kans" heet kansverdeling van X en geeft voor (meetbare) deelverzamelingen B van \mathbb{R} de kans dat X een waarde aanneemt die ligt binnen B.

Het waardenbereik van een stochastische variabele is dus een ‘vertaling’ van de uitkomstenruimte Ω bij een kansexperiment. Soms is het alleen gemakkelijk om formeel een stochastische variabele te introduceren in het geval dat Ω een deelverzameling van \mathbb{R} is. De identieke afbeelding is dan de geschikte functie. Als echter Ω bestaat uit kleuren, vormen, weersgesteldheden, namen van paarden bij een paardenrace, etc. dan zal er bij de definitie van de stochastische variabele X een eenduidig verband (moeten) worden gelegd tussen Ω en het waardenbereik van X (zie het voorbeeld met het dartpijltje).

De formele definitie van een stochastische variabele maakt het mogelijk dit begrip goed in te passen in de formele theorie, maar dat is niet wat ons vooral interesseert. We stellen vooral belang in de kansverdeling van een stochastische variabele, waarmee relevante kansen bepaald kunnen worden.

Voorbeeld[bewerken]

We gooien met twee dobbelstenen. De uitkomstenruimte bestaat uit de 6² = 36 paren mogelijke ogenaantallen:

\Omega = \{1, 2, 3, 4, 5, 6\} \times \{1, 2, 3, 4, 5, 6\}=\{(1,1),(1,2), \dots , (1,6), (2,1), \dots , (6,6) \} \,.

We willen graag het totale aantal geworpen ogen weten, daarom definiëren we de stochastische variabele X door:

X(\omega_1,\omega_2) = \omega_1+ \omega_2 \,.

Het waardenbereik van X is \{2, 3, \dots , 12 \} \,.

Door alle deelverzamelingen als gebeurtenis toe te laten, wat in zo'n eenvoudige situatie mogelijk is, hoeven we ons geen zorgen te maken over de meetbaarheid van X, want dan zijn alle functies meetbaar.

Notatie[bewerken]

Er zijn verschillende notatieconventies voor stochastische variabelen in gebruik. Twee van de meest gebruikte conventies zijn: de stochastische variabele onderstrepen (\underline{x}), de stochastische variabele aangeven met een hoofdletter (X).

Zie ook[bewerken]