Voorwaardelijke verwachting

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

In de kansrekening geeft de voorwaardelijke verwachting of conditionele verwachting van een stochastische variabele, gegeven een gebeurtenis, aan wat de verwachting van de variabele zal zijn, als we ons beperken tot de gegeven gebeurtenis.

Voorbeeld[bewerken]

Het volgende eenvoudige voorbeeld maakt het begrip duidelijk.

De gemiddelde leeftijd in Nederland, de verwachte leeftijd, is vermoedelijk niet gelijk aan de gemiddelde leeftijd per provincie. De voorwaardelijke verwachting van de leeftijd voor (gegeven) een bepaalde provincie, is niets anders dan de gemiddelde leeftijd in die provincie. Zo kan voor elke provincie de voorwaardelijk verwachte leeftijd bepaald worden. Daarmee is de informatie in de verdeling van de leeftijd alvast gereduceerd tot de provincies. De gemiddelde leeftijd in heel Nederland kan nu bepaald worden als het gewogen gemiddelde van de gemiddelden voor de provincies.

In een formele beschrijving kunnen we de leeftijd met X aanduiden en de provincie met Y. De verdeling van de leeftijd in de provincie Zeeland wordt dan gegeven door de voorwaardelijke verdeling van X, gegeven Y=\mbox{Zeeland}:

P(X=x|Y=\mbox{Zeeland}).

De gemiddelde (verwachte) leeftijd in Zeeland is de verwachtingswaarde van deze verdeling, die we de voorwaardelijke verwachting van de leeftijd X, gegeven Y=\mbox{Zeeland}, noemen:

E(X|Y=\mbox{Zeeland})=\sum_x xP(X=x|Y=\mbox{Zeeland}).

Voor elke provincie y kan zo de gemiddelde leeftijd bepaald worden:

E(X|Y=y)=\sum_x xP(X=x|Y=y).

Duidelijk is dat deze voorwaardelijke verwachting een functie van y, de provincie, is. Als functie van de stochastiche variabele Y opgevat, noteren we die als:

E(X|Y)

en noemen die de voorwaardelijke verwachting van X gegeven Y.

Dit is als functie van Y weer een stochastiche variabele. Het toeval bepaalt immers een willekeurige bewoner van Nederland, en daarmee de provincie waarin die woont en uiteindelijk de gemiddelde leeftijd in die provincie. Als de uitkomst \omega (een willekeurige Nederlander) is gevonden, neemt Y de waarde Y(\omega) (de provincie waarin \omega woont) aan en neemt de voorwaardelijke verwachting van X gegeven Y de waarde:

E(X|Y)(\omega)=E(X|Y=Y(\omega))

aan, de gemiddelde leeftijd in de provincie Y.

Definitie voor discrete stochastische variabelen[bewerken]

In het geval van een simultane verdeling van twee discrete stochastische variabelen X en Y, laat zich het begrip voorwaardelijke verwachting eenvoudig definiëren. De voorwaardelijke verwachting van X gegeven (de gebeurtenis) dat Y de waarde y aanneemt, genoteerd als:

E(X|Y=y),

is dan niets anders dan de verwachtingswaarde van de voorwaardelijke verdeling van Y gegeven de gebeurtenis Y=y.

Door de beperking tot de mogelijkheden waarvoor Y de waarde y aanneemt, kan X niet meer alle waarden aannemen, en "verandert" z'n verdeling in de voorwaardelijke verdeling. Dit heet wel voorwaardelijke verdeling, maar het is een gewone kansverdeling, waarvan de verwachtingswaarde, mits die bestaat, afhangt van de waarde y. De voorwaardelijk verwachting, gegeven Y=y is dus een functie van y. Beschouwen we deze functie als functie van de stochastische variabele Y, dan wordt de voorwaardelijke verwachting een stochastische variabele, genoteerd als:

E(X|Y),

die als Y de waarde y aanneemt zelf de waarde E(X|Y=y) aanneemt. Anders gezegd: als\omega de uitkomst is, neemt Y de waarde Y(\omega) aan en E(X|Y) de waarde E(X|Y=Y(\omega)).

In het inleidende voorbeeld is X de leeftijd van een Nederlander en Y de provincie waarin hij woont.

Abstracte definitie[bewerken]

Zij (\Omega,\mathcal{A},P) een kansruimte, X een integreerbare stochastische variabele (een variabele waarvan de absolute waarde integreerbaar is ten opzichte van de maat P) en \mathcal{D}\subset{A} een deel-sigma-algebra die de informatie weergeeft waarover we beschikken.

Een stochastische variabele Y die meetbaar is ten opzichte van \mathcal{D} en met de eigenschap dat voor elke meetbare verzameling D\in\mathcal{D} geldt:

E(X\cdot 1_D)=E(Y\cdot 1_D),

heet voorwaardelijke verwachting van X ten opzichte van \mathcal{D}.

Hierbij is E de gewone verwachting (Lebesgue-integraal) en 1_D de indicatorfunctie van D.

Omdat een voorwaardelijke verwachting op een nulverzameling na, uniek bepaald is, noteert men voor de (equivalentieklasse van de) voorwaardelijke verwachting meestal:

E(X|\mathcal{D}) of ook wel E\left[X|\mathcal{D}\right].

Verantwoording[bewerken]

De variabele Y is uniek bepaald op een nulverzameling na (bijna overal). Dat er altijd een dergelijke variabele bestaat, kan als volgt worden aangetoond. De afbeeldingen

f^+:\mathcal{D}\to\mathbb{R}:D\mapsto E[(X\vee0).1_D]
f^-:\mathcal{D}\to\mathbb{R}:D\mapsto -E[(X\wedge0).1_D]

zijn maten op de meetbare ruimte (\Omega,\mathcal{D}) die absoluut continu zijn ten opzichte van de restrictie van P tot \mathcal{D}. Wegens de stelling van Radon-Nikodym bestaan er dan dichtheden Y^+ en Y^- met de eigenschap dat voor elke meetbare verzameling D\in\mathcal{D} geldt:

f^+(D)=\int_DY^+dP(\omega)
f^-(D)=\int_DY^-dP(\omega)

Het verschil Y=Y^+-Y^- levert de gewenste variabele.

Verband met voorwaardelijke kans[bewerken]

De voorwaardelijke verwachting van een stochastische variabele is een veralgemening van het begrip voorwaardelijke kans. Zij A en B twee gebeurtenissen in een kansruimte, en noem

Y=P(A|B)\cdot 1_B+P(A|B^c)\cdot1_{B^c}.

Dan is Y een "stochastische variabele" die meetbaar is ten opzichte van

\sigma(\{B\})=\{\emptyset ,B, B^c, \Omega \},

de sigma-algebra voortgebracht door de gebeurtenis B. Deze stochastische variabele is meteen de voorwaardelijke verwachting van de stochastische variabele 1_A ten opzichte van \sigma(\{B\}).

Verwachting ten opzichte van een andere variabele[bewerken]

Als X en Y twee stochastische variabelen zijn, noemen we voorwaardelijke verwachting van X ten opzichte van Y, de voorwaardelijke verwachting van X ten opzichte van de sigma-algebra voortgebracht door Y:

E(X|Y)=E(X|\sigma(Y)).

Elementaire eigenschappen[bewerken]

  1. De voorwaardelijke verwachting is integreerbaar, en haar verwachting is gelijk aan de verwachting van de oorspronkelijke variabele: E(E(X|\mathcal{D}))=E(X)
  2. Als X zelf al meetbaar is ten opzichte van \mathcal{D}, is ze (bijna overal) gelijk aan haar eigen voorwaardelijke verwachting.
  3. Als \mathcal{C}\subset\mathcal{D}\subset\mathcal{A} een stijgende keten van deelstammen is, dan is de voorwaardelijke verwachting transitief: E(E(X|\mathcal{D})|\mathcal{C})=E(X|\mathcal{C})

Onafhankelijkheid[bewerken]

De stochastische variabele X is onafhankelijk van de sigma-algebra \mathcal{D} als haar voorwaardelijke verwachting bijna overal gelijk is aan een constante.

In het bijzonder is X onafhankelijk van een andere stochastische variabele Y als E(X|Y) constant is. Deze eigenschap blijkt symmetrisch te zijn in X en Y, en we zeggen dan ook simpelweg dat X en Y (onderling) onafhankelijk zijn.

Algemener heet een familie stochastische variabelen \left\{X_i|i\in I\right\} onderling onafhankelijk als ieder lid van de familie onafhankelijk is van de sigma-algebra voortgebracht door alle andere leden.

Het onafhankelijkheidsbegrip van gebeurtenissen A en B komt overeen met de onafhankelijkheid van hun indicatorfuncties 1_A en 1_B, opgevat als stochastische variabelen.