Covariantie

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

De covariantie is in de statistiek en kansrekening een parameter die bij twee toevalsvariabelen aangeeft in welke mate de beide toevalsvariabelen (lineair) met elkaar samenhangen. De covariantie geeft aan of, en indirect in welke mate, de waarden van de ene variabele toe- dan wel afnemen bij toenemende waarden van de andere.[1].

Een vergelijkbare parameter is de correlatiecoëfficiënt, die aangeeft in hoeverre sprake is van lineaire samenhang en die direct de sterkte van de samenhang aangeeft. De correlatiecoëfficiënt is gebaseerd op de covariantie, maar in tegenstelling tot de correlatiecoëfficiënt is de covariantie niet onafhankelijk van de schaal, zodat aan de grootte van de covariantie niet direct de sterkte van de samenhang afgelezen kan worden.

Met covariantie wordt ook vaak de steekproefcovariantie aangeduid, een grootheid die uit de steekproef berekend wordt als schatter voor de bovengenoemde parameter.

Definitie[bewerken]

Voor twee toevalsvariabelen X en Y wordt de covariantie gegeven door:

\mathrm{cov}(X,Y) = \mathrm{E}((X-\mathrm{E}X)(Y-\mathrm{E}Y))\,,

Daarin staat E voor de (statistische) verwachting. De covariantie is alleen gedefinieerd als de betrokken verwachtingswaarden bestaan.

De covariantie zal dus positief zijn, als grote waarden van X, dus waarden die boven de verwachting liggen, overwegend samengaan met grote waarden van Y en evenzo voor kleine waarden. Gaan grote waarden van X overwegend samen met kleine waarden van Y en omgekeerd kleine waarden van X met grote waarden van Y, dan zal de covariantie negatief zijn.

Covariantiematrix[bewerken]

Wanneer de samenhang tussen meer dan twee variabelen onderzocht wordt, kan een overzicht van de onderlinge covarianties weergegeven worden in een covariantiematrix, een symmetrische matrix waarin de varianties op de diagonale posities staan en de covarianties aan weerszijden.[2]

Eigenschappen[bewerken]

  • Er is een rekenregel die soms het berekenen van de covariantie vergemakkelijkt;
\!\mathrm{cov}(X,Y) = \mathrm{E}(XY)-\mathrm{E}(X)\mathrm{E}(Y).
  • De covariantie van een toevalsvariabele met zichzelf is de variantie:
\!\mathrm{cov}(X,X) = \mathrm{var}(X).
  • De volgorde van de toevalsvariabelen speelt geen rol:
\!\mathrm{cov}(X,Y) = \mathrm{cov}(Y,X).
\!\mathrm{cov}(aX+b,Y) = a\ \mathrm{cov}(Y,X).
\!\mathrm{cov}(X+Z,Y) = \mathrm{cov}(X,Y)+\mathrm{cov}(Z,Y).
  • De covariantie speelt een rol in de variantie van de som en het verschil:
\!\mathrm{var}(X\pm Y)=\mathrm{var}(X)+\mathrm{var}(Y)\pm 2\mathrm{cov}(X,Y).
\!\mathrm{cov}(X,Y) = 0.

Steekproefcovariantie[bewerken]

Als van twee simultaan verdeelde toevalsvariabelen X en Y een steekproef (x_1,y_1),\ldots, (x_n,y_n)\, van omvang n gegeven is, kan op grond van dat resultaat een schatting berekend worden van de covariantie cov(X,Y) van beide, die wel met steekproefcovariantie cxy aangeduid wordt en gedefinieerd is als:

c_{xy} = \frac{1}{n-1}\sum_{i=1}^n{(x_i-\bar{x}) (y_i-\bar{y})},

waarin \bar{x} en \bar{y} de respectievelijke gemiddelden voorstellen.

Er gelden overeenkomstige eigenschappen als voor de covariantie zelf. Ook geldt:

c_{xy} = \frac{1}{n-1} \left( \sum_i x_i y_i - n\bar{x}\bar{y} \right).

Zie ook[bewerken]

Bronnen en verwijzingen

  1. Zie voor uitleg bijvoorbeeld Wonacott & Wonnacott (1990), p 164-167
  2. Wackernagel (2003), p 20-21
  • Lesboek Lesboek: (en) Wonnacott, T.H. & Wonnacott, R.J.; 1990: Introductory Statistics, Wiley (5th ed.), ISBN 0-471-61518-8.
  • Handboek Handboek: (en) Wackernagel, H.; 2003: Multivariate Geostatistics, Springer (3rd ed.), ISBN 3-540-44142-5.