Standaardafwijking

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken
Samenvoegen naar Iemand vindt dat de inhoud van dit artikel ingevoegd zou moeten worden in Variantie, of dat er een duidelijkere afbakening tussen beide artikelen dient te worden gemaakt. Als de tekst wordt ingevoegd, dient dit artikel een redirect te worden (hier melden).

De standaardafwijking of standaarddeviatie, een begrip in de statistiek, is een maat voor de spreiding van een variabele of van een verdeling. De standaardafwijking is gedefinieerd als de wortel uit de variantie, en daardoor vergelijkbaar met de waarden van de variabele zelf. Er moet onderscheid gemaakt worden of het gaat om een populatie of een steekproef. Voor een steekproef is de variantie (ongeveer) het gemiddelde van de kwadraten van de afwijking van de metingen ten opzichte van het gemiddelde van de gegevens. Bij een populatie is de variantie de verwachte kwadratische afwijking van de verwachtingswaarde. De standaardafwijking wordt gebruikt om de spreiding — de mate waarin de waarden onderling verschillen — van een verdeling aan te geven. De standaardafwijking wordt, anders dan de variantie, in dezelfde eenheid uitgedrukt als de verwachtingswaarde of het gemiddelde.

Inhoud

Voorbeelden [bewerken]

Populatie [bewerken]

De formule voor de populatievariantie, meestal aangeduid met σ2 is:

\sigma^2 =\frac 1N \sum_{i=1}^N (x_i - \mu)^2,

met μ het populatiegemiddelde, N de populatieomvang, xi de populatie-elementen.

Bij het werpen met een (eerlijke) dobbelsteen kunnen de ogenaantallen 1 t/m 6 met gelijke kans van 1/6 als uitkomst optreden. Het verwachte ogenaantal (populatiegemiddelde) van een worp is daarom:

\mu=\tfrac16 \cdot 1 +\tfrac16 \cdot 2 +\tfrac16 \cdot 3 +\tfrac16 \cdot 4 +\tfrac16 \cdot 5 +\tfrac16 \cdot 6 = 3\tfrac12.

De mogelijke afwijkingen van het verwachte ogenaantal zijn:

1-3\tfrac12 = -2\tfrac12,
2-3\tfrac12 = -1\tfrac12,
3-3\tfrac12 = -\tfrac12,
4-3\tfrac12 = \tfrac12,
5-3\tfrac12 = 1\tfrac12,
6-3\tfrac12 = 2\tfrac12,

die elk met kans 1/6 voorkomen. De (populatie)variantie is dus:

\sigma^2= \tfrac16 (-2\tfrac12)^2 +\tfrac16 (-1\tfrac12)^2 +\tfrac16  (-\tfrac12)^2 +\tfrac16 (\tfrac12)^2 +\tfrac16 (1\tfrac12)^2 +\tfrac16 (2\tfrac12)^2 = \tfrac{35}{12}.

De (populatie)standaardafwijking σ is dan:

\sigma = \sqrt{\tfrac{35}{12}}\approx 1{,}71,

een waarde tussen de mogelijke positieve afwijkingen.

Steekproef [bewerken]

De formule voor de steekproefvariantie s2 is:

s^2 = \frac 1{n-1}\sum_{i=1}^n (x_i - \bar{x})^2

Hierin zijn n de steekproefgrootte, xi de steekproefelementen en \bar{x} het steekproefgemiddelde.

Gooien we 10 keer met de dobbelsteen, met als resultaat de ogenaantallen:

\scriptstyle 3,\ 5,\ 3,\ 1,\ 6,\ 4,\ 1,\ 3,\ 2,\ 4,

dan is het steekproefgemiddelde:

\scriptstyle  \bar{x}=\tfrac1{10}(3+5+3+1+6+4+1+3+2+4)=3{,}2.

De afwijkingen van het gemiddelde ogenaantal zijn:

3-3{,}2 = -0{,}2,
5-3{,}2 = +1{,}8,
3-3{,}2 = -0{,}2,
1-3{,}2 = -2{,}2,
6-3{,}2 = +2{,}8,
4-3{,}2 = +0{,}8,
1-3{,}2 = -2{,}2,
3-3{,}2 = -0{,}2,
2-3{,}2 = -1{,}2,
4-3{,}2 = +0{,}8.

De (steekproef)variantie is dus:

\scriptstyle s^2=\tfrac19 \left( (-0{,}2)^2 + 1{,}8^2 + (-0{,}2)^2 + (-2{,}2)^2 + 2{,}8^2 + 0{,}8^2 + (-2{,}2)^2+ (-0{,}2)^2+ (-1{,}2)^2+ 0{,}8^2 \right) =2{,}62

en de (steekproef)standaardafwijking s is:

\scriptstyle s = \sqrt{2{,}62} = 1{,}62.

Normale verdeling [bewerken]

Diagramma standaardafwijking.png

Bij normale verdelingen wijkt van de mogelijke waarden:

  • 68,3% ten hoogste 1 keer de standaardafwijking af van de verwachtingswaarde (het midden van de verdeling)
  • 95,4% ten hoogste 2 keer de standaardafwijking af van de verwachtingswaarde
  • 99,7% ten hoogste 3 keer de standaardafwijking af van de verwachtingswaarde

Willekeurige verdeling [bewerken]

Dankzij de centrale limietstelling weten we verder dat voor veel verdelingen de verdeling van de som en dus ook van het gemiddelde van een groot aantal onafhankelijke waarnemingen daaruit, bij voldoende veel metingen bij benadering de vorm van een normale verdeling heeft. Bijgevolg gelden de bovengenoemde percentages niet alleen voor de normale verdeling, maar bij benadering ook voor het gemiddelde van een groot aantal onafhankelijke waarnemingen uit veel onbekende verdelingen.