t-toets

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

Een t-toets is een parametrische statistische toets die onder andere gebruikt kan worden om na te gaan of het (populatie-)gemiddelde van een normaal verdeelde grootheid afwijkt van een bepaalde waarde, dan wel of er een verschil is tussen de gemiddelden van twee groepen in de populatie. Met behulp van een t-toets kan men dan een overschrijdingskans of een betrouwbaarheidsinterval bepalen.

Ontstaansgeschiedenis[bewerken]

De t-toets (en de bijbehorende t-verdeling) is ontwikkeld door William Sealy Gosset die werkte onder het pseudoniem Student. De toets wordt daarom ook regelmatig als Students t-toets aangeduid. Gosset was werkzaam voor de Guinness brouwerij, waar hij de kwaliteit van het gebrouwen bier in de gaten hield. Hij publiceerde zijn resultaten in 1908 in het statistische tijdschrift Biometrika. Zijn werkgever eiste dat hij dat onder een pseudoniem deed, omdat het gebruik van statistische methoden als 'bedrijfsgeheim' gezien werd.

Basisidee[bewerken]

Het basisidee van de t-toets is het volgende: Om na te gaan of van een normale verdeling met standaardafwijking σ de verwachtingswaarde μ een bepaalde waarde μ0 heeft, neemt men een steekproef van omvang n uit die verdeling en berekent men het steekproefgemiddelde \bar{X}. Onder de nulhypothese is dit gemiddelde ook normaal verdeeld met verwachting μ0 en standaardafwijking σ/√n. Het gestandaardiseerde steekproefgemiddelde

Z=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}

is onder de nulhypothese standaardnormaal verdeeld, zodat eenvoudig nagegaan kan worden of een steekproefuitkomst significant is.

In veel praktische gevallen is echter niet alleen de verwachtingswaarde onbekend, maar ook de standaardafwijking. Het ligt nu voor de hand om de standaardafwijking te schatten door de steekproefstandaardafwijking S en te berekenen:

T=\frac{\bar{X}-\mu_0}{S/\sqrt{n}}.

Het gevolg is dat de toetsingsgrootheid T onder de nulhypothese niet meer standaardnormaal verdeeld, maar een t-verdeling heeft, die wat breder is dan de standaardnormale.

Gebruik[bewerken]

De t-toets wordt onder andere in de volgende situaties gebruikt:

  • Als toets voor de nulhypothese dat het gemiddelde van een normaal verdeelde populatie gelijk is aan een bepaalde, vooraf gespecificeerde, waarde.
  • Als toets voor de nulhypothese dat de gemiddelden van twee normaal verdeelde populaties aan elkaar gelijk zijn. Er zijn verschillende varianten voor deze toets, afhankelijk van welke veronderstellingen er gemaakt worden.
  • Als speciaal geval van de eerstgenoemde mogelijkheid bij regressie-analyse om te toetsen of de helling of het intercept gelijk is aan vooraf gespecificeerde waarde.

Voorwaarden[bewerken]

Een t-toets kan gebruikt worden als aan bepaalde voorwaarden is voldaan. Bij de t-toets voor één steekproef moet gelden dat de betrokken steekproef een aselecte steekproef is uit een normale verdeling, met eventueel onbekende variantie.

In het geval van twee steekproeven dienen beide steekproeven uit een normale verdeling te komen. De twee steekproeven moeten óf onafhankelijk van elkaar zijn, óf zogenaamd gepaard zijn. In het geval van twee onafhankelijke steekproeven dienen bij toepassing van de standaard t-toets de beide populaties dezelfde variantie te hebben. Wanneer beide populaties een verschillende variantie hebben, kan een aangepaste t-toets gebruikt worden. Het geval van gepaarde waarnemingen komt neer op een t-toets voor de enkele steekproef van de verschillen.

Schendingen van deze assumpties hebben gevolgen voor de robuustheid en het onderscheidend vermogen van de t-toets. Met behulp van een F-toets kan getoetst worden of de varianties in beide groepen significant van elkaar verschillen. De normaliteit van de populaties kan getoetst worden met behulp van de Kolmogorov-Smirnovtoets.

Als aan de voorwaarden van de centrale limietstelling voldaan is, kan de t-toets benaderend toegepast worden voor grote steekproeven. De voor de berekening van de toetsingsgrootheid benodigde steekproefgemiddelden zijn dan immers bij benadering normaal verdeeld.

t-toets voor één steekproef[bewerken]

Definitie[bewerken]

Zij X_1,\ldots,X_n een aselecte steekproef uit een normale verdeling met onbekende verwachting μ en eventueel onbekende standaardafwijking. De t-toets voor het toetsen van de nulhypothese:

\,H_0: \mu = \mu_0,

is gebaseerd op de toetsingsgrootheid:

\,T=\frac{\bar{X}-\mu_0}{S}\sqrt{n} ,

waarin \bar{X} = \frac 1n \sum_{i=1}^n X_i het steekproefgemiddelde is en S = \sqrt{ \frac 1{n-1}\sum_{i=1}^n(X_i-\bar{X})^2 } de steekproefstandaardafwijking.

Onder de nulhypothese heeft T een t-verdeling met n-1 vrijheidsgraden.

De t-toets voor één groep kan men toepassen op een enkele steekproef, waarbij men toetst of het populatiegemiddelde afwijkt van een bepaalde waarde. Men past de t-toets in deze vorm ook toe op de verschilscores van twee afhankelijke groepen, als deze verschillen een aselecte steekproef vormen die voldoet aan de genoemde voorwaarden.

Voorbeeld 1[bewerken]

Zit er wel gemiddeld 250 g margarine in een kuipje zoals de fabrikant beweert? Om dat na te gaan nemen we een steekproef van n = 25 kuipjes en wegen de inhoud. We vinden als steekproefgemiddelde \bar x = 248.2 g en als standaardafwijking s = 2.5 g. We willen toetsen op een significantieniveau α van 5%. We veronderstellen dat de inhoud van de kuipjes normaal verdeeld is met verwachting \mu en standaardafwijking \sigma en we toetsen:

H_0: \mu = 250\!

tegen

H_1: \mu < 250\!

De toetsingsgrootheid T is dus:

T =\frac{\bar X - 250}{S}\sqrt{n} .

Uit de steekproef volgt voor T een waarde:

t = \frac{\bar x - 250}{s}\sqrt{n}= \frac{248{,}2 - 250}{2{,}5}\ 5 = -3{,}6

We verwerpen de nulhypothese voor te kleine waarden van T. Om na te gaan of de gevonden waarde t te klein is, zijn er twee benaderingen mogelijk.

De eerste methode vergelijkt t met de kritieke waarde tα,ν die bij het gegeven significantieniveau van 5% hoort. We verwerpen de nulhypothese als t ≤ tα,ν. We bepalen tα,ν zo, dat:


\!\,P(T \le t_{\alpha,\nu};H_0) = P(T(24) \le t_{\alpha,\nu}) = \alpha = 0{,}05
.

Uit de tabel van de t-verdeling kan worden afgelezen, gebruikmakend van de symmetrie:

\!\,P(T(24) \ge 1{,}711) = P(T(24) \le -1{,}711) = 0{,}05 ,

zodat we vinden:

\!\,t_{\alpha,\nu} = -1{,}711 .

Aangezien t < tα,ν, dient de nulhypothese verworpen te worden. We concluderen dat de kuipjes systematisch te weinig margarine bevatten.

Bij de tweede methode berekenen we de (linker) overschrijdingskans p van t en verwerpen de nulhypothese als p ≤ α.

\!\,p = P(T \le t;H_0) = P(T(24) \le -3{,}6).

Uit een tabel van de t-verdeling met n-1 = 24 vrijheidsgraden lezen we af dat p kleiner is dan 5%. De nulhypothese dient dus verworpen te worden en we concluderen dat de kuipjes systematisch te weinig margarine bevatten. De waarde van p kan met statistische software of programma's als Office Excel berekend worden en is ongeveer 0,00072.

t-toets voor twee steekproeven[bewerken]

Zoals eerder gemeld, zijn er twee situaties voor de t-toets voor twee steekproeven:

  • Twee gepaarde steekproeven
  • Twee onafhankelijke steekproeven

Definitie bij gepaarde steekproeven[bewerken]

Laat (X_1,Y_1), (X_2,Y_2),\ldots,(X_n,Y_n) een aselecte steekproef zijn van gepaarde waarnemingen uit een simultane verdeling met verwachtingswaarden \mu_X en \mu_Y, zo dat de verschillen Z_i=X_i-Y_i normaal verdeeld zijn. Voor het toetsen van de nulhypothese:

H_0:\mu_X=\mu_Y\!

gebruikt men de t-toets voor de enkelvoudige steekproef van de verschillen Z en toetst:

H_0:\mathrm{E}Z = 0\,

Voorbeeld 2[bewerken]

Is een afslankproduct wel effectief zoals de fabrikant beweert? Om dat na te gaan volgen we n=10 proefpersonen en wegen elk voor ze aan de kuur beginnen en erna. In de onderstaande tabel staan de resultaten.

proefpersoon 1 2 3 4 5 6 7 8 9 10
gewicht X voor 110 85 73 91 163 88 92 75 103 115
gewicht Y na 99 83 75 86 141 79 96 70 91 102
verschil Z=X-Y 11 2 –2 5 22 9 –4 5 12 13

Er is sprake van gepaarde waarnemingen. De beide gewichten van een en dezelfde proefpersoon kunnen niet als onafhankelijk worden beschouwd. Ook is het niet aannemelijk dat de gewichten voor de kuur en evenzo na de kuur uit een normale verdeling komen. Voor de verschilscores Z kan wel veilig aangenomen worden dat ze een aselecte steekproef uit een normale verdeling vormen. Als het middel geen effect heeft is de verwachting \mu_Z van de verschilscore 0; we toetsen daarom:

H_0: \mu_Z = 0\!

tegen

H_1: \mu_Z > 0\!

De toetsingsgrootheid T is dus:

T = \frac{\bar Z - 0}{S}\sqrt{n}.

Uit de steekproef volgt voor T een waarde:

t = \frac{\bar z }{s}\sqrt{n}= \frac{7{,}3}{7{,}75}\sqrt{10}= 2{,}98

We verwerpen de nulhypothese voor te grote waarden van T. Om na te gaan of de gevonden waarde t te groot is bepalen we de (rechter) overschrijdingskans van t. Uit een tabel van de t-verdeling met n- 1 = 9 vrijheidsgraden lezen we af dat de p-waarde van deze uitkomst t kleiner is dan 1%.

\,P(T \ge t;H_0) = P(T(9) \ge 2{,}98) = 0{,}008 < 0{,}01 .

Ook in dit voorbeeld wordt de nulhypothese verworpen (op 5% niveau) en nemen we aan dat het middel effectief is of dat er een placebo-effect is.

Definitie bij onafhankelijke steekproeven[bewerken]

Laat X_1,X_2,\ldots,X_n en Y_1,Y_2,\ldots,Y_m twee onafhankelijke aselecte steekproeven zijn uit respectievelijk een {\mathrm{N}}(\mu_X,\sigma^2)\,- en een {\mathrm{N}}(\mu_Y,\sigma^2)\,-verdeling met onbekende verwachtingswaarden en onbekende maar gelijke varianties. De t-toets voor het toetsen van de nulhypothese:

H_0:\mu_X=\mu_Y\!

is een toets gebaseerd op de toetsingsgrootheid:

T=\frac{\bar{X} -\bar{Y}}{S\sqrt{\frac 1n+\frac 1m}}\!,

waarin \bar X en \bar Y de steekproefgemiddelden zijn en S^2\, de zgn. gepoolde variantie is, gegeven door:

S^2=\frac{(n-1)S_X^2+(m-1)S_Y^2}{n+m-2}\!,

die het gewogen gemiddelde is van de beide afzonderlijke steekproefvarianties S_X^2 en S_Y^2.

Onder de nulhypothese heeft T een t-verdeling met n+m-2 vrijheidsgraden. Afhankelijk van het gekozen alternatief verwerpt men de nulhypothese eenzijdig dan wel tweezijdig.

Er is bij deze definitie aangenomen dat beide populatievarianties aan elkaar gelijk zijn. Wanneer dit niet het geval is, moet er een aangepaste t-toets uitgevoerd worden.

Voorbeeld 3[bewerken]

Zijn vrouwen van 40 jaar gemiddeld zwaarder dan vrouwen van 30 jaar? Om dat na te gaan nemen we een aselecte steekproef van n=10 vrouwen van 30 en een aselecte steekproef van m=15 vrouwen van 40. onafhankelijk van de eerste steekproef. Elke vrouw wordt gewogen. In de onderstaande tabel staan de resultaten.

gewicht in kg
x van 30-jarigen 77 65 73 58 63 49 51 82 103 69
y van 40-jarigen 102 73 56 55 83 72 88 70 81 85 44 71 62 78 75

Er is sprake van twee onafhankelijk steekproeven. De beide gewichten die in de tabel boven elkaar staan, hebben niets met elkaar te maken. We nemen aan dat beide steekproeven afkomstig zijn uit normale verdelingen met gelijke varianties, en verwachtingswaarden respectievelijk \mu_X\! en \mu_Y\!. We toetsen:

H_0: \mu_X = \mu_Y\!

tegen

H_1: \mu_X < \mu_Y\!

De toetsingsgrootheid T is dus:

T=\frac{\bar{X} -\bar{Y}}{S\sqrt{\frac 1n+\frac 1m}}=\frac{\bar{X} -\bar{Y}}{S\sqrt{\frac 1{10}+\frac 1{15}}}\!.

Uit de steekproef volgt:

\bar x = 69{,}0
\bar y = 73{,}0
s_X^2 = 255{,}8
s_Y^2 = 213{,}7

dus

s = \sqrt{\frac{9s_X^2+14s_Y^2}{23}}=\sqrt{230{,}2}=15{,}2

Voor T vinden we dus de waarde:

t=\frac{\bar{x} -\bar{y}}{s\sqrt{\frac 1{10}+\frac 1{15}}}=\frac{69{,}0 -73{,}0}{15{,}2\sqrt{\frac 1{10}+\frac 1{15}}}=-0{,}65\!

We verwerpen de nulhypothese voor te kleine waarden van T. Om na te gaan of de gevonden waarde t te klein is, bepalen we de (linker) overschrijdingskans van t. Uit een tabel van de t-verdeling met n+m–2 = 23 vrijheidsgraden lezen we de p-waarde van deze uitkomst af.

\,P(T \le t;H_0) = P(T(23) \le -0{,}65) = 0{,}26 .

Deze overschrijdingskans is te groot om reden te geven tot verwerping van de nulhypothese. Weliswaar waren de vrouwen van 40 in de steekproef gemiddeld 4 kg zwaarder dan de vrouwen van 30, maar dit verschil is niet significant gezien de spreiding binnen de groepen.

Software[bewerken]

De t-toets is een van de meest gebruikte toetsen in de statistiek, en zit daarom in de meeste statistische en data-verwerkingsprogramma's. Zo kan men in de statistische programmeertaal R de t-toets uitvoeren met behulp van de functie t.test. In de rekenbladen van Microsoft Excel en OpenOffice Calc is er de functie ttoets resp. T.TOETS of "T.TEST". In Matlab wordt gebruikgemaakt van het commando ttest voor de t-toets en ttest2 voor twee onafhankelijke steekproeven. Een veelgebruikt programma voor dergelijke statistische toetsen is SPSS.