Naar inhoud springen

Cronbachs alfa

Uit Wikipedia, de vrije encyclopedie

Cronbachs α (alfa) is een maat voor de betrouwbaarheid van psychometrische tests of van vragenlijsten.[1] De waarde van is een schatting voor de ondergrens van de betrouwbaarheid van de betrokken test. Om een schatting te bepalen van de betrouwbaarheid van een test zijn ten minste twee testafnames nodig. Op basis van één testafname kan Cronbachs berekend worden om zo een schatting van de ondergrens te verkrijgen. Cronbachs hangt af van het aantal items of vragen in de test, de gemiddelde covariantie tussen de items en de spreiding van de somscore.[2]

Cronbachs is ontwikkeld door Lee Cronbach, die hem in 1951 voor het eerst gebruikte. Andere, verwante maten zijn de Kuder-Richardson Formule 20, kortweg KR-20, en lambda-2 van Guttman.

Cronbachs kan waarden aannemen van minus oneindig tot 1 (waarbij wordt opgemerkt dat alleen positieve waarden zinvol zijn). Als vuistregel wordt vaak gehanteerd dat een test of onderzoeksvragenlijst bruikbaar is bij een van 0,70 of hoger, hoewel de gebruiken verschillen per onderzoeksdiscipline. Intelligentietests hebben vaak een hogere waarde voor dan tests voor attitude of persoonlijkheid.

In de psychologie en sociologie wordt Cronbachs frequent toegepast, maar ook in andere wetenschappen is het een belangrijke maat.

Om duidelijk te maken dat Cronbachs een schatting is van de betrouwbaarheid die is gebaseerd op louter één testafname, wordt ook wel gezegd dat Cronbachs een schatting is van de interne consistentie van een instrument. Deze term wordt helaas vaak verkeerd begrepen, namelijk als indicator van constructvaliditeit of dimensionaliteit. Clustering van items is echter niet terug te zien in de waarde van , omdat er bij de berekening van gebruik wordt gemaakt van de gemiddelde covariantie. Mede daarom is het geen goede maat voor dimensionaliteit/factor structuur. Een hoge waarde van impliceert dus niet noodzakelijkerwijs dat de test enkel één construct meet. Daarom raden verschillende auteurs aan om de term interne consistentie te vermijden. Als men een uitspraak wil doen over de dimensionaliteit van een test, is het beter om factoranalyse of item respons theorie[3] te gebruiken.

In de klassieke testtheorie wordt de score op een test bepaald als het totaal van de scores op afzonderlijke items:

De score op item wordt daarin opgevat als de som van de true score en een storingsterm, de error score, :

daarin zijn de true score en de error score ongecorreleerd, en ook worden de error scores van de verschillende items als ongecorreleerd beschouwd. Bovendien is de verwachte error score 0:

De variantie van de totale score kan uiteengelegd worden in:

De onbetrouwbaarheid in de testscore vindt z'n oorzaak in de varianties van de true scores en de error scores. Daarom kan de betrouwbaarheid worden afgemeten aan:

Deze parameter is maximaal gelijk aan . Zie ter illustratie Voorbeeld 1. Ter normering wordt de betrouwbaarheid daarom gedefinieerd als:

De waarde van de betrouwbaarheid is maximaal 1 en naar beneden onbegrensd. Het is deze parameter waarvan Cronbachs een schatting geeft.

,

daarin stellen de verschillende respectievelijk de steekproefvarianties voor van de totale score en de scores op de items .

Als de score is van testpersoon op item en er zijn testpersonen, dan zijn de benodigde formules:

waarin

de gemiddelde score op item is, en

waarin

de testscore van testpersoon is.

Een eenvoudig getallenvoorbeeld demonstreert de berekeningen. In de tabel staan van 3 items () de itemscores van 5 testpersonen () en als rijsom de testscores .

item 1 2 3 rijsom
itemscore testscore
testpersoon
1 4 3 5 12
2 2 0 3 5
3 1 1 2 4
4 3 2 4 9
5 4 2 3 9
variantie 10,70
variantie 1,7 1,3 1,3 4,30

In de onderste rijen staat de variantie van de 5 testscores en de 3 varianties van de itemscores met hun totaal . Voor berekenen we dan:

Gestandaardiseerde items

[bewerken | brontekst bewerken]

Als de items gestandaardiseerd zijn, dat wil zeggen met variantie 1, kan de betrouwbaarheid geschreven worden als:

Als schatter kan dan gebruikt worden:

Hierin staat voor de gemiddelde onderlinge steekproefcorrelatie tussen de items.

Cronbachs kan in verschillende fasen van een onderzoek gebruikt worden.

Onderzoeksfase Toepassing
Vooraf Bij de ontwikkeling van psychometrische tests, door de test voor te leggen aan een groot aantal proefrespondenten alvorens hem in de praktijk toe te passen
Bij de ontwikkeling van een onderzoeksvragenlijst, door hem voor te leggen aan een aantal proefrespondenten alvorens het onderzoek met deze vragenlijst uit te voeren
Tijdens Bij de uitvoering van een onderzoek met een onderzoeksvragenlijst, door items alsnog te verwijderen als ze bij deze onderzoeksgroep Cronbachs nadelig blijken te beïnvloeden
Achteraf Cronbachs geeft een maat voor de betrouwbaarheid van de data. Als bijvoorbeeld een enquête willekeurig is ingevuld of data verzonnen zijn, kan dit leiden tot een lage waarde van α[4]