Cronbachs alfa

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

Cronbachs α (alfa) is een maat voor de interne consistentie van items (bijvoorbeeld antwoorden) in psychometrische tests of van vragenlijsten die in onderzoek worden toegepast. De waarde van α is een indicatie van de mate waarin een aantal items in een test hetzelfde concept meten. Een psychometrische test zal één bepaald concept door middel van verschillende items meten. Om bijvoorbeeld het concept "angst" te meten, zal de test de respondent daarover meerdere vragen voorleggen. Cronbachs α geeft aan in hoeverre die items inderdaad hetzelfde concept meten, door te berekenen of de antwoorden van een grote groep respondenten op deze items consistent zijn.

Deze maat is ontwikkeld door Lee Cronbach, die hem in 1951 voor het eerst gebruikte. Eerder werd gebruikgemaakt van de Kuder-Richardson Formule 20 (kortweg KR-20) en van lambda-2 van Guttman.

Cronbachs α kan waarden aannemen van minus oneindig tot 1 (waarbij wordt opgemerkt dat alleen positieve waarden zinvol zijn). Als vuistregel wordt vaak gehanteerd dat een test of onderzoeksvragenlijst kan worden gebruikt bij een α van 0,70 of hoger, hoewel de gebruiken verschillen per onderzoeksdiscipline. Intelligentietests hebben vaak een hogere waarde voor α dan tests voor attitude of persoonlijkheid.

In de psychologie en sociologie wordt Cronbachs α frequent toegepast, maar ook in andere wetenschappen is het een belangrijke maat.

Definitie[bewerken]

In de klassieke testtheorie wordt de score X op een test bepaald als het totaal van de scores Yi op N afzonderlijke items:

X=\sum Y_i=\sum T_i+\sum E_i\,.

De score Yi op item i wordt daarin opgevat als de som van de "true score" Ti en een storingsterm, de "errorscore", Ei:

Y_i=T_i+E_i\,.

daarin zijn de true score en de errorscore ongecorreleerd, en ook worden de errorscores van de verschillende items als ongecorreleerd beschouwd. Bovendien is de verwachte errorscore 0:

E(E_i)=0\,,

De variantie van de totale score kan uiteengelegd worden in:

\mathrm{var}(X)=\mathrm{var}(\sum Y_i)=\sum \mathrm{cov}(Y_i,Y_j)+\sum\mathrm{var}(Y_i) =\sum \mathrm{cov}(T_i,T_j)+\sum\mathrm{var}(T_i) +\sum\mathrm{var}(E_i).\,

De onbetrouwbaarheid in de testscore vindt z'n oorzaak in de varianties van de true scores en de errorscores. Daarom kan men de betrouwbaarheid afmeten aan:

\frac{\mathrm{var}(X)-\sum\mathrm{var}(T_i)-\sum\mathrm{var}(E_i)}{\mathrm{var}(X)}=\frac{\sum \mathrm{cov}(T_i,T_j)}{\mathrm{var}(X)}=\frac{\mathrm{var}(X)-\sum \mathrm{var}(Y_i)}{\mathrm{var}(X)}=1-\frac{\sum \mathrm{var}(Y_i)}{\mathrm{var}(X)}.\,

Deze parameter is maximaal gelijk aan (N-1)/N. Zie ter illustratie Voorbeeld 1. Ter normering wordt daarom de betrouwbaarheid gedefinieerd als:

\frac N{N-1}\left(1-\frac{\sum \mathrm{var}(Y_i)}{\mathrm{var}(X)}\right).\,

De waarde van de betrouwbaarheid is maximaal 1 en naar beneden onbegrensd.

Het is deze parameter waarvan Cronbachs α een schatting geeft.

\alpha=\frac{N}{N-1}\left( 1-\frac{\sum_{i=1}^N S^2_{Y_i}}{S^2_X}\right),

daarin stellen de S2-en respectievelijk de steekproefvarianties voor van de totale score X en de scores op de items Yi.

Als Yik de score is van testpersoon k op item i, en er zijn m testpersonen, zijn de benodigde formules:

S^2_{Y_i} = \frac 1{m-1}\sum_{k=1}^m(Y_{ik}-Y_{i\cdot})^2,

waarin

Y_{i\cdot} = \frac 1m \sum_{k=1}^m Y_{ik}

de gemiddelde score op item i is, en

S^2_X = \frac 1{m-1}\sum_{k=1}^m(X_k-\bar{X})^2,

waarin

X_k = \sum_{i=1}^N Y_{ik}

de testscore van testpersoon k is.

Voorbeeld 1[bewerken]

Veronderstel dat er 2 respondenten zijn met als antwoordmogelijkheden 5 en 1 (Helemaal mee eens en Helemaal oneens). Persoon 1 geeft respectievelijk voor de items Y1 t/m Yn de code 5, terwijl Persoon 2 voor de items Y1 t/m Yn de code 1 geeft. Voor ieder Item geldt: Var(Yi) = 8 dus de som van Var(Yi) = 8N. Voor de som van de scores X zijn de scores van Persoon 1 en Persoon 2 respectievelijk: 5N en N. Dus var(X) = 8N^2. Bij de berekening van de varianties worden de steekproefvarianties berekend. Dit leidt tot de volgende maximale waarde 1 - 8N/8N^2 = 1 - 1/N = (N-1)/N. Opmerking: Een hoger of lagere meerpuntsschaal van een item leidt tot dezelfde maximale waarde. Om de parameter maximaal 1 te laten zijn wordt deze vermenigvuldigd met N/(N-1). Dit leidt tot bovenstaande Cronbachs alfa.

Voorbeeld 2[bewerken]

Een eenvoudig getallenvoorbeeld demonstreert de berekeningen. In de tabel staan van 3 items (N=3) de itemscores y van 5 (m=5) testpersonen en als rijsom de testscores x.

item 1 2 3 rijsom
itemscore testscore
testpersoon y1 y2 y3 x
1 4 3 5 12
2 2 0 3 5
3 1 1 2 4
4 3 2 4 9
5 4 2 3 9
variantie 10.70
variantie 1.7 1.3 1.3 4.30

In de onderste rijen staat de variantie S^2_X = 10{,}70 van de 5 testscores en de 3 varianties S^2_i van de itemscores met hun totaal \sum S^2_i = 4{,}30. Voor α berekenen we dan:

\alpha=\frac 32 \left(1-\frac{4{,}30}{10{,}70}\right)=0{,}90.

Gestandaardiseerde items[bewerken]

Als de items gestandaardiseerd zijn, dat wil zeggen met variantie 1, kan de betrouwbaarheid geschreven worden als:

\frac N{N-1}\frac{\sum \mathrm{cov}(T_i,T_j)}{\mathrm{var}(X)}=\frac N{N-1}\frac{\sum \rho(T_i,T_j)}{N+\sum \rho(T_i,T_j)}=\frac N{N-1}\frac{N(N-1)\bar{\rho}}{N+N(N-1)\bar{\rho}}=\frac{N\cdot\bar{\rho}}{1+(N-1)\cdot\bar{\rho}}.\,

Als schatter kan dan gebruikt worden:

\alpha = \frac{N\cdot\bar{r}}{1+(N-1)\cdot\bar{r}}

Hierin staat \bar{r} voor de gemiddelde onderlinge steekproefcorrelatie tussen de items.

Gebruik[bewerken]

Cronbachs α kan in verschillende fasen van een onderzoek gebruikt worden.

Onderzoeksfase Toepassing
Vooraf Bij de ontwikkeling van psychometrische tests, door de test voor te leggen aan een groot aantal proefrespondenten alvorens hem in de praktijk toe te passen
Bij de ontwikkeling van een onderzoeksvragenlijst, door hem voor te leggen aan een aantal proefrespondenten alvorens het onderzoek met deze vragenlijst uit te voeren;
Tijdens Bij de uitvoering van een onderzoek met een onderzoeksvragenlijst, door items alsnog te verwijderen als ze bij deze onderzoeksgroep Cronbachs α nadelig blijken te beïnvloeden (en dus niet het bedoelde concept blijken te meten).
Achteraf Cronbachs α geeft een maat voor de betrouwbaarheid van de data. Als bijvoorbeeld een enquête willekeurig is ingevuld of data verzonnen zijn, kan dit leiden tot een lage waarde van α.[1]
Bronnen, noten en/of referenties
  1. [1] Maarten Keulemans in de Volkskrant van 21/01/2012: Ontmaskering frauderende Stapel werd maandenlang voorbereid.