Betrouwbaarheid (statistiek)

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

In statistische toepassingen wordt de term betrouwbaarheid gebruikt om aan te geven in hoeverre een meting vrij is van meetfouten.

Een score op een test (bijvoorbeeld een vragenlijst, een bloedtest, een MRI test, etc.) bestaat volgens de klassieke testtheorie uit twee delen: de betrouwbare score en een meetfout. Betrouwbaarheid en meetnauwkeurigheid zijn aanverwante begrippen. De belangrijkste toetssteen voor nauwkeurigheid/betrouwbaarheid is dat bij hermeting (ongeveer) hetzelfde resultaat wordt opgetekend. De test-hertest methode is dan een veelgebruikte methode om de betrouwbaarheid te schatten. Hierbij wordt er een correlatie berekend tussen scores op twee of meer testafnames. Er wordt dan wel de aanname gemaakt dat de tests dezelfde statistische eigenschappen bezitten.[1]

Als men enkel beschikt over één testafname, is het uitsluitend mogelijk de ondergrens van de betrouwbaarheid te schatten. Voor een vragenlijst met minimaal drie vragen kan men gebruik maken van bijvoorbeeld Cronbachs alfa of Guttmanns Lambda-2.

Betrouwbaarheid garandeert niet de validiteit van de meting. Echter, een hoge betrouwbaarheid is een voorwaarde voor validiteit.

De betrouwbaarheid van een meting kan op verschillende wijzen worden gedefinieerd. Een definitie luidt: betrouwbaarheid geeft de mate aan waarin meetresultaten een afspiegeling zijn van de te meten variabele. Een andere definitie luidt: betrouwbaarheid geeft de mate aan waarin metingen vrij zijn van de invloed van toevallige factoren. Beide definities komen op hetzelfde neer. De betrouwbaarheid wordt als een verhouding van twee varianties uitgedrukt:

r_{xx}= \frac{\sigma^2(T)}{\sigma^2(X)}

Hier is r_{xx} het symbool voor betrouwbaarheid, \sigma^2(T) voor de variantie van de betrouwbare score (T van het Engelse 'True score'), en \sigma^2(X) de variantie van de geobserveerde score X.

Zoals eerder werd genoemd, wordt de betrouwbaarheid vaak geschat door de correlatiecoëfficient te berekenen voor twee testafnames. Correlaties kunnen normaal gesproken liggen tussen de waarden -1 en +1. De betrouwbaarheid is zoals hierboven te zien is uit te drukken als de breuk van twee varianties. Omdat varianties alleen positieve waarden aan kunnen nemen, zal de betrouwbaarheid dus (in theorie) altijd liggen tussen de 0 en de 1.

Bij de minimale waarde van de betrouwbaarheid (0) zijn de meetresultaten volledig onbetrouwbaar, scores worden alleen door toevallige factoren bepaald. Bij de waarde 1 zijn de toevalsfactoren volledig uitgeschakeld.

Tegenover de toevallige factoren staan de niet-toevallige factoren (systematische factoren) die al dan niet gebonden zijn aan de onderzoekssituatie of het gebruikte meetinstrument. Systematische fouten (bias) komen niet tot uitdrukking in een betrouwbaarheidscoëfficient.

In de geodesie wordt met statistische betrouwbaarheid de mate van gecontroleerdheid van een meting aangeduid.


Zie ook[bewerken]

  1. Nunnally, J. C. (1978). Assessment of Reliability. In: Psychometric Theory (2nd ed.). New York: McGraw-Hill.