Accuraatheid

Uit Wikipedia, de vrije encyclopedie

Accuraatheid is de verhouding tussen het aantal juist geklasseerden en het totaal aantal geklasseerden bij een binaire classificatie.

Vierveldentabel[bewerken | brontekst bewerken]

Een binaire classificatie wordt dikwijls aanschouwelijk voorgesteld in een vierveldentabel. Hier volgt een algemeen voorbeeld:

ziekte Z aanwezig ziekte Z afwezig totaal
test positief (+) a c a+c
test negatief (–) b d b+d
totaal a+b c+d a+b+c+d

De frequentie a wordt vaak aangeduid door TP (True Positives), de frequentie b door FP (False Positives), de frequentie c door FN (False Negatives) en de frequentie d door TN (True Negatives). De frequentie a is het aantal van degenen die positief op de test scoren en die ook aan de door de test onderzochte ziekte lijden. 'Test' moet hier zeer breed verstaan worden: het kan ja of neen als antwoord zijn op een vraag, wit of zwart, zes of meer ten opzichte van minder dan zes, enzovoorts. De frequentie b is het aantal van degenen die positief scoren en die niet aan de ziekte lijden, de frequentie c is het aantal van degenen die negatief scoren en toch aan de ziekte lijden en de frequentie d is het aantal van degenen die negatief scoren en niet aan de ziekte lijden. Het totaal aantal geklasseerden is de som van a, b, c en d. Men kan dus schrijven:

accuraatheid = (a + d) / (a + b + c + d)

Het resultaat van de bewerking met deze formule drukt accuraatheid uit als fractie in per een (per unum, peruun). Vermenigvuldigd met honderd is de accuraatheid uitgedrukt als percentage (per honderd); vermenigvuldigt men met duizend dan wordt de accuraatheid uitgedrukt als promille (per duizend), enzovoorts.

Voorbeeld[bewerken | brontekst bewerken]

Een uitgewerkt voorbeeld:

ziekte Z aanwezig ziekte Z afwezig totaal
test positief (+) 60 20 80
test negatief (–) 40 80 120
totaal 100 100 200

In dit voorbeeld is dus a = 60, c = 20, b = 40 en d = 80. De accuraatheid is gelijk aan (60 + 80) / (60 + 20 + 40 + 80) = 0,7 per een (70%).