ROC-curve

In de signaaldetectietheorie is een ROC-kromme (Engels: receiver operating characteristic (ROC)) een grafiek van de gevoeligheid (sensitiviteit) als functie van de aspecificiteit (1 - specificiteit) voor een binaire classifier als zijn discriminatiedrempel wordt gevarieerd. De ROC kan ook worden weergegeven door de fractie van true positives (TPR = true positive rate) uit te zetten tegen de fractie van fout-positieven (FPR = false positive rate). De ROC-kromme staat ook bekend als de relative operating characteristic curve, omdat twee operating characteristics (TPR en FPR) met elkaar worden vergeleken terwijl het criterium (de drempel) verandert.^[1]^[2]

ROC-analyse kan gebruikt worden voor kosten-batenanalyse bij diagnostische besliskunde. Met ROC-analyse kunnen optimale modellen worden uitgekozen en minder goede verworpen. De ROC-kromme werd oorspronkelijk ontwikkeld door elektrotechnici en radartechnici in de Tweede Wereldoorlog om vijandelijke objecten te onderscheiden. Het vakgebied heet ook wel signaaldetectietheorie. Tegenwoordig wordt ROC-analyse al tientallen jaren toegepast in de geneeskunde, radiologie, psychologie en andere gebieden. Sinds kort^{[(sinds) wanneer?]} wordt het ook gebruikt bij machinaal leren en datamining.

Terminologie en afleidingen[bewerken | brontekst bewerken]

In een voorspellingsprobleem met twee klassen (binaire klassificatie) zijn de uitslagen positief (p) of negatief (n). Een binaire classifier geeft vier resultaten. Als de uitslag p is en de echte waarde is ook p, dan hebben we een echt-positief (true positive, TP). Maar als de echte waarde n is hebben we een fout-positief (false positive, FP). Omgekeerd is er een echt-negatief (true negative, TN) als zowel de uitslag als de echte waarde n zijn en een fout-negatief (false negative, FN) als de uitslag n maar de echte waarde p is.

Naam	Verklaring	Formule
Echt-positief (true positive, TP)	treffer	$TP$
Echt-negatief (true negative, TN)	terechte verwerping	$TN$
Fout-positief (false positive, FP)	vals alarm, type I-fout	$FP$
Fout-negatief (false negative, FN)	gemist geval, type II-fout	$FN$
Totaal positieven P	som van echt-positieve en fout-negatieve uitslagen	$P=TP+FN$
Totaal negatieven N	som van echt-negatieve en fout-positieve uitslagen	$N=TN+FP$
True positive rate (TPR)	trefkans, recall, sensitiviteit	$TPR=TP/P=TP/(TP+FN)$
False positive rate (FPR)	gelijk aan kans op vals alarm, fall-out	$FPR=FP/N=FP/(FP+TN)$
Nauwkeurigheid (ACC)	aandeel juiste uitslagen	$ACC=(TP+TN)/(P+N)$
Specificiteit (SPC) of True Negative Rate		$SPC=TN/N=TN/(FP+TN)=1-FPR$
Positive predictive value (PPV)	gelijk aan precisie	$PPV=TP/(TP+FP)$
Negative predictive value (NPV)	kans op echt-negatieve uitslag	$NPV=TN/(TN+FN)$
False discovery rate (FDR)	kans op vals alarm	$FDR=FP/(FP+TP)$
Matthews correlatie coefficient (MCC)^[3]		$MCC={\frac {TP\times TN-FP\times FN}{\sqrt {(TP+FP)(TP+FN)(TN+FP)(TN+FN)}}}$

Voorbeeld[bewerken | brontekst bewerken]

Als voorbeeld nemen we een medische test om te bepalen of iemand een bepaalde ziekte heeft. Een fout-positief is als de test positief uitvalt (dus patiënt heeft de ziekte volgens de test), maar de persoon in het echt niet ziek is. Een fout-negatief doet zich voor als iemand een negatieve uitslag krijgt, terwijl de ziekte toch aanwezig is.

We bekijken een proef met P positieve en N negatieve gevallen. De vier uitkomsten kunnen in een 2×2 contingency table of confusion matrix, weergegeven worden:

		echte waarde
		p	n	totaal
Voorspelling resultaat	p'	True Positive	False Positive	P'
Voorspelling resultaat	n'	False Negative	True Negative	N'
total		P	N

Zie ook[bewerken | brontekst bewerken]

Bronnen, noten en/of referenties

↑ Swets, J. A. (1996): Signal detection theory and ROC analysis in psychology and diagnostics: Collected papers. Scientific psychology series. Hillsdale, NJ, US: Lawrence Erlbaum Associates, Inc.
↑ Fawcett, Tom (2006): An introduction to ROC analysis, Pattern Recognition Letters, 27, 861–874.
↑ Fawcett (2004)

[1] Swets, J. A. (1996): Signal detection theory and ROC analysis in psychology and diagnostics: Collected papers. Scientific psychology series. Hillsdale, NJ, US: Lawrence Erlbaum Associates, Inc.

[2] Fawcett, Tom (2006): An introduction to ROC analysis, Pattern Recognition Letters, 27, 861–874.

[3] Fawcett (2004)

[1]

[2]

[3]