Correlatie
In de statistiek spreekt men van correlatie als er een min of meer (lineaire) samenhang blijkt te zijn tussen twee reeksen metingen of de mogelijke waarden van twee toevalsvariabelen. De sterkte van deze samenhang wordt beschreven met de correlatiecoëfficiënt.
[bewerken] Correlatiemaat
De mate van correlatie tussen twee variabelen wordt uitgedrukt in de correlatiecoëfficiënt. De waarde daarvan kan variëren tussen -1 en +1. Daarbij betekent 0: geen lineaire samenhang, +1: een perfecte positieve lineaire samenhang en -1: een perfecte negatieve lineaire samenhang. Hoe verder de correlatiecoëfficiënt verwijderd is van 0, hoe sterker de correlatie, en hoe nauwkeuriger de waarde van de ene variabele voorspeld kan worden op grond van de waarde van de andere variabele.
[bewerken] Praktische betekenis
Correlaties kunnen in de praktijk gebruikt worden om verbanden aan te wijzen en voorspellingen te doen. Voorbeelden daarvan zijn de correlatie tussen de uitslagen in twee opeenvolgende jaren van de CITO-toets in het lager onderwijs, en de correlatie tussen de prijs en de vraag in de economie. Als bekend is dat dergelijke variabelen gecorreleerd zijn, kan de ene variabele gebruikt worden om de andere te voorspellen. Zo is het voor een elektriciteitsbedrijf handig te weten hoeveel energie er op een dag gebruikt wordt, wat voorspeld kan worden als de correlatie tussen temperatuur en het energieverbruik van huishoudens bekend is.
Een bepaalde mate van statistische correlatie hoeft echter niet altijd te betekenen dat er inderdaad een oorzakelijk verband tussen de twee variabelen is. Als geen aanleiding bestaat om een correlatie te vermoeden (zoals tussen de kleur van de ogen en criminaliteit) betekent de correlatie waarschijnlijk niets. Als men correlaties test tussen honderden eigenschappen, zal een op de twintig onderzochte relaties statistisch significant zijn (wanneer men toetst op 5%-niveau), ook als de betreffende samenhang in de populatie waaruit de steekproef is getrokken, niet bestaat.
Een (significante) correlatie suggereert ook geen oorzakelijk verband. Als er een correlatie wordt gevonden tussen verhoogde agressiviteit bij kinderen en het aantal uren dat ze naar tv kijken is daarmee niet bewezen dat kinderen agressief worden van het televisiekijken. Net zo goed is het mogelijk dat kinderen die in aanleg meer neigen tot agressiviteit ook vaker televisiekijken als vrijetijdsbesteding kiezen, of dat een derde variabele (bijvoorbeeld sociaal milieu) verantwoordelijk is voor de samenhang tussen televisie kijken en agressiviteit. Er is in dit geval dus slechts sprake van een statistisch verband, en niet van een oorzakelijk verband.
Bekende voorbeelden van zulke "nonsenscorrelaties" zijn: de sterke, positieve correlatie tussen de grootte van de schade bij een brand en het aantal ingezette brandweerlieden, en de positieve correlatie tussen het aantal gesignaleerde ooievaars in Nederland en het geboortecijfer.