Page 24 - HS 3 Regressie en correlatie
P. 24
Combinatieleer, kansrekening en verklarende statistiek
3.6.3 Valkuilen voor causaliteit
Correlatie duidt slechts op een samenhang en niet op een oorzakelijk (causaal) verband. Op basis van de
correlatiecoëfficiënt is alleen te zeggen of er een lineair verband is tussen bijvoorbeeld gewicht en
lengte, niet of het één het ander veroorzaakt. Het is ook mogelijk dat een andere variabele zowel het
gewicht als de lengte beïnvloedt. Het is belangrijk om je bewust te zijn van het verschil tussen correlatie
en causaliteit.
Voorbeeld 1: de omgekeerde causaliteit
Soms lijken verbanden tussen twee variabelen op het eerste gezicht vrij logisch maar bij nader inzien
onzin. Er is een duidelijke correlatie tussen het aantal ingezette brandweermannen x bij een brand en de
grootte van de schade y van de brand.
Dit betekent geenszins dat een groter aantal brandweermannen de oorzaak zijn van een grotere brand.
Het is net andersom: indien er een grote brand is dan komen er meer brandweermannen om te blussen.
Voorbeeld 2: een derde variabele
Er is een correlatie tussen het aantal verkochte ijsjes en het aantal verkochte zonnebrillen.
Dit betekent geenszins dat het eten van ijsjes x de oorzaak is van het groter aantal verkochte
zonnebrillen y. Het aantal verkochte zonnebrillen is ook niet de oorzaak dat er meer ijsjes worden
gegeten.
In dit geval is er een derde variabele z, met name het goede weer. Deze derde variabele zal zowel het
aantal verkochte ijsjes laten toenemen als het aantal verkochte zonnebrillen.
Voorbeeld 3: schijnverbanden zonder enige verklaring
Er blijkt een sterke correlatie te zijn tussen de hoeveelheid ooievaars x in een gebied en het aantal
baby’s y die geboren worden. Uiteraard is het hier geen causaliteit. De verklaring is als volgt op het
platteland gaan meer jonge koppeltjes wonen die kinderen krijgen en op het platteland zijn er ook
ooievaars. t
e
Het voorbeeld duikt, voor zover valt na te gaan, het eerst op in het invloedrijke Amerikaanse n
.
statistiekboek van Box, Hunter en Hunter, Statistics for experimenters, gepubliceerd in 1978. o
l
Voorbeeld 4: nonsenscorrelaties e
h
In een studie werd de correlatie onderzocht tussen chocoladeconsumptie en het winnen van de t
a
Nobelprijs per 10 miljoen bewoners. Hoe hoger de chocoladeconsumptie, hoe meer mensen de m
Nobelprijs wonnen. Over causaliteit kunnen we in deze studie echter niet spreken. Er is namelijk geen .
enkele studie die deze correlatie wetenschappelijk kan verklaren. Ook van een logisch verband is geen w
sprake. De correlatie is dus toeval en totale nonsens. Nog meer nonsenscorrelaties werden verzameld w
op de website http://www.tylervigen.com/spurious-correlations w
© 2024 Ivan De Winne ivan@mathelo.net 24