Page 24 - HS 3 Regressie en correlatie
P. 24

Combinatieleer, kansrekening en verklarende statistiek


               3.6.3  Valkuilen voor causaliteit


               Correlatie duidt slechts op een samenhang en niet op een oorzakelijk (causaal) verband. Op basis van de
               correlatiecoëfficiënt is alleen te zeggen of er een lineair verband is tussen bijvoorbeeld gewicht en
               lengte, niet of het één het ander veroorzaakt. Het is ook mogelijk dat een andere variabele zowel het
               gewicht als de lengte beïnvloedt. Het is belangrijk om je bewust te zijn van het verschil tussen correlatie
               en causaliteit.
               Voorbeeld 1: de omgekeerde causaliteit
               Soms lijken verbanden tussen twee variabelen op het eerste gezicht vrij logisch maar bij nader inzien
               onzin. Er is een duidelijke correlatie tussen het aantal ingezette brandweermannen x bij een brand en de
               grootte van de schade y van de brand.









               Dit betekent geenszins dat een groter aantal brandweermannen de oorzaak zijn van een grotere brand.
               Het is net andersom: indien er een grote brand is dan komen er meer brandweermannen om te blussen.

               Voorbeeld 2: een derde variabele
               Er is een correlatie tussen het aantal verkochte ijsjes en het aantal verkochte zonnebrillen.
               Dit betekent geenszins dat het eten van ijsjes x de oorzaak is van het groter aantal verkochte
               zonnebrillen y. Het aantal verkochte zonnebrillen is ook niet de oorzaak dat er meer ijsjes worden
               gegeten.

               In dit geval is er een derde variabele z, met name het goede weer. Deze derde variabele zal zowel het
               aantal verkochte ijsjes laten toenemen als het aantal verkochte zonnebrillen.

               Voorbeeld 3: schijnverbanden zonder enige verklaring









               Er blijkt een sterke correlatie te zijn tussen de hoeveelheid ooievaars x in een gebied en het aantal
               baby’s y die geboren worden. Uiteraard is het hier geen causaliteit. De verklaring is als volgt op het
               platteland gaan meer jonge koppeltjes wonen die kinderen krijgen en op het platteland zijn er ook

               ooievaars.                                                                                          t
                                                                                                                   e
               Het voorbeeld duikt, voor zover valt na te gaan, het eerst op in het invloedrijke Amerikaanse       n
                                                                                                                   .
               statistiekboek van Box, Hunter en Hunter, Statistics for experimenters, gepubliceerd in 1978.       o
                                                                                                                   l
               Voorbeeld 4: nonsenscorrelaties                                                                     e
                                                                                                                   h
               In een studie werd de correlatie onderzocht tussen chocoladeconsumptie en het winnen van de         t
                                                                                                                   a
               Nobelprijs per 10 miljoen bewoners. Hoe hoger de chocoladeconsumptie, hoe meer mensen de            m
               Nobelprijs wonnen. Over causaliteit kunnen we in deze studie echter niet spreken. Er is namelijk geen   .
               enkele studie die deze correlatie wetenschappelijk kan verklaren. Ook van een logisch verband is geen   w
               sprake. De correlatie is dus toeval en totale nonsens. Nog meer nonsenscorrelaties werden verzameld   w
               op de website http://www.tylervigen.com/spurious-correlations                                       w


               © 2024 Ivan De Winne                 ivan@mathelo.net                                      24
   19   20   21   22   23   24