Statistiek
Wat betekent correlatie?
Correlatie betekent kort gezegd samenhang. Het gaat hierbij om samenhang tussen reeksen getallen of de waarden van toevalsvariabelen. Je kunt bij samenhang denken aan de samenhang tussen leeftijd en lengte of de samenhang tussen de groei van de economie en de bevolkingsgroei. De mate van samenhang wordt weergegeven met de correlatiecoëfficiënt.
Het gaat bij correlatie om lineaire samenhang. Bij wiskunde A, B en C leer je dat lineaire samenhang min of meer betekent dat je een rechte lijn kunt trekken door een grafiek. De onderstaande formule geeft de standaardvorm van een lineaire functie weer:
y = ax + b (1)
Correlatiecoëfficiënt
Een correlatiecoëfficiënt kan negatief, positief of 0 zijn. De coëfficiënt van negatieve correlatie valt tussen de 0 en de -1 en geeft een negatief verband aan. De coëfficiënt van positieve correlatie valt tussen de 0 en de 1 in en geeft een positief verband aan. Een coëfficiënt van 0 betekent dat er geen samenhang is. Dus hoe verder de correlatiecoëfficiënt verwijderd is van 0, hoe sterker de correlatie tussen de variabelen.
Hoe reken je correlatiecoëfficiënt uit?
De correlatie wordt weergeven met een r en meet de sterkte en de richting van de relatie tussen twee variabelen. Om de samenhang tussen verschillende variabelen uit te rekenen moet je de volgende stappen nemen.
Stap 1: Bereken de N. Dat is het aantal individuen die je hebt ondervraagd (het aantal respondenten).
Stap 2: Bereken de steekproefvariantie. Je moet eerst de steekproefvariantie berekenen voordat je uiteindelijk de standaarddeviatie kunt berekenen. Dat doe je met onderstaande formule. In de formule staat de N voor het aantal respondenten. De xi staat voor de waargenomen observaties 1 t/m i. De x (met streep erboven) staat voor het gemiddelde van de observaties x. Het sigmateken is het sommeringsteken en dit betekent dat je de reeks getallen bij elkaar op moet tellen.
Stap 3: Bereken de standaarddeviatie. De (steekproef)standaarddeviatie/standaardafwijking is de wortel van de steekproefvariantie die je bij stap 2 hebt berekend. Dus s = √ s².
Stap 4: Herhaal de stappen 2 t/m 4 ook voor de observaties y.
Stap 5: Als je de N en alle standaarden van de observaties hebt uitgerekend kun je aan de hand van onderstaande formule de correlatie uitrekenen.
Een voorbeeld
Om te verduidelijken hoe je een correlatiecoëfficiënt uitrekent, zal hier een voorbeeld uitgewerkt worden.
Stel je doet een onderzoek naar jongeren tussen de 15 en 20 jaar oud en je wilt graag weten of dit ook samenhangt met hoe gelukkig ze zijn. Je meet aan de hand van een enquête hoe gelukkig ze zijn. Je verwachting is dat kinderen gelukkiger worden naarmate ze ouder worden.
Jongeren |
Leeftijd |
Mate van geluk (waarbij 1 = ongelukkig en 5 = gelukkig) |
1 |
15 |
2 |
2 |
18 |
4 |
3 |
20 |
5 |
4 |
20 |
4 |
5 |
16 |
1 |
6 |
18 |
3 |
Interpretatie:
De correlatiecoëfficiënt in dit voorbeeld is 0,876426. Dit is een positief getal, dus dit betekent dat er een positief verband is tussen leeftijd en geluk. Hoe ouder je bent, hoe gelukkiger je bent.
Zoals eerder gezegd is de correlatie hoog als de coëfficiënt dicht bij 1 zit en laag als deze dicht bij 0 zit. Deze correlatie zit erg dicht bij 1. Je kunt dus zeggen dat er sprake is van een vrij sterke samenhang.
Als de correlatie tussen de 0.1 en de 0.3 zit kun je zeggen dat de correlatie laag is. Tussen 0.3 en 0.6 is de correlatie matig. Vanaf 0.6 kun je de correlatie hoog noemen.
Belangrijke punten
Belangrijk is om te bedenken dat samenhang niet perse een oorzakelijk verband aan geeft. Je kunt wel benoemen dat er een verband is maar je kunt bijvoorbeeld niet zeggen dat geluk veroorzaakt wordt door leeftijd. Uit het bovengenoemde voorbeeld zou namelijk ook gezegd kunnen worden dat geluk je leeftijd bepaalt en dit kan natuurlijk niet.
Ten slotte een belangrijk punt dat uit het bovenstaande voorbeeld blijkt: zorg dat je genoeg respondenten hebt geïnterviewd. Het liefst meer dan 20. Want hoe meer respondenten, hoe beter en betrouwbaarder je berekening van de correlatie wordt. Het is erg lastig om een verband aan te tonen als je maar weinig mensen ondervraagd hebt. Het aantal respondenten in het voorbeeld is ook eigenlijk te weinig.
Verder nog een tip: wordt niet ongelukkig als er geen verband wordt gevonden. In heel veel wetenschappelijk onderzoek komen er niet houdbare uitkomsten uit de statistische analyse. Maar 'geen resultaten' zijn ook resultaten. Succes!
Laatst gewijzigd: | 29 november 2021 15:54 |