Onderzoeksmethoden in de psychologie
On januari 4, 2022 by adminLeerdoelen
- Definieer correlationeel onderzoek en geef verschillende voorbeelden.
- Leg uit waarom een onderzoeker zou kunnen kiezen voor correlationeel onderzoek in plaats van experimenteel onderzoek of een ander type niet-experimenteel onderzoek.
- Interpreteer de sterkte en richting van verschillende correlatiecoëfficiënten.
- Leg uit waarom correlatie geen causatie impliceert.
Wat is correlationeel onderzoek?
Correlationeel onderzoek is een type niet-experimenteel onderzoek waarbij de onderzoeker twee variabelen (binair of continu) meet en het statistische verband (d.w.z., de correlatie) tussen beide met weinig of geen inspanning om externe variabelen te controleren. Er zijn vele redenen waarom onderzoekers die geïnteresseerd zijn in statistische relaties tussen variabelen zouden kiezen voor een correlationele studie in plaats van een experiment. De eerste reden is dat zij niet geloven dat het statistisch verband een oorzakelijk verband is of dat zij niet geïnteresseerd zijn in oorzakelijke verbanden. De twee doelstellingen van de wetenschap zijn te beschrijven en te voorspellen en de correlationele onderzoeksstrategie stelt onderzoekers in staat beide doelstellingen te bereiken. In het bijzonder kan deze strategie worden gebruikt om de sterkte en de richting van de relatie tussen twee variabelen te beschrijven en als er een relatie tussen de variabelen bestaat, kunnen de onderzoekers de scores op de ene variabele gebruiken om de scores op de andere te voorspellen (met behulp van een statistische techniek die regressie wordt genoemd en die verder wordt besproken in de sectie over complexe correlatie in dit hoofdstuk).
Een andere reden waarom onderzoekers zouden kiezen voor een correlationele studie in plaats van een experiment is dat de statistische relatie van belang wordt verondersteld causaal te zijn, maar de onderzoeker kan de onafhankelijke variabele niet manipuleren omdat dit onmogelijk, onpraktisch of onethisch is. Een onderzoeker kan bijvoorbeeld geïnteresseerd zijn in het verband tussen de frequentie waarmee mensen cannabis gebruiken en hun geheugencapaciteiten, maar hij kan de frequentie waarmee mensen cannabis gebruiken ethisch niet manipuleren. Als zodanig moeten ze vertrouwen op de correlationele onderzoeksstrategie; ze moeten gewoon de frequentie meten waarmee mensen cannabis gebruiken en hun geheugenvaardigheden meten met behulp van een gestandaardiseerde geheugentest en vervolgens bepalen of de frequentie waarmee mensen cannabis gebruiken statistisch gerelateerd is aan de prestaties van de geheugentest.
Correlatie wordt ook gebruikt om de betrouwbaarheid en geldigheid van metingen vast te stellen. Een onderzoeker kan bijvoorbeeld de geldigheid van een korte extraversietest beoordelen door deze aan een grote groep deelnemers af te nemen samen met een langere extraversietest waarvan de geldigheid reeds is aangetoond. Deze onderzoeker kan dan nagaan of de scores van de deelnemers op de korte test sterk gecorreleerd zijn met hun scores op de langere test. Geen van beide testscores wordt geacht de andere te veroorzaken, dus er is geen onafhankelijke variabele om te manipuleren. In feite zijn de termen onafhankelijke variabele en afhankelijke variabele niet van toepassing op dit soort onderzoek.
Een ander sterk punt van correlationeel onderzoek is dat het vaak een hogere externe validiteit heeft dan experimenteel onderzoek. Bedenk dat er gewoonlijk een wisselwerking bestaat tussen interne validiteit en externe validiteit. Naarmate meer controles worden toegevoegd aan experimenten, wordt de interne validiteit verhoogd, maar dit gaat vaak ten koste van de externe validiteit, omdat kunstmatige voorwaarden worden geïntroduceerd die in werkelijkheid niet bestaan. Correlationele studies daarentegen hebben doorgaans een lage interne validiteit omdat er niets wordt gemanipuleerd of gecontroleerd, maar zij hebben vaak een hoge externe validiteit. Omdat er niets door de experimentator wordt gemanipuleerd of gecontroleerd, is de kans groter dat de resultaten relaties weerspiegelen die in de echte wereld bestaan.
Ten slotte, voortbouwend op deze afweging tussen interne en externe validiteit, kan correlationeel onderzoek helpen om convergerende bewijzen voor een theorie te leveren. Als een theorie wordt ondersteund door zowel een waar experiment met een hoge interne validiteit als door een correlationeel onderzoek met een hoge externe validiteit, kunnen de onderzoekers meer vertrouwen hebben in de geldigheid van hun theorie. Een concreet voorbeeld is dat correlationele studies die vaststellen dat er een verband bestaat tussen gewelddadig televisiekijken en agressief gedrag, zijn aangevuld met experimentele studies die bevestigen dat het om een causaal verband gaat (Bushman & Huesmann, 2001).
Does Correlational Research Always Involve Quantitative Variables?
Een veel voorkomende misvatting onder beginnende onderzoekers is dat correlationeel onderzoek twee kwantitatieve variabelen moet omvatten, zoals scores op twee extraversietests of het aantal dagelijkse rompslomp en het aantal symptomen dat mensen hebben ervaren. Het bepalende kenmerk van correlationeel onderzoek is echter dat de twee variabelen worden gemeten – geen van beide wordt gemanipuleerd – en dit geldt ongeacht of de variabelen kwantitatief of categorisch zijn. Stel bijvoorbeeld dat een onderzoeker de Rosenberg Self-Esteem Scale toedient aan 50 Amerikaanse en 50 Japanse universiteitsstudenten. Hoewel dit “aanvoelt” als een experiment tussen twee proefpersonen, is het een correlationele studie omdat de onderzoeker de nationaliteit van de studenten niet heeft gemanipuleerd. Hetzelfde geldt voor de studie van Cacioppo en Petty, waarin de behoefte aan cognitie van universiteitsdocenten wordt vergeleken met die van fabrieksarbeiders. Het is een correlationeel onderzoek omdat de onderzoekers de beroepen van de deelnemers niet manipuleerden.
Figuur 6.2 toont gegevens van een hypothetisch onderzoek naar het verband tussen de vraag of mensen dagelijks een lijstje maken van dingen die ze moeten doen (een “to-do list”) en stress. Merk op dat het onduidelijk is of dit een experiment of een correlationeel onderzoek is, omdat het onduidelijk is of de onafhankelijke variabele werd gemanipuleerd. Als de onderzoeker willekeurig een aantal deelnemers heeft toegewezen om dagelijkse takenlijstjes te maken en anderen om dat niet te doen, dan is het een experiment. Als de onderzoeker gewoon aan de deelnemers vroeg of ze dagelijkse takenlijstjes maakten, dan is het een correlationele studie. Het onderscheid is belangrijk, want als het onderzoek een experiment was, dan zou men kunnen concluderen dat het maken van de dagelijkse takenlijstjes de stress van de deelnemers verminderde. Maar als het een correlationele studie was, dan kon alleen geconcludeerd worden dat deze variabelen statistisch gerelateerd zijn. Misschien heeft gestresseerd zijn een negatief effect op het vermogen van mensen om vooruit te plannen (het directionaliteitsprobleem). Of misschien maken mensen die gewetensvoller zijn vaker to-do lijstjes en hebben ze minder kans om gestresst te zijn (het derde-variabele probleem). Het cruciale punt is dat wat een studie als experimenteel of correlationeel definieert, niet de bestudeerde variabelen zijn, noch of de variabelen kwantitatief of categorisch zijn, noch het type grafiek of statistiek dat wordt gebruikt om de gegevens te analyseren. Wat een onderzoek definieert, is de manier waarop het onderzoek wordt uitgevoerd.
Gegevensverzameling bij correlationeel onderzoek
Ook hier is het bepalende kenmerk van correlationeel onderzoek dat geen van beide variabelen wordt gemanipuleerd. Het maakt niet uit hoe of waar de variabelen worden gemeten. Een onderzoeker zou deelnemers naar een laboratorium kunnen laten komen om een computergestuurde achterwaartse cijferreekstaak en een computergestuurde riskante besluitvormingstaak uit te voeren en dan de relatie tussen de scores van de deelnemers op de twee taken te beoordelen. Of een onderzoeker zou naar een winkelcentrum kunnen gaan om mensen te vragen naar hun houding ten opzichte van het milieu en hun winkelgewoonten en vervolgens de relatie tussen deze twee variabelen kunnen beoordelen. Beide studies zouden correlationeel zijn omdat er geen onafhankelijke variabele wordt gemanipuleerd.
Correlaties tussen kwantitatieve variabelen
Correlaties tussen kwantitatieve variabelen worden vaak gepresenteerd met behulp van scatterplots. Figuur 6.3 toont enkele hypothetische gegevens over het verband tussen de hoeveelheid stress die mensen ondervinden en het aantal lichamelijke klachten dat zij hebben. Elk punt in de scatterplot vertegenwoordigt de score van één persoon op beide variabelen. Bijvoorbeeld, het omcirkelde punt in figuur 6.3 stelt een persoon voor wiens stressscore 10 was en die drie lichamelijke symptomen had. Wanneer alle punten in aanmerking worden genomen, kan men zien dat mensen met meer stress meer lichamelijke klachten hebben. Dit is een goed voorbeeld van een positieve relatie, waarbij hogere scores op de ene variabele meestal samengaan met hogere scores op de andere. Met andere woorden, ze bewegen in dezelfde richting, ofwel beide omhoog of beide omlaag. Een negatief verband is een verband waarbij hogere scores op de ene variabele gepaard gaan met lagere scores op de andere. Met andere woorden, ze bewegen in tegengestelde richting. Er is bijvoorbeeld een negatieve relatie tussen stress en het functioneren van het immuunsysteem, omdat hogere stress gepaard gaat met een lager functioneren van het immuunsysteem.
De sterkte van een correlatie tussen kwantitatieve variabelen wordt gewoonlijk gemeten met behulp van een statistiek die Pearsons correlatiecoëfficiënt (of Pearsons r) wordt genoemd. Zoals figuur 6.4 laat zien, varieert Pearsons r van -1,00 (het sterkst mogelijke negatieve verband) tot +1,00 (het sterkst mogelijke positieve verband). Een waarde van 0 betekent dat er geen verband is tussen de twee variabelen. Als Pearson’s r 0 is, vormen de punten op een scatterplot een vormeloze “wolk”. Naarmate de waarde in de richting van -1,00 of +1,00 gaat, komen de punten steeds dichter bij een enkele rechte lijn te liggen. Correlatiecoëfficiënten in de buurt van ±.10 worden als klein beschouwd, waarden in de buurt van ±.30 worden als gemiddeld beschouwd en waarden in de buurt van ±.50 worden als groot beschouwd. Merk op dat het teken van Pearson’s r geen verband houdt met de sterkte ervan. Pearson’s r-waarden van +.30 en -.30 zijn bijvoorbeeld even sterk; het is alleen zo dat de ene een matig positief verband vertegenwoordigt en de andere een matig negatief verband. Met uitzondering van de betrouwbaarheidscoëfficiënten zijn de meeste correlaties die we in de psychologie vinden klein of middelmatig van omvang. De website http://rpsychologist.com/d3/correlation/, gemaakt door Kristoffer Magnusson, biedt een uitstekende interactieve visualisatie van correlaties waarmee u de sterkte en de richting van een correlatie kunt aanpassen terwijl u de overeenkomstige veranderingen in de scatterplot ziet.
Er zijn twee veel voorkomende situaties waarin de waarde van Pearsons r misleidend kan zijn. Pearsons r is alleen een goede maatstaf voor lineaire verbanden, waarbij de punten het best benaderd worden door een rechte lijn. Het is geen goede maatstaf voor niet-lineaire verbanden, waarbij de punten beter benaderd worden door een gebogen lijn. Figuur 6.5 toont bijvoorbeeld een hypothetisch verband tussen de hoeveelheid slaap die mensen per nacht krijgen en hun depressieniveau. In dit voorbeeld is de lijn die de punten het best benadert een kromme – een soort omgekeerde “U” – omdat mensen die ongeveer acht uur slapen meestal het minst depressief zijn. Degenen die te weinig slaap krijgen en degenen die te veel slaap krijgen, neigen meer depressief te zijn. Hoewel figuur 6.5 een vrij sterke relatie tussen depressie en slaap laat zien, zou Pearson’s r dicht bij nul liggen omdat de punten in de scatterplot niet goed door één rechte lijn passen. Dit betekent dat het belangrijk is een scatterplot te maken en te bevestigen dat een relatie bij benadering lineair is alvorens Pearson’s r te gebruiken. Niet-lineaire relaties komen vrij vaak voor in de psychologie, maar het meten van hun sterkte valt buiten het bestek van dit boek.
De andere veel voorkomende situaties waarin de waarde van Pearsons r misleidend kan zijn, is wanneer een of beide variabelen in de steekproef een beperkt bereik hebben ten opzichte van de populatie. Dit probleem wordt aangeduid als restriction of range. Stel bijvoorbeeld dat er een sterke negatieve correlatie is tussen de leeftijd van mensen en hun plezier in hiphopmuziek, zoals blijkt uit de scatterplot in figuur 6.6. Pearson’s r is hier -.77. Als we echter alleen gegevens zouden verzamelen van 18- tot 24-jarigen – voorgesteld door het gearceerde gebied in figuur 6.6 – dan zou het verband vrij zwak lijken. In feite is Pearsons r voor dit beperkte leeftijdsbereik 0. Het is daarom een goed idee om studies zo op te zetten dat een beperking van het bereik wordt vermeden. Als leeftijd bijvoorbeeld een van uw primaire variabelen is, dan kunt u gegevens verzamelen van mensen met een grote verscheidenheid aan leeftijden. Omdat een beperking van de spreiding niet altijd te verwachten of gemakkelijk te vermijden is, is het echter een goede gewoonte uw gegevens te onderzoeken op een mogelijke beperking van de spreiding en Pearson’s r in het licht daarvan te interpreteren. (Er bestaan ook statistische methoden om Pearsons r te corrigeren voor een beperking van het bereik, maar die vallen buiten het bestek van dit boek).
Correlatie impliceert geen oorzakelijk verband
U hebt waarschijnlijk herhaaldelijk gehoord dat “correlatie geen oorzakelijk verband impliceert”. Een amusant voorbeeld hiervan komt uit een onderzoek uit 2012 dat een positieve correlatie (Pearson’s r = 0,79) aantoonde tussen de chocoladeconsumptie per hoofd van de bevolking van een natie en het aantal Nobelprijzen dat aan burgers van die natie werd toegekend. Het lijkt echter duidelijk dat dit niet betekent dat het eten van chocolade ervoor zorgt dat mensen Nobelprijzen winnen, en het zou geen zin hebben om te proberen het aantal gewonnen Nobelprijzen te verhogen door ouders aan te bevelen hun kinderen meer chocolade te voeren.
Er zijn twee redenen waarom correlatie geen oorzakelijk verband impliceert. De eerste wordt het directionaliteitsprobleem genoemd. Twee variabelen, X en Y, kunnen statistisch met elkaar in verband staan omdat X Y veroorzaakt of omdat Y X veroorzaakt. Neem bijvoorbeeld een onderzoek waaruit blijkt dat het al dan niet sporten van mensen statistisch in verband staat met hoe gelukkig zij zijn – zodat mensen die sporten gemiddeld gelukkiger zijn dan mensen die dat niet doen. Dit statistisch verband is consistent met het idee dat lichaamsbeweging geluk veroorzaakt, maar het is ook consistent met het idee dat geluk lichaamsbeweging veroorzaakt. Misschien geeft gelukkig zijn mensen meer energie of leidt het ertoe dat zij op zoek gaan naar mogelijkheden om met anderen te socialiseren door naar de sportschool te gaan. De tweede reden dat correlatie geen oorzakelijk verband inhoudt, wordt het derde-variabele-probleem genoemd. Twee variabelen, X en Y, kunnen statistisch met elkaar in verband staan, niet omdat X Y veroorzaakt, of omdat Y X veroorzaakt, maar omdat een derde variabele, Z, zowel X als Y veroorzaakt. Het feit bijvoorbeeld dat landen die meer Nobelprijzen hebben gewonnen een hogere chocoladeconsumptie hebben, is waarschijnlijk een geografische afspiegeling van het feit dat Europese landen een hogere chocoladeconsumptie per hoofd van de bevolking hebben en meer investeren in onderwijs en technologie (ook weer per hoofd van de bevolking) dan veel andere landen in de wereld. Evenzo zou de statistische relatie tussen lichaamsbeweging en geluk kunnen betekenen dat een derde variabele, zoals lichamelijke gezondheid, de oorzaak is van de beide andere. Lichamelijk gezond zijn kan ertoe leiden dat mensen gaan sporten en daardoor gelukkiger worden. Correlaties die het gevolg zijn van een derde variabele worden vaak onechte correlaties genoemd.
Een aantal uitstekende en amusante voorbeelden van onechte correlaties is te vinden op http://www.tylervigen.com (Figuur 6.7 geeft een dergelijk voorbeeld).
“Veel snoep kan leiden tot geweld”
Hoewel onderzoekers in de psychologie weten dat correlatie geen oorzakelijk verband inhoudt, weten veel journalisten dit niet. Een website over correlatie en causatie, http://jonathan.mueller.faculty.noctrl.edu/100/correlation_or_causation.htm, linkt naar tientallen mediaberichten over echt biomedisch en psychologisch onderzoek. Veel van de koppen suggereren dat er een oorzakelijk verband is aangetoond, terwijl een zorgvuldige lezing van de artikelen laat zien dat dit niet het geval is vanwege de problemen met directionaliteit en derde-variabelen.
Een zo’n artikel gaat over een studie waaruit blijkt dat kinderen die elke dag snoep aten, meer kans hadden dan andere kinderen om later in hun leven te worden gearresteerd voor een gewelddadig delict. Maar kan snoep echt “leiden tot” geweld, zoals de kop suggereert? Welke alternatieve verklaringen kun je bedenken voor deze statistische relatie? Hoe kan de kop worden herschreven zodat hij niet misleidend is?
Zoals je door het lezen van dit boek hebt geleerd, zijn er verschillende manieren waarop onderzoekers het directionaliteits- en derde-variabele-probleem aanpakken. De meest effectieve is het uitvoeren van een experiment. In plaats van eenvoudigweg te meten hoeveel mensen sporten, kan een onderzoeker bijvoorbeeld mensen in een laboratorium brengen en willekeurig de helft van hen 15 minuten op een loopband laten rennen en de rest 15 minuten op een bank laten zitten. Hoewel dit een kleine wijziging in de onderzoeksopzet lijkt, is het uiterst belangrijk. Als de mensen die aan lichaamsbeweging deden positiever gestemd zijn dan de mensen die niet aan lichaamsbeweging deden, kan dat niet komen doordat hun stemming van invloed was op de hoeveelheid lichaamsbeweging die zij deden (de onderzoeker heeft immers door middel van willekeurige toewijzing bepaald hoeveel zij trainden). Evenmin kan het zijn omdat een derde variabele (bv. lichamelijke gezondheid) van invloed was op zowel de hoeveelheid lichaamsbeweging als de stemming waarin zij verkeerden. Experimenten elimineren dus de problemen met directionaliteit en derde variabelen en stellen onderzoekers in staat harde conclusies te trekken over causale verbanden.
Een grafiek die correlaties weergeeft tussen twee kwantitatieve variabelen, een op de x-as en een op de y-as. De scores worden uitgezet op het snijpunt van de waarden op elke as.
Een relatie waarin hogere scores op de ene variabele de neiging hebben samen te gaan met hogere scores op de andere.
Een relatie waarin hogere scores op de ene variabele de neiging hebben samen te gaan met lagere scores op de andere.
Een relatie waarin hogere scores op de ene variabele de neiging hebben samen te gaan met lagere scores op de andere.
Een statistiek die de sterkte van een correlatie tussen kwantitatieve variabelen meet.
Wanneer een of beide variabelen in de steekproef een beperkt bereik hebben ten opzichte van de populatie, waardoor de waarde van de correlatiecoëfficiënt misleidend is.
Het probleem waarbij twee variabelen, X en Y, statistisch met elkaar samenhangen omdat X Y veroorzaakt, of omdat Y X veroorzaakt, en de causale richting van het effect dus niet kan worden vastgesteld.
Twee variabelen, X en Y, kunnen statistisch met elkaar samenhangen, niet omdat X Y veroorzaakt, of omdat Y X veroorzaakt, maar omdat een derde variabele, Z, zowel X als Y veroorzaakt.
Correlaties die niet het gevolg zijn van de twee gemeten variabelen, maar van een derde, niet gemeten variabele die beide gemeten variabelen beïnvloedt.
Geef een antwoord