Výzkumné metody v psychologii
On 4 ledna, 2022 by adminCíle výuky
- Definujte korelační výzkum a uveďte několik příkladů.
- Vysvětlete, proč se výzkumník může rozhodnout provést korelační výzkum místo experimentálního výzkumu nebo jiného typu neexperimentálního výzkumu.
- Interpretujte sílu a směr různých korelačních koeficientů.
- Vysvětlete, proč korelace neznamená příčinnou souvislost.
Co je korelační výzkum?
Korelační výzkum je typ neexperimentálního výzkumu, ve kterém výzkumník měří dvě proměnné (binární nebo spojité) a posuzuje statistický vztah (tj. vztah mezi nimi), korelaci) mezi nimi s malým nebo žádným úsilím o kontrolu cizích proměnných. Existuje mnoho důvodů, proč se výzkumníci, kteří se zajímají o statistické vztahy mezi proměnnými, rozhodnou provést korelační studii namísto experimentu. Prvním z nich je, že nevěří, že statistický vztah je kauzální, nebo se o kauzální vztahy nezajímají. Připomeňme si dva cíle vědy, kterými jsou popis a předpověď, a korelační výzkumná strategie umožňuje výzkumníkům dosáhnout obou těchto cílů. Konkrétně lze tuto strategii použít k popisu síly a směru vztahu mezi dvěma proměnnými, a pokud mezi proměnnými existuje vztah, pak mohou výzkumníci použít výsledky jedné proměnné k předpovědi výsledků druhé proměnné (pomocí statistické techniky zvané regrese, o níž se dále hovoří v části věnované komplexní korelaci v této kapitole).
Dalším důvodem, proč se výzkumníci rozhodnou použít korelační studii namísto experimentu, je to, že statistický vztah, který je předmětem zájmu, je považován za kauzální, ale výzkumník nemůže manipulovat s nezávislou proměnnou, protože je to nemožné, nepraktické nebo neetické. Výzkumníka může například zajímat vztah mezi frekvencí užívání konopí a paměťovými schopnostmi, ale z etického hlediska nemůže manipulovat s frekvencí užívání konopí. Proto se musí spolehnout na korelační výzkumnou strategii; musí jednoduše změřit frekvenci, s jakou lidé užívají konopí, a změřit jejich paměťové schopnosti pomocí standardizovaného testu paměti a poté zjistit, zda frekvence, s jakou lidé užívají konopí, statisticky souvisí s výkonem v testu paměti.
Korelace se také používá ke zjištění spolehlivosti a platnosti měření. Výzkumník může například vyhodnotit platnost krátkého testu extraverze tak, že jej zadá velké skupině účastníků spolu s delším testem extraverze, jehož platnost již byla prokázána. Výzkumník pak může ověřit, zda výsledky účastníků v krátkém testu silně korelují s výsledky v delším testu. Předpokládá se, že ani jeden výsledek testu nezpůsobuje ten druhý, takže není třeba manipulovat s žádnou nezávislou proměnnou. Ve skutečnosti se pro tento druh výzkumu nepoužívají pojmy nezávislá a závislá proměnná.
Další silnou stránkou korelačního výzkumu je, že má často vyšší externí validitu než experimentální výzkum. Připomeňme, že obvykle existuje kompromis mezi interní a externí validitou. Když se do experimentů přidávají větší kontrolní prvky, zvyšuje se interní validita, ale často na úkor externí validity, protože se zavádějí umělé podmínky, které ve skutečnosti neexistují. Naproti tomu korelační studie mají obvykle nízkou interní validitu, protože nic není manipulováno ani kontrolováno, ale často mají vysokou externí validitu. Protože experimentátor nic nemanipuluje ani nekontroluje, je pravděpodobnější, že výsledky odrážejí vztahy, které existují v reálném světě.
Nakonec, v návaznosti na tento kompromis mezi interní a externí validitou, může korelační výzkum pomoci poskytnout konvergentní důkazy pro teorii. Pokud je teorie podpořena skutečným experimentem, který má vysokou interní validitu, stejně jako korelační studií, která má vysokou externí validitu, pak mohou mít výzkumníci větší důvěru v platnost své teorie. Jako konkrétní příklad lze uvést korelační studie, které prokázaly, že existuje vztah mezi sledováním televize plné násilí a agresivním chováním, a které byly doplněny experimentálními studiemi potvrzujícími, že tento vztah je kauzální (Bushman & Huesmann, 2001).
Musí korelační výzkum vždy zahrnovat kvantitativní proměnné?“
Běžnou mylnou představou začínajících výzkumníků je, že korelační výzkum musí zahrnovat dvě kvantitativní proměnné, například skóre ve dvou testech extraverze nebo počet každodenních potíží a počet symptomů, které lidé zažili. Definičním znakem korelačního výzkumu je však to, že obě proměnné jsou měřeny – ani jedna z nich není manipulována – a to platí bez ohledu na to, zda jsou proměnné kvantitativní nebo kategoriální. Představte si například, že výzkumník zadá Rosenbergovu škálu sebeúcty 50 americkým vysokoškolákům a 50 japonským vysokoškolákům. Ačkoli to „vypadá“ jako experiment mezi subjekty, jedná se o korelační studii, protože výzkumník nemanipuloval s národností studentů. Totéž platí o studii Cacioppa a Pettyho, kteří srovnávali vysokoškolské učitele a dělníky v továrnách z hlediska jejich potřeby poznání. Jedná se o korelační studii, protože výzkumníci nemanipulovali s povoláním účastníků.
Obrázek 6.2 ukazuje údaje z hypotetické studie o vztahu mezi tím, zda si lidé denně vytvářejí seznam věcí k vyřízení („to-do list“), a stresem. Všimněte si, že není jasné, zda se jedná o experiment nebo korelační studii, protože není jasné, zda byla nezávislá proměnná manipulována. Pokud výzkumník náhodně přiřadil některým účastníkům, aby si denně dělali seznamy úkolů, a jiným, aby si je nedělali, pak se jedná o experiment. Pokud se výzkumník pouze zeptal účastníků, zda si dělají denní seznamy úkolů, pak se jedná o korelační studii. Toto rozlišení je důležité, protože pokud by studie byla experimentem, pak by bylo možné dojít k závěru, že vytváření denních seznamů úkolů snižuje stres účastníků. Pokud by se však jednalo o korelační studii, bylo by možné dojít pouze k závěru, že tyto proměnné spolu statisticky souvisejí. Možná, že stres má negativní vliv na schopnost lidí plánovat dopředu (problém směrovosti). Nebo možná lidé, kteří jsou svědomitější, častěji vytvářejí seznamy úkolů a méně často jsou ve stresu (problém třetí proměnné). Zásadní je, že to, co definuje studii jako experimentální nebo korelační, nejsou studované proměnné, ani to, zda jsou proměnné kvantitativní nebo kategoriální, ani typ grafu nebo statistiky použité k analýze dat. To, co definuje studii, je způsob, jakým je studie prováděna.
Sběr dat v korelačním výzkumu
Opět, definičním znakem korelačního výzkumu je, že ani jedna z proměnných není manipulována. Nezáleží na tom, jak nebo kde jsou proměnné měřeny. Výzkumník by mohl nechat účastníky přijít do laboratoře, aby vyplnili počítačovou úlohu na rozpětí číslic pozpátku a počítačovou úlohu na rizikové rozhodování, a poté vyhodnotit vztah mezi výsledky účastníků v těchto dvou úlohách. Nebo může výzkumník zajít do nákupního centra a zeptat se lidí na jejich postoje k životnímu prostředí a na jejich nákupní zvyklosti a poté vyhodnotit vztah mezi těmito dvěma proměnnými. Obě tyto studie by byly korelační, protože se nemanipuluje s žádnou nezávislou proměnnou.
Korelace mezi kvantitativními proměnnými
Korelace mezi kvantitativními proměnnými se často prezentují pomocí rozptylových grafů. Obrázek 6.3 ukazuje hypotetické údaje o vztahu mezi množstvím stresu, kterému jsou lidé vystaveni, a počtem tělesných příznaků, které mají. Každý bod v rozptylovém diagramu představuje skóre jedné osoby v obou proměnných. Například zakroužkovaný bod na obrázku 6.3 představuje osobu, jejíž skóre stresu bylo 10 a která měla tři fyzické příznaky. Vezmeme-li v úvahu všechny body, je vidět, že lidé vystavení většímu stresu mají tendenci mít více fyzických příznaků. To je dobrý příklad pozitivního vztahu, kdy vyšší skóre jedné proměnné bývá spojeno s vyšším skóre druhé proměnné. Jinými slovy, pohybují se stejným směrem, buď obě nahoru, nebo obě dolů. Negativní vztah je takový, kdy vyšší skóre jedné proměnné má tendenci být spojeno s nižším skóre druhé proměnné. Jinými slovy, pohybují se opačným směrem. Existuje například negativní vztah mezi stresem a fungováním imunitního systému, protože vyšší stres je spojen s nižším fungováním imunitního systému.
Síla korelace mezi kvantitativními proměnnými se obvykle měří pomocí statistiky zvané Pearsonův korelační koeficient (nebo Pearsonovo r). Jak ukazuje obrázek 6.4, Pearsonovo r se pohybuje od -1,00 (nejsilnější možný negativní vztah) do +1,00 (nejsilnější možný pozitivní vztah). Hodnota 0 znamená, že mezi oběma proměnnými neexistuje žádný vztah. Když je Pearsonovo r rovno 0, body na grafu rozptylu tvoří beztvarý „mrak“. Jak se jeho hodnota pohybuje směrem k -1,00 nebo +1,00, body se stále více přibližují k jedné přímce. Korelační koeficienty blízké hodnotě ±,10 se považují za malé, hodnoty blízké ±,30 za střední a hodnoty blízké ±,50 za velké. Všimněte si, že znaménko Pearsonova r nesouvisí s jeho silou. Například hodnoty Pearsonova r +,30 a -,30 jsou stejně silné; pouze jedna představuje středně silný pozitivní vztah a druhá středně silný negativní vztah. S výjimkou koeficientů spolehlivosti je většina korelací, které nacházíme v psychologii, malá nebo středně velká. Webová stránka http://rpsychologist.com/d3/correlation/, kterou vytvořil Kristoffer Magnusson, poskytuje vynikající interaktivní vizualizaci korelací, která umožňuje upravovat sílu a směr korelace a zároveň sledovat odpovídající změny rozptylu.
Existují dvě běžné situace, kdy může být hodnota Pearsonova r zavádějící. Pearsonovo r je dobrým měřítkem pouze pro lineární vztahy, kdy jsou body nejlépe aproximovány přímkou. Není dobrým měřítkem pro nelineární vztahy, v nichž jsou body lépe aproximovány zakřivenou přímkou. Obrázek 6.5 například ukazuje hypotetický vztah mezi množstvím spánku, které lidé za noc naspí, a úrovní jejich deprese. V tomto příkladu je přímka, která nejlépe aproximuje body, křivka – jakési obrácené „U“ – protože lidé, kteří spí přibližně osm hodin, bývají nejméně depresivní. Ti, kteří spí příliš málo, a ti, kteří spí příliš mnoho, bývají depresivnější. Přestože obrázek 6.5 ukazuje poměrně silný vztah mezi depresí a spánkem, Pearsonovo r by se blížilo nule, protože body v rozptylu nejsou dobře přizpůsobeny jedné přímce. To znamená, že před použitím Pearsonova r je důležité sestavit rozptylový graf a potvrdit, že vztah je přibližně lineární. nelineární vztahy jsou v psychologii poměrně běžné, ale měření jejich síly přesahuje rámec této knihy.
Druhou častou situací, kdy hodnota Pearsonova r může být zavádějící, je situace, kdy jedna nebo obě proměnné mají ve vzorku omezený rozsah vzhledem k populaci. Tento problém se označuje jako omezení rozsahu. Předpokládejme například, že existuje silná záporná korelace mezi věkem lidí a jejich oblibou hiphopové hudby, jak ukazuje graf rozptylu na obrázku 6.6. Na obrázku 6.6 je vidět, že se jedná o silnou zápornou korelaci. Pearsonovo r je zde -,77. Kdybychom však shromáždili údaje pouze od lidí ve věku 18 až 24 let – což představuje stínovaná oblast na obrázku 6.6 -, vztah by se zdál být poměrně slabý. Ve skutečnosti je Pearsonovo r pro tento omezený věkový rozsah rovno 0. Je proto dobré navrhovat studie tak, aby nedocházelo k omezování rozsahu. Pokud je například věk jednou z vašich primárních proměnných, pak můžete naplánovat sběr dat od lidí v širokém věkovém rozmezí. Protože však omezení rozsahu nelze vždy předpokládat nebo se mu lze snadno vyhnout, je dobré prozkoumat svá data z hlediska možného omezení rozsahu a interpretovat Pearsonovo r s ohledem na něj. (Existují také statistické metody pro korekci Pearsonova r na omezení rozsahu, ale ty přesahují rámec této knihy).
Korelace neznamená příčinnou souvislost
Jistě jste opakovaně slyšeli, že „korelace neznamená příčinnou souvislost“. Zábavným příkladem je studie z roku 2012, která prokázala pozitivní korelaci (Pearsonovo r = 0,79) mezi spotřebou čokolády na hlavu v daném národě a počtem Nobelových cen udělených občanům tohoto národa. Zdá se však jasné, že to neznamená, že konzumace čokolády způsobuje, že lidé získávají Nobelovy ceny, a nemělo by smysl snažit se zvýšit počet získaných Nobelových cen doporučením, aby rodiče krmili své děti více čokoládou.
Existují dva důvody, proč korelace neznamená příčinnou souvislost. První se nazývá problém směrovosti. Dvě proměnné, X a Y, mohou statisticky souviset, protože X způsobuje Y, nebo protože Y způsobuje X. Uvažujme například studii, která ukazuje, že to, zda lidé cvičí, statisticky souvisí s tím, jak jsou šťastní – tak, že lidé, kteří cvičí, jsou v průměru šťastnější než lidé, kteří necvičí. Tento statistický vztah je v souladu s myšlenkou, že cvičení způsobuje štěstí, ale je také v souladu s myšlenkou, že štěstí způsobuje cvičení. Možná, že štěstí dodává lidem více energie nebo je vede k tomu, že vyhledávají příležitosti ke kontaktu s ostatními a chodí do posilovny. Druhý důvod, proč korelace neznamená příčinnou souvislost, se nazývá problém třetí proměnné. Dvě proměnné, X a Y, spolu mohou statisticky souviset ne proto, že X způsobuje Y, nebo že Y způsobuje X, ale proto, že nějaká třetí proměnná, Z, způsobuje jak X, tak Y. Například skutečnost, že národy, které získaly více Nobelových cen, mají tendenci mít vyšší spotřebu čokolády, pravděpodobně odráží geografickou polohu v tom, že evropské země mají tendenci mít vyšší míru spotřeby čokolády na obyvatele a investovat více do vzdělání a technologií (opět v přepočtu na obyvatele) než mnoho jiných zemí světa. Podobně statistický vztah mezi cvičením a štěstím by mohl znamenat, že nějaká třetí proměnná, například fyzické zdraví, způsobuje obě ostatní proměnné. Fyzické zdraví by mohlo způsobit, že lidé budou cvičit a budou šťastnější. Korelace, které jsou důsledkem třetí proměnné, se často označují jako falešné korelace.
Několik vynikajících a zábavných příkladů falešných korelací lze nalézt na http://www.tylervigen.com (jeden takový příklad uvádí obrázek 6.7).
„Hodně sladkostí může vést k násilí“
Ačkoli vědci v oblasti psychologie vědí, že korelace neznamená příčinnou souvislost, mnoho novinářů to neví. Jedna webová stránka o korelaci a kauzalitě, http://jonathan.mueller.faculty.noctrl.edu/100/correlation_or_causation.htm, odkazuje na desítky mediálních zpráv o skutečném biomedicínském a psychologickém výzkumu. Mnohé z titulků naznačují, že byla prokázána příčinná souvislost, i když pozorné čtení článků ukazuje, že tomu tak není kvůli problémům se směrovostí a třetí proměnnou.
Jeden takový článek je o studii, která ukázala, že děti, které každý den jedly sladkosti, měly větší pravděpodobnost, že budou později v životě zatčeny za násilný trestný čin, než ostatní děti. Mohly však sladkosti skutečně „vést“ k násilí, jak naznačuje titulek? Jaká alternativní vysvětlení tohoto statistického vztahu vás napadají? Jak by se dal titulek přepsat, aby nebyl zavádějící?
Jak jste se při čtení této knihy dozvěděli, existují různé způsoby, jak vědci řeší problémy se směrovostí a třetí proměnnou. Nejúčinnější je provedení experimentu. Například místo pouhého měření toho, jak moc lidé cvičí, může výzkumník přivést lidi do laboratoře a náhodně zadat polovině z nich, aby 15 minut běhali na běžeckém pásu, a zbytku, aby 15 minut seděli na gauči. Ačkoli se to zdá jako drobná změna v plánu výzkumu, je nesmírně důležitá. Pokud nyní cvičící skončí s pozitivnější náladou než ti, kteří necvičili, nemůže to být proto, že jejich nálada ovlivnila to, kolik cvičili (protože to byl výzkumník, kdo použil náhodné přiřazení k určení toho, kolik cvičili). Stejně tak to nemůže být proto, že nějaká třetí proměnná (např. fyzické zdraví) ovlivnila jak to, kolik cvičili, tak to, jakou měli náladu. Experimenty tak odstraňují problémy se směrovostí a třetí proměnnou a umožňují výzkumníkům vyvozovat pevné závěry o příčinných vztazích.
Kartogram, který znázorňuje korelace mezi dvěma kvantitativními proměnnými, jednou na ose x a druhou na ose y. V grafu jsou znázorněny korelace mezi dvěma kvantitativními proměnnými. Skóre jsou vynesena v průsečíku hodnot na obou osách.
Vztah, ve kterém vyšší skóre jedné proměnné bývá spojeno s vyšším skóre druhé proměnné.
Vztah, ve kterém vyšší skóre jedné proměnné bývá spojeno s nižším skóre druhé proměnné.
Statistika, která měří sílu korelace mezi kvantitativními proměnnými.
Když jedna nebo obě proměnné mají ve vzorku omezený rozsah vzhledem k populaci, což činí hodnotu korelačního koeficientu zavádějící.
Problém, kdy dvě proměnné, X a Y, spolu statisticky souvisejí buď proto, že X způsobuje Y, nebo proto, že Y způsobuje X, a proto nelze poznat kauzální směr účinku.
Dvě proměnné, X a Y, mohou statisticky souviset ne proto, že X způsobuje Y, nebo proto, že Y způsobuje X, ale proto, že nějaká třetí proměnná, Z, způsobuje jak X, tak Y.
Souvislosti, které nejsou důsledkem dvou měřených proměnných, ale spíše důsledkem třetí, neměřené proměnné, která ovlivňuje obě měřené proměnné.
.
Napsat komentář