Mikä on GRADE?
On 3 marraskuun, 2021 by adminGRADE (Grading of Recommendations, Assessment, Development and Evaluations, suositusten, arvioinnin, kehittämisen ja arvioinnin luokittelu) on läpinäkyvä kehys todistusaineiston yhteenvetojen laatimiseksi ja esittämiseksi, ja se tarjoaa systemaattisen lähestymistavan kliinisen käytännön suositusten laatimiseen. Se on laajimmin hyväksytty väline näytön laadun luokitteluun ja suositusten laatimiseen, ja yli 100 organisaatiota ympäri maailmaa on virallisesti hyväksynyt GRADEn.
Miten se toimii?
Aluksi kirjoittajat päättävät, mikä on kliininen kysymys, mukaan lukien populaatio, jota kysymys koskee, kaksi tai useampi vaihtoehto ja lopputulokset, jotka ovat tärkeimpiä päätöksenteon edessä oleville. Tutkimus – mieluiten systemaattinen katsaus – antaa parhaan arvion kunkin lopputuloksen vaikutuksen suuruudesta absoluuttisina lukuina (esim. riskiero).
Tekijät arvioivat sitten näytön laadun, jota sovelletaan parhaiten kuhunkin lopputulokseen, koska näytön laatu vaihtelee usein lopputulosten välillä. GRADE:n kokonaislaatuluokitusta voidaan soveltaa näyttöön kaikissa lopputuloksissa, yleensä ottamalla kaikista päätöksenteon kannalta kriittisistä lopputuloksista vähiten laadukas näyttö.
GRADE:ssa on neljä näytön tasoa, jotka tunnetaan myös nimellä näytön varmuus tai näytön laatu: erittäin alhainen, alhainen, kohtalainen ja korkea (taulukko 1). Satunnaistetuista kontrolloiduista tutkimuksista saatu näyttö alkaa korkeasta laadusta, ja jäljelle jäävän sekoittavan vaikutuksen vuoksi havainnointitietoja sisältävä näyttö alkaa heikosta laadusta. Näyttöön liittyvä varmuus lisääntyy tai vähenee useista syistä, joita kuvataan tarkemmin jäljempänä.
Varmuus | Mitä se tarkoittaa |
Erittäin alhainen | Todellinen vaikutus poikkeaa luultavasti huomattavasti siitä, mitä estimoitu vaikutus |
Alhainen | Todellinen vaikutus saattaa poiketa huomattavasti estimoidusta vaikutuksesta |
kohtalainen | Tekijöiden mielestä että todellinen vaikutus on todennäköisesti lähellä estimoitua vaikutusta |
Korkea | Tekijät luottavat paljon siihen, että todellinen vaikutus on samankaltainen kuin estimoitu vaikutus |
GRADE on subjektiivinen
GRADEa ei voi toteuttaa mekaanisesti – jokaisessa päätöksessä on väistämättä huomattavan paljon subjektiivisuutta. Kaksi henkilöä, jotka arvioivat samaa todistusaineistoa, voivat kohtuudella päätyä erilaisiin johtopäätöksiin sen varmuudesta. GRADE tarjoaa kuitenkin toistettavissa olevan ja läpinäkyvän kehyksen näytön varmuuden luokitteluun.
Mikä tekee näytöstä vähemmän varmaa?
Kunkin harhaisuuden riskin, epätarkkuuden, epäjohdonmukaisuuden, epäsuoruuden ja julkaisuharhaisuuden osalta kirjoittajilla on mahdollisuus alentaa varmuuden tasoa yhdellä tai kahdella portaalla (esim. korkeasta kohtalaiseksi).
GRADE:n osa-alueet, joiden perusteella voidaan tehdä alentavia luokitteluja
1. Harhan riski
Harhaa esiintyy, kun tutkimuksen tulokset eivät edusta totuutta tutkimuksen suunnitteluun tai toteuttamiseen liittyvien luontaisten rajoitusten vuoksi. Käytännössä on vaikea tietää, missä määrin mahdolliset vääristymät vaikuttavat tuloksiin, ja siksi varmuus arvioidusta vaikutuksesta on vähäisempi, jos arvioitua vaikutusta tukevat tutkimukset voivat olla vääristyneitä.
Käytettävissä on useita välineitä, joilla voidaan arvioida yksittäisten satunnaistettujen tutkimusten ja havainnointitutkimusten vääristymäriskiä.
GRADE-luokitusta käytetään arvioimaan todistusaineistoa pikemminkin lopputulostasolla kuin tutkimustasolla. Kirjoittajien on näin ollen arvioitava, onko yksittäisten tutkimusten harhaisuusriski niin suuri, että heidän luottamuksensa arvioituun hoitovaikutukseen on pienempi. GRADE-ohjesarjassa nro 4 kuvataan yksityiskohtaisesti harhaisuusriskiä koskevia keskeisiä näkökohtia ja kuvataan yksityiskohtaisesti prosessi, jossa siirrytään tutkimustasolla esiintyvästä harhaisuusriskistä koko aineiston harhaisuusriskiin: Rating the quality of evidence – study limitations (risk of bias).
2. Epätarkkuus
GRADE-lähestymistavassa epätarkkuuden arvioinnissa keskitytään 95 prosentin luottamusväliin absoluuttisen vaikutuksen parhaan estimaatin ympärillä. Epätarkkuus on pienempi, jos kliininen päätös olisi todennäköisesti erilainen, jos todellinen vaikutus olisi luottamusvälin ylä- tai alapäässä. Kirjoittajat voivat myös halutessaan laskea epätarkkuuden arviota, jos vaikutusestimaatti on peräisin vain yhdestä tai kahdesta pienestä tutkimuksesta tai jos tapahtumia oli vähän. Yksityiskohtainen kuvaus epätarkkuudesta on kuvattu GRADE-ohjesarjassa #6: Rating the quality of evidence – imprecision.
3. Epäjohdonmukaisuus
Varmuus näytön laadusta on korkein silloin, kun on useita tutkimuksia, jotka osoittavat johdonmukaisia vaikutuksia. Harkitessaan, pitäisikö varmuus luokitella alaspäin epäjohdonmukaisuuden vuoksi, kirjoittajien tulisi tarkastaa piste-estimaattien samankaltaisuus ja niiden luottamusvälien päällekkäisyys sekä heterogeenisuuden tilastolliset kriteerit (esim. I2- ja khiin neliö -testi). Täydellinen keskustelu epäjohdonmukaisuudesta on saatavilla GRADE-ohjesarjassa #7: Rating the quality of evidence – inconsistency.
4. Epäsuoruus
Näyttö on varminta silloin, kun tutkimuksissa verrataan suoraan kiinnostuksen kohteena olevia interventioita kiinnostuksen kohteena olevassa populaatiossa ja raportoidaan päätöksenteon kannalta kriittiset tulokset. Varmuus voidaan luokitella huonommaksi, jos tutkittavat potilaat ovat erilaisia kuin ne, joita suositus koskee. Epäsuoruutta voi esiintyä myös silloin, kun tutkittavat toimenpiteet eroavat todellisista tuloksista (esimerkiksi tutkimus uudesta kirurgisesta toimenpiteestä pitkälle erikoistuneessa keskuksessa koskee vain epäsuorasti keskuksia, joilla on vähemmän kokemusta). Epäsuoruutta esiintyy myös silloin, kun tutkittu lopputulos on korvike jollekin toiselle lopputulokselle, joka on yleensä potilaille tärkeämpi. Epäsuoruutta käsitellään perusteellisesti GRADE-ohjeiden sarjassa #8: Rating the quality of evidence – indirectness.
5. Julkaisuvirhe
Julkaisuvirhe on ehkä GRADEn osa-alueista hankalin, koska se edellyttää päätelmien tekemistä puuttuvasta näytöstä. Useista tilastollisista ja visuaalisista menetelmistä on apua julkaisuharhojen havaitsemisessa, vaikka niillä onkin vakavia rajoituksia. Julkaisuvirhe on yleisempää havainnointitiedoissa ja silloin, kun suurin osa julkaistuista tutkimuksista on teollisuuden rahoittamia. Julkaisuvirheitä käsitellään kattavasti GRADE-ohjesarjassa #5: Rating the quality of evidence – publication bias.
Mikä lisää luottamusta näyttöön?
Harvinaisissa tilanteissa varmuutta näyttöön voidaan arvioida ylöspäin (ks. taulukko 2). Ensinnäkin, kun vaikutuksen suuruus on hyvin suuri, voimme olla varmempia siitä, että kyseessä on ainakin pieni vaikutus. Toiseksi, kun on olemassa selvä annos-vaste-gradientti. Kolmanneksi, kun jäännösvaikutukset todennäköisesti pikemminkin vähentävät kuin lisäävät vaikutuksen suuruutta (tilanteissa, joissa vaikutus on olemassa). Täydellisempi keskustelu syistä, joiden vuoksi luottamusta on syytä lisätä, on saatavilla GRADE-ohjeiden sarjassa #9: Todisteiden laadun arviointi.
Varmuus voidaan arvioida alaspäin: | Varmuus voidaan arvioida ylöspäin: |
|
|
Siirtyminen näytön laadusta suosituksiin
GRADE:ssa, suositukset voivat olla vahvoja tai heikkoja, intervention puolesta tai sitä vastaan. Vahvat suositukset viittaavat siihen, että kaikki tai lähes kaikki henkilöt valitsisivat kyseisen intervention. Heikot suositukset merkitsevät, että on todennäköistä, että tietoisten henkilöiden todennäköisesti tekemä päätös vaihtelee huomattavasti. Suositusten voimakkuus on toimintakelpoista: heikko suositus viittaa siihen, että osallistuminen yhteiseen päätöksentekoprosessiin on olennaista, kun taas vahva suositus viittaa siihen, että yleensä ei ole tarpeen esittää molempia vaihtoehtoja.
Suositukset ovat todennäköisemmin heikkoja kuin vahvoja silloin, kun näytön varmuus on vähäinen, kun toivottujen ja ei-toivottujen seurausten välillä on tiukka tasapaino, kun potilaiden arvoissa ja mieltymyksissä on huomattavaa vaihtelua tai epävarmuustekijöitä ja kun toimenpiteet vaativat huomattavia resursseja. Täydellinen keskustelu on saatavilla BMJ:n sarjassa GRADE Evidence to Decision -kehyksestä päätöksentekoon ja alkuperäisessä sarjassa.
Authors: Reed Siemieniuk ja Gordon Guyatt
- Guyatt GH, Oxman AD, Kunz R, Vist GE, Falck-Ytter Y, Schunemann HJ. Mitä on ”näytön laatu” ja miksi se on tärkeää kliinikoille? BMJ (Clinical research ed). 2008;336(7651):995-8.
- Guyatt GH, Oxman AD, Vist GE, Kunz R, Falck-Ytter Y, Alonso-Coello P, et al. GRADE: an emerging consensus on rating quality of evidence and strength of recommendations. BMJ (Clinical research ed). 2008;336(7650):924-6.
- Guyatt G, Oxman AD, Akl EA, Kunz R, Vist G, Brozek J, et al. GRADE guidelines: 1. Johdanto-GRADE näyttöprofiilit ja tulosten yhteenvetotaulukot. Journal of clinical epidemiology. 2011;64(4):383-94.
- Guyatt GH, Oxman AD, Kunz R, Atkins D, Brozek J, Vist G, et al. GRADE guidelines: 2. Kysymyksen muotoilu ja tärkeistä lopputuloksista päättäminen. Journal of clinical epidemiology. 2011;64(4):395-400.
- Balshem H, Helfand M, Schunemann HJ, Oxman AD, Kunz R, Brozek J, et al. GRADE guidelines: 3. Näytön laadun arviointi. Journal of clinical epidemiology. 2011;64(4):401-6.
- Guyatt G, Oxman AD, Sultan S, Brozek J, Glasziou P, Alonso-Coello P, et al. GRADE guidelines: 11. Kokonaisarvion tekeminen vaikutusestimaattien luotettavuudesta yksittäisen lopputuloksen ja kaikkien lopputulosten osalta. Journal of clinical epidemiology. 2013;66(2):151-7.
- Mustafa RA, Santesso N, Brozek J, Akl EA, Walter SD, Norman G, et al. The GRADE approach is reproducible in assessing the quality of evidence of quantitative evidence syntheses. Journal of clinical epidemiology. 2013;66(7):736-42; quiz 42.e1-5.
- Guyatt GH, Oxman AD, Vist G, Kunz R, Brozek J, Alonso-Coello P, et al. GRADE guidelines: 4. Näyttöaineiston laadun arviointi-tutkimuksen rajoitukset (harhan riski). Journal of clinical epidemiology. 2011;64(4):407-15.
- Higgins JP, Altman DG, Gøtzsche PC, Jüni P, Moher D, Oxman AD, et al. The Cochrane Collaboration’s tool for assessing risk of bias in randomised trials. BMJ (Clinical research ed). 2011;343:d5928.
- Wells G, Shea B, O’connell D, Peterson J, Welch V, Losos M, et al. The Newcastle-Ottawa Scale (NOS) for assessing the quality of nonrandomised studies in meta-analyses. Ottawa: Ottawa Hospital Research Institute; 2011. oxford. asp; 2011.
- Sterne JA, Hernan MA, Reeves BC, Savovic J, Berkman ND, Viswanathan M, et al. ROBINS-I: a tool for assessing risk of bias in non-randomised studies of interventions. BMJ (Clinical research ed). 2016;355:i4919.
- Guyatt GH, Oxman AD, Kunz R, Brozek J, Alonso-Coello P, Rind D, et al. GRADE guidelines 6. Todisteiden laadun-tarkkuuden arviointi. Journal of clinical epidemiology. 2011;64(12):1283-93.
- Walsh M, Srinathan SK, McAuley DF, Mrkobrada M, Levine O, Ribic C ym. Satunnaistettujen kontrolloitujen tutkimustulosten tilastollinen merkitsevyys on usein haurasta: Fragility-indeksin tarve. Journal of clinical epidemiology. 2014;67(6):622-8.
- Guyatt GH, Oxman AD, Kunz R, Woodcock J, Brozek J, Helfand M, et al. GRADE guidelines: 7. Todisteiden laadun arviointi – epäjohdonmukaisuus. Journal of clinical epidemiology. 2011;64(12):1294-302.
- Guyatt GH, Oxman AD, Kunz R, Woodcock J, Brozek J, Helfand M, et al. GRADE guidelines: 8. Todisteiden laadun arviointi – epäsuoruus. Journal of clinical epidemiology. 2011;64(12):1303-10.
- Guyatt GH, Oxman AD, Montori V, Vist G, Kunz R, Brozek J, et al. GRADE guidelines: 5. Todisteiden laadun arviointi-julkaisun puolueellisuus (Rating the quality of evidence-publication bias). Journal of clinical epidemiology. 2011;64(12):1277-82.
- Guyatt GH, Oxman AD, Sultan S, Glasziou P, Akl EA, Alonso-Coello P, et al. GRADE guidelines: 9. Rating up the quality of evidence. Journal of clinical epidemiology. 2011;64(12):1311-6.
- Alonso-Coello P, Schunemann HJ, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, et al. GRADE Evidence to Decision (EtD) frameworks: systemaattinen ja läpinäkyvä lähestymistapa tietoon perustuvien terveydenhuollon valintojen tekemiseen. 1: Johdanto. BMJ (Clinical research ed). 2016;353:i2016.
- Alonso-Coello P, Oxman AD, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, et al. GRADE Evidence to Decision (EtD) frameworks: systemaattinen ja läpinäkyvä lähestymistapa hyvin perusteltujen terveydenhuollon valintojen tekemiseen. 2: Kliinisen käytännön ohjeet. BMJ (Clinical research ed). 2016;353:i2089.
- Guyatt GH, Oxman AD, Kunz R, Falck-Ytter Y, Vist GE, Liberati A, et al. Going from evidence to recommendations. BMJ (Clinical research ed). 2008;336(7652):1049-51.
Vastaa