Co to jest GRADE?
On 3 listopada, 2021 by adminGRADE (Grading of Recommendations, Assessment, Development and Evaluations) to przejrzyste ramy do opracowywania i przedstawiania podsumowań dowodów oraz zapewnia systematyczne podejście do formułowania zaleceń dotyczących praktyki klinicznej. Jest to najszerzej przyjęte narzędzie do oceny jakości dowodów i formułowania zaleceń, a ponad 100 organizacji na całym świecie oficjalnie popiera GRADE.
Jak to działa?
Najpierw autorzy decydują, jakie jest pytanie kliniczne, w tym do jakiej populacji odnosi się pytanie, dwie lub więcej alternatyw oraz wyniki, które mają największe znaczenie dla osób podejmujących decyzję. Badanie – najlepiej przegląd systematyczny – dostarcza najlepszego oszacowania wielkości efektu dla każdego wyniku, w wartościach bezwzględnych (np. różnica ryzyka).
Następnie autorzy oceniają jakość dowodów, co najlepiej odnieść do każdego wyniku, ponieważ jakość dowodów często różni się w zależności od wyniku. Ogólna ocena jakości GRADE może być zastosowana do zbioru dowodów dotyczących różnych wyników, zwykle poprzez przyjęcie najniższej jakości dowodów ze wszystkich wyników, które są krytyczne dla podejmowania decyzji.
GRADE ma cztery poziomy dowodów – znane również jako pewność dowodów lub jakość dowodów: bardzo niska, niska, umiarkowana i wysoka (Tabela 1). Dowody pochodzące z randomizowanych badań kontrolowanych rozpoczynają się od wysokiej jakości, a ze względu na szczątkowe uwarunkowania, dowody obejmujące dane obserwacyjne rozpoczynają się od niskiej jakości. Pewność dowodów jest zwiększana lub zmniejszana z kilku powodów, opisanych szczegółowo poniżej.
Certainty | What it means |
Very low | The true effect is probably markedly different from the szacowanego efektu |
Niski | Prawdziwy efekt może być znacząco różny od szacowanego efektu |
Umiarkowany | Autorzy uważają, że że prawdziwy efekt jest prawdopodobnie zbliżony do oszacowanego efektu |
Wysoki | Autorzy mają dużą pewność, że prawdziwy efekt jest zbliżony do oszacowanego efektu |
GRADE jest subiektywny
GRADE nie może być zaimplementowany mechanicznie – z konieczności w każdej decyzji występuje znaczna doza subiektywizmu. Dwie osoby oceniające ten sam materiał dowodowy mogą zasadnie dojść do różnych wniosków na temat jego pewności. To, co zapewnia GRADE, to powtarzalne i przejrzyste ramy dla oceny pewności dowodów.
Co sprawia, że dowody są mniej pewne?
Dla każdego z czynników ryzyka błędu, niedokładności, niespójności, pośredniości i błędu publikacji autorzy mają możliwość obniżenia poziomu pewności o jeden lub dwa poziomy (np. z wysokiego do umiarkowanego).
Domeny GRADE dla oceny w dół
1. Ryzyko stronniczości
Stronniczość występuje wtedy, gdy wyniki badania nie odzwierciedlają prawdy z powodu nieodłącznych ograniczeń w projektowaniu lub prowadzeniu badania. W praktyce trudno jest określić, w jakim stopniu potencjalna stronniczość wpływa na wyniki i dlatego pewność co do szacowanego efektu jest mniejsza, jeżeli badania informujące o szacowanym efekcie mogą być stronnicze.
Dostępnych jest kilka narzędzi do oceny ryzyka stronniczości w poszczególnych badaniach randomizowanych i badaniach obserwacyjnych.
GRADE służy do oceny dowodów na poziomie wyników, a nie na poziomie badań. Autorzy muszą zatem ocenić, czy ryzyko błędu systematycznego w poszczególnych badaniach jest wystarczająco duże, aby obniżyć zaufanie do szacowanego efektu leczenia. Kluczowe rozważania dotyczące ryzyka błędu systematycznego oraz szczegółowy opis procesu przechodzenia od ryzyka błędu systematycznego na poziomie badania do ryzyka błędu systematycznego dla całości materiału dowodowego opisano szczegółowo w serii wytycznych GRADE #4: Rating the quality of evidence – study limitations (risk of bias).
2. Niedokładność
Podejście GRADE do oceny niedokładności koncentruje się na 95% przedziale ufności wokół najlepszego oszacowania efektu bezwzględnego. Pewność jest mniejsza, jeżeli decyzja kliniczna byłaby inna, gdyby prawdziwy efekt znajdował się w górnej lub dolnej części przedziału ufności. Autorzy mogą również obniżyć ocenę za niedokładność, jeśli szacowany efekt pochodzi tylko z jednego lub dwóch małych badań lub jeśli wystąpiło niewiele zdarzeń. Szczegółowy opis niedokładności jest opisany w serii wytycznych GRADE #6: Ocena jakości dowodów – niedokładność.
3. Niespójność
Pewność w zbiorze dowodów jest największa, gdy istnieje kilka badań, które wykazują spójne efekty. Przy rozważaniu, czy pewność powinna być obniżona z powodu niespójności, autorzy powinni sprawdzić podobieństwo oszacowań punktowych i nakładanie się ich przedziałów ufności, a także kryteria statystyczne heterogeniczności (np. test I2 i chi-squared). Pełne omówienie niespójności jest dostępne w serii wytycznych GRADE #7: rating the quality of evidence – inconsistency.
4. Pośredniość
Dowody są najbardziej pewne, gdy badania bezpośrednio porównują interesujące interwencje w interesującej populacji i podają wynik(i) krytyczny(e) dla podejmowania decyzji. Pewność może być obniżona, jeżeli badani pacjenci różnią się od tych, dla których stosuje się dane zalecenie. Pośredniość może również wystąpić, gdy badane interwencje różnią się od rzeczywistych wyników (na przykład badanie nowej procedury chirurgicznej w wysokospecjalistycznym ośrodku tylko pośrednio dotyczy ośrodków o mniejszym doświadczeniu). Pośredniość występuje również wtedy, gdy badany wynik jest surogatem innego wyniku – zazwyczaj takiego, który jest ważniejszy dla pacjentów. Pełna dyskusja na temat pośredniości jest dostępna w serii wytycznych GRADE #8: ocena jakości dowodów – pośredniość.
5. Publication bias
Publication bias jest prawdopodobnie najbardziej kłopotliwą z dziedzin GRADE, ponieważ wymaga wnioskowania o brakujących dowodach. Kilka metod statystycznych i wizualnych jest pomocnych w wykrywaniu błędu publikacji, mimo że mają one poważne ograniczenia. Publication bias jest bardziej powszechne w przypadku danych obserwacyjnych i gdy większość opublikowanych badań jest finansowana przez przemysł. Pełne omówienie publication bias jest dostępne w serii wytycznych GRADE #5: rating the quality of evidence – publication bias.
Co zwiększa pewność dowodów?
W rzadkich okolicznościach pewność dowodów można zwiększyć (patrz tabela 2). Po pierwsze, gdy występuje bardzo duża skala efektu, możemy być bardziej pewni, że występuje co najmniej mały efekt. Po drugie, gdy istnieje wyraźny gradient dawka-odpowiedź. Po trzecie, gdy resztkowa konfundacja może raczej zmniejszyć niż zwiększyć wielkość efektu (w sytuacjach z efektem). Pełniejsze omówienie powodów, dla których należy oceniać pewność dowodów w górę, jest dostępne w serii wytycznych GRADE #9: Rating up the quality of evidence.
Certainty can be rated down for: | Certainty can be rated up for: |
|
|
Przejście od jakości dowodów do zaleceń
W GRADE, Zalecenia mogą być silne lub słabe, za lub przeciw danej interwencji. Silne rekomendacje sugerują, że wszystkie lub prawie wszystkie osoby wybrałyby tę interwencję. Słabe rekomendacje sugerują, że istnieje prawdopodobieństwo istotnego zróżnicowania decyzji, które prawdopodobnie podejmą osoby poinformowane. Siła zaleceń jest możliwa do zastosowania: słabe zalecenie wskazuje, że niezbędne jest zaangażowanie we wspólny proces podejmowania decyzji, natomiast silne zalecenie sugeruje, że zwykle nie jest konieczne przedstawianie obu opcji.
Zalecenia są raczej słabe niż silne, gdy pewność dowodów jest mała, gdy istnieje ścisła równowaga między pożądanymi i niepożądanymi następstwami, gdy istnieje znaczne zróżnicowanie lub niepewność wartości i preferencji pacjenta oraz gdy interwencje wymagają znacznych zasobów. Pełna dyskusja jest dostępna w serii BMJ na temat ram GRADE Evidence to Decision oraz w oryginalnej serii.
Autorzy: Reed Siemieniuk i Gordon Guyatt
- Guyatt GH, Oxman AD, Kunz R, Vist GE, Falck-Ytter Y, Schunemann HJ. What is „quality of evidence” and why is it important to clinicians? BMJ (Clinical research ed). 2008;336(7651):995-8.
- Guyatt GH, Oxman AD, Vist GE, Kunz R, Falck-Ytter Y, Alonso-Coello P, et al. GRADE: an emerging consensus on rating quality of evidence and strength of recommendations. BMJ (Clinical research ed). 2008;336(7650):924-6.
- Guyatt G, Oxman AD, Akl EA, Kunz R, Vist G, Brozek J, et al. GRADE guidelines: 1. Wprowadzenie-GRADE profile dowodów i tabele podsumowania wyników. Journal of clinical epidemiology. 2011;64(4):383-94.
- Guyatt GH, Oxman AD, Kunz R, Atkins D, Brozek J, Vist G, et al. GRADE guidelines: 2. Framing the question and deciding on important outcomes. Journal of clinical epidemiology. 2011;64(4):395-400.
- Balshem H, Helfand M, Schunemann HJ, Oxman AD, Kunz R, Brozek J, et al. GRADE guidelines: 3. Ocena jakości dowodów. Journal of clinical epidemiology. 2011;64(4):401-6.
- Guyatt G, Oxman AD, Sultan S, Brożek J, Glasziou P, Alonso-Coello P, et al. GRADE guidelines: 11. Making an overall rating of confidence in effect estimates for a single outcome and for all outcomes. Journal of clinical epidemiology. 2013;66(2):151-7.
- Mustafa RA, Santesso N, Brozek J, Akl EA, Walter SD, Norman G, et al. The GRADE approach is reproducible in assessing the quality of evidence of quantitative evidence syntheses. Journal of clinical epidemiology. 2013;66(7):736-42; quiz 42.e1-5.
- Guyatt GH, Oxman AD, Vist G, Kunz R, Brozek J, Alonso-Coello P, et al. GRADE guidelines: 4. Rating the quality of evidence-study limitations (risk of bias). Journal of clinical epidemiology. 2011;64(4):407-15.
- Higgins JP, Altman DG, Gøtzsche PC, Jüni P, Moher D, Oxman AD, et al. The Cochrane Collaboration’s tool for assessing risk of bias in randomised trials. BMJ (Clinical research ed). 2011;343:d5928.
- Wells G, Shea B, O’connell D, Peterson J, Welch V, Losos M, et al. The Newcastle-Ottawa Scale (NOS) for assessing the quality of nonrandomised studies in meta-analyses. Ottawa: Ottawa Hospital Research Institute; 2011. oxford. asp; 2011.
- Sterne JA, Hernan MA, Reeves BC, Savovic J, Berkman ND, Viswanathan M, et al. ROBINS-I: a tool for assessing risk of bias in non-randomised studies of interventions. BMJ (Clinical research ed). 2016;355:i4919.
- Guyatt GH, Oxman AD, Kunz R, Brozek J, Alonso-Coello P, Rind D, et al. GRADE guidelines 6. Ocena jakości dowodów – precyzja. Journal of clinical epidemiology. 2011;64(12):1283-93.
- Walsh M, Srinathan SK, McAuley DF, Mrkobrada M, Levine O, Ribic C, et al. The statistical significance of randomized controlled trial results is frequently fragile: a case for a Fragility Index. Journal of clinical epidemiology. 2014;67(6):622-8.
- Guyatt GH, Oxman AD, Kunz R, Woodcock J, Brozek J, Helfand M, et al. GRADE guidelines: 7. Rating the quality of evidence-inconsistency. Journal of clinical epidemiology. 2011;64(12):1294-302.
- Guyatt GH, Oxman AD, Kunz R, Woodcock J, Brozek J, Helfand M, et al. GRADE guidelines: 8. Rating the quality of evidence-indirectness. Journal of clinical epidemiology. 2011;64(12):1303-10.
- Guyatt GH, Oxman AD, Montori V, Vist G, Kunz R, Brozek J, et al. GRADE guidelines: 5. Rating the quality of evidence-publication bias. Journal of clinical epidemiology. 2011;64(12):1277-82.
- Guyatt GH, Oxman AD, Sultan S, Glasziou P, Akl EA, Alonso-Coello P, et al. GRADE guidelines: 9. Rating up the quality of evidence. Journal of clinical epidemiology. 2011;64(12):1311-6.
- Alonso-Coello P, Schunemann HJ, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, et al. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 1: Wprowadzenie. BMJ (Clinical research ed). 2016;353:i2016.
- Alonso-Coello P, Oxman AD, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, et al. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 2: Wytyczne praktyki klinicznej. BMJ (Clinical research ed). 2016;353:i2089.
- Guyatt GH, Oxman AD, Kunz R, Falck-Ytter Y, Vist GE, Liberati A, et al. Going from evidence to recommendations. BMJ (Clinical research ed). 2008;336(7652):1049-51.
Dodaj komentarz