Was ist GRADE?
On November 3, 2021 by adminGRADE (Grading of Recommendations, Assessment, Development and Evaluations) ist ein transparentes Rahmenwerk für die Entwicklung und Präsentation von Zusammenfassungen von Belegen und bietet einen systematischen Ansatz für die Erstellung von Empfehlungen für die klinische Praxis. Es ist das am weitesten verbreitete Instrument zur Einstufung der Qualität von Belegen und zur Erstellung von Empfehlungen, wobei über 100 Organisationen weltweit GRADE offiziell unterstützen.
Wie funktioniert es?
Zunächst entscheiden die Autoren, wie die klinische Frage lautet, einschließlich der Population, auf die sich die Frage bezieht, der zwei oder mehr Alternativen und der Ergebnisse, die für diejenigen, die vor der Entscheidung stehen, am wichtigsten sind. Eine Studie – idealerweise eine systematische Übersichtsarbeit – liefert die beste Schätzung der Effektgröße für jedes Ergebnis in absoluten Zahlen (z. B. eine Risikodifferenz).
Die Autoren bewerten dann die Qualität der Evidenz, die am besten auf jedes Ergebnis angewandt wird, da die Qualität der Evidenz oft zwischen den Ergebnissen variiert. Eine GRADE-Qualitätsbewertung kann auf eine Gesamtheit von Belegen für alle Ergebnisse angewandt werden, wobei in der Regel die niedrigste Qualität der Belege für alle Ergebnisse, die für die Entscheidungsfindung entscheidend sind, herangezogen wird.
GRADE hat vier Evidenzstufen – auch bekannt als Evidenzsicherheit oder Qualität der Belege: sehr niedrig, niedrig, moderat und hoch (Tabelle 1). Evidenz aus randomisierten kontrollierten Studien beginnt mit hoher Qualität, und Evidenz, die Beobachtungsdaten einschließt, beginnt aufgrund von Restverfälschungen mit niedriger Qualität. Die Sicherheit der Evidenz wird aus verschiedenen Gründen erhöht oder verringert, die im Folgenden näher beschrieben werden.
Sicherheit | Was es bedeutet |
Sehr niedrig | Der wahre Effekt unterscheidet sich wahrscheinlich deutlich vom geschätzten Effekt |
Niedrig | Der wahre Effekt könnte sich deutlich von dem geschätzten Effekt unterscheiden |
Mäßig | Die Autoren glauben dass der wahre Effekt wahrscheinlich nahe am geschätzten Effekt liegt |
Hoch | Die Autoren sind sehr zuversichtlich, dass der wahre Effekt dem geschätzten Effekt ähnlich ist |
GRADE ist subjektiv
GRADE kann nicht mechanisch umgesetzt werden – jede Entscheidung ist zwangsläufig sehr subjektiv. Zwei Personen, die ein und dasselbe Beweismaterial bewerten, können vernünftigerweise zu unterschiedlichen Schlussfolgerungen über dessen Sicherheit kommen. Was GRADE jedoch bietet, ist ein reproduzierbares und transparentes Rahmenwerk für die Einstufung der Sicherheit von Belegen.
Was macht Belege weniger sicher?
Für jedes der Kriterien Verzerrungsrisiko, Ungenauigkeit, Inkonsistenz, Indirektheit und Publikationsverzerrung haben die Autoren die Möglichkeit, den Grad ihrer Sicherheit um eine oder zwei Stufen zu verringern (z.B. von hoch auf mäßig).
Die GRADE-Bereiche für die Herabstufung
1. Risiko der Verzerrung
Eine Verzerrung liegt vor, wenn die Ergebnisse einer Studie aufgrund inhärenter Einschränkungen im Design oder in der Durchführung einer Studie nicht der Wahrheit entsprechen. In der Praxis ist es schwierig zu wissen, inwieweit potenzielle Verzerrungen die Ergebnisse beeinflussen, und daher ist die Sicherheit des geschätzten Effekts geringer, wenn die Studien, die den geschätzten Effekt erklären, verzerrt sein könnten.
Es gibt mehrere Instrumente zur Bewertung des Verzerrungsrisikos in einzelnen randomisierten Studien und Beobachtungsstudien.
GRADE wird verwendet, um die Evidenz auf der Ergebnisebene und nicht auf der Studienebene zu bewerten. Die Autoren müssen daher beurteilen, ob das Verzerrungsrisiko in den einzelnen Studien so groß ist, dass ihr Vertrauen in den geschätzten Behandlungseffekt geringer ist. Die wichtigsten Überlegungen zum Verzerrungsrisiko und eine detaillierte Beschreibung des Prozesses für den Übergang vom Verzerrungsrisiko auf Studienebene zum Verzerrungsrisiko für einen Evidenzkorpus werden in der GRADE-Leitlinienreihe #4 ausführlich beschrieben: Bewertung der Qualität der Evidenz – Studieneinschränkungen (Verzerrungsrisiko).
2. Ungenauigkeit
Der GRADE-Ansatz zur Bewertung der Ungenauigkeit konzentriert sich auf das 95%-Konfidenzintervall um die beste Schätzung des absoluten Effekts. Die Sicherheit ist geringer, wenn die klinische Entscheidung wahrscheinlich anders ausfallen würde, wenn der tatsächliche Effekt am oberen oder am unteren Ende des Konfidenzintervalls läge. Die Autoren können sich auch dafür entscheiden, die Ungenauigkeit niedriger zu bewerten, wenn der Effektschätzer nur aus einer oder zwei kleinen Studien stammt oder wenn es nur wenige Ereignisse gab. Eine ausführliche Beschreibung der Ungenauigkeit findet sich in der GRADE-Leitlinienserie #6: Rating the quality of evidence – imprecision.
3. Inkonsistenz
Die Gewissheit in einem Evidenzkorpus ist am höchsten, wenn es mehrere Studien gibt, die konsistente Effekte zeigen. Bei der Überlegung, ob die Sicherheit wegen Inkonsistenz herabgestuft werden sollte, sollten die Autoren die Ähnlichkeit der Punktschätzungen und die Überlappung ihrer Konfidenzintervalle sowie statistische Kriterien für Heterogenität (z. B. I2 und Chi-Quadrat-Test) prüfen. Eine ausführliche Erörterung der Inkonsistenz findet sich in der GRADE-Leitlinienreihe #7: Bewertung der Qualität der Evidenz – Inkonsistenz.
4. Indirektheit
Die Evidenz ist am sichersten, wenn Studien die interessierenden Interventionen in der interessierenden Population direkt miteinander vergleichen und die für die Entscheidungsfindung entscheidenden Ergebnisse berichten. Die Sicherheit kann herabgestuft werden, wenn die untersuchten Patienten sich von denen unterscheiden, für die die Empfehlung gilt. Indirektheit kann auch auftreten, wenn sich die untersuchten Interventionen von den tatsächlichen Ergebnissen unterscheiden (z. B. gilt eine Studie über ein neues chirurgisches Verfahren in einem hochspezialisierten Zentrum nur indirekt für Zentren mit weniger Erfahrung). Indirektheit tritt auch auf, wenn das untersuchte Ergebnis ein Surrogat für ein anderes Ergebnis ist – in der Regel eines, das für die Patienten wichtiger ist. Eine ausführliche Erörterung der Indirektheit findet sich in der GRADE-Leitlinienreihe #8: rating the quality of evidence – indirectness.
5. Publikationsverzerrung
Die Publikationsverzerrung ist vielleicht der schwierigste der GRADE-Bereiche, da sie Rückschlüsse auf fehlende Evidenz erfordert. Mehrere statistische und visuelle Methoden sind bei der Erkennung von Publikationsverzerrungen hilfreich, auch wenn sie schwerwiegende Einschränkungen aufweisen. Publikationsverzerrungen treten häufiger bei Beobachtungsdaten auf und wenn die meisten der veröffentlichten Studien von der Industrie finanziert werden. Eine ausführliche Erörterung der Publikationsverzerrung findet sich in der GRADE-Leitlinienreihe #5: Bewertung der Qualität von Belegen – Publikationsverzerrung.
Was erhöht das Vertrauen in die Belege?
In seltenen Fällen kann die Sicherheit der Belege höher eingestuft werden (siehe Tabelle 2). Erstens, wenn es eine sehr große Wirkung gibt, können wir sicherer sein, dass es zumindest eine kleine Wirkung gibt. Zweitens, wenn es einen klaren Dosis-Wirkungs-Gradienten gibt. Drittens, wenn verbleibende Verunreinigungen das Ausmaß des Effekts wahrscheinlich eher verringern als erhöhen (in Situationen mit einem Effekt). Eine ausführlichere Erörterung der Gründe für eine Höherbewertung der Sicherheit findet sich in der GRADE-Leitlinienreihe #9: Bewertung der Qualität der Evidenz.
Sicherheit kann niedriger bewertet werden für: | Sicherheit kann höher bewertet werden für: |
|
|
Von der Qualität der Belege zu Empfehlungen übergehen
In GRADE, können Empfehlungen stark oder schwach sein, für oder gegen eine Intervention. Starke Empfehlungen deuten darauf hin, dass alle oder fast alle Personen diese Intervention wählen würden. Schwache Empfehlungen deuten darauf hin, dass die Entscheidung, die informierte Personen wahrscheinlich treffen würden, stark variieren kann. Die Stärke der Empfehlungen ist handlungsrelevant: Eine schwache Empfehlung weist darauf hin, dass ein gemeinsamer Entscheidungsfindungsprozess unerlässlich ist, während eine starke Empfehlung darauf hindeutet, dass es in der Regel nicht notwendig ist, beide Optionen vorzustellen.
Empfehlungen sind eher schwach als stark, wenn die Evidenzsicherheit gering ist, wenn es ein enges Gleichgewicht zwischen erwünschten und unerwünschten Folgen gibt, wenn es erhebliche Unterschiede oder Unsicherheiten bei den Werten und Präferenzen der Patienten gibt und wenn Interventionen erhebliche Ressourcen erfordern. Eine ausführliche Diskussion ist in der BMJ-Reihe zum GRADE Evidence to Decision Framework und in der Originalserie zu finden.
Autoren: Reed Siemieniuk und Gordon Guyatt
- Guyatt GH, Oxman AD, Kunz R, Vist GE, Falck-Ytter Y, Schunemann HJ. Was ist „Qualität der Evidenz“ und warum ist sie für Kliniker wichtig? BMJ (Clinical research ed). 2008;336(7651):995-8.
- Guyatt GH, Oxman AD, Vist GE, Kunz R, Falck-Ytter Y, Alonso-Coello P, et al. GRADE: an emerging consensus on rating quality of evidence and strength of recommendations. BMJ (Clinical research ed). 2008;336(7650):924-6.
- Guyatt G, Oxman AD, Akl EA, Kunz R, Vist G, Brozek J, et al. GRADE guidelines: 1. Einführung – GRADE-Evidenzprofile und Tabellen mit Zusammenfassungen der Ergebnisse. Journal of clinical epidemiology. 2011;64(4):383-94.
- Guyatt GH, Oxman AD, Kunz R, Atkins D, Brozek J, Vist G, et al. GRADE guidelines: 2. Formulierung der Fragestellung und Entscheidung über wichtige Ergebnisse. Journal of clinical epidemiology. 2011;64(4):395-400.
- Balshem H, Helfand M, Schunemann HJ, Oxman AD, Kunz R, Brozek J, et al. GRADE guidelines: 3. Rating the quality of evidence. Journal of clinical epidemiology. 2011;64(4):401-6.
- Guyatt G, Oxman AD, Sultan S, Brozek J, Glasziou P, Alonso-Coello P, et al. GRADE guidelines: 11. Erstellung einer Gesamtbewertung des Vertrauens in Effektschätzungen für ein einzelnes Ergebnis und für alle Ergebnisse. Journal of clinical epidemiology. 2013;66(2):151-7.
- Mustafa RA, Santesso N, Brozek J, Akl EA, Walter SD, Norman G, et al. The GRADE approach is reproducible in assessing the quality of evidence of quantitative evidence syntheses. Journal of clinical epidemiology. 2013;66(7):736-42; quiz 42.e1-5.
- Guyatt GH, Oxman AD, Vist G, Kunz R, Brozek J, Alonso-Coello P, et al. GRADE guidelines: 4. Bewertung der Qualität der Evidenz – Studieneinschränkungen (Risiko der Verzerrung). Journal of clinical epidemiology. 2011;64(4):407-15.
- Higgins JP, Altman DG, Gøtzsche PC, Jüni P, Moher D, Oxman AD, et al. The Cochrane Collaboration’s tool for assessing risk of bias in randomised trials. BMJ (Clinical research ed). 2011;343:d5928.
- Wells G, Shea B, O’connell D, Peterson J, Welch V, Losos M, et al. The Newcastle-Ottawa Scale (NOS) for assessing the quality of nonrandomised studies in meta-analyses. Ottawa: Ottawa Hospital Research Institute; 2011. oxford. asp; 2011.
- Sterne JA, Hernan MA, Reeves BC, Savovic J, Berkman ND, Viswanathan M, et al. ROBINS-I: a tool for assessing risk of bias in non-randomised studies of interventions. BMJ (Clinical research ed). 2016;355:i4919.
- Guyatt GH, Oxman AD, Kunz R, Brozek J, Alonso-Coello P, Rind D, et al. GRADE guidelines 6. Bewertung der Qualität der Evidenz-Imprecision. Journal of clinical epidemiology. 2011;64(12):1283-93.
- Walsh M, Srinathan SK, McAuley DF, Mrkobrada M, Levine O, Ribic C, et al. The statistical significance of randomized controlled trial results is frequently fragile: a case for a Fragility Index. Journal of clinical epidemiology. 2014;67(6):622-8.
- Guyatt GH, Oxman AD, Kunz R, Woodcock J, Brozek J, Helfand M, et al. GRADE guidelines: 7. Bewertung der Qualität der Evidenz – Inkonsistenz. Journal of clinical epidemiology. 2011;64(12):1294-302.
- Guyatt GH, Oxman AD, Kunz R, Woodcock J, Brozek J, Helfand M, et al. GRADE guidelines: 8. Bewertung der Qualität der Evidenz – Indirektheit. Journal of clinical epidemiology. 2011;64(12):1303-10.
- Guyatt GH, Oxman AD, Montori V, Vist G, Kunz R, Brozek J, et al. GRADE guidelines: 5. Bewertung der Qualität der Evidenz – Publikationsverzerrung. Journal of clinical epidemiology. 2011;64(12):1277-82.
- Guyatt GH, Oxman AD, Sultan S, Glasziou P, Akl EA, Alonso-Coello P, et al. GRADE guidelines: 9. Rating up the quality of evidence. Journal of clinical epidemiology. 2011;64(12):1311-6.
- Alonso-Coello P, Schunemann HJ, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, et al. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 1: Einführung. BMJ (Clinical research ed). 2016;353:i2016.
- Alonso-Coello P, Oxman AD, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, et al. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 2: Leitlinien für die klinische Praxis. BMJ (Clinical research ed). 2016;353:i2089.
- Guyatt GH, Oxman AD, Kunz R, Falck-Ytter Y, Vist GE, Liberati A, et al. Going from evidence to recommendations. BMJ (Clinical research ed). 2008;336(7652):1049-51.
Schreibe einen Kommentar