Die Verwendung von 4+ zur Einstufung einer nahezu normalen Muskelkraft verbessert die Übereinstimmung nicht.
Ziel dieser Studie war es zu untersuchen, ob die Erweiterung der Standard-MRC-Skala auf eine modifizierte MRC-Skala die Übereinstimmung verbessert und die Variation verringert
Insgesamt zeigen die Daten keine größere prozentuale Übereinstimmung in der modifizierten MRC-Gruppe im Vergleich zur Standard-MRC-Gruppe und zur visuellen Inspektion der Fig. 1 und 2. 1 und 2 legen nahe, dass es in der modifizierten MRC-Gruppe größere Unterschiede zwischen den Noten und zwischen den Fällen gibt.
Das Analogon der durchschnittlichen Abweichung wurde auch in neun von zehn Vergleichen als größer befunden (alle fünf Fälle begrenzt) und nicht beschränkt) in der modifizierten MRC-Gruppe im Vergleich zur Standard-MRC-Gruppe sowie in allen Fällen zusammen, was darauf hinweist, dass die Bewertungen in der modifizierten MRC-Gruppe gleichmäßiger verteilt und weniger fokussiert waren.
Kappa-Werte für Sowohl Standard- als auch modifizierte MRC-Skalen waren sehr niedrig (0,05 bzw. 0,14). Obwohl für beide Skalen die Hypothese, dass keine Übereinstimmung die reine Zufallsvereinbarung überschreitet (kappa = 0), mit p < 0,0001 zurückgewiesen wurde, schien es eine ziemlich große Variabilität in der gegebenen zu geben Bewertungen und die Stärke der Übereinstimmung sind für beide Bewertergruppen schlecht.
Vorsicht ist geboten, wenn Schlussfolgerungen aus der beobachteten prozentualen Übereinstimmung, dem Analogon der durchschnittlichen Abweichung und dem Kappa gezogen werden, da die Anzahl der Kategorien erhöht ist um eins beim Wechsel von der Standard-MRC zur modifizierten MRC-Skala. Beispielsweise sinkt bei einer Erhöhung von 2 auf 3 Kategorien auf einer bestimmten Skala die minimal mögliche prozentuale Übereinstimmung, die beobachtet werden kann, von 50% auf 33,3%. Der Ada-Index zwischen 0 und 1 überwindet dieses Problem, da seine Maximal- und Minimalwerte nicht von der Anzahl der Kategorien abhängen. Intermediäre Ada-Indizes nehmen jedoch normalerweise ab, wenn die Anzahl der Kategorien erhöht wird, in die Fälle eingestuft werden, wobei die Reihenfolge der Fälle nicht unbedingt beibehalten wird, wenn sie nach ihren Ada-Indizes geordnet werden (siehe Wilcox „Indizes für qualitative Variationen …“ zur Veranschaulichung Beispiel).
Mit anderen Worten, wenn mehr Kategorien zur Auswahl stehen, wird die Übereinstimmung wahrscheinlich abnehmen (und die Streuung zunehmen), zumindest wenn die gesamte Spanne der Skala verwendet wird Es wurde jedoch darauf hingewiesen, dass der aktuelle Fragebogen absichtlich so konzipiert wurde, dass er sich auf einen sehr begrenzten Teil der Skala konzentriert: mit 2 richtigen Antworten (Noten 4 und 5) auf der Standard-MRC-Skala und nur einer (4+) die modifizierte MRC-Skala. Wenn also tatsächlich eine größere Übereinstimmung und geringere Dispersion in der modifizierten MRC-Gruppe gefunden worden wäre, wie angenommen, könnte dies bis zu einem gewissen Grad das Ergebnis von mehr (2 gegen 1) korrekten Antwortoptionen auf der Standard-MRC-Skala gewesen sein Aber wie beschrieben, der aktuelle Fund Ingens deuten auf eine geringere Übereinstimmung und größere Streuung in der modifizierten MRC-Gruppe hin, trotz der Auswirkungen von Unterschieden in der Anzahl der Kategorien. Im folgenden Abschnitt diskutieren wir, ob die fünf Fälle tatsächlich erfolgreich so konstruiert wurden, dass sie sich auf die Antworten 4 oder 5 auf der Standard-MRC-Skala und 4+ auf der modifizierten Skala konzentrieren. P. >
Schließlich ist Kappa ein Maß für die Übereinstimmung, das normalerweise in Studien mit einer relativ großen Anzahl von Fällen und einer relativ kleinen Anzahl von Bewertern verwendet wird. Es kann auf Situationen mit einer geringen Anzahl von Fällen angewendet werden, die von einer größeren Anzahl von Bewertern bewertet werden, führt jedoch typischerweise zu relativ niedrigen Kappa-Werten. Unabhängig davon würde immer noch eine Abnahme des Kappa erwartet, wenn die Anzahl der Kategorien erhöht wird, dh von Standard-MRC zu modifizierter MRC (siehe z. B. Altmann „Praktische Statistik für die medizinische Forschung“).
Zusammenfassend ist die Übereinstimmung für beide Skalen schlecht. Die Tatsache, dass wir bei Verwendung der modifizierten anstelle der Standard-MRC-Skala einen Anstieg des Kappa beobachteten, könnte im Prinzip als Hinweis auf eine leicht erhöhte Übereinstimmung der modifizierten MRC-Skala angesehen werden. Dies kann jedoch nicht rigoros getestet werden, da Standardfehler für die beobachtete Änderung der Kappa-Werte im gegebenen Kontext nicht verfügbar sind. Im Gegensatz dazu zeigt eine Erhöhung der ada für die modifizierte MRC-Skala eine größere qualitative Variation der Bewertungen im Vergleich zum Standard MRC und damit weniger Konsens unter diesen Bewertern. Die Beobachtung, dass die prozentuale Übereinstimmung in den meisten Fällen sowie in allen Fällen zusammen abnimmt, liefert keinen weiteren Hinweis auf eine verbesserte Übereinstimmung und c Schlussfolgerungen bleiben somit ambivalent. Insgesamt deuten die Daten nicht auf eine deutliche Verbesserung der Übereinstimmung unter Verwendung der modifizierten MRC-Skala hin.
Fallbeschreibungen
Bei Fällen, die speziell zur mehrdeutigen Beschreibung von Muskelschwäche in der Grauzone zwischen 4 entwickelt wurden und 5 auf der Standard-MRC-Skala war zu erwarten, dass die Bewerter in der Standard-MRC-Gruppe sich nicht sicher sind, welche dieser beiden Optionen sie wählen sollen.Umgekehrt könnten Bewerter in der modifizierten MRC-Gruppe diese Unsicherheit beheben, indem sie den „mittleren“ Wert von „4+“ wählen. Dies sollte wiederum zu einer größeren Übereinstimmung und einer geringeren Variabilität der Bewertungen in der modifizierten MRC-Gruppe im Vergleich zur Standard-MRC-Gruppe führen. Wie festgestellt, war dies nicht der Fall.
Eine mehrdeutig beschriebene Schwäche zwischen 4 und 5 sollte nicht zu einer gleichmäßigen Verteilung von 4 und 5 führen. Es ist zu erwarten, dass die Ärzte die abnormalen Befunde in der Fallbeschreibung stärker in den Vordergrund stellen als die normalen Befunde. In der Tat war die Note 4 in der Standard-MRC-Gruppe ungefähr dreimal so häufig wie die Note 5.
Abgesehen von Fall C können Antworten von 3 oder weniger in der Standard-MRC-Gruppe im Allgemeinen zugeordnet werden für Teilnehmer, die mit der MRC-Skala nicht vertraut sind und / oder Teilnehmer, die die Skala auf den Kopf gestellt haben und die meisten Fälle mit 0, 1 oder 2 bewertet haben. Die höhere Häufigkeit von Antworten von 3 und weniger in der Standard-MRC-Gruppe wird durch die erklärt Wortlaut der Frage Nr. 1. Teilnehmer, die mit der MRC-Skala nicht vertraut sind, würden Frage 1 natürlich mit „Nein“ beantworten und sie so in die Standard-MRC-Gruppe einordnen. Bewerter, die mit der MRC-Skala nicht vertraut sind, würden daher überwiegend in der Standard-MRC-Gruppe gefunden. Um dem entgegenzuwirken, haben wir Ergebnisse basierend auf allen verfügbaren Daten („unbegrenzt“) sowie Daten, die auf geeignete Antworten beschränkt sind, am oberen Ende der Skala präsentiert.
Die Verteilung der Antworten in Fall A war Im Wesentlichen ähnlich zwischen den Gruppen, wobei 4+ einfach 4 in der modifizierten MRC-Gruppe ersetzt. In Fall B wählte jedoch eine proportional größere Anzahl von Bewertern in der modifizierten MRC-Gruppe „4“, obwohl ihnen die Option „4+“ zur Verfügung stand. Wie im obigen Abschnitt beschrieben, wählten einige Bewerter in Fall C „3“ – nicht wegen Unkenntnis der Skala, sondern weil sie sich gegen die Schwerkraft schwach fühlten und die allmählich zunehmende Schwäche eine Note „3“ rechtfertigte. In jedem Fall wählte die überwiegende Mehrheit der Bewerter in der Standard-MRC-Gruppe in Fall C 4, während die modifizierte MRC-Gruppe gleichmäßiger über 4, 4+ und 5 verteilt war, wobei nur 3 Bewerter wählten 3. Fall D unterschied sich von den anderen Fällen darin, dass die Antwort in der Fallbeschreibung gegeben wurde: „Sie finden eine Schwachstelle 4“, und außerdem wurde der Charakter der Schwäche als „hauptsächlich schmerzbedingt“ angegeben. Interessanterweise stuften 44% der Standard-MRC-Gruppe und 31% der modifizierten MRC-Gruppe den Fall immer noch als „5“ ein. Mit anderen Worten, eine beträchtliche Anzahl von Bewertern entschied sich dafür, eine Schwäche der Klasse 4 in die Note 5 zu übersetzen, wenn sie darüber informiert wurden, dass die Art der Schwäche schmerzbedingt war (im Gegensatz zu neuromuskulär). Die Standard-MRC-Gruppe wurde daher fast gleichmäßig zwischen den Klassen „5“ und „4“ aufgeteilt. Die modifizierte MRC-Gruppe hingegen wählte in nur 9% der Antworten die erwartete Antwort „4+“ (in jedem Fall die niedrigste) und in 60% der Antworten „4“. Es könnte argumentiert werden, dass eine hohe Rate von Antworten der Note 4 nicht überraschend ist, da die Fallbeschreibung ausdrücklich darauf hinweist, dass eine Note 4 beobachtet wurde. Beide Gruppen hatten jedoch trotz der Fallbeschreibung wenig Bedenken, 5 zu wählen, und außerdem würde die Option 4+, die der modifizierten MRC-Gruppe zur Verfügung steht, auch mit der Fallbeschreibung übereinstimmen und könnte als Möglichkeit dienen, eine Note zu qualifizieren 4 Schwäche als schmerzbedingt – dennoch war es die am wenigsten verbreitete Antwort in der modifizierten MRC-Gruppe (abgesehen von den 2 Antworten von 0). Die Verfügbarkeit einer Option „4+“ hat die modifizierte MRC-Gruppe offenbar nicht dazu verleitet, diese Note zu wählen, um die Schwäche als schmerzbedingt zu qualifizieren. Obwohl Fall E die am wenigsten überzeugende Beschreibung der Schwäche hatte, entschieden sich 15% der modifizierten MRC-Gruppe immer noch für „4“ – wiederum hat die Verfügbarkeit einer „4+“ -Option sie weder beeinflusst noch die Übereinstimmung verbessert.
nsgesamt würden wir also argumentieren, dass die fünf Fälle ambivalent formuliert wurden, um eine „mittlere“ Reaktion in der Grauzone zwischen „4“ und „5“ zu begünstigen. Unter Berücksichtigung dieser Prämisse hätten die Ergebnisse in der modifizierten MRC-Gruppe im Vergleich zur Standard-MRC-Gruppe wohl besser übereinstimmen müssen. Stattdessen hat die Option 4+ anscheinend nur eine zusätzliche Antwortoption hinzugefügt, um ambivalent zu sein, was zu einer größeren und nicht zu einer geringeren Disparität in der modifizierten MRC-Gruppe führt.
Die aktuelle Studie untersuchte nur den Effekt des Hinzufügens 4+ für die MRC-Skala, da dieses Ende der Skala am schwierigsten zu bewerten scheint. Aufgrund der aktuellen Daten können wir nicht sagen, ob die vom Medical Research Council, Barr et al. Paternostro-Sluka et al. oder Bohannon würde zu einer größeren Übereinstimmung führen, aber es scheint unwahrscheinlich, da eine noch größere Anzahl von Noten ohne klare Definitionen höchstwahrscheinlich nur zu einer noch größeren Streuung führen wird.Es ist natürlich durchaus möglich, dass sich die Übereinstimmung durch die Hinzufügung von Zwischennoten wie „4+“ eher verbessert als verschlechtert, wenn diese Noten klar mit objektiven Grenzen definiert würden – dies ist jedoch nicht der Fall.
Die aktuellen Ergebnisse basieren nicht auf tatsächlichen körperlichen Untersuchungen der Muskelschwäche und sollten nicht die Gültigkeit manueller Muskeltests als solche untersuchen. Stattdessen bedeutet die schriftliche Beschreibung der klinischen Befunde, die den Teilnehmern vorgelegt wurde, dass die Variabilität aufgrund unterschiedlicher Untersuchungstechniken und Verzerrungen in Bezug auf die Patienten-Compliance usw. beseitigt wurde. Nach unserem Kenntnisstand wurden bisher keine vergleichbaren Fragebogenstudien vorgelegt. Allen Bewertern wurden die gleichen klinischen Befunde vorgelegt (allerdings in ihrer Muttersprache). Die Variabilität der vorliegenden Daten wird daher vorwiegend die Varianz in Bezug auf Unterschiede zwischen den Skalen, die Variation zwischen den Bewertern und möglicherweise sprachbezogene Unterschiede in der Interpretation der schriftlichen Fallbeschreibungen widerspiegeln. Basierend auf den aktuellen Daten können wir diese Effekte nicht disentagieren, aber obwohl wir vermuten, dass geringfügige sprachbedingte Unterschiede bei der Interpretation der Fragen nur geringe Auswirkungen haben, ist es durchaus möglich, dass systematische Unterschiede zwischen anderen Bewertern als denen, die sich auf die MRC-Skala beziehen, ist zwischen Gruppen verzerrt – z dass mit der MRC-Skala nicht vertraute Bewerter die Frage Nr. 1 mit „Nein“ beantworteten.
Studienbeschränkungen
Der Fragebogen könnte möglicherweise an eine sehr große Anzahl von Klinikern aus verschiedenen Ländern verteilt worden sein Berufe in Nordeuropa. Die Daten spiegeln sozusagen nur Chiropraktiker wider, und es ist möglich, dass eine breitere Stichprobe von Klinikern zu anderen Ergebnissen hätte führen können. Wir haben jedoch keinen besonderen Grund, dies zu glauben, da die MRC-Skala nicht für einen bestimmten Beruf spezifisch ist und Teil vieler gängiger Lehrbücher und klinischer Richtlinien für Hochschulabsolventen ist.
Auch, um die Länge des Fragebogens einzuschränken Auf ein Minimum (um die Wahrscheinlichkeit zu erhöhen, dass Teilnehmer daran teilnehmen) haben wir uns nicht nach grundlegenden Merkmalen wie Alter, Geschlecht, Jahren in der Praxis, klinischen Hauptinteressen, Universität / Hochschule usw. erkundigt. Es ist möglich, dass solche Daten vorliegen hätte interessante Assoziationen / Eventualitäten aufwerfen können und sicherlich die Studienpopulation detaillierter beschreiben können. So wie es ist, kann die Studienpopulation wirklich nur als nordeuropäische Chiropraktiker bezeichnet werden.