Stosowanie 4+ do stopniowania prawie normalnej siły mięśni nie poprawia zgodności
To badanie miało na celu zbadanie, czy rozszerzenie standardowej skali MRC na zmodyfikowaną skalę MRC poprawia zgodność i zmniejsza zmienność ocen.
Ogólnie rzecz biorąc, dane nie wykazują większej zgodności procentowej w zmodyfikowanej grupie MRC w porównaniu ze standardową grupą MRC i oględzinach ryc. 1 i 2 sugerują, że jeśli cokolwiek, istnieje większe zróżnicowanie między ocenami i między przypadkami w zmodyfikowanej grupie MRC.
Stwierdzono również, że średni analog odchylenia był większy w dziewięciu z dziesięciu porównań (wszystkie pięć przypadków, ograniczone i bez ograniczeń) w zmodyfikowanej grupie MRC w porównaniu ze standardową grupą MRC, a także we wszystkich połączonych przypadkach, co wskazuje, że oceny były bardziej równomierne i mniej skoncentrowane w zmodyfikowanej grupie MRC.
Wartości Kappa dla zarówno standardowe, jak i zmodyfikowane skale MRC były bardzo niskie (0,05 lub 0,14). Chociaż dla obu skal hipoteza o braku zgodności przekraczającej zgodność czysto przypadkową (kappa = 0) została odrzucona przy p < 0,0001, wydawało się, że istnieje dość duża zmienność w danym oceny i siła zgodności są słabe dla obu grup oceniających.
Należy zachować ostrożność przy wyciąganiu wniosków z obserwowanej zgodności procentowej, średniego analogu odchylenia i kappa ze względu na fakt, że liczba kategorii jest zwiększona o jeden podczas przechodzenia ze standardowej skali MRC na zmodyfikowaną skalę MRC. Przykładowo wraz ze wzrostem z 2 do 3 kategorii w danej skali minimalna możliwa zgodność procentowa, jaką można zaobserwować, spada z 50% do 33,3%. Indeks ada w zakresie od 0 do 1 rozwiązuje ten problem, ponieważ jego wartości maksymalne i minimalne nie zależą od liczby kategorii. Jednak pośrednie wskaźniki ada zwykle zmniejszają się wraz ze wzrostem liczby kategorii, na które są oceniane przypadki, niekoniecznie zachowując kolejność przypadków, gdy są uporządkowane zgodnie z ich indeksami ada (zob. Wilcox „Wskaźniki zmienności jakościowej…”, aby zapoznać się z ilustracją przykład).
Innymi słowy, przy większej liczbie dostępnych kategorii do wyboru, zgodność prawdopodobnie zmniejszy się (a rozproszenie wzrośnie), przynajmniej jeśli wykorzystany zostanie cały zakres skali. zauważył jednak, że obecny kwestionariusz został celowo zaprojektowany tak, aby skupić się na bardzo ograniczonej części skali: z 2 poprawnymi odpowiedziami (oceny „4” i „5”) w standardowej skali MRC i tylko jedną („4+”) na Tak więc, gdyby rzeczywiście stwierdzono większą zgodność i mniejszą dyspersję w zmodyfikowanej grupie MRC zgodnie z hipotezą, mogłoby to w pewnym stopniu wynikać z większej liczby (2 vs 1) poprawnych odpowiedzi na standardowej skali MRC , Ale jak opisano, obecne znalezisko Wyniki sugerują mniejszą zgodność i większą dyspersję w zmodyfikowanej grupie MRC, pomimo skutków różnic w liczbie kategorii. W poniższej sekcji omawiamy, czy te pięć przypadków faktycznie zostało pomyślnie skonstruowanych w taki sposób, aby skupić się na odpowiedziach „4” lub „5” w standardowej skali MRC i „4+” w zmodyfikowanej skali.
Wreszcie kappa jest miarą zgodności zwykle używaną w badaniach obejmujących stosunkowo dużą liczbę przypadków i stosunkowo niewielką liczbę osób oceniających. Można go zastosować w sytuacjach z małą liczbą przypadków ocenianych przez większą liczbę oceniających, ale zazwyczaj skutkuje stosunkowo niskimi wartościami kappa. Niezależnie od tego nadal oczekiwano by spadku kappa przy zwiększaniu liczby kategorii, tj. Przechodzeniu ze standardowego MRC do zmodyfikowanego MRC (patrz np. Altmann „Practical Statistics for Medical Research”).
Podsumowując, zgodność jest słaba dla obu skal, fakt, że zaobserwowaliśmy wzrost kappa przy zastosowaniu zmodyfikowanej zamiast standardowej skali MRC, można w zasadzie uznać za przejaw nieznacznie zwiększonej zgodności zmodyfikowanej skali MRC. Jednak nie można tego rygorystycznie przetestować, ponieważ standardowe błędy obserwowanej zmiany wartości kappa nie są dostępne w danym kontekście. Z kolei wzrost ada dla zmodyfikowanej skali MRC wskazuje na większą jakościową zmienność ocen w porównaniu ze standardem MRC, a tym samym mniejszy konsensus wśród tych oceniających. Obserwowanie spadku zgodności procentowej w większości przypadków, jak również we wszystkich przypadkach łącznie, nie dostarcza dalszych wskazówek dotyczących poprawy zgodności oraz c w ten sposób wnioski pozostają ambiwalentne. W sumie dane nie wskazują na wyraźną poprawę zgodności przy użyciu zmodyfikowanej skali MRC.
Opisy przypadków
W przypadkach specjalnie zaprojektowanych do niejednoznacznego opisu osłabienia mięśni w szarej strefie między „4 i 5 w standardowej skali MRC, należało oczekiwać, że oceniający w standardowej grupie MRC nie będą mieli pewności, którą z tych dwóch opcji wybrać.I odwrotnie, osoby oceniające w zmodyfikowanej grupie MRC mogą rozwiązać taką niepewność, wybierając „środkową” wartość „4+”. To z kolei miało skutkować większą zgodnością i mniejszą zmiennością ocen w zmodyfikowanej grupie MRC w porównaniu ze standardową grupą MRC. Jak podsumowano, nie stwierdzono, aby tak było.
Niejednoznacznie opisana słabość gdzieś pomiędzy „4” a „5” nie powinna skutkować równym rozkładem „4” i „5” stopni w standardowej grupie MRC i można oczekiwać, że klinicyści będą kładli większy nacisk na nieprawidłowe wyniki w opisie przypadku niż na wyniki prawidłowe. Rzeczywiście, ocena „4” była mniej więcej 3 razy częściej niż „5” w standardowej grupie MRC.
Oprócz przypadku C, odpowiedzi na poziomie „3” lub niższym w standardowej grupie MRC można ogólnie przypisać uczestnikom niezaznajomionym ze skalą MRC i / lub uczestnikom, którzy odwrócili skalę do góry nogami, oceniając większość przypadków jako 0, 1 lub 2. Wyższą częstotliwość odpowiedzi „3” i mniej w standardowej grupie MRC wyjaśnia sformułowanie pytania nr 1. Uczestnicy niezaznajomieni ze skalą MRC w naturalny sposób odpowiedzieliby „Nie” na pytanie nr 1, umieszczając ich w ten sposób w standardowej grupie MRC. Osoby oceniające niezaznajomione ze skalą MRC znajdowałyby się zatem głównie w standardowej grupie MRC. Aby temu przeciwdziałać, przedstawiliśmy wyniki oparte na wszystkich dostępnych danych („bez ograniczeń”), a także danych ograniczonych do odpowiednich odpowiedzi na górnym końcu skali.
Rozkład odpowiedzi w przypadku A był zasadniczo podobne między grupami, przy czym „4+” po prostu zastępuje „4” w zmodyfikowanej grupie MRC. Jednak w przypadku B proporcjonalnie większa liczba oceniających w zmodyfikowanej grupie MRC wybrała „4”, pomimo posiadania dostępnej dla nich opcji „4+”. Jak opisano w sekcji powyżej, niektórzy oceniający wybrali „3” w przypadku C – nie z powodu nieznajomości skali, ale dlatego, że odczuwali słabość wobec grawitacji i stopniowo narastająca słabość uzasadniała ocenę „3”. W każdym razie zdecydowana większość oceniających w standardowej grupie MRC wybrała „4” w przypadku C, podczas gdy zmodyfikowana grupa MRC była bardziej równomiernie rozłożona na „4”, „4+” i „5”, przy czym tylko 3 oceniające wybrały „3”. Przypadek D różnił się od innych przypadków tym, że odpowiedź została udzielona w opisie przypadku: „znajdujesz 4 stopień osłabienia”, a ponadto charakter osłabienia określono jako „głównie związany z bólem”. Co ciekawe, 44% ze standardowej grupy MRC i 31% ze zmodyfikowanej grupy MRC nadal oceniło ten przypadek na „5”. Innymi słowy, znaczna liczba oceniających zdecydowała się przełożyć słabość oceny „4” na ocenę „5”, gdy została poinformowana, że charakter osłabienia jest związany z bólem (w przeciwieństwie do układu nerwowo-mięśniowego). Standardowa grupa MRC została zatem prawie równo podzielona między stopniami „5” i „4”. Z drugiej strony zmodyfikowana grupa MRC wybrała oczekiwaną odpowiedź „4+” tylko w 9% odpowiedzi (najniższą we wszystkich przypadkach), a odpowiedź „4” w 60% odpowiedzi. Można argumentować, że wysoki odsetek odpowiedzi „4” nie jest zaskakujący, ponieważ opis przypadku wyraźnie sugerował, że zaobserwowano ocenę 4. Jednak obie grupy miały niewielkie zastrzeżenia co do wyboru „5” pomimo opisu przypadku, a ponadto opcja „4+” dostępna dla zmodyfikowanej grupy MRC byłaby również zgodna z opisem przypadku i mogłaby służyć jako sposób zakwalifikowania oceny Osłabienie „4” jako związane z bólem – ale była to najmniej powszechna odpowiedź w zmodyfikowanej grupie MRC (poza 2 odpowiedziami „0”). Dostępność opcji „4+” najwyraźniej nie skłoniła zmodyfikowanej grupy MRC do wybrania tego stopnia jako środka do zakwalifikowania osłabienia jako związanego z bólem. Mimo że przypadek E miał najmniej przekonujący opis słabych punktów, 15% zmodyfikowanej grupy MRC nadal wybrało „4” – ponownie dostępność opcji „4+” nie wpłynęła na nich ani nie poprawiła porozumienia. p> Ogólnie rzecz biorąc, chcielibyśmy argumentować, że pięć przypadków zostało sformułowanych ambiwalentnie w taki sposób, aby faworyzować odpowiedź „środkową” w szarej strefie między „4” a „5”. Przyjmując to założenie, wyniki prawdopodobnie powinny być bardziej zgodne w zmodyfikowanej grupie MRC w porównaniu ze standardową grupą MRC. Zamiast tego opcja „4+” najwyraźniej dodała tylko dodatkową opcję odpowiedzi, która była ambiwalentna, co skutkowało większą, a nie mniejszą dysproporcją w zmodyfikowanej grupie MRC.
W obecnym badaniu analizowano jedynie wpływ dodania „4+” w skali MRC, ponieważ ten koniec skali wydaje się najtrudniejszy do oceny. Na podstawie aktualnych danych nie możemy stwierdzić, czy bardziej zmodyfikowane skale sugerowane przez Medical Research Council, Barr i wsp. , Paternostro-Sluka i in. lub Bohannon doprowadziłby do większej zgodności, ale wydaje się nieprawdopodobne, ponieważ jeszcze większa liczba ocen bez jasnych definicji najprawdopodobniej spowoduje tylko jeszcze większe rozproszenie.Jest oczywiście całkowicie możliwe, że zgodność ta poprawiłaby się, a nie pogorszyłaby po dodaniu ocen pośrednich, takich jak „4+”, gdyby takie oceny były jasno określone z obiektywnymi ograniczeniami – tak jednak nie jest.
Obecne ustalenia nie są oparte na rzeczywistych, fizycznych badaniach osłabienia mięśni i nie miały na celu zbadania ważności ręcznych testów mięśni jako takich. Zamiast tego pisemny opis wyników klinicznych, który został przedstawiony uczestnikom, oznacza, że zmienność wynikająca z różnych technik badania i stronniczości związanych z przestrzeganiem zaleceń przez pacjenta itp. Została wyeliminowana. O ile nam wiadomo, wcześniej nie przedstawiono żadnych porównywalnych badań kwestionariuszowych. Wszystkim oceniającym przedstawiono te same wyniki kliniczne (aczkolwiek w ich języku ojczystym). Zmienność obecnych danych będzie zatem w przeważającej mierze odzwierciedlać wariancję związaną z różnicami między skalami, różnicami między oceniającymi i prawdopodobnie językowymi różnicami w interpretacji pisemnych opisów przypadków. Na podstawie aktualnych danych nie możemy wykluczyć tych efektów, ale choć podejrzewamy niewielkie różnice językowe w interpretacji pytań, które mają niewielki wpływ, jest całkiem możliwe, że systematyczne różnice między oceniającymi inne niż te odnoszące się do skali MRC, jest wypaczony między grupami – np że oceniający niezaznajomieni ze skalą MRC zwykle odpowiadali „Nie” na pytanie nr 1.
Ograniczenia badania
Kwestionariusz mógł być potencjalnie rozesłany do bardzo dużej liczby klinicystów z różnych zawody w Europie Północnej. W rzeczywistości dane dotyczą tylko kręgarzy i jest możliwe, że szersza próba klinicystów mogła dać inne wyniki. Nie mamy jednak szczególnych powodów, aby tak sądzić, ponieważ skala MRC nie jest specyficzna dla żadnego zawodu i jest częścią wielu popularnych podręczników dla absolwentów i wytycznych klinicznych.
Ponadto, aby ograniczyć długość kwestionariusza do absolutnego minimum (aby zwiększyć prawdopodobieństwo ukończenia przez uczestników) nie pytaliśmy o takie podstawowe cechy, jak wiek, płeć, staż pracy, główne zainteresowania kliniczne, uczelnia / uczelnia itp. Możliwe, że takie dane mógł wywołać ciekawe skojarzenia / nieprzewidziane okoliczności iz pewnością mógł bardziej szczegółowo opisać badaną populację. W rzeczywistości badaną populację można określić tylko jako kręgarzy z północy Europy.