Bruk av 4+ for å gradere nesten normal muskelstyrke forbedrer ikke samsvar
Denne studien tar sikte på å undersøke om utvidelse av standard MRC-skala til en modifisert MRC-skala forbedrer samsvar og reduserer variasjon av rangeringene.
Samlet viser ikke dataene en større prosentvis samsvar i den modifiserte MRC-gruppen sammenlignet med standard MRC-gruppen og visuell inspeksjon i fig. 1 og 2 antyder at hvis noe er større variasjon mellom karakterer og mellom tilfeller i den modifiserte MRC-gruppen.
Den gjennomsnittlige avviksanalogen ble også funnet å være større i ni av ti sammenligninger (alle fem tilfeller, begrenset og ikke begrenset) i den modifiserte MRC-gruppen sammenlignet med standard MRC-gruppen, så vel som for alle tilfeller kombinert, noe som indikerer at rangeringer var jevnere fordelt og mindre fokusert i den modifiserte MRC-gruppen.
Kappa-verdier for både standard og modifiserte MRC-skalaer var veldig lave (0,05 resp. 0,14). Selv om hypotesen om at ingen avtaler som overstiger den rene tilfeldighetsavtalen (kappa = 0) for begge skalaer ble avvist med p < 0,0001, så det ut til å være en ganske stor variasjon i det gitte rangeringer og styrken av enighet er dårlig for begge ratergruppene.
Forsiktighet bør utvises når man trekker konklusjoner fra den observerte prosentvise avtalen, gjennomsnittlig avviksanalog og kappa på grunn av at antall kategorier økes av en når du bytter fra standard MRC til modifisert MRC skala. For eksempel, med en økning fra 2 til 3 kategorier på en gitt skala, faller den minste mulige prosentvise avtalen som kan observeres fra 50% til 33,3%. Ada-indeksen fra 0 til 1 overvinner dette problemet ved at maksimums- og minimumsverdiene ikke avhenger av antall kategorier. Mellomliggende ada-indekser reduseres imidlertid vanligvis når man øker antall kategorier i hvilke saker som er vurdert, og beholder ikke nødvendigvis rekkefølgen på sakene når de er bestilt i henhold til deres ada-indekser (se Wilcox «Indices of qualitative variation …» for en illustrasjon Eksempel).
Med andre ord, med flere tilgjengelige kategorier å velge mellom, vil avtalen sannsynligvis avta (og spredning for å øke), i det minste hvis hele skalaen brukes. bemerket imidlertid at det nåværende spørreskjemaet med vilje var utformet for å fokusere på en svært begrenset del av skalaen: med to riktige svar (karakterer 4 og 5) på standard MRC-skalaen og bare ett (4+) på den modifiserte MRC-skalaen. Således, hvis en større samsvar og lavere spredning faktisk hadde blitt funnet i den modifiserte MRC-gruppen som antatt, kunne dette til en viss grad ha vært resultatet av flere (2 mot 1) riktige svaralternativer på standard MRC-skalaen … Men som beskrevet, gjeldende funnet ting antyder lavere samsvar og større spredning i den modifiserte MRC-gruppen, til tross for effekten av forskjeller i antall kategorier. I avsnittet nedenfor diskuterer vi om de fem tilfellene faktisk ble vellykket konstruert på en slik måte at de fokuserte på svar på 4 eller 5 på standard MRC-skalaen og 4+ på den modifiserte skalaen.
Til slutt er kappa et mål på enighet som vanligvis brukes i studier med et relativt stort antall tilfeller og et relativt lite antall rangere. Den kan brukes i situasjoner med et lavt antall tilfeller vurdert av et større antall rangere, men vil vanligvis resultere i relativt lave kappa-verdier. Uavhengig av dette vil forventningen fortsatt være å se en nedgang i kappa når man øker antall kategorier, dvs. å gå fra standard MRC til modifisert MRC (se f.eks. Altmann «Praktisk statistikk for medisinsk forskning»).
Oppsummert er avtalen dårlig for begge skalaer. Det faktum at vi observerte en økning i kappa, når vi brukte den modifiserte i stedet for standard MRC-skalaen, kunne i prinsippet tas som en indikasjon på litt økt samsvar med den modifiserte MRC-skalaen. Dette kan imidlertid ikke testes nøye, siden standardfeil for den observerte endringen i kappa-verdier ikke er tilgjengelige i den gitte konteksten. Derimot indikerer en økning i ada for den modifiserte MRC-skalaen en større kvalitativ variasjon i rangeringer sammenlignet med standarden MRC og dermed mindre konsensus blant disse forvalterne. Å observere at prosentandelen er synkende i de fleste tilfeller så vel som i alle tilfeller tilsammen, gir ikke ytterligere indikasjoner på forbedret avtale og inneslutninger forblir således ambivalente. Totalt sett antyder ikke dataene en klar forbedring i samsvar med den modifiserte MRC-skalaen.
Saksbeskrivelser
Med saker som er spesielt utviklet for å beskrive muskelsvakhet tvetydig i det grå området mellom 4 og 5 på standard MRC-skalaen, var det å forvente at rangere i standard MRC-gruppen ville være usikre på hvilke av de to alternativene å velge.Omvendt kunne rangere i den modifiserte MRC-gruppen løse en slik usikkerhet ved å velge den «midtre» verdien på «4+». Dette forventes igjen å resultere i større samsvar og mindre variasjon i rangeringer i den modifiserte MRC-gruppen sammenlignet med standard MRC-gruppen. Som konkludert ble dette ikke funnet å være tilfelle.
En tvetydig beskrevet svakhet et sted mellom 4 og 5 kan ikke forventes å resultere i en jevn fordeling av 4 og 5. karakterer i standard MRC-gruppen, og det er rimelig å forvente at klinikere legger større vekt på de unormale funnene i saksbeskrivelsen, enn på de normale funnene. Faktisk var grad 4 omtrent 3 tre ganger mer vanlig enn 5 i standard MRC-gruppen.
Bortsett fra tilfelle C, kan svar på 3 eller mindre i standard MRC-gruppen generelt tilskrives til deltakere som ikke er kjent med MRC-skalaen og / eller deltakere som har snudd skalaen opp ned og scoret de fleste tilfeller som 0, 1 eller 2. Den høyere frekvensen av svar på 3 og mindre i standard MRC-gruppen, forklares av formulering av spørsmål nr. 1. Deltakere som ikke er kjent med MRC-skalaen, vil naturligvis svare ‘Nei’ på spørsmål nr. 1 og plassere dem i standard MRC-gruppen. Raters som ikke er kjent med MRC-skalaen, vil således overveiende bli funnet i standard MRC-gruppen. For å motvirke dette har vi presentert resultater basert på alle tilgjengelige data (ubegrenset) samt data begrenset til passende svar i øvre ende av skalaen.
Svarfordelingen i tilfelle A var hovedsakelig likt mellom gruppene, med 4+ som bare erstatter 4 i den modifiserte MRC-gruppen. I tilfelle B valgte imidlertid et proporsjonalt større antall rangere i den modifiserte MRC-gruppen 4, til tross for at alternativet 4+ var tilgjengelig for dem. Som beskrevet i avsnittet ovenfor valgte noen rangere ‘3’ i tilfelle C – ikke på grunn av ukjennlighet med skalaen, men fordi de følte svakhet mot tyngdekraften og gradvis økende svakhet berettiget en karakter ‘3’. I alle fall valgte det store flertallet av rangere i standard MRC-gruppen 4 i tilfelle C, mens den modifiserte MRC-gruppen var spredt mer jevnt over 4, 4+ og 5, med bare 3 rangere som valgte 3. Tilfelle D skilte seg fra de andre tilfellene ved at svaret ble gitt i saksbeskrivelsen: ‘Du finner en svakhetsgrad 4’, og videre ble svakhetens karakter gitt som ‘hovedsakelig smerterelatert’. Interessant nok, klassifiserte 44% av standard MRC-gruppen og 31% av den modifiserte MRC-gruppen saken som 5. Med andre ord valgte et betydelig antall rangere å oversette en svakhet av grad ‘4’ til grad ‘5’ da de ble informert om at svakhetens natur var smerterelatert (i motsetning til nevromuskulær). Standard MRC-gruppen ble dermed nesten jevnt fordelt mellom karakterene 5 og 4. Den modifiserte MRC-gruppen valgte derimot forventet svar på 4+ i bare 9% av svarene (det laveste i noen av tilfellene) og svarte 4 i 60% av svarene. Det kan hevdes at en høy grad av grad ‘4’-svar er ikke overraskende, ettersom saksbeskrivelsen spesifikt antydet at en grad 4 ble observert. Begge gruppene hadde imidlertid liten forbehold om å velge 5 til tross for saksbeskrivelsen, og videre ville alternativet 4+ tilgjengelig for den modifiserte MRC-gruppen også være i tråd med saksbeskrivelsen og kunne tjene som en måte å kvalifisere en karakter på. 4 svakhet som smerterelatert – likevel var det det minst vanlige svaret i den modifiserte MRC-gruppen (bar de 2 svarene på 0). Tilgjengeligheten av et 4+ alternativ fristet tilsynelatende ikke den modifiserte MRC-gruppen til å velge den karakteren som et middel til å kvalifisere svakheten som smerterelatert. Selv om tilfelle E hadde den minst overbevisende beskrivelsen av svakhet, valgte 15% av den modifiserte MRC-gruppen fremdeles 4 – igjen var tilgjengeligheten av et 4+ alternativ ikke svingende, eller forbedret avtalen.
Samlet sett vil vi hevde at de fem tilfellene var ambivalent formulert på en slik måte at de favoriserte et midt svar i det grå området mellom 4 og 5. Hvis man aksepterer denne forutsetningen, burde resultatene uten tvil ha vært større samsvar i den modifiserte MRC-gruppen, sammenlignet med standard MRC-gruppen. I stedet la alternativet 4+ tilsynelatende bare til et ekstra svaralternativ å være ambivalent til, noe som resulterte i større, snarere enn mindre ulikhet i den modifiserte MRC-gruppen.
Den nåværende studien undersøkte bare effekten av å legge til 4+ til MRC-skalaen, da den enden av skalaen ser ut til å være den vanskeligste å rangere. Basert på dagens data kan vi ikke si om de mer omfattende modifiserte skalaene foreslått av Medical Research Council, Barr et al. Paternostro-Sluka et al. eller Bohannon vil resultere i større enighet, men det virker usannsynlig ettersom et enda større antall karakterer uten klare definisjoner, mest sannsynlig bare vil resultere i enda større spredning.Det er selvfølgelig fullt mulig at avtalen vil bli bedre enn å forverres med tillegg av mellomkarakterer som «4+», hvis slike karakterer var klart definert med objektive grenser – det er imidlertid ikke tilfelle.
De nåværende funnene er ikke basert på faktiske, fysiske undersøkelser av muskelsvakhet og var ikke ment å undersøke gyldigheten av manuell muskeltesting som sådan. I stedet betyr den skriftlige beskrivelsen av kliniske funn som ble presentert for deltakerne at variabilitet på grunn av forskjellige undersøkelsesteknikker og skjevheter relatert til pasientoverensstemmelse osv. Ble eliminert. Så vidt vi vet er det ikke presentert noen sammenlignbare spørreskjemaundersøkelser tidligere. Alle rangere ble presentert med de samme kliniske funnene (om enn på morsmålet). Variasjon i de foreliggende data vil således overveiende gjenspeile varians relatert til forskjeller mellom skalaene, variasjon mellom rangere og muligens språkrelaterte forskjeller i tolkning av de skriftlige saksbeskrivelsene. Basert på gjeldende data kan vi ikke dele disse effektene, men mens vi mistenker at mindre språkrelaterte forskjeller i tolkningen av spørsmålene har liten effekt, er det ganske mulig at systematiske forskjeller mellom andre enn de som er relatert til MRC-skalaen, er skjevt mellom gruppene – f.eks at rangere som ikke er kjent med MRC-skalaen, hadde en tendens til å svare «Nei» på spørsmål nr. 1.
Studiebegrensninger
Spørreskjemaet kunne potensielt ha blitt distribuert til et veldig stort antall klinikere fra forskjellige yrker i Nord-Europa. Dataene reflekterer som sagt bare kiropraktorer, og det er mulig at et bredere utvalg av klinikere kunne ha gitt andre resultater. Vi har ingen spesiell grunn til å tro det, ettersom MRC-skalaen ikke er spesifikk for ett yrke og er en del av mange vanlige lærebøker og kliniske retningslinjer.
Også for å begrense spørreskjemaets lengde til et minimum (for å øke sannsynligheten for at deltakere fullfører det) spurte vi ikke om slike baselineegenskaper som alder, kjønn, år i praksis, hovedkliniske interesser, opplæringshøgskole osv. Det er mulig at slike data kunne ha kastet opp interessante assosiasjoner / beredskaper og absolutt kunne det ha beskrevet studiepopulasjonen mer detaljert. Som det er, kan studiepopulasjonen bare virkelig beskrives som northeuropeiske kiropraktorer.