Luso di 4+ per valutare la forza muscolare quasi normale non migliora laccordo
Questo studio mirava a esaminare se lestensione della scala MRC standard a una scala MRC modificata migliori laccordo e riduca la variazione delle valutazioni.
Nel complesso, i dati non dimostrano una maggiore concordanza percentuale nel gruppo MRC modificato rispetto al gruppo MRC standard e lispezione visiva delle Figg. 1 e 2 suggeriscono che semmai cè una maggiore variazione tra i gradi e tra i casi nel gruppo MRC modificato.
Lanalogo della deviazione media è stato anche trovato maggiore in nove su dieci confronti (tutti e cinque i casi, limitati e non limitato) nel gruppo MRC modificato rispetto al gruppo MRC standard, così come per tutti i casi combinati, indicando che le valutazioni erano distribuite più uniformemente e meno focalizzate nel gruppo MRC modificato.
Valori Kappa per sia le scale MRC standard che quelle modificate erano molto basse (0,05 risp. 0,14). Sebbene, per entrambe le scale, lipotesi di nessun accordo superiore al puro accordo casuale (kappa = 0) fosse rifiutata con p < 0.0001, sembrava esserci una quantità piuttosto ampia di variabilità nel dato le valutazioni e la forza dellaccordo sono scarse per entrambi i gruppi di valutatori.
È necessario prestare attenzione quando si traggono conclusioni dallaccordo percentuale osservato, dallanalogo della deviazione media e dal kappa a causa del fatto che il numero di categorie è aumentato di uno quando si passa dalla scala MRC standard alla scala MRC modificata. Ad esempio, con un aumento da 2 a 3 categorie su una data scala, la minima concordanza percentuale possibile osservabile scende dal 50% al 33,3%. Lindice ada compreso tra 0 e 1 supera questo problema in quanto i suoi valori massimi e minimi non dipendono dal numero di categorie. Gli indici ada intermedi, tuttavia, in genere diminuiscono quando si aumenta il numero di categorie in cui vengono classificati i casi, non necessariamente preservando lordine dei casi quando ordinati in base ai loro indici ada (fare riferimento a Wilcox “Indici di variazione qualitativa …” per un esempio illustrativo esempio).
In altre parole, con più categorie disponibili tra cui scegliere, è probabile che laccordo diminuisca (e la dispersione aumenti), almeno se viene utilizzato lintero arco della scala. Dovrebbe essere ha notato, tuttavia, che lattuale questionario è stato intenzionalmente progettato per concentrarsi su una parte molto limitata della scala: con 2 risposte corrette (voti 4 e 5) sulla scala MRC standard e solo una (4+) su la scala MRC modificata. Pertanto, se nel gruppo MRC modificato fossero state effettivamente trovate una maggiore concordanza e una minore dispersione come ipotizzato, ciò potrebbe essere stato in qualche modo il risultato di più (2 vs 1) opzioni di risposta corrette sulla scala MRC standard Ma come descritto, lattuale trovare suggeriscono un minore accordo e una maggiore dispersione nel gruppo MRC modificato, nonostante gli effetti delle differenze nel numero di categorie. Nella sezione seguente discutiamo se i cinque casi sono stati effettivamente costruiti con successo in modo tale da concentrarsi sulle risposte di “4” o “5” sulla scala MRC standard e “4+” sulla scala modificata.
Infine, kappa è una misura di concordanza usata solitamente negli studi con un numero relativamente grande di casi e un numero relativamente piccolo di valutatori. Può essere applicato a situazioni con un numero basso di casi valutati da un numero maggiore di valutatori, ma in genere si tradurrà in valori kappa relativamente bassi. Indipendentemente da ciò, laspettativa sarebbe comunque di vedere una diminuzione in kappa quando si aumenta il numero di categorie, cioè passando da MRC standard a MRC modificato (vedere ad es. Altmann “Statistiche pratiche per la ricerca medica”).
In sintesi, laccordo è scarso per entrambe le scale.Il fatto che abbiamo osservato un aumento di kappa, utilizzando la scala MRC modificata anziché quella standard, potrebbe in linea di principio essere preso come unindicazione di un accordo leggermente aumentato della scala MRC modificata. Tuttavia questo non può essere testato rigorosamente, poiché gli errori standard per la variazione osservata dei valori kappa non sono disponibili nel contesto dato. Al contrario, un aumento di ada per la scala MRC modificata indica una maggiore variazione qualitativa nei rating, rispetto allo standard MRC e quindi meno consenso tra quei valutatori. Losservazione della percentuale di accordo in diminuzione nella maggior parte dei casi così come per tutti i casi combinati, non fornisce ulteriori indicazioni di un migliore accordo ec Le esclusioni rimangono quindi ambivalenti. Nel complesso, i dati non suggeriscono un chiaro miglioramento della concordanza utilizzando la scala MRC modificata.
Descrizioni dei casi
Con casi specificamente progettati per descrivere la debolezza muscolare in modo ambiguo nella zona grigia tra 4 “e” 5 “sulla scala MRC standard, era prevedibile che i valutatori del gruppo MRC standard sarebbero stati incerti su quale di queste due opzioni scegliere.Al contrario, i valutatori nel gruppo MRC modificato potrebbero risolvere tale incertezza scegliendo il valore “medio” di “4+”. Ci si aspettava che questo a sua volta determinasse un maggiore accordo e una minore variabilità nelle valutazioni nel gruppo MRC modificato rispetto al gruppo MRC standard. Come concluso, non è stato riscontrato che questo fosse il caso.
Una debolezza descritta in modo ambiguo da qualche parte tra “4” e “5” non dovrebbe risultare in una distribuzione uguale di “4” e “5” gradi nel gruppo MRC standard ed è ragionevole aspettarsi che i medici pongano maggiore enfasi sui risultati anormali nella descrizione del caso, piuttosto che sui risultati normali. In effetti, il grado “4” era circa 3 tre volte più comune di “5” nel gruppo MRC standard.
A parte il caso C, si possono generalmente attribuire risposte di “3” o meno nel gruppo MRC standard ai partecipanti che non hanno familiarità con la scala MRC e / o ai partecipanti che hanno capovolto la scala, classificando la maggior parte dei casi come 0, 1 o 2. La frequenza più alta di risposte di 3 e inferiore nel gruppo MRC standard, è spiegata dal formulazione della domanda n. 1. I partecipanti che non hanno familiarità con la scala MRC risponderebbero naturalmente “No” alla domanda n. 1, inserendoli così nel gruppo MRC standard. I valutatori che non hanno familiarità con la scala MRC si troverebbero quindi prevalentemente nel gruppo MRC standard. Per contrastare questo problema, abbiamo presentato risultati basati su tutti i dati disponibili (“illimitati”) e dati limitati alle risposte appropriate allestremità superiore della scala.
La distribuzione delle risposte nel caso A era sostanzialmente simile tra i gruppi, con “4+” che sostituisce semplicemente “4” nel gruppo MRC modificato. Nel caso B, tuttavia, un numero proporzionalmente maggiore di valutatori nel gruppo MRC modificato ha scelto “4”, nonostante avesse a loro disposizione lopzione “4+”. Come descritto nella sezione precedente, alcuni valutatori hanno scelto “3” nel caso C, non per mancanza di familiarità con la scala, ma perché sentivano debolezza contro la gravità e la debolezza gradualmente crescente giustificava un grado “3”. In ogni caso, la stragrande maggioranza dei valutatori nel gruppo MRC standard ha eletto “4” nel caso C, mentre il gruppo MRC modificato è stato distribuito in modo più uniforme su “4”, “4+” e “5”, con solo 3 valutatori che hanno scelto “3”. Il caso D era distinto dagli altri casi in quanto la risposta era data nella descrizione del caso: “Trovate un grado di debolezza 4”, e inoltre il carattere della debolezza è stato dato come “principalmente correlato al dolore”. È interessante notare che il 44% del gruppo MRC standard e il 31% del gruppo MRC modificato hanno ancora classificato il caso come “5”. In altre parole, un numero considerevole di valutatori ha scelto di tradurre una debolezza di grado “4” in grado “5” quando ha informato che la natura della debolezza era correlata al dolore (al contrario del neuromuscolare). Il gruppo MRC standard è stato quindi suddiviso quasi equamente tra i gradi “5” e “4”. Il gruppo MRC modificato, daltra parte, ha scelto la risposta attesa di “4+” solo nel 9% delle risposte (la più bassa in tutti i casi) e ha risposto “4” nel 60% delle risposte. Si potrebbe sostenere che un alto tasso di risposte di grado “4” non sorprende, poiché la descrizione del caso suggerisce specificamente che è stato osservato un grado 4. Tuttavia, entrambi i gruppi avevano poche riserve nella scelta di “5” nonostante la descrizione del caso e, inoltre, lopzione “4+” disponibile per il gruppo MRC modificato sarebbe stata in linea con la descrizione del caso e potrebbe servire come un modo per qualificare un grado Debolezza “4” come correlata al dolore – tuttavia era la risposta meno comune nel gruppo MRC modificato (escluse le 2 risposte di “0”). La disponibilità di unopzione “4+” apparentemente non ha indotto il gruppo MRC modificato a scegliere quel grado come mezzo per qualificare la debolezza come correlata al dolore. Anche se il caso E presentava la descrizione meno convincente di debolezza, il 15% del gruppo MRC modificato ha comunque scelto “4” – ancora una volta la disponibilità di unopzione “4+” non li ha influenzati, né ha migliorato laccordo.
Nel complesso, quindi, si potrebbe sostenere che i cinque casi sono stati formulati in modo ambivalente in modo tale da favorire una risposta “centrale” nellarea grigia tra “4” e “5”. Accettando questa premessa, i risultati avrebbero dovuto probabilmente essere un maggiore accordo nel gruppo MRC modificato, rispetto al gruppo MRC standard. Invece, lopzione “4+” apparentemente ha aggiunto solo unopzione di risposta in più su cui essere ambivalenti, risultando in maggiore, piuttosto che minore disparità nel gruppo MRC modificato.
Lattuale studio ha esaminato solo leffetto dellaggiunta “4+” alla scala MRC, poiché quella fine della scala sembrerebbe essere la più difficile da valutare. Sulla base dei dati attuali non possiamo dire se le scale più ampiamente modificate suggerite dal Medical Research Council, Barr et al. , Paternostro-Sluka et al. o Bohannon porterebbe a un maggiore accordo, ma sembra improbabile poiché un numero ancora maggiore di voti senza definizioni chiare, molto probabilmente si tradurrà solo in una dispersione ancora maggiore.È del tutto possibile, naturalmente, che laccordo migliorerebbe piuttosto che peggiorare con laggiunta di gradi intermedi come “4+”, se tali gradi fossero chiaramente definiti con limiti oggettivi, ma non è così.
I risultati attuali non si basano su esami fisici effettivi della debolezza muscolare e non avevano lo scopo di esaminare la validità del test muscolare manuale in quanto tale. Invece, la descrizione scritta dei risultati clinici che è stata presentata ai partecipanti, significa che è stata eliminata la variabilità dovuta a diverse tecniche di esame e il bias relativo alla compliance del paziente, ecc. A nostra conoscenza, non sono stati presentati in precedenza studi con questionari comparabili. Tutti i valutatori sono stati presentati con gli stessi risultati clinici (anche se nella loro lingua madre). La variabilità nei dati presenti rifletterà quindi prevalentemente la varianza correlata alle differenze tra le scale, la variazione tra valutatori e possibilmente differenze legate alla lingua nellinterpretazione delle descrizioni scritte dei casi. Sulla base dei dati attuali, non possiamo dissociare questi effetti, ma mentre sospettiamo che differenze minori legate alla lingua nellinterpretazione delle domande abbiano scarso effetto, è del tutto possibile che differenze sistematiche tra valutatori diversi da quelli relativi alla scala MRC, è distorto tra i gruppi – ad es che i valutatori che non avevano familiarità con la scala MRC tendevano a rispondere “No” alla domanda n. 1.
Limitazioni dello studio
Il questionario avrebbe potuto essere potenzialmente distribuito a un numero molto elevato di medici di diversi professioni nel nord Europa. Per così dire, i dati riflettono solo chiropratici ed è possibile che un campionamento più ampio di medici avrebbe potuto produrre altri risultati. Non abbiamo alcun motivo particolare per crederlo, tuttavia, poiché la scala MRC non è specifica per nessuna professione e fa parte di molti libri di testo pre-laurea e linee guida cliniche comuni.
Inoltre, per limitare la lunghezza del questionario al minimo indispensabile (per aumentare la probabilità che i partecipanti lo completino) non abbiamo indagato su caratteristiche di base come età, sesso, anni di pratica, principali interessi clinici, università / college di formazione, ecc. È possibile che tali dati avrebbe potuto sollevare interessanti associazioni / imprevisti e certamente avrebbe potuto descrivere la popolazione in studio in maggior dettaglio. Così comè, la popolazione dello studio può essere descritta solo come chiropratici nordeuropei.