Lutilisation de 4+ pour évaluer une force musculaire presque normale naméliore pas la concordance

Cette étude visait à déterminer si lextension de léchelle MRC standard à une échelle MRC modifiée améliore la concordance et réduit la variation des notes.

Dans lensemble, les données ne démontrent pas une plus grande concordance en pourcentage dans le groupe MRC modifié par rapport au groupe MRC standard et linspection visuelle des Fig. 1 et 2 suggèrent quil y a une plus grande variation entre les grades et entre les cas dans le groupe MRC modifié.

Lanalogue décart moyen sest également avéré plus grand dans neuf des dix comparaisons (les cinq cas, limité et non limité) dans le groupe MRC modifié par rapport au groupe MRC standard, ainsi que pour tous les cas combinés, indiquant que les notes étaient plus uniformément réparties et moins concentrées dans le groupe MRC modifié.

Valeurs Kappa pour les échelles MRC standard et modifiées étaient très faibles (0,05 resp. 0,14). Bien que, pour les deux échelles, lhypothèse de labsence daccord dépassant laccord purement aléatoire (kappa = 0) ait été rejetée avec p < 0,0001, il semble y avoir une assez grande variabilité dans le les notes et la force de laccord sont médiocres pour les deux groupes dévaluateurs.

Il faut faire preuve de prudence lorsque lon tire des conclusions du pourcentage de concordance observé, de lécart moyen analogique et kappa en raison du fait que le nombre de catégories est augmenté par un lors du passage de léchelle MRC standard à léchelle MRC modifiée. Par exemple, avec une augmentation de 2 à 3 catégories sur une échelle donnée, le pourcentage de concordance minimum possible qui peut être observé passe de 50% à 33,3%. Lindice ada allant de 0 à 1 surmonte ce problème en ce que ses valeurs maximale et minimale ne dépendent pas du nombre de catégories. Cependant, les indices ada intermédiaires diminuent généralement lors de laugmentation du nombre de catégories dans lesquelles les cas sont notés, sans nécessairement préserver lordre des cas lorsquils sont ordonnés en fonction de leurs indices ada (voir Wilcox «Indices of qualitative variation …» pour un exemple exemple).

En dautres termes, avec plus de catégories disponibles, laccord est susceptible de diminuer (et la dispersion daugmenter), du moins si toute létendue de léchelle est utilisée. Cela devrait être a cependant noté que le questionnaire actuel était intentionnellement conçu pour se concentrer sur une partie très limitée de léchelle: avec 2 bonnes réponses (notes «  4 et «  5 ) sur léchelle MRC standard et une seule («  4+ ) sur léchelle MRC modifiée. Ainsi, si une plus grande concordance et une dispersion plus faible avaient effectivement été trouvées dans le groupe MRC modifié tel que supposé, cela pourrait dans une certaine mesure être le résultat de plus doptions de réponses correctes (2 vs 1) sur léchelle MRC standard . Mais comme décrit, la recherche actuelle Les résultats suggèrent un accord plus faible et une plus grande dispersion dans le groupe MRC modifié, malgré les effets des différences dans le nombre de catégories. Dans la section ci-dessous, nous discutons si les cinq cas ont en fait été construits avec succès de manière à se concentrer sur les réponses de «4» ou «5» sur léchelle MRC standard et «4+» sur léchelle modifiée.

Enfin, kappa est une mesure de la concordance généralement utilisée dans les études avec un nombre relativement grand de cas et un nombre relativement petit dévaluateurs. Il peut être appliqué à des situations avec un faible nombre de cas évalués par un plus grand nombre dévaluateurs, mais se traduira généralement par des valeurs kappa relativement faibles. Indépendamment de cela, on sattend toujours à voir une diminution du kappa lors de laugmentation du nombre de catégories, cest-à-dire en passant du MRC standard au MRC modifié (voir par exemple Altmann «Statistiques pratiques pour la recherche médicale»).

En résumé, la concordance est mauvaise pour les deux échelles. Le fait que nous ayons observé une augmentation du kappa, en utilisant léchelle MRC modifiée au lieu de léchelle standard, pourrait en principe être considéré comme une indication dune concordance légèrement accrue de léchelle MRC modifiée. Cependant, cela ne peut pas être testé rigoureusement, car les erreurs standard pour le changement observé des valeurs kappa ne sont pas disponibles dans le contexte donné. En revanche, une augmentation de ada pour léchelle MRC modifiée indique une plus grande variation qualitative des notes, par rapport à la norme MRC et donc moins de consensus parmi ces évaluateurs. Lobservation du pourcentage de concordance décroissant dans la plupart des cas ainsi que pour tous les cas combinés ne fournit pas une indication supplémentaire dune amélioration de laccord et c les onclusions restent donc ambivalentes. Dans lensemble, les données ne suggèrent pas une nette amélioration de laccord en utilisant léchelle MRC modifiée.

Descriptions de cas

Avec des cas spécifiquement conçus pour décrire la faiblesse musculaire de manière ambiguë dans la zone grise entre 4 »et« 5 »sur léchelle MRC standard, il fallait sattendre à ce que les évaluateurs du groupe MRC standard ne sachent pas laquelle de ces deux options choisir.Inversement, les évaluateurs du groupe MRC modifié pourraient résoudre cette incertitude en choisissant la valeur «moyenne» de «4+». On sattendait à ce que cela se traduise à son tour par une plus grande concordance et une moindre variabilité des notes dans le groupe MRC modifié par rapport au groupe MRC standard. En conclusion, cela ne sest pas avéré être le cas.

Une faiblesse décrite de manière ambiguë entre «4» et «5» ne devrait pas aboutir à une distribution égale de «4» et «5» dans le groupe MRC standard et il est raisonnable de sattendre à ce que les cliniciens mettent davantage laccent sur les résultats anormaux de la description de cas que sur les résultats normaux. En effet, la note «4» était environ 3 trois fois plus courante que «5» dans le groupe MRC standard.

À part le cas C, des réponses de «3» ou moins dans le groupe MRC standard peuvent généralement être attribuées aux participants qui ne connaissent pas léchelle MRC et / ou aux participants ayant inversé léchelle, notant la plupart des cas comme 0, 1 ou 2. La fréquence plus élevée de réponses de «  3 et moins dans le groupe MRC standard sexplique par libellé de la question n ° 1. Les participants qui ne connaissent pas l’échelle MRC répondraient naturellement «Non» à la question 1, les plaçant ainsi dans le groupe MRC standard. Les évaluateurs ne connaissant pas léchelle MRC se trouveraient donc principalement dans le groupe MRC standard. Pour contrer cela, nous avons présenté des résultats basés sur toutes les données disponibles («illimitées») ainsi que des données limitées aux réponses appropriées à lextrémité supérieure de léchelle.

La distribution des réponses dans le cas A était essentiellement similaire entre les groupes, avec «4+» remplaçant simplement «4» dans le groupe MRC modifié. Dans le cas B cependant, un nombre proportionnellement plus grand de noteurs dans le groupe MRC modifié a choisi «4», malgré l’option «4+» à leur disposition. Comme décrit dans la section ci-dessus, certains évaluateurs ont choisi «3» dans le cas C – non pas parce qu’ils ne connaissaient pas l’échelle, mais parce qu’ils ressentaient une faiblesse par rapport à la gravité et qu’une faiblesse progressivement croissante justifiait une note «3». Dans tous les cas, la grande majorité des évaluateurs du groupe MRC standard ont choisi «  4 dans le cas C, alors que le groupe MRC modifié était réparti plus uniformément sur «  4 , «  4+ et «  5 , avec seulement 3 évaluateurs choisissant «3». Le cas D se distinguait des autres cas en ce que la réponse était donnée dans la description du cas: «Vous trouvez une faiblesse de grade 4», et en outre, le caractère de la faiblesse a été donné comme «principalement lié à la douleur». Il est intéressant de noter que 44% du groupe MRC standard et 31% du groupe MRC modifié ont encore noté le cas comme «5». En d’autres termes, un nombre considérable d’évaluateurs ont choisi de traduire une faiblesse de «4» en «5» après avoir été informés que la nature de la faiblesse était liée à la douleur (par opposition à la neuro-musculaire). Le groupe MRC standard était donc réparti presque également entre les grades «5» et «4». Le groupe MRC modifié, quant à lui, a choisi la réponse attendue «4+» dans seulement 9% des réponses (la plus basse dans tous les cas) et a répondu «4» dans 60% des réponses. On pourrait faire valoir qu’un taux élevé de réponses en «4e» n’est pas surprenant, car la description du cas suggérait spécifiquement qu’une note de 4 avait été observée. Cependant, les deux groupes avaient peu de réserves quant au choix de «  5 malgré la description du cas et de plus, loption «  4+ disponible pour le groupe MRC modifié serait également conforme à la description du cas et pourrait servir de moyen de qualifier une note. «4» faiblesse liée à la douleur – pourtant cétait la réponse la moins courante dans le groupe MRC modifié (à lexception des 2 réponses de «0»). La disponibilité d’une option «4+» n’a apparemment pas incité le groupe MRC modifié à choisir ce grade comme moyen de qualifier la faiblesse comme étant liée à la douleur. Même si le cas E présentait la description de faiblesse la moins convaincante, 15% du groupe MRC modifié a quand même choisi «4» – encore une fois, la disponibilité dune option «4+» ne les a pas influencés, ni amélioré laccord.

Dans lensemble, nous dirions donc que les cinq cas ont été formulés de manière ambivalente de manière à favoriser une réponse «moyenne» dans la zone grise entre «4» et «5». En acceptant cette prémisse, les résultats auraient sans doute dû être une plus grande concordance dans le groupe MRC modifié, par rapport au groupe MRC standard. Au lieu de cela, loption 4+ na apparemment ajouté quune option de réponse supplémentaire pour être ambivalente, entraînant une disparité plus grande, plutôt que moins, dans le groupe MRC modifié.

Létude actuelle na examiné que leffet de lajout «4+» à léchelle MRC, car cette extrémité de léchelle semble être la plus difficile à noter. Sur la base des données actuelles, nous ne pouvons pas dire si les échelles plus largement modifiées suggérées par le Medical Research Council, Barr et al. , Paternostro-Sluka et al. ou Bohannon aboutirait à une plus grande concordance, mais il semble improbable car un nombre encore plus grand de grades sans définitions claires nentraînera très probablement quune dispersion encore plus grande.Il est tout à fait possible, bien sûr, que l’accord s’améliore au lieu de se détériorer avec l’ajout de notes intermédiaires telles que «4+», si ces notes étaient clairement définies avec des limites objectives – ce n’est cependant pas le cas.

Les résultats actuels ne sont pas basés sur des examens physiques réels de la faiblesse musculaire et nétaient pas destinés à examiner la validité des tests musculaires manuels en tant que tels. Au lieu de cela, la description écrite des résultats cliniques qui a été présentée aux participants signifie que la variabilité due aux différentes techniques dexamen et aux biais liés à lobservance du patient, etc. a été éliminée. À notre connaissance, aucune étude de questionnaire comparable na été présentée précédemment. Tous les évaluateurs ont reçu les mêmes résultats cliniques (quoique dans leur langue maternelle). La variabilité des données actuelles reflètera donc principalement la variance liée aux différences entre les échelles, la variation entre les évaluateurs et éventuellement les différences liées à la langue dans linterprétation des descriptions de cas écrites. Sur la base des données actuelles, nous ne pouvons pas démêler ces effets, mais si nous soupçonnons des différences mineures dinterprétation des questions liées au langage davoir peu deffet, il est tout à fait possible que des différences systématiques entre les évaluateurs autres que ceux relatifs à léchelle MRC, est biaisé entre les groupes – par exemple que les évaluateurs ne connaissant pas léchelle MRC avaient tendance à répondre «Non» à la question n ° 1.

Limites de létude

Le questionnaire aurait pu être distribué à un très grand nombre de cliniciens de différents métiers en Europe du Nord. Pour ainsi dire, les données ne reflètent que les chiropraticiens et il est possible quun échantillon plus large de cliniciens ait donné dautres résultats. Cependant, nous navons aucune raison particulière de le croire, car léchelle MRC nest spécifique à aucune profession et fait partie de nombreux manuels et directives cliniques courants pour les pré-diplômés.

Aussi, pour restreindre la longueur du questionnaire au strict minimum (pour augmenter la probabilité que les participants lachèvent), nous navons pas posé de questions sur les caractéristiques de base telles que lâge, le sexe, les années de pratique, les principaux intérêts cliniques, luniversité / le collège de formation, etc. Il est possible que de telles données aurait pu créer des associations / contingences intéressantes et aurait certainement pu décrire la population étudiée plus en détail. Dans létat actuel des choses, la population étudiée ne peut vraiment être décrite que comme des chiropracteurs nord-européens.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *