4+を使用してほぼ正常な筋力を評価しても一致は改善されない

この研究は、標準のMRCスケールを修正されたMRCスケールに拡張することで一致が改善され、変動が減少するかどうかを調べることを目的としています。

全体として、データは、標準のMRCグループおよび図1および2の目視検査と比較して、変更されたMRCグループでより大きな一致率を示していません。 1と2は、修正されたMRCグループのグレード間およびケース間で大きなばらつきがあることを示唆しています。

平均偏差アナログも、10回の比較のうち9回で大きいことがわかりました(5つのケースすべて、限定標準のMRCグループと比較した変更されたMRCグループ、およびすべてのケースを組み合わせた場合、変更されたMRCグループでは評価がより均等に分散され、焦点が絞られていないことを示しています。

カッパ値標準および修正MRCスケールの両方が非常に低かった(0.05または0.14)。両方のスケールで、純粋な偶然の合意(kappa = 0)を超える合意がないという仮説はp < 0.0001で棄却されましたが、与えられたものにはかなり大きな変動があるように見えました両方の評価者グループの評価と一致の強さは不十分です。

カテゴリの数が増加しているため、観察された一致率、平均偏差アナログ、およびカッパから結論を引き出す場合は注意が必要です。標準のMRCから変更されたMRCスケールに切り替えるときに1つずつ。たとえば、特定のスケールで2から3のカテゴリに増加すると、観察できる最小の一致率は50%から33.3%に低下します。 0から1の範囲のadaインデックスは、最大値と最小値がカテゴリの数に依存しないという点で、この問題を克服します。ただし、中間adaインデックスは、通常、ケースが評価されるカテゴリの数を増やすと減少し、adaインデックスに従って順序付けされた場合のケースの順序を必ずしも維持するわけではありません(説明については、Wilcoxの「定性的変動のインデックス…」を参照してください)。例)。

言い換えると、選択できるカテゴリが増えると、少なくともスケールのスパン全体を使用した場合、合意は減少する(そして分散が増加する)可能性があります。ただし、現在の質問票は、スケールの非常に限られた部分に焦点を当てるように意図的に設計されていることに注意してください。標準のMRCスケールで2つの正解(グレード「4」と「5」)があり、1つ(「4+」)のみです。修正されたMRCスケールしたがって、仮定されたように修正されたMRCグループでより大きな一致とより低い分散が実際に見つかった場合、これはある程度、標準のMRCスケールでのより多くの(2対1)正解オプションの結果である可能性があります。 。しかし、説明したように、現在の発見カテゴリ数の違いの影響にもかかわらず、修正されたMRCグループでは一致度が低く分散が大きいことが示唆されています。以下のセクションでは、標準のMRCスケールで「4」または「5」、修正されたスケールで「4+」の回答に焦点を当てるような方法で、5つのケースが実際に正常に構築されたかどうかについて説明します。

最後に、カッパは、比較的多数の症例と比較的少数の評価者を対象とした研究で通常使用される一致の尺度です。これは、多数の評価者によって評価されるケースの数が少ない状況に適用できますが、通常、カッパ値は比較的低くなります。それとは関係なく、カテゴリの数を増やすと、つまり標準MRCから修正MRCに移行すると、カッパが減少することが予想されます(たとえば、Altmann「医学研究の実用統計」を参照)。

要約すると、両方のスケールの一致は不十分です。標準のMRCスケールの代わりに修正を使用した場合にカッパの増加が観察されたという事実は、原則として、修正MRCスケールの一致がわずかに増加したことを示していると見なすことができます。ただし、カッパ値の観測された変化の標準エラーは特定のコンテキストでは利用できないため、これを厳密にテストすることはできません。対照的に、変更されたMRCスケールのadaの増加は、標準と比較した場合、評価の質的な変動が大きいことを示します。 MRC、したがってそれらの評価者間のコンセンサスが低い。ほとんどの場合、およびすべてのケースを合わせた場合に一致率が低下していることを観察しても、一致が改善されたことをさらに示すものではありません。したがって、包含はあいまいなままです。全体として、データは、修正されたMRCスケールを使用した一致の明確な改善を示唆していません。

ケースの説明

4の間の灰色の領域で筋力低下を曖昧に説明するように特別に設計されたケース標準MRCスケールの「」と「5」では、標準MRCグループの評価者は、これら2つのオプションのどちらを選択するかについて不確実であると予想されていました。逆に、修正されたMRCグループの評価者は、「4+」の「中間」値を選択することにより、このような不確実性を解決できます。これにより、標準のMRCグループと比較して、変更されたMRCグループの評価の一致度が高くなり変動が少なくなることが期待されていました。結論として、これは当てはまらないことがわかりました。

「4」と「5」の間のどこかで曖昧に記述された弱点が、「4」と「5」の均等な分布をもたらすと期待されるべきではありません。標準的なMRCグループのグレードであり、臨床医が正常な所見よりも症例の説明の異常な所見に重点を置くことを期待するのは合理的です。実際、グレード「4」は、標準MRCグループの「5」よりも約3倍一般的でした。

ケースCを除いて、標準MRCグループの「3」以下の応答は一般に帰することができます。 MRCスケールに慣れていない参加者、および/またはスケールを逆さまにして、ほとんどの場合を0、1、または2としてスコア付けした参加者に対して、標準のMRCグループで「3」以下の回答の頻度が高いことは、質問#1の文言。 MRCスケールに慣れていない参加者は、当然、質問1に「いいえ」と答えるので、標準のMRCグループに入れられます。したがって、MRCスケールに精通していない評価者は、主に標準のMRCグループに含まれます。これに対抗するために、利用可能なすべてのデータ(「無制限」)に基づく結果と、スケールの上限で適切な回答に限定されたデータを提示しました。

ケースAの回答の分布はグループ間で本質的に類似しており、変更されたMRCグループの「4」を「4+」に置き換えるだけです。ただし、ケースBの場合、変更されたMRCグループの評価者の数が比例して多く、「4+」オプションを使用できるにもかかわらず、「4」を選択しました。上記のセクションで説明したように、一部の評価者はケースCで「3」を選択しました。これは、スケールに慣れていないためではなく、重力に対する弱さを感じ、徐々に弱さが増すため、グレード「3」が必要でした。いずれにせよ、標準MRCグループの評価者の大多数はケースCで「4」を選択しましたが、修正されたMRCグループは「4」、「4 +」、「5」に均一に分散し、3人の評価者のみが選択しました。 「3」。ケースDは、ケースの説明で「弱点グレード4が見つかりました」と回答され、さらに弱点の特徴が「主に痛みに関連する」とされたという点で、他のケースとは異なりました。興味深いことに、標準のMRCグループの44%と変更されたMRCグループの31%は、依然としてケースを「5」と評価しました。言い換えれば、かなりの数の評価者が、弱点の性質が(神経筋ではなく)痛みに関連していると知らされたときに、グレード「4」の弱点をグレード「5」に変換することを選択しました。したがって、標準のMRCグループは、グレード「5」と「4」にほぼ均等に分割されました。一方、修正されたMRCグループは、回答の9%(いずれの場合も最低)で「4+」の予想回答を選択し、回答の60%で「4」と回答しました。ケースの説明がグレード4が観察されたことを具体的に示唆しているため、グレード「4」の回答の割合が高いことは驚くべきことではないと主張することができます。ただし、両方のグループは、ケースの説明にもかかわらず「5」を選択することにほとんど予約がなく、さらに、変更されたMRCグループで使用可能な「4+」オプションもケースの説明と一致し、グレードを認定する方法として役立つ可能性があります痛みに関連する「4」の弱点-それでも、修正されたMRCグループでは最も一般的ではなかった回答でした(「0」の2つの回答を除く)。 「4+」オプションが利用可能になったからといって、修正されたMRCグループが、弱点を痛みに関連していると見なす手段としてそのグレードを選択するように誘惑されなかったようです。ケースEの弱点の説明は最も説得力がありませんでしたが、修正されたMRCグループの15%は依然として「4」を選択しました。「4+」オプションを利用しても、彼らは動揺せず、合意も改善されませんでした。

したがって、全体として、5つのケースは、「4」と「5」の間の灰色の領域で「中間」の応答を支持するような方法で曖昧に表現されたと主張します。この前提を受け入れると、結果は、標準のMRCグループと比較して、修正されたMRCグループでより大きな一致を示したはずです。代わりに、「4+」オプションは明らかに、曖昧な追加の回答オプションを追加しただけであり、変更されたMRCグループの格差は小さくなるのではなく大きくなりました。

現在の調査では、追加の効果のみを調べました。 MRCスケールの「4+」。スケールの端が最も評価が難しいように見えるためです。現在のデータに基づいて、医学研究評議会、バーらによって提案されたより広範囲に修正されたスケールであるかどうかを言うことはできません。 、Paternostro-Sluka etal。または、ボハノンはより大きな一致をもたらしますが、明確な定義のないさらに多くのグレードが、さらに大きな分散をもたらす可能性が高いため、それはありそうにないようです。もちろん、「4+」などの中間グレードが客観的な制限で明確に定義されている場合、そのようなグレードを追加することで合意が悪化するのではなく改善する可能性は十分にありますが、そうではありません。

現在の調査結果は、筋力低下の実際の身体検査に基づいておらず、手動の筋力検査自体の有効性を調べることを目的としていませんでした。代わりに、参加者に提示された臨床所見の書面による説明は、異なる検査技術による変動性および患者のコンプライアンスなどに関連するバイアスが排除されたことを意味します。私たちの知る限り、これまでに比較可能なアンケート調査は提示されていません。すべての評価者に同じ臨床所見が提示されました(母国語ではありますが)。したがって、現在のデータの変動性は、主に、尺度間の差異、評価者間の変動、および場合によっては書かれた症例の説明の解釈における言語関連の差異に関連する差異を反映します。現在のデータに基づくと、これらの影響を解消することはできませんが、質問の解釈における言語関連のわずかな違いはほとんど影響がないと思われますが、MRCスケールに関連するもの以外の評価者間の体系的な違いはかなりあり得ます。グループ間で偏っている-例: MRCスケールに精通していない評価者は、質問1に「いいえ」と答える傾向がありました。

研究の制限

質問票は、さまざまな地域の非常に多くの臨床医に配布された可能性があります。北ヨーロッパの職業。いわば、データはカイロプラクターのみを反映しており、臨床医のより広範なサンプリングが他の結果をもたらした可能性があります。ただし、MRCスケールは特定の職業に固有のものではなく、多くの一般的な大学院の教科書や臨床ガイドラインの一部であるため、特にそう信じる理由はありません。

また、アンケートの長さを制限する最低限(参加者がそれを完了する可能性を高めるために)、年齢、性別、実際の年数、主な臨床的関心、大学/トレーニングの大学などのベースライン特性については問い合わせませんでした。そのようなデータは可能性があります興味深い関連/偶発事象を引き起こした可能性があり、確かにそれは研究集団をより詳細に説明した可能性があります。現状では、調査対象集団は実際には北欧のカイロプラクターとしてしか説明できません。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です