Het gebruik van 4+ om bijna normale spierkracht te beoordelen, verbetert de overeenkomst niet
Deze studie was gericht op het onderzoeken of het uitbreiden van de standaard MRC-schaal naar een gemodificeerde MRC-schaal de overeenkomst verbetert en de variatie vermindert van de beoordelingen.
Over het algemeen laten de gegevens geen grotere procentuele overeenstemming zien in de gemodificeerde MRC-groep in vergelijking met de standaard MRC-groep en visuele inspectie van Fig. 1 en 2 suggereren dat er in de gemodificeerde MRC-groep in ieder geval meer variatie is tussen cijfers en tussen gevallen.
De gemiddelde deviatie-analoog bleek ook groter te zijn in negen van de tien vergelijkingen (alle vijf gevallen, beperkt en niet beperkt) in de gemodificeerde MRC-groep in vergelijking met de standaard MRC-groep, evenals voor alle gevallen gecombineerd, wat aangeeft dat beoordelingen meer gelijkmatig verdeeld en minder gefocust waren in de gemodificeerde MRC-groep.
Kappa-waarden voor zowel standaard als gemodificeerde MRC-schalen waren erg laag (0,05 resp. 0,14). Hoewel voor beide schalen de hypothese dat geen overeenkomst de zuivere kansovereenkomst overschrijdt (kappa = 0) werd verworpen met p < 0.0001, leek er een vrij grote mate van variabiliteit in de gegeven beoordelingen en de sterkte van overeenstemming is slecht voor beide beoordelaarsgroepen.
Voorzichtigheid is geboden bij het trekken van conclusies uit de waargenomen procentuele overeenkomst, gemiddelde afwijking analoog en kappa vanwege het feit dat het aantal categorieën toeneemt door één bij het overschakelen van de standaard MRC naar de gemodificeerde MRC-schaal. Bij een verhoging van bijvoorbeeld 2 naar 3 categorieën op een bepaalde schaal, daalt het minimaal mogelijke percentage overeenstemming dat kan worden waargenomen van 50% naar 33,3%. De ada-index van 0 tot 1 lost dit probleem op doordat de maximum- en minimumwaarden niet afhankelijk zijn van het aantal categorieën. Tussenliggende ada-indices nemen echter doorgaans af wanneer het aantal categorieën waarin gevallen worden beoordeeld, worden verhoogd, waarbij niet noodzakelijkerwijs de volgorde van de gevallen behouden blijft wanneer ze zijn gerangschikt volgens hun ada-indices (raadpleeg Wilcox Indices van kwalitatieve variatie … voor een voorbeeld) voorbeeld).
Met andere woorden, als er meer categorieën beschikbaar zijn om uit te kiezen, zal de overeenkomst waarschijnlijk afnemen (en de spreiding zal toenemen), tenminste als de hele schaal van de schaal wordt gebruikt. merkte echter op dat de huidige vragenlijst met opzet was ontworpen om zich te concentreren op een zeer beperkt deel van de schaal: met 2 juiste antwoorden (graad 4 en 5) op de standaard MRC-schaal en slechts één (4+) op de gemodificeerde MRC-schaal. Dus als er inderdaad een grotere overeenstemming en lagere spreiding was gevonden in de gemodificeerde MRC-groep zoals verondersteld, zou dit tot op zekere hoogte het resultaat kunnen zijn geweest van meer (2 versus 1) juiste antwoordopties op de standaard MRC-schaal Maar zoals beschreven, de huidige vondst ings suggereren een lagere overeenstemming en grotere spreiding in de gemodificeerde MRC-groep, ondanks de effecten van verschillen in het aantal categorieën. In het onderstaande gedeelte bespreken we of de vijf cases inderdaad zo succesvol zijn geconstrueerd dat de focus ligt op antwoorden van 4 of 5 op de standaard MRC-schaal en 4+ op de aangepaste schaal.
Ten slotte is kappa een maatstaf voor overeenstemming die gewoonlijk wordt gebruikt in onderzoeken met een relatief groot aantal gevallen en een relatief klein aantal beoordelaars. Het kan worden toegepast op situaties met een laag aantal gevallen beoordeeld door een groter aantal beoordelaars, maar zal doorgaans resulteren in relatief lage kappa-waarden. Ongeacht dit, zou de verwachting nog steeds een afname van kappa zijn wanneer het aantal categorieën wordt verhoogd, dwz van standaard MRC naar gemodificeerde MRC (zie bijv. Altmann “Praktische statistieken voor medisch onderzoek”).
Samenvattend is de overeenkomst slecht voor beide schalen: het feit dat we een toename in kappa waarnamen bij gebruik van de gemodificeerde in plaats van de standaard MRC-schaal, zou in principe kunnen worden opgevat als een indicatie van een iets grotere overeenstemming van de gemodificeerde MRC-schaal. Dit kan echter niet rigoureus worden getest, aangezien standaardfouten voor de waargenomen verandering in kappa-waarden niet beschikbaar zijn in de gegeven context. Een toename in ada voor de gemodificeerde MRC-schaal duidt daarentegen op een grotere kwalitatieve variatie in beoordelingen in vergelijking met de standaard MRC en dus minder consensus onder die beoordelaars. Het observeren van het percentage overeenstemming dat zowel in de meeste gevallen als in alle gevallen samen afneemt, geeft geen verdere indicatie van verbeterde overeenstemming en c Conclusies blijven dus ambivalent. Al met al suggereren de gegevens geen duidelijke verbetering in overeenstemming met de aangepaste MRC-schaal.
Casusbeschrijvingen
Met casussen die specifiek zijn ontworpen om spierzwakte dubbelzinnig te beschrijven in het grijze gebied tussen 4 en 5 op de standaard MRC-schaal, was het te verwachten dat beoordelaars in de standaard MRC-groep onzeker zouden zijn over welke van die twee opties ze moesten kiezen.Omgekeerd zouden beoordelaars in de gemodificeerde MRC-groep dergelijke onzekerheid kunnen oplossen door de ‘middelste’ waarde van ‘4+’ te kiezen. Verwacht werd dat dit op zijn beurt zou resulteren in meer overeenstemming en minder variabiliteit in beoordelingen in de gemodificeerde MRC-groep in vergelijking met de standaard MRC-groep. Zoals geconcludeerd, bleek dit niet het geval te zijn.
Van een dubbelzinnig beschreven zwakte ergens tussen 4 en 5 mag niet worden verwacht dat dit resulteert in een gelijke verdeling van 4 en 5 cijfers in de standaard MRC-groep en het is redelijk te verwachten dat clinici meer nadruk leggen op de abnormale bevindingen in de casusbeschrijving dan op de normale bevindingen. Graad 4 kwam inderdaad drie keer vaker voor dan 5 in de standaard MRC-groep.
Afgezien van geval C kunnen reacties van 3 of minder in de standaard MRC-groep over het algemeen worden toegeschreven aan deelnemers die niet bekend zijn met de MRC-schaal en / of deelnemers die de schaal ondersteboven hebben gedraaid en de meeste gevallen als 0, 1 of 2 hebben gescoord. De hogere frequentie van antwoorden van 3 en minder in de standaard MRC-groep, wordt verklaard door de formulering van vraag # 1. Deelnemers die niet bekend zijn met de MRC-schaal zouden natuurlijk Nee antwoorden op vraag 1, waardoor ze in de standaard MRC-groep worden geplaatst. Beoordelaars die niet bekend zijn met de MRC-schaal zouden dus voornamelijk in de standaard MRC-groep worden aangetroffen. Om dit tegen te gaan, hebben we resultaten gepresenteerd op basis van alle beschikbare gegevens (onbeperkt) en gegevens die zijn beperkt tot passende antwoorden aan de bovenkant van de schaal.
De verdeling van de antwoorden in geval A was in wezen vergelijkbaar tussen groepen, waarbij 4+ gewoon 4 vervangt in de gemodificeerde MRC-groep. In geval B koos een proportioneel groter aantal beoordelaars in de gemodificeerde MRC-groep echter ‘4’, ondanks dat ze de optie ‘4+’ tot hun beschikking hadden. Zoals beschreven in het gedeelte hierboven, kozen sommige beoordelaars voor ‘3’ in geval C – niet omdat ze niet vertrouwd waren met de schaal, maar omdat ze zwakte voelden tegen de zwaartekracht in en geleidelijk toenemende zwakte een graad ‘3’ rechtvaardigde. In elk geval koos de overgrote meerderheid van de beoordelaars in de standaard MRC-groep 4 in geval C, terwijl de gemodificeerde MRC-groep gelijkmatiger was verdeeld over 4, 4+ en 5, waarbij slechts 3 beoordelaars kozen 3. Geval D onderscheidde zich van de andere gevallen doordat het antwoord werd gegeven in de casusbeschrijving: ‘Je vindt een zwakte graad 4’, en bovendien werd het karakter van de zwakte gegeven als ‘voornamelijk pijngerelateerd’. Interessant is dat 44% van de standaard MRC-groep en 31% van de gemodificeerde MRC-groep de casus nog steeds als ‘5’ beoordeelden. Met andere woorden, een aanzienlijk aantal beoordelaars koos ervoor om een zwakte van graad ‘4’ te vertalen naar graad ‘5’ toen ze werd meegedeeld dat de aard van de zwakte pijngerelateerd was (in tegenstelling tot neuromusculair). De standaard MRC-groep was dus bijna gelijkmatig verdeeld over de klassen ‘5’ en ‘4’. De gemodificeerde MRC-groep daarentegen koos het verwachte antwoord van ‘4+’ in slechts 9% van de antwoorden (het laagste in alle gevallen) en antwoordde ‘4’ in 60% van de antwoorden. Men zou kunnen stellen dat een hoog percentage van de ‘4’-antwoorden niet verrassend is, aangezien de casusbeschrijving specifiek suggereerde dat een cijfer 4 werd waargenomen. Beide groepen hadden echter weinig voorbehoud bij het kiezen van 5 ondanks de casusbeschrijving en bovendien zou de 4+ optie die beschikbaar is voor de gewijzigde MRC-groep ook in overeenstemming zijn met de casusbeschrijving en zou kunnen dienen als een manier om een cijfer te kwalificeren 4 zwakte als pijngerelateerd – maar het was het minst voorkomende antwoord in de gemodificeerde MRC-groep (behalve de 2 antwoorden van 0). De beschikbaarheid van een ‘4+’ -optie heeft de gemodificeerde MRC-groep blijkbaar niet verleid om dat cijfer te kiezen als middel om de zwakte als pijngerelateerd te kwalificeren. Hoewel geval E de minst overtuigende beschrijving van de zwakte had, koos 15% van de gemodificeerde MRC-groep nog steeds voor 4 – opnieuw had de beschikbaarheid van een 4+ – optie geen invloed op hen, noch verbeterde de overeenkomst.
Al met al zouden we dus stellen dat de vijf gevallen ambivalent waren geformuleerd op een manier die de voorkeur gaf aan een midden-respons in het grijze gebied tussen 4 en 5 . Als we dit uitgangspunt accepteren, hadden de resultaten aantoonbaar meer overeenstemming moeten zijn in de gemodificeerde MRC-groep, vergeleken met de standaard MRC-groep. In plaats daarvan voegde de 4+ – optie blijkbaar alleen een extra antwoordoptie toe om ambivalent over te zijn, wat resulteerde in grotere, in plaats van minder ongelijkheid in de gemodificeerde MRC-groep.
In het huidige onderzoek is alleen gekeken naar het effect van het toevoegen 4+ naar de MRC-schaal, omdat dat uiteinde van de schaal het moeilijkst te beoordelen lijkt. Op basis van de huidige gegevens kunnen we niet zeggen of de meer uitgebreid aangepaste schalen voorgesteld door de Medical Research Council, Barr et al. , Paternostro-Sluka et al. of Bohannon zou resulteren in meer overeenstemming, maar het lijkt onwaarschijnlijk omdat een nog groter aantal graden zonder duidelijke definities hoogstwaarschijnlijk alleen zal resulteren in een nog grotere verspreiding.Het is natuurlijk heel goed mogelijk dat die overeenkomst eerder zou verbeteren dan verslechteren met de toevoeging van tussenliggende kwaliteiten zoals 4+, als dergelijke kwaliteiten duidelijk waren gedefinieerd met objectieve limieten – dat is echter niet het geval.
De huidige bevindingen zijn niet gebaseerd op feitelijk lichamelijk onderzoek van spierzwakte en waren niet bedoeld om de validiteit van manuele spiertesten als zodanig te onderzoeken. In plaats daarvan betekent de schriftelijke beschrijving van klinische bevindingen die aan de deelnemers werd gepresenteerd, dat variabiliteit als gevolg van verschillende onderzoekstechnieken en vooringenomenheid gerelateerd aan de therapietrouw van de patiënt, enz. Werd geëlimineerd. Voor zover wij weten, zijn er nog geen vergelijkbare vragenlijstonderzoeken gepresenteerd. Alle beoordelaars kregen dezelfde klinische bevindingen gepresenteerd (zij het in hun moedertaal). Variabiliteit in de huidige gegevens zal dus voornamelijk variantie weerspiegelen die verband houdt met verschillen tussen de schalen, variatie tussen beoordelaars en mogelijk taalgerelateerde verschillen in interpretatie van de schriftelijke casusbeschrijvingen. Op basis van de huidige gegevens kunnen we deze effecten niet ontkennen, maar hoewel we vermoeden dat kleine taalgerelateerde verschillen in interpretatie van de vragen weinig effect hebben, is het heel goed mogelijk dat systematische verschillen tussen beoordelaars anders dan die met betrekking tot de MRC-schaal, is scheef tussen groepen – bijv dat beoordelaars die niet bekend waren met de MRC-schaal de neiging hadden om Nee te antwoorden op vraag 1.
Studiebeperkingen
De vragenlijst zou mogelijk zijn verspreid onder een zeer groot aantal clinici van verschillende beroepen in Noord-Europa. De gegevens geven als het ware alleen chiropractoren weer en het is mogelijk dat een bredere steekproef van clinici andere resultaten had kunnen opleveren. We hebben echter geen specifieke reden om dit aan te nemen, aangezien de MRC-schaal niet specifiek is voor een bepaald beroep en deel uitmaakt van veel gangbare pre-graduate studieboeken en klinische richtlijnen.
Ook om de lengte van de vragenlijst te beperken tot een absoluut minimum (om de kans te vergroten dat deelnemers het afronden), hebben we niet gevraagd naar basiskenmerken zoals leeftijd, geslacht, jaren in de praktijk, belangrijkste klinische interesses, universiteit / hogeschool, enz. Het is mogelijk dat dergelijke gegevens had interessante associaties / contingenties kunnen oproepen en had de onderzoekspopulatie zeker in meer detail kunnen beschrijven. Zoals het nu is, kan de onderzoekspopulatie eigenlijk alleen worden omschreven als Northeuropese chiropractoren.