Hämmentävät tilastotermit # 1: Itsenäisten muuttujien monet nimet
Tilastolliset mallit, kuten yleiset lineaariset mallit (lineaarinen regressio, ANOVA, MANOVA), lineaariset sekamallit ja yleistetyt lineaariset mallit (logistinen, Poisson, regressio jne.) Kaikilla on sama yleinen muoto.
Yhtälön vasemmalla puolella on yksi tai useampi vastemuuttuja, Y. Oikealla puolella on yksi tai useampi ennustemuuttuja, X ja niiden kertoimet B. Oikeanpuoleisilla muuttujilla voi olla monia muotoja, ja niitä kutsutaan monilla nimillä.
Näiden nimien merkityksissä on hienovaraisia eroja. Valitettavasti on kuitenkin kaksi käytäntöä, jotka tekevät niistä sekavampia kuin heidän pitäisi olla.
Ensinnäkin niitä käytetään usein keskenään. Joten joku voi käyttää ”ennustavaa muuttujaa” ja ”itsenäistä muuttujaa” keskenään ja toinen ei. Joten kuuntelija saattaa lukea hienovaraisia eroja, joita puhuja ei välttämättä tarkoita.
Toiseksi samoja termejä käytetään eri tavoin eri aloilla tai tutkimustilanteissa. Joten jos olet epidemiologi, joka tutkii enimmäkseen havaittuja muuttujia, olet todennäköisesti saanut koulutusta hieman erilaisilla merkityksillä joihinkin näistä termeistä kuin jos olet psykologi, joka tekee kokeellista tutkimusta.
Vielä pahempaa, tilastolliset ohjelmistopaketit käyttävät erilaisia nimiä samankaltaisille käsitteille, jopa omien menettelytapojensa joukossa. Tämä pyrkimys tarkkuuteen saa usein hämmennystä. (Se on tarpeeksi vaikeaa vaihtamatta sanoja!).
Tässä on joitain yleisiä termejä, jotka kaikki viittaavat mallin muuttujaan, jonka ehdotetaan vaikuttavan tai ennustavan toista muuttujaa.
I Annan sinulle erilaisia määritelmiä ja vaikutuksia, mutta on hyvin todennäköistä, että minulta puuttuu joitain. Jos näet termin, joka tarkoittaa jotain erilaista kuin ymmärrät, lisää se kommentteihin. Ja kerro meille, millä alalla työskentelet ensisijaisesti.
Ennakoiva muuttuja, Ennustaja
Tämä on yleisin termeistä. Ei ole mitään seurauksia manipuloinnille, havainnoinnille, kategorialliselle tai numeeriselle. Se ei tarkoita syy-yhteyttä.
Ennakoivaa muuttujaa käytetään yksinkertaisesti vastemuuttujan arvon selittämiseen tai ennustamiseen. Käytetään pääasiassa regressiossa.
Itsenäinen muuttuja
Olen nähnyt itsenäisen muuttujan (IV) käyttävän eri tapoja.
1. Se tarkoittaa syy-yhteyttä: riippumaton muuttuja vaikuttaa riippuvaan muuttujaan. Tämä käyttö on hallitsevaa ANOVA-malleissa, joissa kokeilija manipuloi itsenäistä muuttujaa. Jos sitä manipuloidaan, se on yleensä kategorinen ja kohteet osoitetaan satunnaisesti olosuhteisiin.
2. Se ei tarkoita syy-yhteyttä, mutta se on keskeinen ennustava muuttuja vastaamaan tutkimuskysymykseen. Toisin sanoen, se on mallissa, koska tutkija on kiinnostunut ymmärtämään sen suhdetta riippuvaan muuttujaan. Toisin sanoen, se ei ole kontrollimuuttuja.
3. Se ei tarkoita syy-yhteyttä tai muuttujan merkitystä tutkimuskysymykselle. Mutta se on korreloimaton (riippumaton) kaikista muista ennustajista.
Rehellisesti sanoen näin vasta äskettäin jonkun määrittelevän termin Itsenäinen muuttuja tällä tavalla. Ennakoivat muuttujat eivät voi olla riippumattomia muuttujia, jos ne ovat lainkaan korreloineet. Se yllätti minut, mutta on hyvä tietää, että jotkut ihmiset tarkoittavat tätä, kun he käyttävät termiä.
Selittävä muuttuja
Ennustava muuttuja mallissa, jossa pääasia ei ole ennustaa. vastamuuttuja, mutta selittää X: n ja Y: n välinen suhde.
Ohjausmuuttuja
Ennustava muuttuja, joka voi liittyä riippuvaan muuttujaan tai vaikuttaa siihen, mutta ei todellakaan kiinnosta tutkimuskysymys.
Kovariaatti
Yleensä jatkuva ennustemuuttuja. Käytetään sekä ANCOVA: ssa (kovarianssianalyysi) että regressiossa. Jotkut ihmiset käyttävät tätä viitaten kaikkiin ennustemuuttujiin regressiossa, mutta se tarkoittaa todella jatkuvia ennustajia. Kovariaatin lisääminen ANOVA: han (varianssianalyysi) muuttaa sen ANCOVA: ksi (kovarianssianalyysi).
Joskus kovariaatti tarkoittaa, että muuttuja on kontrollimuuttuja (toisin kuin riippumaton muuttuja), mutta ei aina.
Ja joskus ihmiset käyttävät kovariaattia tarkoittamaan joko numeerista tai kategorista kontrollimuuttujaa.
Tämä on niin hämmentävää, että sai oman hämmentävän tilastotermin artikkelin.
Sekoittava muuttuja, yhdistäjä
Näitä termejä käytetään eri tavoin eri kentissä. Kokeellisessa suunnittelussa sitä käytetään muuttujana, jonka vaikutusta ei voida erottaa riippumattoman muuttujan vaikutuksesta.
Tarkkailukentissä sitä käytetään tarkoittamaan yhtä kahdesta tilanteesta. Ensimmäinen on muuttuja, joka korreloi niin riippumattomalla muuttujalla, että on vaikeaa erottaa niiden vaikutuksia vastemuuttujaan. Toinen on muuttuja, joka aiheuttaa riippumattoman muuttujan vaikutuksen vasteeseen.
Ero näissä tulkinnoissa on pieni, mutta tärkeä.
Altistumismuuttuja
Tämä on termi itsenäiselle muuttujalle joillakin aloilla, erityisesti epidemiologiassa. Se on tärkein ennustava muuttuja.
Riskitekijä
Toinen ennustemuuttujan epidemiologinen termi. Toisin kuin alla lueteltu termi ”tekijä”, se ei tarkoita kategorista muuttujaa.
Kerroin
Kategoriallinen ennustemuuttuja. Se voi tai ei välttämättä osoita syy-seuraussuhdetta muuttujaan. vastemuuttuja (tämä riippuu tutkimuksen suunnittelusta, ei analyysistä).
ANOVA: n itsenäisiä muuttujia kutsutaan melkein aina tekijöiksi. Regressiossa niitä kutsutaan usein indikaattorimuuttujiksi, kategorisiksi ennustajiksi tai nukkeiksi . Ne ovat kaikki samanlaisia tässä yhteydessä.
Huomaa myös, että Factorilla on tilastoissa aivan muita merkityksiä, joten myös se sai oman hämmentävän tilastoterminsä.
Ominaisuus
Koneoppimisessa ja ennakoivissa malleissa tämä on yksinkertaisesti ennustava muuttuja.
Muuttujan ryhmittely
Sama kuin tekijä.
Kiinteäkerroin
Kategoriallinen ennustemuuttuja, jossa kategorioiden tietyt arvot ovat tarkoituksellisia ja tärkeitä, usein kokeilijan valitsemia. Esimerkkejä ovat henkinen hoito tai väestöryhmät, kuten sukupuoli ja rotu.
Jos et tee sekamallia (ja sinun pitäisi tietää, jos olet), kaikki tekijät ovat kiinteitä tekijöitä. Lisätietoja kiinteiden ja satunnaisten tekijöiden perusteellisemmasta selvityksestä on kohdassa Kiinteiden ja satunnaisten tekijöiden määrittäminen sekoitetuissa tai monitasoisissa malleissa
Satunnaiskerroin
Kategoriallinen ennustemuuttuja, jossa luokat jaettiin satunnaisesti. Yleisesti käytetty sekamallinnuksessa. Esimerkkejä ovat aiheita tai satunnaisia lohkoja.
Kiinteiden ja satunnaisten tekijöiden perusteellisemman selityksen, katso Kiinteiden ja satunnaisten tekijöiden määrittäminen sekoitetuissa tai monitasoisissa malleissa
Estävä muuttuja
Tätä termiä käytetään yleensä kokeellisessa suunnittelussa, mutta olen nähnyt sen myös satunnaistetuissa kontrolloiduissa kokeissa.
Estomuuttuja on muuttuja, joka osoittaa kokeellisen lohkon: klusteri tai koeyksikkö, joka rajoittaa täydellistä satunnaistamista ja se johtaa usein samanlaisiin vastearvoihin lohkon jäsenten keskuudessa.
Estomuuttujat voivat olla joko kiinteitä tai satunnaisia tekijöitä. Ne eivät ole koskaan jatkuvia.
Dummy-muuttuja
Kategoriallinen muuttuja, joka on koodattu nukkeella. Nukekoodausta (jota kutsutaan myös indikaattorikoodaukseksi) käytetään yleensä regressiomalleissa, mutta ei ANOVA: ta. Nuken muuttujalla voi olla vain kaksi arvoa: 0 ja 1. Kun kategorisella muuttujalla on enemmän kuin kaksi arvoa, se koodataan useiksi nuken muuttujiksi.
Indikaattorimuuttuja
Sama kuin nukke muuttuja.
Ota pois -viesti
Aina kun käytät teknisiä termejä raportissa, artikkelissa tai keskustelussa, on aina hyvä määritellä termisi. Tämä on erityisen tärkeää tilastoissa, joita käytetään monilla ja monilla aloilla, joista jokainen lisää omat hienovaraisuutensa terminologiaan.
Sekava tilastotermisarja
Sekava tilastotermi # 1 : Itsenäisten muuttujien monet nimet