Matoucí statistické pojmy č. 1: Mnoho jmen nezávislých proměnných

Statistické modely, jako jsou obecné lineární modely (lineární regrese, ANOVA, MANOVA), lineární smíšené modely a zobecněné lineární modely (logistické, Poisson, regrese atd.) Mají všechny stejný obecný tvar.

Na levé straně rovnice je jedna nebo více proměnných odezvy, Y. Na pravé straně je jedna nebo více predikčních proměnných, X a jejich koeficienty, B. Proměnné na pravé straně mohou mít mnoho podob a jsou nazývány mnoha jmény.

Ve významech těchto jmen existují jemné rozdíly. Bohužel však existují dva postupy, díky nimž jsou více matoucí, než je třeba.

Nejprve se často používají zaměnitelně. Někdo tedy může používat „prediktorovou proměnnou“ a „nezávislou proměnnou“ zaměnitelně a jiný nemusí. Posluchač tedy může číst jemné rozdíly, které řečník nemusí naznačovat.

Zadruhé, stejné pojmy se v různých oborech nebo výzkumných situacích používají odlišně. Pokud jste tedy epidemiologem, který provádí výzkum většinou pozorovaných proměnných, pravděpodobně jste byli vyškoleni s mírně odlišnými významy pro některé z těchto pojmů, než kdybyste byli psychologem, který provádí experimentální výzkum.

Ještě horší je, statistické softwarové balíčky používají různé názvy pro podobné koncepty, dokonce i mezi svými vlastními postupy. Tato snaha o přesnost často vyvolává zmatek. (Je to dost těžké bez přepínání slov!).

Zde je několik běžných výrazů, které všechny odkazují na proměnnou v modelu, který má ovlivnit nebo předpovědět jinou proměnnou.

I Uvedu různé definice a důsledky, ale je velmi pravděpodobné, že mi některé chybí. Pokud vidíte výraz, který znamená něco jiného, než tomu rozumíte, přidejte jej do komentářů. A prosím, řekněte nám, ve kterém oboru primárně pracujete.

Proměnná prediktoru, Predictor

Toto je nejobecnější výraz. Neexistují žádné důsledky pro manipulaci, pozorování, kategorické nebo číselné vyjádření. Neznamená to kauzalitu.

Proměnná prediktoru se jednoduše používá k vysvětlení nebo předpovědi hodnoty proměnné odpovědi. Používá se převážně v regresi.

Nezávislá proměnná

Viděl jsem, jak nezávislá proměnná (IV) používá různé způsoby.

1. To implikuje kauzalitu: nezávislá proměnná ovlivňuje závislou proměnnou. Toto použití převládá v modelech ANOVA, kde je nezávislá proměnná manipulována experimentátorem. Pokud je manipulováno, je to obecně kategorické a subjekty jsou náhodně přiřazeny podmínkám.

2. Neznamená to kauzalitu, ale je to klíčová predikční proměnná pro zodpovězení výzkumné otázky. Jinými slovy, je v modelu, protože výzkumník má zájem porozumět jeho vztahu se závislou proměnnou. Jinými slovy to není kontrolní proměnná.

3. Neznamená to kauzalitu ani důležitost proměnné pro výzkumnou otázku. Ale nesouvisí (nezávisí) se všemi ostatními prediktory.

Upřímně řečeno, teprve nedávno jsem viděl, jak někdo definuje pojem nezávislá proměnná tímto způsobem. Proměnné prediktoru nemohou být nezávislé proměnné, pokud vůbec souvisejí. Překvapilo mě to, ale je dobré vědět, že to někteří lidé myslí, když používají tento výraz.

Vysvětlující proměnná

Proměnná prediktoru v modelu, kde hlavním bodem není predikce proměnnou odezvy, ale vysvětlit vztah mezi X a Y.

Řídicí proměnná

Proměnná prediktoru, která by mohla souviset nebo ovlivňovat závislou proměnnou, ale ve skutečnosti ji nezajímá výzkumná otázka.

Kovariate

Obecně spojitá predikční proměnná. Používá se jak v ANCOVA (analýza kovariance), tak v regresi. Někteří lidé to používají k označení všech proměnných prediktorů v regresi, ale ve skutečnosti to znamená spojité prediktory. Přidání kovariátu do ANOVA (analýza rozptylu) ji promění v ANCOVA (analýza kovariance).

Někdy kovariát znamená, že proměnná je kontrolní proměnná (na rozdíl od nezávislé proměnné), ale ne vždy.

A někdy lidé používají kovarianci k označení řídicí proměnné, ať už numerické nebo kategorické.

Tenhle je tak matoucí, že má svůj vlastní článek Matoucí statistické pojmy.

Zmatená proměnná, zmatek

Tyto výrazy se v různých polích používají odlišně. V experimentálním designu to znamená proměnnou, jejíž účinek nelze odlišit od účinku nezávislé proměnné.

V pozorovacích polích to znamená jednu ze dvou situací. První je proměnná, která je tak korelována s nezávislou proměnnou, že je obtížné oddělit jejich účinky na proměnnou odezvy. Druhá je proměnná, která způsobí vliv nezávislé proměnné na reakci.

Rozdíl v těchto interpretacích je malý, ale důležitý.

Proměnná expozice

Toto je termín pro nezávislou proměnnou v některých oblastech, zejména v epidemiologii. Je to klíčová predikční proměnná.

Rizikový faktor

Další epidemiologický výraz pro predikční proměnnou. Na rozdíl od níže uvedeného výrazu „Faktor“ nenaznačuje kategorickou proměnnou.

Faktor

Proměnná kategorického prediktoru. Může nebo nemusí indikovat vztah příčina / účinek s proměnná odezvy (záleží na designu studie, nikoli na analýze).

Nezávislé proměnné v ANOVA se téměř vždy nazývají faktory. V regresi se často označují jako proměnné indikátorů, kategorické prediktory nebo fiktivní proměnné . V tomto kontextu jsou to samé.

Vezměte prosím také na vědomí, že Factor má ve statistikách úplně jiné významy, takže také dostal svůj vlastní článek Matoucí statistické pojmy.

Funkce

Používá se v strojovém učení a prediktivních modelech, jedná se jednoduše o predikční proměnnou.

Proměnná seskupení

Stejné jako faktor.

Fixed factor

Kategorická predikční proměnná, ve které jsou konkrétní hodnoty kategorií záměrné a důležité, často vybrané experimentátorem. Mezi příklady patří experiment mentální ošetření nebo demografické kategorie, jako je pohlaví a rasa.

Pokud neděláte smíšený model (a měli byste vědět, jestli ano), všechny vaše faktory jsou pevné faktory. Podrobnější vysvětlení pevných a náhodných faktorů najdete v části Určení pevných a náhodných faktorů ve smíšených nebo víceúrovňových modelech.

Náhodný faktor

Kategorická predikční proměnná, ve které jsou konkrétní hodnoty kategorie byly náhodně přiřazeny. Obecně se používá ve smíšeném modelování. Mezi příklady patří předměty nebo náhodné bloky.

Podrobnější vysvětlení pevných a náhodných faktorů najdete v části Určení pevných a náhodných faktorů ve smíšených nebo víceúrovňových modelech.

Blokovací proměnná

Tento termín se obecně používá v experimentálním designu, ale také jsem ho viděl v randomizovaných kontrolovaných studiích.

Blokovací proměnná je proměnná, která označuje experimentální blok: klastr nebo experimentální jednotka, která omezuje úplnou randomizaci, což často vede k podobným hodnotám odezvy mezi členy bloku.

Blokovací proměnné mohou být pevné nebo náhodné faktory. Nikdy nejsou spojité.

Fiktivní proměnná

Kategorická proměnná, která byla kódována fiktivně. Fiktivní kódování (nazývané také indikátorové kódování) se obvykle používá v regresních modelech, ale ne ANOVA. Fiktivní proměnná může mít pouze dvě hodnoty: 0 a 1. Pokud má kategorická proměnná více než dvě hodnoty, je překódována do více fiktivních proměnných.

Proměnná indikátoru

Stejná jako fiktivní proměnná proměnná.

Zpráva Take Away

Kdykoli v přehledu, článku nebo konverzaci používáte technické výrazy, je vždy vhodné je definovat. To je zvláště důležité ve statistikách, které se používají v mnoha a mnoha oblastech, z nichž každý přidává k terminologii své vlastní jemnosti.

Řada matoucích statistických pojmů

Matoucí statistické pojmy # 1 : Mnoho názvů nezávislých proměnných

Matoucí statistické výrazy č. 2: Alfa a Beta

Matoucí statistický výraz č. 4: Hierarchická regrese vs. hierarchický model

Interpretace lineárních regresních koeficientů: Procházka výstupem
Naučte se přístup k pochopení koeficientů v této regresi, když procházíme výstupem modelu, který obsahuje numerické a kategorické prediktory a interakce.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *