1. számú zavaros statisztikai kifejezések: A független változók sok neve
Statisztikai modellek, például általános lineáris modellek (lineáris regresszió, ANOVA, MANOVA), lineáris vegyes modellek és általánosított lineáris modellek (logisztikai, Poisson, regresszió stb.) Mindegyikének ugyanaz az általános formája.
Az egyenlet bal oldalán található egy vagy több válaszváltozó, Y. Jobb oldalon egy vagy több prediktor változó, X , és azok együtthatói, B. A jobb oldali változóknak sokféle formája lehet, és sok névvel hívják őket.
Finom megkülönböztetések vannak e nevek jelentésében. Sajnos azonban két olyan gyakorlat létezik, amelyek zavaróbbá teszik a kelleténél.
Először is gyakran felcserélhetőek. Tehát valaki használhatja a “prediktor változót” és a “független változót” felcserélhetően, egy másik pedig nem. Tehát a hallgató olvashatja azokat a finom különbségeket, amelyekre a beszélő nem utal.
Másodszor, ugyanazokat a kifejezéseket más-más módon használják a különböző területeken vagy kutatási helyzetekben. Tehát, ha epidemiológus vagy, aki többnyire megfigyelt változókat kutat, akkor valószínűleg némileg eltérõ jelentéssel bírtad ezeket a kifejezéseket, mint ha kísérleti kutatást végzõ pszichológus. a statisztikai szoftvercsomagok különböző megnevezéseket használnak hasonló fogalmakhoz, még a saját eljárásaik között is. Ez a pontosságra törekvés gyakran zavart okoz. (Elég nehéz a szavak váltása nélkül!).
Íme néhány általános kifejezés, amelyek mindegyike egy olyan modell változójára utal, amely egy másik változó befolyásolására vagy előrejelzésére javasolt.
I Megadom a különböző definíciókat és következményeket, de nagyon valószínű, hogy hiányoznának néhány. Ha olyan kifejezést lát, amely mást jelent, mint amit ért, kérjük, adja hozzá a megjegyzésekhez. És kérjük, mondja el, melyik területen dolgozik elsősorban.
Predictor Variable, Predictor
Ez a kifejezések közül a legáltalánosabb. Nincsenek következményei a manipulációnak, megfigyelésnek, kategorikus vagy számszerűségnek. Ez nem utal okságra.
A prediktor változót egyszerűen a válaszváltozó értékének magyarázatára vagy előrejelzésére használják. Főleg regresszióban használják.
Független változó
Láttam, hogy a Független Változó (IV) különböző módszereket használ.
1. Okozatot feltételez: a független változó befolyásolja a függő változót. Ez a használat túlsúlyban van az ANOVA modellekben, ahol a független változót a kísérletező manipulálja. Ha manipulálják, akkor általában kategorikus, és az alanyokat véletlenszerűen hozzárendelik a feltételekhez.
2. Ez nem utal okságra, de kulcsfontosságú előrejelző változó a kutatási kérdés megválaszolásához. Más szavakkal, azért szerepel a modellben, mert a kutató érdekelt a függő változóval való kapcsolatának megértésében. Más szóval, ez nem vezérlő változó.
3. Nem utal ok-okozati viszonyra vagy a változó fontosságára a kutatási kérdés szempontjából. De nincs korrelálva (független) az összes többi prediktortól.
Őszintén szólva csak nemrégiben láttam olyat, hogy valaki így határozta meg a Független Változó kifejezést. A prediktor változók nem lehetnek független változók, ha egyáltalán korrelálnak egymással. Meglepett, de jó tudni, hogy egyesek ezt értik, amikor használják a kifejezést. a válaszváltozó, hanem az X és Y közötti kapcsolat magyarázata. a kutatási kérdés.
Kovariált
Általában folyamatos prediktor változó. Az ANCOVA-ban (a kovariancia elemzése) és a regresszióban egyaránt alkalmazzák. Vannak, akik ezt regresszióban az összes prediktor változóra utalják, de ez valóban folyamatos prediktorokat jelent. Kovária hozzáadása az ANOVA-hoz (varianciaanalízis) ANCOVA -vá (kovariancia-elemzés) válik.
A kovariátum néha azt jelenti, hogy a változó kontroll változó (szemben egy független változóval), de nem mindig.
És néha az emberek a kovariátust a kontrollváltozó jelentésére használják, akár numerikus, akár kategorikus.
Ez annyira zavaros, hogy megkapta a saját zavaró statisztikai kifejezéseket. Zavaró változó, alapító
Ezeket a kifejezéseket a különböző mezőkben eltérően használják. A kísérleti tervezés során ez azt a változót jelenti, amelynek hatása nem különböztethető meg egy független változó hatásától.
A megfigyelési mezőkben a két helyzet egyikét jelenti. Az első olyan változó, amely annyira korrelál egy független változóval, hogy nehéz elkülöníteni a válaszváltozóra gyakorolt hatásukat. A második egy olyan változó, amely a független változó hatását váltja ki a válaszra.
A különbségtétel ezekben az értelmezésekben csekély, de fontos.
Expozíció-változó
Ez a független változó kifejezés néhány területen, különösen az epidemiológiában. Ez a legfontosabb előrejelző változó.
Kockázati tényező
A prediktor változó másik epidemiológiai kifejezése. Az alább felsorolt “Faktor” kifejezéssel ellentétben ez nem jelent kategorikus változót.
Faktor
Kategóriás előrejelző változó. Lehet, hogy nem utal ok-okozati összefüggésre a válaszváltozó (ez a tanulmány felépítésétől, és nem az elemzéstől függ).
Az ANOVA független változóit szinte mindig tényezőknek nevezik. Regresszióban gyakran indikátorváltozóknak, kategorikus prediktoroknak vagy dummy változóknak nevezik őket. . Ebben a kontextusban mindegyikük ugyanaz.
Kérjük, vegye figyelembe, hogy a Factornak teljesen más jelentése van a statisztikákban, ezért megkapta a saját zavaró statisztikai kifejezéseket is.
Feature
A gépi tanulás és a prediktív modellekben használják, ez egyszerűen egy előrejelző változó.
Változó csoportosítása
Ugyanaz, mint egy tényező.
Fix faktor
Egy kategorikus prediktor változó, amelyben a kategóriák meghatározott értékei szándékosak és fontosak, gyakran a kísérletező választja. Példák: mentális kezelések vagy demográfiai kategóriák, például szex és faj.
Ha nem vegyes modellt csinálsz (és tudnod kell, hogy igen), akkor minden tényeződ rögzített tényező. A rögzített és véletlenszerű tényezők alaposabb magyarázatához lásd: Fix és véletlen tényezők meghatározása vegyes vagy többszintű modellekben.
Véletlen tényező
Egy kategorikus prediktor változó, amelyben a a kategóriákat véletlenszerűen osztották ki. Általában vegyes modellezésben használják. Példák lehetnek tárgyak vagy véletlenszerű blokkok.
A rögzített és véletlen tényezők alaposabb magyarázatához lásd: Fix és véletlen tényezők meghatározása vegyes vagy többszintű modellekben.
Blokkoló változó
Ezt a kifejezést általában a kísérleti tervezés során használják, de véletlenszerű, kontrollált vizsgálatokban is láttam.
A blokkoló változó olyan változó, amely egy kísérleti blokkot jelöl: egy klaszter vagy kísérleti egység, amely korlátozza a teljes randomizálást, és ez gyakran hasonló válaszértékeket eredményez a blokk tagjai között.
A blokkoló változók lehetnek fix vagy véletlenszerű tényezők. Soha nem folytonosak.
Dummy változó
Dummy kódolású kategorikus változó. A dummy kódolást (más néven indikátor kódolásnak) általában a regressziós modellekben használják, de az ANOVA-t nem. A dummy változónak csak két értéke lehet: 0 és 1. Ha egy kategorikus változónak kettőnél több értéke van, akkor azt több dummy változóba kódolják át.
Indikátor változó
Ugyanaz, mint a dummy változó.
Az elveszítés üzenet
Amikor egy jelentésben, cikkben vagy beszélgetésben technikai kifejezéseket használ, mindig érdemes meghatározni a kifejezéseket. Ez különösen fontos a statisztikákban, amelyeket sok-sok területen használnak, és mindegyik saját finomsággal egészíti ki a terminológiát.
Zavaros statisztikai kifejezések sorozat
Statisztikai kifejezések zavaros # 1 : A független változók sok neve