紛らわしい統計用語#1:独立変数の多くの名前

一般線形モデル(線形回帰、ANOVA、MANOVA)、線形混合モデル、一般化線形モデル(ロジスティック、ポアソン、回帰など)はすべて同じ一般形式です。

方程式の左側には1つ以上の応答変数Yがあり、右側には1つ以上の予測変数Xがあります。 、およびそれらの係数、B。右側の変数は多くの形式を持つことができ、多くの名前で呼び出されます。

これらの名前の意味には微妙な違いがあります。ただし、残念ながら、必要以上に混乱させる2つの方法があります。

まず、これらは同じ意味で使用されることがよくあります。したがって、誰かが「予測変数」と「独立変数」を同じ意味で使用する場合と、別の人が使用しない場合があります。そのため、聞き手は話し手が暗示していないかもしれない微妙な違いを読んでいる可能性があります。

次に、同じ用語が異なる分野や研究状況で異なって使用されています。したがって、主に観察される変数を研究する疫学者の場合、実験研究を行う心理学者の場合とは、これらの用語のいくつかに対してわずかに異なる意味で訓練されている可能性があります。

さらに悪いことに、統計ソフトウェアパッケージは、独自の手順の中でも、同様の概念に異なる名前を使用します。この正確さの探求はしばしば混乱を招きます。 (言葉を変えなければ十分に難しいです!)

ここに、別の変数に影響を与えたり予測したりするために提案されたモデル内の変数を指す一般的な用語がいくつかあります。

Iさまざまな定義と意味を説明しますが、私がいくつかを見逃している可能性が非常に高いです。理解していない意味の用語を見つけた場合は、コメントに追加してください。そして、主にどの分野で働いているかを教えてください。

予測変数、予測

これは最も一般的な用語です。操作、観察、分類、または数値化に影響はありません。因果関係を意味するものではありません。

予測変数は、応答変数の値を説明または予測するために使用されます。主に回帰で使用されます。

独立変数

独立変数(IV)がさまざまな方法で使用されるのを見てきました。

1。これは因果関係を意味します。独立変数は従属変数に影響を与えます。この使用法は、独立変数が実験者によって操作されるANOVAモデルで主流です。操作する場合、通常はカテゴリに分類され、被験者はランダムに条件に割り当てられます。

2。因果関係を意味するものではありませんが、リサーチクエスチョンに答えるための重要な予測変数です。言い換えれば、研究者が従属変数との関係を理解することに関心があるため、モデル内にあります。言い換えれば、それは制御変数ではありません。

3。リサーチクエスチョンに対する変数の因果関係や重要性を意味するものではありません。しかし、それは他のすべての予測子とは無相関(独立)です。

正直なところ、私は最近、誰かが独立変数という用語をこのように定義しているのを見ました。予測変数は、相関している場合、独立変数にすることはできません。驚きましたが、この用語を使用するときにこれを意味する人がいることを知っておくとよいでしょう。

説明変数

主要なポイントが予測ではないモデルの予測変数応答変数ですが、XとYの関係を説明します。

制御変数

従属変数に関連または影響を与える可能性があるが、実際には関心がない予測変数調査の質問。

共変量

通常、連続予測変数。 ANCOVA(共分散分析)と回帰の両方で使用されます。これを使用して回帰のすべての予測変数を参照する人もいますが、実際には連続予測変数を意味します。共変量をANOVA(分散分析)に追加すると、ANCOVA(共分散分析)に変わります。

共変量は、変数が(独立変数ではなく)制御変数であることを意味する場合がありますが、常にそうとは限りません。

また、共変量を使用して、数値またはカテゴリの制御変数を意味する場合もあります。

これは非常に混乱しているため、独自の交絡統計用語の記事があります。

交絡変数、交絡因子

これらの用語は、分野によって使用方法が異なります。実験計画では、独立変数の効果と効果を区別できない変数を意味するために使用されます。

観測分野では、2つの状況のいずれかを意味するために使用されます。 1つ目は、独立変数との相関が非常に高いため、応答変数への影響を分離するのが難しい変数です。 2つ目は、応答に対する独立変数の影響を引き起こす変数です。

これらの解釈の違いはわずかですが、重要です。

露出変数

これは、一部の分野、特に疫学における独立変数の用語です。これは重要な予測変数です。

危険因子

予測変数のもう1つの疫学用語。以下にリストされている「ファクター」という用語とは異なり、カテゴリー変数を意味するものではありません。

ファクター

カテゴリー予測変数。これは、との因果関係を示す場合と示さない場合があります。応答変数(これは分析ではなく、研究の設計に依存します)。

ANOVAの独立変数は、ほとんどの場合、因子と呼ばれます。回帰では、指標変数、カテゴリ予測子、またはダミー変数と呼ばれることがよくあります。 。このコンテキストでは、これらはすべて同じです。

また、Factorは統計においてまったく別の意味を持っているため、独自の紛らわしい統計用語の記事もあります。

機能

機械学習および予測モデルで使用され、これは単なる予測変数です。

グループ化変数

因子と同じです。

固定因子

カテゴリの特定の値が意図的で重要であり、実験者によって選択されることが多いカテゴリ予測変数。例には、実験が含まれます。精神的治療または性別や人種などの人口統計学的カテゴリ。

混合モデルを行っていない場合(そして、そうであるかどうかを知っておく必要があります)、すべての要因は固定要因です。固定因子とランダム因子の詳細については、混合モデルまたはマルチレベルモデルでの固定因子とランダム因子の指定

ランダム因子

の特定の値が含まれるカテゴリ予測変数を参照してください。カテゴリはランダムに割り当てられました。一般的に混合モデリングで使用されます。例には、サブジェクトやランダムブロックが含まれます。

固定因子とランダム因子の詳細については、混合モデルまたはマルチレベルモデルでの固定因子とランダム因子の指定

ブロック変数

この用語は一般に実験計画で使用されますが、ランダム化比較試験でも見られます。

ブロッキング変数は、実験ブロックを示す変数です。クラスターまたは実験ユニットは次のようになります。完全なランダム化を制限し、その結果、ブロックのメンバー間で同様の応答値が得られることがよくあります。

ブロック変数は、固定要素またはランダム要素のいずれかです。連続することはありません。

ダミー変数

ダミーコード化されたカテゴリ変数。ダミーコーディング(インジケーターコーディングとも呼ばれます)は通常、回帰モデルで使用されますが、ANOVAでは使用されません。ダミー変数は、0と1の2つの値のみを持つことができます。カテゴリ変数に3つ以上の値がある場合、複数のダミー変数に再コード化されます。

インジケータ変数

ダミーと同じ変数。

持ち帰りメッセージ

レポート、記事、または会話で専門用語を使用する場合は常に、用語を定義することをお勧めします。これは、多くの分野で使用される統計において特に重要であり、それぞれが用語に独自の微妙な点を追加します。

紛らわしい統計用語シリーズ

紛らわしい統計用語#1 :独立変数の多くの名前

紛らわしい統計用語#2:アルファとベータ

紛らわしい統計用語#4:階層回帰と階層モデル

線形回帰係数の解釈:ウォークスルー出力
数値予測子とカテゴリ予測子を含むモデルの出力をウォークスルーしながら、その回帰の係数を理解するためのアプローチを学びます。相互作用。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です