<その4>Cox比例ハザード解析やロジスティック解析における多変量解析: 多重共線性とはなんぞや
<その3>Cox比例ハザード解析やロジスティック解析における多変量解析では、組み入れることができる変数の数はどれくらい? の続きになります。見ていない方は、こちらへ。多重共線性の重要性多重共線性(Multicollinearity)とは、複数の独立変数が強い相関関係を持つ場合に発生する問題で、回帰分析のようなモデルにおいて以下の影響を及ぼします。独立変数の影響の正確な推定が難しくなる:回帰係数の分散が増加し、信頼区間が広くなる。解析結果の不安定性:サンプルや変数選択によって結果が大きく変わる。予測モデルの解釈性の低下:どの変数が実際にモデルに寄与しているかを判断しにくくなる。簡単にいうと、Coxやロジスティックモデルを用いた多変量解析で、複数の変数を組み入れるとき、相関係数が高い変数同士をモデルに入れると統計がおかしくなる可能性があるということです。多重共線性の確認方法と統計1.相関行列(Correlation Matrix):変数間の単純相関を確認する。相関係数(PearsonまたはSpearman)を計算し、高い値(一般的に0.7以上)が多重共線性の指標となる。2. VIF(Var...