データ解析:平均値と中央値 どちらを使う? 群間比較に用いる統計は? 正規分布って??
前向き・後ろ向きを問わず、臨床研究では「A群とB群の年齢の比較」など、複数の群間における興味ある変数の比較が重要ですね。このような解析のときには、そのような変数は平均値で表した方がよいのか?それとも中央値で表した方がよいのかどちらがよいのでしょうか?あと聞きたいんですが、興味ある変数の群間比較にはt検定とかマン・ホイットニーとかがありますが、どれを使えばいいんですか?その前に、まずは目的の変数が正規分布しているかどうかを評価しよう平均値で表した方がよいのか、それとも中央値で表した方がよいのかを決めるときには、まず、その変数が正規分布かどうかを判別します。その時には、主に以下の方法を使用します。(1) 視覚的な確認ヒストグラムを作成して、データが正規分布に従っているかを視覚的に確認します。(まずは見た目で。)(2) 統計検定シャピロ・ウィルク検定やコルモゴロフ・スミルノフ検定を用いて、データが正規分布に従っているかを検定します。帰無仮説:データは正規分布に従う。検定結果のp値が0.05未満の場合、正規分布ではないと判断します。 シャピロ・ウィルク検定(Shapiro-Wilk Test)...