統計

論文の書き方

<その1>Cox比例ハザード解析やロジスティック解析における多変量解析の変数選択はどのように行うべきか?

Cox比例ハザード解析やロジスティック解析における多変量解析の変数選択は、研究の目的やデータ特性によって異なりますが、一般的な選択基準の妥当性が高い順に以下のように整理できます。1.事前に定義された研究目的や仮説に基づく選択(優先度:高)目的: 既存の知見や文献レビューから、研究目的に合致する重要な変数を明確にする。利点:研究の焦点を絞り込む。過剰なデータ操作による誤った結果を防ぐ。例:臨床的に重要とされるリスク因子(例: 年齢、性別、基礎疾患)。研究の仮説を検証するために必要な変数。2.文献やガイドラインに基づく選択(優先度:中-高)目的: 過去の研究でリスク因子として確認されている変数を考慮。利点:信頼性が高い。既存知見と結果を比較しやすい。注意点:ガイドラインや文献は地域や患者特性によって異なる場合があるため、対象集団に合うか検討が必要。3.専門家の意見や臨床的知見に基づく選択(優先度:中)目的: 研究者や専門家が臨床的に重要と考える変数を選ぶ。利点:実務的な意味のある結果を得られる可能性が高い。課題: 主観的な偏りが生じるリスクがある。4.データ駆動型アプローチによる選択(優先...
0
論文の書き方

Nested case–control studies(ネストした症例対照研究)

Nested case–control studies(ネストした症例対照研究)とは、疫学研究でよく用いられる手法であり、特徴的なアプローチを持っています。以下に手法を解説します。概要定義: 大規模なコホート研究内で、発生した症例(アウトカムを経験した人)と、アウトカムが発生しなかった対照を選び出し、詳細な解析を行う手法。特定のリスク要因(曝露)とアウトカムの関連性を効率的に調べる。特徴:研究対象はコホート内の一部に限定されるため、通常の症例対照研究よりもバイアスが少なく、効率的。対照は症例と同じコホート内からランダムに選ばれる。コホート研究の中で症例を「ネスト」する(埋め込む)形で実施される。メリット効率的: コホート全体を解析せず、対象を症例と対照に絞るため、コストやリソースを節約できる。交絡因子の調整: 対照群が同じコホート内から選ばれるため、交絡因子(年齢や性別など)の分布が症例群と類似している。信頼性: コホート全体から選んだ症例と対照のデータがもとになるため、選択バイアスが少ない。デメリット時間とリソースの制約: コホート研究が前提のため、コホートデータがなければ実施できな...
0
論文の書き方

Self-Controlled Case Series(自己対照症例シリーズ)

self-controlled case series(自己対照症例シリーズ)とは、疫学研究でよく用いられる手法であり、特徴的なアプローチを持っています。以下に手法を解説します。概要定義: 研究対象者自身を「対照」として用いる手法であり、アウトカムが発生した期間(リスク期間)とアウトカムが発生しなかった期間を比較する。曝露(例: ワクチン接種)が特定の時間枠内でアウトカムに影響を与えるかを検証する。特徴:被験者は全員がアウトカムを経験している。。個人内でリスク要因とアウトカムの関連を評価するため、個人間の交絡因子の影響を排除できる。メリット交絡因子を排除: 年齢、性別、遺伝的要因など、個人間の違いを完全に除外できる。高い効率性: 対照群を設定する必要がなく、症例データのみで解析可能。時間依存性の解析に適合: 特定のリスク期間(曝露後の一定期間など)の影響を直接評価可能。デメリット全てのアウトカムには適用不可: アウトカムが再発しない事象(例: 死亡)では適用困難。解析が複雑: 時間枠やリスク期間の設定が不適切だと、結果が正確でなくなる可能性がある。リスク期間の仮定: 曝露とアウトカムの...
0
論文の書き方

逆確率重み付け法(Inverse Probability Treatment WeightingIPTW)と傾向スコアマッチング

IPTW(Inverse Probability Treatment Weighting)と通常の傾向スコアマッチング(Propensity Score Matching, PSM)は、いずれも傾向スコア(propensity score)を用いて交絡因子を調整し、観察研究で因果推論を行うための手法です。しかし、アプローチや特性、結果に至る過程にいくつかの重要な違いがあります。傾向スコアマッチング(PSM)の概要手法:傾向スコアを用いて、治療群の患者と交絡因子が似た非治療群の患者を1対1、または1対多でマッチングします。マッチング後のペアを用いて治療効果を推定します。具体的な手順:傾向スコアを計算。傾向スコアが近い治療群と非治療群の患者をマッチング。マッチングされたデータセットを用いて治療効果を推定。目的:治療群と非治療群の交絡因子をバランスさせ、治療効果の「平均処置効果(ATE)」や「処置群における平均処置効果(Average Treatment Effect on the Treated, ATT)」を評価。IPTWの概要手法:傾向スコアを用いて各患者に「重み」を割り当て、全データ...
0
論文の書き方

データ解析:平均値と中央値 どちらを使う? 群間比較に用いる統計は? 正規分布って??

前向き・後ろ向きを問わず、臨床研究では「A群とB群の年齢の比較」など、複数の群間における興味ある変数の比較が重要ですね。このような解析のときには、そのような変数は平均値で表した方がよいのか?それとも中央値で表した方がよいのかどちらがよいのでしょうか?あと聞きたいんですが、興味ある変数の群間比較にはt検定とかマン・ホイットニーとかがありますが、どれを使えばいいんですか?その前に、まずは目的の変数が正規分布しているかどうかを評価しよう平均値で表した方がよいのか、それとも中央値で表した方がよいのかを決めるときには、まず、その変数が正規分布かどうかを判別します。その時には、主に以下の方法を使用します。(1) 視覚的な確認ヒストグラムを作成して、データが正規分布に従っているかを視覚的に確認します。(まずは見た目で。)(2) 統計検定シャピロ・ウィルク検定やコルモゴロフ・スミルノフ検定を用いて、データが正規分布に従っているかを検定します。帰無仮説:データは正規分布に従う。検定結果のp値が0.05未満の場合、正規分布ではないと判断します。 シャピロ・ウィルク検定(Shapiro-Wilk Test)...
0
タイトルとURLをコピーしました