統計

一般化可能性(Generalizability)と過適合(overfitting)ってなあに?

臨床研究などである疾患におけるリスク因子を同定するとき(例えば、IPFにおける死亡リスク因子)やバイオマーカーやAI、診断モデルの開発では、「開発(探索)コホート」と「検証コホート」を分けて解析を行うことが一般的です。まず、開発コホートでリスク因子の同定やモデル構築を行い、検証コホートでそれが機能するかどうかを確かめます。その目的は、モデルや結果の一般化可能性を確保し、過適合を防ぐことにあります。以下では、これらの概念を解説します。一般化可能性(Generalizability)とは?一般化可能性とは、モデルや研究結果が新しいデータや異なる集団に対しても同じように適用できる能力を指します。つまり、「特定のデータセットや環境だけでなく、他の状況でも有効に機能するか」を評価する概念です。なぜ一般化可能性が重要なんでしょうか?一般化可能性が高い研究やモデルは、リアルワールドのさまざまな状況で有用であり、信頼性の高い結果を提供します。逆に、一般化可能性が低い場合、そのモデルや結論は特定の環境に依存しており、新しいデータでは役に立たない可能性があります。具体例臨床研究例: ある薬の効果を調べる臨...
0
統計

開発コホートと検証コホートってなあに?

臨床研究などである疾患におけるリスク因子を同定するとき(例えば、IPFにおける死亡リスク因子)やバイオマーカーやAI、診断モデルの開発では、「開発(探索)コホート」と「検証コホート」を分けて解析を行うことが一般的です。まず、開発コホートでリスク因子の同定やモデル構築を行い、検証コホートでそれが機能するかどうかを確かめます。その目的は、モデルや結果の一般化可能性を確保し、過適合を防ぐことにあります。以下では、これらの概念を解説しながら、その重要性を順を追って説明します。開発コホートと検証コホートとは?開発コホートリスク因子の同定やモデルの構築、バイオマーカーの選定を行うためのデータセットです。検証コホート同定したリスク因子や開発したモデル、選定したバイオマーカーが別のデータセットでも有効かを確認するために使用されるデータセットです。ちなみに、開発コホート・検証コホートは以下のような表現を使うことがあります。開発コホート(Development Cohort)日本語での言い換え:学習用コホート:モデルを「学習」させるためのデータセットとして強調する場合に使われる。構築用データ:モデルの構築...
0
肺癌

進行非小細胞肺癌における免疫療法に対する治療反応性予測のための深層学習モデル(Rakaee M, et al. JAMA Oncol. 2024.)

Deep Learning Model for Predicting Immunotherapy Response in Advanced Non-Small Cell Lung Cancer.引用文献この論文を勉強してみました。この論文は、「進行非小細胞肺癌(NSCLC)患者において、深層学習アルゴリズムによる組織学的画像評価によって、免疫チェックポイント阻害剤(ICI)への反応を直接予測できるか?」というクリニカルクエスチョンに基づいています。実臨床では、ICI単剤療法における反応を予測する主要なバイオマーカーはPD-L1タンパク質の発現量ですね。しかし、PD-L1発現の評価は万能ではなく、PD-L1発現が低くてもICI治療の恩恵を受ける患者がいますし、PD-L1発現が高くてもでも反応しない患者もいますね。ICIの予測バイオマーカーとして、tumor mutational burden(TMB)もありますが、TMBの使用にはコスト、アッセイのばらつき、最適なカットオフ値の定義、感度や特異度の限界といった課題があります。そのため、ICIへの反応を予測するための新たなバイオマーカーを特...
0
統計

<その4>Cox比例ハザード解析やロジスティック解析における多変量解析: 多重共線性とはなんぞや

<その3>Cox比例ハザード解析やロジスティック解析における多変量解析では、組み入れることができる変数の数はどれくらい? の続きになります。見ていない方は、こちらへ。多重共線性の重要性多重共線性(Multicollinearity)とは、複数の独立変数が強い相関関係を持つ場合に発生する問題で、回帰分析のようなモデルにおいて以下の影響を及ぼします。独立変数の影響の正確な推定が難しくなる:回帰係数の分散が増加し、信頼区間が広くなる。解析結果の不安定性:サンプルや変数選択によって結果が大きく変わる。予測モデルの解釈性の低下:どの変数が実際にモデルに寄与しているかを判断しにくくなる。簡単にいうと、Coxやロジスティックモデルを用いた多変量解析で、複数の変数を組み入れるとき、相関係数が高い変数同士をモデルに入れると統計がおかしくなる可能性があるということです。多重共線性の確認方法と統計1.相関行列(Correlation Matrix):変数間の単純相関を確認する。相関係数(PearsonまたはSpearman)を計算し、高い値(一般的に0.7以上)が多重共線性の指標となる。2. VIF(Var...
0
統計

<その3>Cox比例ハザード解析やロジスティック解析における多変量解析では、組み入れることができる変数の数はどれくらい?

<その2>Cox比例ハザード解析やロジスティック解析における多変量解析の変数選択はどのように行うべきか? の続きになります。見ていない方は、こちらへ。多変量解析に組み入れることのできる変数の種類はいくつまで?多変量解析において、モデルが過剰適合(overfitting)するのを避けるためには、サンプルサイズと変数数のバランスが重要です。10~20イベント/変数(EPV: Events Per Variable)が一般的な目安です。例えば、100のイベントがある場合、5~10変数が推奨されます。イベント数が少ない場合、モデルの信頼性が低下します。イベントが少ない場合、Lasso回帰や縮小推定などの正則化手法を使用して変数を絞り込むことが推奨されます。具体例を挙げます。IPFの死亡率に関連する解析を行う場合、あなたのデータで30例の死亡があったとしましょう。年齢と性別、FVC、DLCO、喫煙歴、KL-6、体重などの7つのベースライン変数の中から死亡リスク因子となりうる変数を同定する多変量Cox解析を行うとします。死亡イベントが30しかないので、7つのベースライン変数を組み込むことはできませ...
0
統計

<その2>Cox比例ハザード解析やロジスティック解析における多変量解析の変数選択はどのように行うべきか?

<その1>Cox比例ハザード解析やロジスティック解析における多変量解析の変数選択はどのように行うべきか? の続きになります。見ていない方は、こちらへ。どうしても変数選択が必要な場合には何を使う?1. 事前知識に基づく変数選択(Clinical Knowledge-Driven Selection)概要医学的な事前知識や先行研究に基づいて、解析に含める変数を選択します。メリット科学的妥当性が高い。過剰適合(overfitting)のリスクが低い。結果の解釈が容易。デメリット知識やエビデンスが乏しい分野では利用が難しい。潜在的な交絡因子を見逃す可能性がある。使い分け臨床研究や治療介入試験で、主要な因子を特定する際に使用。使用例臨床研究: 特定の疾患の主要なリスク因子を調査する研究。治療介入試験: 介入効果に影響を与える可能性のある因子(年齢、性別など)を調整。2. 全変数投入(Enter Method, Forced Entry)概要全ての候補変数をモデルに含め、変数の独立した影響を評価します。メリット変数選択による偏りが生じない。結果が再現性高く解釈が簡単。デメリット過剰適合のリスクがあ...
0
統計

<その1>Cox比例ハザード解析やロジスティック解析における多変量解析の変数選択はどのように行うべきか?

Cox比例ハザード解析やロジスティック解析における多変量解析の変数選択は、研究の目的やデータ特性によって異なりますが、一般的な選択基準の妥当性が高い順に以下のように整理できます。1.事前に定義された研究目的や仮説に基づく選択(優先度:高)目的: 既存の知見や文献レビューから、研究目的に合致する重要な変数を明確にする。利点:研究の焦点を絞り込む。過剰なデータ操作による誤った結果を防ぐ。例:臨床的に重要とされるリスク因子(例: 年齢、性別、基礎疾患)。研究の仮説を検証するために必要な変数。2.文献やガイドラインに基づく選択(優先度:中-高)目的: 過去の研究でリスク因子として確認されている変数を考慮。利点:信頼性が高い。既存知見と結果を比較しやすい。注意点:ガイドラインや文献は地域や患者特性によって異なる場合があるため、対象集団に合うか検討が必要。3.専門家の意見や臨床的知見に基づく選択(優先度:中)目的: 研究者や専門家が臨床的に重要と考える変数を選ぶ。利点:実務的な意味のある結果を得られる可能性が高い。課題: 主観的な偏りが生じるリスクがある。4.データ駆動型アプローチによる選択(優先...
0
統計

Nested case–control studies(ネストした症例対照研究)

Nested case–control studies(ネストした症例対照研究)とは、疫学研究でよく用いられる手法であり、特徴的なアプローチを持っています。以下に手法を解説します。概要定義: 大規模なコホート研究内で、発生した症例(アウトカムを経験した人)と、アウトカムが発生しなかった対照を選び出し、詳細な解析を行う手法。特定のリスク要因(曝露)とアウトカムの関連性を効率的に調べる。特徴:研究対象はコホート内の一部に限定されるため、通常の症例対照研究よりもバイアスが少なく、効率的。対照は症例と同じコホート内からランダムに選ばれる。コホート研究の中で症例を「ネスト」する(埋め込む)形で実施される。メリット効率的: コホート全体を解析せず、対象を症例と対照に絞るため、コストやリソースを節約できる。交絡因子の調整: 対照群が同じコホート内から選ばれるため、交絡因子(年齢や性別など)の分布が症例群と類似している。信頼性: コホート全体から選んだ症例と対照のデータがもとになるため、選択バイアスが少ない。デメリット時間とリソースの制約: コホート研究が前提のため、コホートデータがなければ実施できな...
0
統計

Self-Controlled Case Series(自己対照症例シリーズ)

self-controlled case series(自己対照症例シリーズ)とは、疫学研究でよく用いられる手法であり、特徴的なアプローチを持っています。以下に手法を解説します。概要定義: 研究対象者自身を「対照」として用いる手法であり、アウトカムが発生した期間(リスク期間)とアウトカムが発生しなかった期間を比較する。曝露(例: ワクチン接種)が特定の時間枠内でアウトカムに影響を与えるかを検証する。特徴:被験者は全員がアウトカムを経験している。。個人内でリスク要因とアウトカムの関連を評価するため、個人間の交絡因子の影響を排除できる。メリット交絡因子を排除: 年齢、性別、遺伝的要因など、個人間の違いを完全に除外できる。高い効率性: 対照群を設定する必要がなく、症例データのみで解析可能。時間依存性の解析に適合: 特定のリスク期間(曝露後の一定期間など)の影響を直接評価可能。デメリット全てのアウトカムには適用不可: アウトカムが再発しない事象(例: 死亡)では適用困難。解析が複雑: 時間枠やリスク期間の設定が不適切だと、結果が正確でなくなる可能性がある。リスク期間の仮定: 曝露とアウトカムの...
0
統計

逆確率重み付け法(Inverse Probability Treatment WeightingIPTW)と傾向スコアマッチング

IPTW(Inverse Probability Treatment Weighting)と通常の傾向スコアマッチング(Propensity Score Matching, PSM)は、いずれも傾向スコア(propensity score)を用いて交絡因子を調整し、観察研究で因果推論を行うための手法です。しかし、アプローチや特性、結果に至る過程にいくつかの重要な違いがあります。傾向スコアマッチング(PSM)の概要手法:傾向スコアを用いて、治療群の患者と交絡因子が似た非治療群の患者を1対1、または1対多でマッチングします。マッチング後のペアを用いて治療効果を推定します。具体的な手順:傾向スコアを計算。傾向スコアが近い治療群と非治療群の患者をマッチング。マッチングされたデータセットを用いて治療効果を推定。目的:治療群と非治療群の交絡因子をバランスさせ、治療効果の「平均処置効果(ATE)」や「処置群における平均処置効果(Average Treatment Effect on the Treated, ATT)」を評価。IPTWの概要手法:傾向スコアを用いて各患者に「重み」を割り当て、全データ...
0
タイトルとURLをコピーしました