バリデーション

一般化可能性（Generalizability）と過適合（overfitting）ってなあに？

臨床研究などである疾患におけるリスク因子を同定するとき（例えば、IPFにおける死亡リスク因子）やバイオマーカーやAI、診断モデルの開発では、「開発（探索）コホート」と「検証コホート」を分けて解析を行うことが一般的です。まず、開発コホートでリスク因子の同定やモデル構築を行い、検証コホートでそれが機能するかどうかを確かめます。その目的は、モデルや結果の一般化可能性を確保し、過適合を防ぐことにあります。以下では、これらの概念を解説します。一般化可能性（Generalizability）とは？一般化可能性とは、モデルや研究結果が新しいデータや異なる集団に対しても同じように適用できる能力を指します。つまり、「特定のデータセットや環境だけでなく、他の状況でも有効に機能するか」を評価する概念です。なぜ一般化可能性が重要なんでしょうか？一般化可能性が高い研究やモデルは、リアルワールドのさまざまな状況で有用であり、信頼性の高い結果を提供します。逆に、一般化可能性が低い場合、そのモデルや結論は特定の環境に依存しており、新しいデータでは役に立たない可能性があります。具体例臨床研究例: ある薬の効果を調べる臨...

2025.01.02 2025.01.19 0

論文の書き方統計

開発コホートと検証コホートってなあに？

臨床研究などである疾患におけるリスク因子を同定するとき（例えば、IPFにおける死亡リスク因子）やバイオマーカーやAI、診断モデルの開発では、「開発（探索）コホート」と「検証コホート」を分けて解析を行うことが一般的です。まず、開発コホートでリスク因子の同定やモデル構築を行い、検証コホートでそれが機能するかどうかを確かめます。その目的は、モデルや結果の一般化可能性を確保し、過適合を防ぐことにあります。以下では、これらの概念を解説しながら、その重要性を順を追って説明します。開発コホートと検証コホートとは？開発コホートリスク因子の同定やモデルの構築、バイオマーカーの選定を行うためのデータセットです。検証コホート同定したリスク因子や開発したモデル、選定したバイオマーカーが別のデータセットでも有効かを確認するために使用されるデータセットです。ちなみに、開発コホート・検証コホートは以下のような表現を使うことがあります。開発コホート（Development Cohort）日本語での言い換え:学習用コホート:モデルを「学習」させるためのデータセットとして強調する場合に使われる。構築用データ:モデルの構築...

2025.01.01 2025.01.19 0

論文の書き方統計

タイトルとURLをコピーしました