ディープラーニングでILD患者の急性増悪・死亡リスクを予測できるか？

Deep Learning for Predicting Acute Exacerbation and Mortality of Interstitial Lung Disease. Teramachi R, et al. Ann Am Thorac Soc. 2024.

名古屋大学からの報告です。

引用文献

📢 深層学習（ディープラーニング）で間質性肺疾患（ILD）患者の急性増悪・死亡リスクを予測！

名古屋大学からの報告です。
LSTM（Long Short-Term Memory）を活用した AIモデル が、日本の2つの病院（公立陶生病院・浜松医大）のコホートデータを基に開発されました。
このモデルは、ILDの急性増悪（AE）や死亡リスクを高精度に予測 することが可能とのことです。

🔹 従来の統計モデル（ILD-GAPなど）を超える予測能
🔹 CRP・好中球数・ILD-GAPスコア・大気汚染（PM2.5, SPM） などがリスク因子
🔹 外部検証でも高精度を維持し、臨床応用に期待✨

今後は多施設での検証を進め、データ収集と機械学習の強化により、さらなる精度向上が期待されます。
このAIが実用化されれば、日々の診療データや環境データをもとにAEや死亡リスクを予測し、最適な治療戦略を選択 できる未来が訪れるかもしれません。

💡 AIを活用したILD管理が、実臨床の重要なツールとなる日も近いかも！？

はじめに：この研究のデータの収集
背景
目的
方法
測定および主な結果
結語
まとめ
おまけ

はじめに：この研究のデータの収集

ILD診断時点からAE-ILDや死亡が発生するまで、もしくは観察期間終了までの縦断的データを収集しています。

具体的には、以下のようなデータを集め、LSTMという深層学習モデルを活用した機械学習を用いて、AE-ILDや死亡の発生を予測するモデルを作りました。

モデルの構築と検証
公立陶生病院のデータを用いて学習・検証・テストを行い、LSTMモデルを作成しています。

その後、浜松医科大学のデータを使って外部検証を行い、モデルの汎用性を評価しています。

また、このモデルの予測能（C-Index）が、従来よく使用されている ILD-GAP を用いた単変量Cox比例ハザードモデルや、複数の変数を用いた多変量Cox比例ハザードモデルと比較して優れているかどうかを検証しています。

収集した変数やアウトカム

患者背景情報（年齢、性別、喫煙歴など）
ILDの診断情報（疾患の種類、診断基準など）
合併症の情報（Charlson Comorbidity Indexを使用）
検査データ（血液検査、肺機能検査、6分間歩行テストなど）
治療データ（ステロイド、免疫抑制剤、抗線維化薬の使用状況）
AE-ILDと死亡の記録
環境データ（PM2.5やSPMなどの大気汚染物質、気温や降水量などの気象データ）

環境データは、日本の国立環境研究所や気象庁のデータを活用し、患者さんの居住地の近く（50km以内）の観測所から収集したそうです。

背景

一部の間質性肺疾患（ILD）患者は、死亡リスクが高かったり、急性増悪（AE-ILD）を起こして死亡率が上がることがある。

これらの高リスク患者を早期に特定し、重大なイベントの発生を正確に予測することは、治療方針を決める上で重要である。

しかし、ILDの経過にはさまざまな要因が影響し、正確な予測が難しい。

そこで、縦断的データ（時間の経過とともに得られる情報）を活用することで、より正確な予測が可能になると考えられる。

目的

AE-ILDまたは死亡のいずれかが初めて発生することを「複合アウトカム」として定義し、それを予測する深層学習（DL）モデルを開発することを目的とする。

方法

2008年1月から2015年12月にかけて、2つの専門施設において連続するILD患者の縦断的な臨床および環境データを後ろ向きに収集した。

DLモデルは、最初の施設の患者のうち80%のデータを用いて構築し、残り20%の患者と第2の施設のデータを用いて検証を行った。

開発したDLモデルは、ILD診断時点のデータを用いたILD gender-age-physiology（ILD-GAP）スコアを指標とする単変量Cox比例ハザード（CPH）モデルおよび多変量CPHモデルと比較した。

測定および主な結果

登録された1,175名の患者のうち、218名がAE-ILDを発症し、380名はAE-ILDを発症することなく死亡した。

12、24、36か月以内の複合アウトカムの予測における単変量/多変量CPHモデルの打ち切りコンコーダンス指数（C-index）は、内部検証においてそれぞれ0.789/0.843、0.788/0.853、0.787/0.853であり、外部検証においては0.650/0.718、0.652/0.756、0.640/0.756であった。

→C-index（予測の精度を示す指標）が・・・
内部検証（学習に使ったデータの一部で評価）では、多変量モデルのほうが単変量モデルより予測精度が高い。
外部検証（新しいデータで評価）では、モデルの予測精度がやや低下することを意味する。