Deep Learning for Predicting Acute Exacerbation and Mortality of Interstitial Lung Disease. Teramachi R, et al. Ann Am Thorac Soc. 2024.
名古屋大学からの報告です。

📢 深層学習(ディープラーニング)で間質性肺疾患(ILD)患者の急性増悪・死亡リスクを予測!
名古屋大学からの報告です。
日本の2つの病院(公立陶生病院・浜松医大)のコホートデータを用い、LSTM(Long Short-Term Memory) という深層学習モデルを活用したILDの急性増悪(AE)や死亡を予測するAIモデル が発表されました。
✅ 従来の統計モデル(ILD-GAPなど)より高精度な予測能!
✅ CRP・好中球数・ILD-GAPスコア・大気汚染(PM2.5, SPM)などがリスク因子
✅ 外部検証でも高い予測精度を維持し、臨床応用に期待✨
今後は多施設での検証を進め、継続的なデータ収集と機械学習の強化 によって、さらなる精度向上が期待されます。
AIを活用したILD管理が、実臨床での重要なツールになる日も近いかもしれませんね!
データの収集
ILD診断時点からAE-ILDや死亡が発生するまで、もしくは観察期間終了までの 縦断的データ を収集しています。
具体的には、以下のようなデータを集め、LSTMという 深層学習モデルを活用した機械学習 を用いて、AE-ILDや死亡の発生を予測しました。
モデルの構築と検証
公立陶生病院のデータを用いて 学習・検証・テスト を行い、LSTMモデルを作成しています。
その後、浜松医科大学のデータを使って 外部検証 を行い、モデルの汎用性を評価しています。
また、このモデルの予測能(C-Index)が、従来よく使用されている ILD-GAP を用いた単変量Cox比例ハザードモデルや、複数の変数を用いた多変量Cox比例ハザードモデルと比較して 優れているかどうか を検証しています。
収集した変数やアウトカム
- 患者背景情報(年齢、性別、喫煙歴など)
- ILDの診断情報(疾患の種類、診断基準など)
- 合併症の情報(Charlson Comorbidity Indexを使用)
- 検査データ(血液検査、肺機能検査、6分間歩行テストなど)
- 治療データ(ステロイド、免疫抑制剤、抗線維化薬の使用状況)
- AE-ILDと死亡の記録
- 環境データ(PM2.5やSPMなどの大気汚染物質、気温や降水量などの気象データ)

環境データ は、日本の 国立環境研究所 や 気象庁 のデータを活用し、患者さんの 居住地の近く(50km以内) の観測所から収集したそうです。
背景
一部の間質性肺疾患(ILD)患者は、死亡リスクが高かったり、急性増悪(AE-ILD)を起こして死亡率が上がることがある。
これらの高リスク患者を早期に特定し、重大なイベントの発生を正確に予測することは、治療方針を決める上で重要である。
しかし、ILDの経過にはさまざまな要因が影響し、正確な予測が難しい。
そこで、縦断的データ(時間の経過とともに得られる情報)を活用することで、より正確な予測が可能になると考えられる。
目的
AE-ILDまたは死亡のいずれかが初めて発生することを「複合アウトカム」として定義し、それを予測する深層学習(DL)モデルを開発することを目的とする。
方法
2008年1月から2015年12月にかけて、2つの専門施設において連続するILD患者の縦断的な臨床および環境データを後ろ向きに収集した。
DLモデルは、最初の施設の患者のうち80%のデータを用いて構築し、残り20%の患者と第2の施設のデータを用いて検証を行った。
開発したDLモデルは、ILD診断時点のデータを用いたILD gender-age-physiology(ILD-GAP)スコアを指標とする単変量Cox比例ハザード(CPH)モデルおよび多変量CPHモデルと比較した。
測定および主な結果
- 登録された1,175名の患者のうち、218名がAE-ILDを発症し、380名はAE-ILDを発症することなく死亡した。
- 12、24、36か月以内の複合アウトカムの予測における単変量/多変量CPHモデルの打ち切りコンコーダンス指数(C-index)は、内部検証においてそれぞれ0.789/0.843、0.788/0.853、0.787/0.853であり、外部検証においては0.650/0.718、0.652/0.756、0.640/0.756であった。
→C-index(予測の精度を示す指標)が・・・
内部検証(学習に使ったデータの一部で評価)では、多変量モデルのほうが単変量モデルより予測精度が高い。
外部検証(新しいデータで評価)では、モデルの予測精度がやや低下することを意味する。
- ILD診断後12か月時点での複合アウトカムの予測において、DLモデルのC-indexは、内部検証では0.842であり、単変量CPHモデル(0.840)および多変量CPHモデル(0.839)を上回った。
→つまり、DLモデルのほうが少し優れた予測ができる可能性を示している。
- 外部検証では、それぞれ0.803、0.744、0.746であり、DLモデルの優位性が示された。
→つまり、外部データにおいてもDLモデルの予測精度が良いことを示している。
- さらに、好中球数、C反応性蛋白(CRP)、ILD-GAPスコア、および浮遊粒子状物質への曝露が、複合アウトカムと強く関連していた。
→つまり、これらの要因が高いと、AE-ILDや死亡のリスクが上がる可能性がある。
結語
DLモデルは、縦断的データを用いることで、AE-ILDまたは死亡の発生を高精度で予測することが可能である。
まとめ

- 今回の研究では、ILD患者さんの長期的なデータをAIで機械学習し、AE-ILDや死亡の発生を予測する深層学習モデルを開発しました。
- その結果、このDLモデルは従来の統計モデルよりも高い予測精度を示し、特に新しいデータに対しても精度を維持できることがわかったんですね。
- つまり、ILD患者さんのデータを縦断的にAIに学習させることで、AE-ILDの発生や死亡リスクをより高精度に予測できる可能性があるということです。

- さらに、機械学習を用いてAE-ILDや死亡の発生に関わる要因を分析したところ、好中球数、CRP、ILD-GAPスコア、浮遊粒子状物質(SPM)への曝露などが、これらのイベントと深く関係していることが明らかになりました。
- 今後は、多施設での研究や前向き研究を通じて、このモデルの有効性をさらに検証し、実臨床での活用につなげていくことが求められそうです。