Deep Learning for Predicting Acute Exacerbation and Mortality of Interstitial Lung Disease. Teramachi R, et al. Ann Am Thorac Soc. 2024.
名古屋大学からの報告です。

📢 深層学習(ディープラーニング)で間質性肺疾患(ILD)患者の急性増悪・死亡リスクを予測!
名古屋大学からの報告です。
LSTM(Long Short-Term Memory)を活用した AIモデル が、日本の2つの病院(公立陶生病院・浜松医大)のコホートデータを基に開発されました。
このモデルは、ILDの急性増悪(AE)や死亡リスクを高精度に予測 することが可能とのことです。
🔹 従来の統計モデル(ILD-GAPなど)を超える予測能
🔹 CRP・好中球数・ILD-GAPスコア・大気汚染(PM2.5, SPM) などがリスク因子
🔹 外部検証でも高精度を維持し、臨床応用に期待✨
今後は多施設での検証を進め、データ収集と機械学習の強化により、さらなる精度向上が期待されます。
このAIが実用化されれば、日々の診療データや環境データをもとにAEや死亡リスクを予測し、最適な治療戦略を選択 できる未来が訪れるかもしれません。
💡 AIを活用したILD管理が、実臨床の重要なツールとなる日も近いかも!?
はじめに:この研究のデータの収集
ILD診断時点からAE-ILDや死亡が発生するまで、もしくは観察期間終了までの 縦断的データ を収集しています。
具体的には、以下のようなデータを集め、LSTMという 深層学習モデルを活用した機械学習 を用いて、AE-ILDや死亡の発生を予測するモデルを作りました。
モデルの構築と検証
公立陶生病院のデータを用いて 学習・検証・テスト を行い、LSTMモデルを作成しています。
その後、浜松医科大学のデータを使って 外部検証 を行い、モデルの汎用性を評価しています。
また、このモデルの予測能(C-Index)が、従来よく使用されている ILD-GAP を用いた単変量Cox比例ハザードモデルや、複数の変数を用いた多変量Cox比例ハザードモデルと比較して 優れているかどうか を検証しています。
収集した変数やアウトカム
- 患者背景情報(年齢、性別、喫煙歴など)
- ILDの診断情報(疾患の種類、診断基準など)
- 合併症の情報(Charlson Comorbidity Indexを使用)
- 検査データ(血液検査、肺機能検査、6分間歩行テストなど)
- 治療データ(ステロイド、免疫抑制剤、抗線維化薬の使用状況)
- AE-ILDと死亡の記録
- 環境データ(PM2.5やSPMなどの大気汚染物質、気温や降水量などの気象データ)

環境データ は、日本の 国立環境研究所 や 気象庁 のデータを活用し、患者さんの 居住地の近く(50km以内) の観測所から収集したそうです。
背景
一部の間質性肺疾患(ILD)患者は、死亡リスクが高かったり、急性増悪(AE-ILD)を起こして死亡率が上がることがある。
これらの高リスク患者を早期に特定し、重大なイベントの発生を正確に予測することは、治療方針を決める上で重要である。
しかし、ILDの経過にはさまざまな要因が影響し、正確な予測が難しい。
そこで、縦断的データ(時間の経過とともに得られる情報)を活用することで、より正確な予測が可能になると考えられる。
目的
AE-ILDまたは死亡のいずれかが初めて発生することを「複合アウトカム」として定義し、それを予測する深層学習(DL)モデルを開発することを目的とする。
方法
2008年1月から2015年12月にかけて、2つの専門施設において連続するILD患者の縦断的な臨床および環境データを後ろ向きに収集した。
DLモデルは、最初の施設の患者のうち80%のデータを用いて構築し、残り20%の患者と第2の施設のデータを用いて検証を行った。
開発したDLモデルは、ILD診断時点のデータを用いたILD gender-age-physiology(ILD-GAP)スコアを指標とする単変量Cox比例ハザード(CPH)モデルおよび多変量CPHモデルと比較した。
測定および主な結果
- 登録された1,175名の患者のうち、218名がAE-ILDを発症し、380名はAE-ILDを発症することなく死亡した。
- 12、24、36か月以内の複合アウトカムの予測における単変量/多変量CPHモデルの打ち切りコンコーダンス指数(C-index)は、内部検証においてそれぞれ0.789/0.843、0.788/0.853、0.787/0.853であり、外部検証においては0.650/0.718、0.652/0.756、0.640/0.756であった。
→C-index(予測の精度を示す指標)が・・・
内部検証(学習に使ったデータの一部で評価)では、多変量モデルのほうが単変量モデルより予測精度が高い。
外部検証(新しいデータで評価)では、モデルの予測精度がやや低下することを意味する。
- ILD診断後12か月時点での複合アウトカムの予測において、DLモデルのC-indexは、内部検証では0.842であり、単変量CPHモデル(0.840)および多変量CPHモデル(0.839)を上回った。
→つまり、DLモデルのほうが少し優れた予測ができる可能性を示している。
- 外部検証では、それぞれ0.803、0.744、0.746であり、DLモデルの優位性が示された。
→つまり、外部データにおいてもDLモデルの予測精度が良いことを示している。
- さらに、好中球数、C反応性蛋白(CRP)、ILD-GAPスコア、および浮遊粒子状物質への曝露が、複合アウトカムと強く関連していた。
→つまり、これらの要因が高いと、AE-ILDや死亡のリスクが上がる可能性がある。
結語
DLモデルは、縦断的データを用いることで、AE-ILDまたは死亡の発生を高精度で予測することが可能である。
まとめ

- 今回の研究では、ILD患者さんの長期的なデータをAIで機械学習し、AE-ILDや死亡の発生を予測する深層学習モデルを開発しました。
- その結果、このDLモデルは従来の統計モデルよりも高い予測精度を示し、特に新しいデータに対しても精度を維持できることがわかったんですね。
- つまり、ILD患者さんのデータを縦断的にAIに学習させることで、AE-ILDの発生や死亡リスクをより高精度に予測できる可能性があるということです。

- さらに、機械学習を用いてAE-ILDや死亡の発生に関わる要因を分析したところ、好中球数、CRP、ILD-GAPスコア、浮遊粒子状物質への曝露などが、これらのイベントと深く関係していることが明らかになりました。
- 今後は、多施設での研究や前向き研究を通じて、このモデルの有効性をさらに検証し、実臨床での活用につなげていくことが求められそうです。
おまけ
LSTMとは?
LSTM(Long Short-Term Memory)は、深層学習(ディープラーニング)の一種であるRNN(リカレントニューラルネットワーク)を改良したモデルです。
特に、時系列データ(時間の流れがあるデータ)を扱うのが得意なモデルです。
そもそも深層学習(ディープラーニング)とは?
深層学習とは、人間の脳のように学習するコンピュータの仕組みのことです。
たとえば、AIが「猫の画像を見て猫だと判断する」ようなことを実現します。
これは、ニューラルネットワーク(脳の神経細胞のようなもの)を何層も重ねて情報を処理することで可能になります。
深層学習の主な種類
- CNN(畳み込みニューラルネットワーク) → 画像認識に強い
- RNN(リカレントニューラルネットワーク) → 時系列データ(文章や音声など)を扱う
- LSTM(ロング・ショートターム・メモリ) → RNNを改良し、長期間の情報を記憶できる
LSTMの特徴
普通のRNNには「長期記憶が苦手」という問題があります。
つまり、長い文章や過去の情報を記憶するのが難しく、古い情報が忘れられてしまいます。
LSTMは、この問題を解決するために**「記憶の仕組み(メモリセル)」**を持っています。
これにより、過去の重要な情報を長期間覚えておくことができるのです。
例えば、
✅ 普通のRNN → 「今日の天気は…(直前の単語だけ覚えている)」
✅ LSTM → 「昨日から雨が続いているから、今日も雨の可能性が高い(過去の情報も覚えている)」
LSTMの活用例
LSTMは、時間の流れがあるデータを扱うのが得意なので、次のような分野で活用されています。
✔ 自然言語処理(NLP)
👉 文章の翻訳・要約、チャットボット、感情分析 など
✔ 音声認識
👉 SiriやGoogle音声入力などの音声アシスタント
✔ 株価予測・時系列分析
👉 過去のデータから未来の値動きを予測
✔ 動画解析
👉 映像の中の動きを分析し、行動認識を行う
まとめ
- LSTMは「時系列データを扱う」のが得意な深層学習モデル
- 普通のRNNよりも長期間の情報を覚えられる
- 文章、音声、株価予測などに活用される
これがLSTMの基本的な仕組みです!