範囲: 電子医療記録を使用した来院時の将来の診断の予測
ホームページホームページ > ブログ > 範囲: 電子医療記録を使用した来院時の将来の診断の予測

範囲: 電子医療記録を使用した来院時の将来の診断の予測

Jun 14, 2024

Scientific Reports volume 13、記事番号: 11005 (2023) この記事を引用

633 アクセス

4 オルトメトリック

メトリクスの詳細

私たちは、過去の診断と検査結果に基づいて、遭遇時の可能性の高い診断を予測するための、解釈可能でスケーラブルなモデルを提案します。 このモデルは、医師が電子医療記録 (EHR) を操作するのを支援することを目的としています。 これを達成するために、私たちは、2008 年 1 月から 2016 年 12 月までの期間にわたって、スタンフォード ヘルスケアの患者 2,701,522 人の EHR データを遡及的に収集し、匿名化しました。患者の集団ベースのサンプルは、以下の症状を持つ 524,198 人 (男性 44%、女性 56%) で構成されています。少なくとも 1 つの頻繁に発生する診断コードとの複数の遭遇が選択されました。 バイナリ関連性ベースのマルチラベル モデリング戦略を使用して、過去の診断と検査結果に基づいて、遭遇時の ICD-10 診断コードを予測するための校正モデルが開発されました。 ロジスティック回帰とランダム フォレストが基本分類子としてテストされ、過去の診断とラボを集計するためにいくつかの時間枠がテストされました。 このモデリング手法はリカレント ニューラル ネットワーク ベースの深層学習手法と比較されました。 最良のモデルは、基本分類子としてランダム フォレストを使用し、人口統計学的特徴、診断コード、検査結果を統合しました。 最良のモデルが校正され、そのパフォーマンスは、583 疾患にわたる AUROC 中央値 0.904 (IQR [0.838, 0.954]) など、さまざまな指標の点で既存の方法と同等かそれ以上でした。 患者の疾患ラベルの最初の発生を予測する場合、最良のモデルの AUROC 中央値は 0.796 (IQR [0.737, 0.868]) でした。 私たちのモデリングアプローチは、テストされたディープラーニング手法と同等のパフォーマンスを示し、AUROC (p < 0.001) に関してはそれを上回りましたが、AUPRC に関してはパフォーマンスを下回りました (p < 0.001)。 モデルを解釈すると、このモデルが意味のある特徴を使用しており、診断と検査結果の間の多くの興味深い関連性を強調していることがわかりました。 マルチラベル モデルは、シンプルさと潜在的に優れた解釈可能性を提供しながら、RNN ベースの深層学習モデルと同等のパフォーマンスを発揮すると結論付けています。 このモデルは単一の機関から取得したデータに基づいてトレーニングおよび検証されましたが、そのシンプルさ、解釈可能性、およびパフォーマンスにより、導入の有望な候補となっています。

電子医療記録 (EHR) の広範な導入により、実世界のデータ ストリームから学習して適用できる大きな可能性がもたらされましたが、同時に医療従事者には直接的な患者ケアの機会を奪う文書作成事務の負担が生じています。 プライマリケアの医師は、勤務時間の半分を EHR とのやり取りに費やし 1、患者のケアに費やす時間を削減することもあります 2。 さらに、文書作成の負担により医師の満足度が低下し、燃え尽き症候群につながる可能性もあります3。 さらに、EHR データには偏りがあることが多く 4、データの欠落や不完全な問題が発生します 5、6。 ここでは、外来診察設定における EHR の可能性を引き出すために、これらの重要な課題に対処するための機械学習手法の開発を目指しています。

私たちの研究の主な焦点は、過去の病歴から患者の可能性の高い診断を予測することです。 近年、EHR から得られる過去の病歴から診断と患者の転帰を予測する一連の研究が行われています 7、8、9。 私たちの業務は外来診療のみを中心に行っております。 手法に関しては、最近の研究は深層学習アプローチに重点を置いています10。 ただし、ここでは、ロジスティック回帰やランダム フォレストなどの古典的な機械学習モデルを提案します。これらは、モジュール性とスケーラビリティだけでなく、より優れた解釈可能性を提供します。 最後に、1 つまたは少数の疾患だけに焦点を当てるのではなく 11、データの制約に従い、適切なレベルの粒度で広範囲の疾患にわたってこれらのモデルを評価します。 これは、外来患者が複数の慢性および急性疾患を患っていることが多く、単一疾患モデルは非常に便利ですが、複数の異種モデルを維持して有意義な予測を得るのがすぐに面倒になるという事実によって動機づけられています。 外来診療所での広範な実践をモデル化するための統一的なアプローチを紹介します。