研究
pyhealth avatar

pyhealth

全方位 Python 醫療 AI 工具包,用於臨床數據處理、醫學編碼轉換,以及開發用於 EHR、生理訊號和臨床預測任務的深度學習模型(如 RETAIN 與 Transformer)。

簡介

PyHealth 是一個專為醫療人工智慧與臨床機器學習研究而設計的全方位 Python 函式庫。它提供了一個專門的模組化管道,旨在簡化臨床數據從原始電子健康紀錄 (EHR) 到部署就緒預測模型的生命週期。此技能適用於處理複雜醫學數據集與診斷架構的臨床研究人員、數據科學家及醫療 AI 工程師。該函式庫針對效能進行了優化,處理速度顯著高於標準 pandas 工作流,非常適合大規模臨床隊列分析。

  • 完整支援各類主要醫療數據集,包括 MIMIC-III、MIMIC-IV、eICU 及 OMOP CDM。

  • 強大的醫學編碼轉換引擎,涵蓋 ICD-9/10、NDC、RxNorm、ATC 及 CCS 系統,用於數據標準化。

  • 預定義臨床預測任務庫,涵蓋死亡率預測、再入院風險、藥物推薦及住院天數預測。

  • 豐富的 33 種以上專用模型庫,包括 RETAIN、SafeDrug、GAMENet、StageNet、AdaCare 以及用於 EHR 的先進 Transformer 與 GNN 架構。

  • 針對序列事件、生理訊號 (EEG, ECG)、醫學影像及臨床文本的高級預處理能力。

  • 整合式訓練與評估模組,支援公平性指標、校準、可解釋性分析及不確定性量化。

  • 當您需要對 EHR 數據進行預測建模、在不同醫學編碼系統間進行轉換,或構建臨床決策支援工具時,請調用此技能。

  • 在匯入數據前,請確保數據集已按照標準 EHR 結構(Patients, Visits, Events)進行格式化,本技能提供專用的介面與轉換器。

  • 對於生理訊號任務,請先利用專用的預處理工具處理採樣率與時間對齊,再將數據輸入深度學習模型。

  • 使用模型選擇模組來比較傳統邏輯迴歸與複雜的醫療專用神經網路,以評估模型性能。

  • 本工具包可高效處理高維度稀疏臨床數據;在對縱向患者數據訓練基於 Transformer 的架構時,請確保運算環境具備充足的 GPU 記憶體。

倉庫統計

Star 數
19,784
Fork 數
2,208
Open Issue 數
41
主要語言
Python
預設分支
main
同步狀態
閒置
最近同步時間
2026年4月30日 上午11:18
在 GitHub 查看