研究
pyhealth avatar

pyhealth

全方位 Python 医疗 AI 工具包,用于临床数据处理、医学编码转换,以及开发用于 EHR、生理信号和临床预测任务的深度学习模型(如 RETAIN 与 Transformer)。

简介

PyHealth 是一个专为医疗人工智能与临床机器学习研究而设计的全方位 Python 函数库。它提供了一个专门的模块化管道,旨在简化临床数据从原始电子健康记录 (EHR) 到部署就绪预测模型的生命周期。此技能适用于处理复杂医学数据集与诊断架构的临床研究人员、数据科学家及医疗 AI 工程师。该函数库针对性能进行了优化,处理速度显著高于标准 pandas 工作流,非常适合大规模临床队列分析。

  • 完整支持各类主要医疗数据集,包括 MIMIC-III、MIMIC-IV、eICU 及 OMOP CDM。

  • 强大的医学编码转换引擎,涵盖 ICD-9/10、NDC、RxNorm、ATC 及 CCS 系统,用于数据标准化。

  • 预定义临床预测任务库,涵盖死亡率预测、再入院风险、药物推荐及住院天数预测。

  • 丰富的 33 种以上专用模型库,包括 RETAIN、SafeDrug、GAMENet、StageNet、AdaCare 以及用于 EHR 的先进 Transformer 与 GNN 架构。

  • 针对序列事件、生理信号 (EEG, ECG)、医学影像及临床文本的高级预处理能力。

  • 整合式训练与评估模块,支持公平性指标、校准、可解释性分析及不确定性量化。

  • 当您需要对 EHR 数据进行预测建模、在不同医学编码系统间进行转换,或构建临床决策支持工具时,请调用此技能。

  • 在导入数据前,请确保数据集已按照标准 EHR 结构(Patients, Visits, Events)进行格式化,本技能提供专用的接口与转换器。

  • 对于生理信号任务,请先利用专用的预处理工具处理采样率与时间对齐,再将数据输入深度学习模型。

  • 使用模型选择模块来比较传统逻辑回归与复杂的医疗专用神经网络,以评估模型性能。

  • 本工具包可高效处理高维度稀疏临床数据;在对纵向患者数据训练基于 Transformer 的架构时,请确保运算环境具备充足的 GPU 内存。

仓库统计

Star 数
19,784
Fork 数
2,208
Open Issue 数
41
主要语言
Python
默认分支
main
同步状态
空闲
最近同步时间
2026年4月30日 11:18
在 GitHub 查看