工程开发
rdkit avatar

rdkit

用于分子分析与设计的化学信息学工具包。使用 RDKit 进行 SMILES/SDF 解析、描述符计算(LogP, TPSA)、指纹生成、子结构搜索及化学反应建模。

简介

RDKit 技能提供了一个全面的化学信息学环境,实现了精确的分子控制与计算化学工作流。专为药物发现、材料科学或分子建模领域的研究人员、药物化学家及数据科学家设计。通过利用行业标准的 RDKit Python 库,此技能允许用户以程序化方式处理化学数据、自动化解析结构文件,并进行先进的计算分析,无需手动介入复杂的流程。

  • 使用 SMILES 字符串、MOL 文件、MOL 区块及 InChI 格式进行分子输入输出。

  • 执行自动化清理处理,包括价数检查、芳香性感知及手性指定。

  • 计算关键分子描述符,如分子量、LogP、TPSA 及用于药物相似性的利平斯基五规则参数。

  • 通过 SDMolSupplier 和多线程读取器对大型化学数据集进行批处理。

  • 执行结构分析,包括环感知 (SSSR)、碎片识别、Murcko 骨架提取及子结构搜索。

  • 生成用于分子可视化与空间分析的 2D 描绘与 3D 坐标集。

  • 计算分子指纹 (RDKit, MACCS keys, Torsions) 以进行相似性评估与虚拟筛选。

  • 进行化学反应建模并程序化操作分子结构以进行库枚举。

  • 请务必使用条件检查来验证 Mol 对象以处理解析错误,无效输入会返回 None。

  • RDKit 分子会进行自动化清理;针对自定义处理或故障排除,可使用显式标记来禁用此行为。

  • 针对复杂工作流或高通量筛选,请优先使用多线程供应器以优化性能。

  • 使用 MurckoScaffold 模块将分子分解为核心骨架,以便进行药物化学分析。

  • 执行相似性搜索时,请确保所选的指纹类型与骨架或属性分析的具体需求相符。

  • 此工具旨在实现程序化控制;对于简单的工作流,请评估高阶封装工具(如 datamol)是否提供更高效的切入点。

仓库统计

Star 数
195
Fork 数
26
Open Issue 数
4
主要语言
Python
默认分支
main
同步状态
空闲
最近同步时间
2026年4月30日 09:35
在 GitHub 查看