rdkit
用于分子分析与设计的化学信息学工具包。使用 RDKit 进行 SMILES/SDF 解析、描述符计算(LogP, TPSA)、指纹生成、子结构搜索及化学反应建模。
简介
RDKit 技能提供了一个全面的化学信息学环境,实现了精确的分子控制与计算化学工作流。专为药物发现、材料科学或分子建模领域的研究人员、药物化学家及数据科学家设计。通过利用行业标准的 RDKit Python 库,此技能允许用户以程序化方式处理化学数据、自动化解析结构文件,并进行先进的计算分析,无需手动介入复杂的流程。
-
使用 SMILES 字符串、MOL 文件、MOL 区块及 InChI 格式进行分子输入输出。
-
执行自动化清理处理,包括价数检查、芳香性感知及手性指定。
-
计算关键分子描述符,如分子量、LogP、TPSA 及用于药物相似性的利平斯基五规则参数。
-
通过 SDMolSupplier 和多线程读取器对大型化学数据集进行批处理。
-
执行结构分析,包括环感知 (SSSR)、碎片识别、Murcko 骨架提取及子结构搜索。
-
生成用于分子可视化与空间分析的 2D 描绘与 3D 坐标集。
-
计算分子指纹 (RDKit, MACCS keys, Torsions) 以进行相似性评估与虚拟筛选。
-
进行化学反应建模并程序化操作分子结构以进行库枚举。
-
请务必使用条件检查来验证 Mol 对象以处理解析错误,无效输入会返回 None。
-
RDKit 分子会进行自动化清理;针对自定义处理或故障排除,可使用显式标记来禁用此行为。
-
针对复杂工作流或高通量筛选,请优先使用多线程供应器以优化性能。
-
使用 MurckoScaffold 模块将分子分解为核心骨架,以便进行药物化学分析。
-
执行相似性搜索时,请确保所选的指纹类型与骨架或属性分析的具体需求相符。
-
此工具旨在实现程序化控制;对于简单的工作流,请评估高阶封装工具(如 datamol)是否提供更高效的切入点。
仓库统计
- Star 数
- 195
- Fork 数
- 26
- Open Issue 数
- 4
- 主要语言
- Python
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年4月30日 09:35