工程開發
rdkit avatar

rdkit

用於分子分析與設計的化學資訊學工具包。使用 RDKit 進行 SMILES/SDF 解析、描述符計算(LogP, TPSA)、指紋生成、子結構搜索及化學反應建模。

簡介

RDKit 技能提供了一個全面的化學資訊學環境,實現了精確的分子控制與計算化學工作流。專為藥物發現、材料科學或分子建模領域的研究人員、藥物化學家及數據科學家設計。透過利用行業標準的 RDKit Python 函式庫,此技能允許用戶以程式化方式處理化學數據、自動化解析結構檔案,並進行先進的計算分析,無需手動介入複雜的流程。

  • 使用 SMILES 字串、MOL 檔案、MOL 區塊及 InChI 格式進行分子輸入輸出。

  • 執行自動化清潔處理,包括價數檢查、芳香性感知及手性指定。

  • 計算關鍵分子描述符,如分子量、LogP、TPSA 及用於藥物相似性的利平斯基五規則參數。

  • 透過 SDMolSupplier 和多執行緒讀取器對大型化學數據集進行批次處理。

  • 執行結構分析,包括環感知 (SSSR)、碎片識別、Murcko 骨架提取及子結構搜索。

  • 生成用於分子視覺化與空間分析的 2D 描繪與 3D 座標集。

  • 計算分子指紋 (RDKit, MACCS keys, Torsions) 以進行相似性評估與虛擬篩選。

  • 進行化學反應建模並程式化操作分子結構以進行庫枚舉。

  • 請務必使用條件檢查來驗證 Mol 物件以處理解析錯誤,無效輸入會返回 None。

  • RDKit 分子會進行自動化清潔;針對自定義處理或故障排除,可使用顯式標記來停用此行為。

  • 針對複雜工作流或高通量篩選,請優先使用多執行緒供應器以優化效能。

  • 使用 MurckoScaffold 模組將分子分解為核心骨架,以便進行藥物化學分析。

  • 執行相似性搜索時,請確保所選的指紋類型與骨架或屬性分析的具體需求相符。

  • 此工具旨在實現程式化控制;對於簡單的工作流,請評估高階封裝工具(如 datamol)是否提供更高效的切入點。

倉庫統計

Star 數
195
Fork 數
26
Open Issue 數
4
主要語言
Python
預設分支
main
同步狀態
閒置
最近同步時間
2026年4月30日 上午09:35
在 GitHub 查看