rdkit
用於分子分析與設計的化學資訊學工具包。使用 RDKit 進行 SMILES/SDF 解析、描述符計算(LogP, TPSA)、指紋生成、子結構搜索及化學反應建模。
簡介
RDKit 技能提供了一個全面的化學資訊學環境,實現了精確的分子控制與計算化學工作流。專為藥物發現、材料科學或分子建模領域的研究人員、藥物化學家及數據科學家設計。透過利用行業標準的 RDKit Python 函式庫,此技能允許用戶以程式化方式處理化學數據、自動化解析結構檔案,並進行先進的計算分析,無需手動介入複雜的流程。
-
使用 SMILES 字串、MOL 檔案、MOL 區塊及 InChI 格式進行分子輸入輸出。
-
執行自動化清潔處理,包括價數檢查、芳香性感知及手性指定。
-
計算關鍵分子描述符,如分子量、LogP、TPSA 及用於藥物相似性的利平斯基五規則參數。
-
透過 SDMolSupplier 和多執行緒讀取器對大型化學數據集進行批次處理。
-
執行結構分析,包括環感知 (SSSR)、碎片識別、Murcko 骨架提取及子結構搜索。
-
生成用於分子視覺化與空間分析的 2D 描繪與 3D 座標集。
-
計算分子指紋 (RDKit, MACCS keys, Torsions) 以進行相似性評估與虛擬篩選。
-
進行化學反應建模並程式化操作分子結構以進行庫枚舉。
-
請務必使用條件檢查來驗證 Mol 物件以處理解析錯誤,無效輸入會返回 None。
-
RDKit 分子會進行自動化清潔;針對自定義處理或故障排除,可使用顯式標記來停用此行為。
-
針對複雜工作流或高通量篩選,請優先使用多執行緒供應器以優化效能。
-
使用 MurckoScaffold 模組將分子分解為核心骨架,以便進行藥物化學分析。
-
執行相似性搜索時,請確保所選的指紋類型與骨架或屬性分析的具體需求相符。
-
此工具旨在實現程式化控制;對於簡單的工作流,請評估高階封裝工具(如 datamol)是否提供更高效的切入點。
倉庫統計
- Star 數
- 195
- Fork 數
- 26
- Open Issue 數
- 4
- 主要語言
- Python
- 預設分支
- main
- 同步狀態
- 閒置
- 最近同步時間
- 2026年4月30日 上午09:35