polars
高性能 Python 与 Rust 内存内 DataFrame 库。支持延迟计算、并行处理,并使用 Apache Arrow 引擎,适用于高效 ETL、数据处理及加速 pandas 工作流。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 120 个技能
高性能 Python 与 Rust 内存内 DataFrame 库。支持延迟计算、并行处理,并使用 Apache Arrow 引擎,适用于高效 ETL、数据处理及加速 pandas 工作流。
适用于 Python 的交互式绘图库,支持超过 40 种图表类型、科学可视化、统计分析以及通过 Plotly Express 和 Graph Objects 构建 Web 仪表板。
为 pandas/polars/PySpark 生成数据清洗管道,处理缺失值、重复项、异常值、类型转换及数据验证。
全方位 Python 医疗 AI 工具包,用于临床数据处理、医学编码转换,以及开发用于 EHR、生理信号和临床预测任务的深度学习模型(如 RETAIN 与 Transformer)。
使用 LLVM XRay 追踪 Rspack Rust 函数调用,用于性能分析、故障排除及可视化执行流程。
加载并预处理保险保单周度 CSV 数据,支持智能周期检测、多周数据加载、数据验证和清洗。
使用 DuckDB 读取并分析任何数据文件 (CSV, JSON, Parquet, Avro, Excel 等) 或远程链接 (S3, HTTPS)。自动检测文件格式并进行数据概览与分析。
用于存储分块 N 维阵列的高性能 Python 技能。支持云存储 (S3/GCS)、并行 I/O,并与 NumPy、Dask 及 Xarray 无缝集成,适用于大规模科学计算。
一个模块化的数据处理工具,用于清理、验证和分析 CSV 文件,支持自定义转换及自动化依赖管理。
用于地理空间向量数据分析的 Python 库。利用 GeoPandas、shapely 及交互式工具进行空间连接、几何运算、坐标转换与地图绘制。
HealthSim 跨产品数据持久化、SSN 实体关联及 DuckDB 数据库操作的基础设施。
全方位的 PDF 处理工具包,支持文字与表格提取、文档合并/分割、旋转以及 PDF 文件自动化生成与填写,提供 Python 与命令行工具集成。