polars
高性能 Python 與 Rust 記憶體內 DataFrame 函式庫。支援延遲計算、平行處理,並使用 Apache Arrow 引擎,適用於高效 ETL、數據處理及加速 pandas 工作流。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 120 個技能
高性能 Python 與 Rust 記憶體內 DataFrame 函式庫。支援延遲計算、平行處理,並使用 Apache Arrow 引擎,適用於高效 ETL、數據處理及加速 pandas 工作流。
適用於 Python 的互動式繪圖函式庫,支援超過 40 種圖表類型、科學視覺化、統計分析以及透過 Plotly Express 與 Graph Objects 建立網頁儀表板。
為 pandas/polars/PySpark 生成數據清洗管道,處理缺失值、重複項、異常值、類型轉換及數據驗證。
全方位 Python 醫療 AI 工具包,用於臨床數據處理、醫學編碼轉換,以及開發用於 EHR、生理訊號和臨床預測任務的深度學習模型(如 RETAIN 與 Transformer)。
使用 LLVM XRay 追蹤 Rspack Rust 函式呼叫,用於效能分析、故障排除及視覺化執行流程。
載入並預處理保險保單週度 CSV 資料,支援自動化週期檢測、多週載入、資料驗證與清理。
使用 DuckDB 讀取並分析任何資料檔案 (CSV, JSON, Parquet, Avro, Excel 等) 或遠端連結 (S3, HTTPS)。自動偵測檔案格式並進行資料概覽與分析。
用於儲存分塊 N 維陣列的高效能 Python 技能。支援雲端儲存 (S3/GCS)、平行 I/O,並與 NumPy、Dask 及 Xarray 無縫整合,適用於大規模科學運算。
一個模組化的數據處理工具,用於清理、驗證和分析 CSV 檔案,支援自定義轉換及自動化依賴管理。
用於地理空間向量數據分析的 Python 庫。利用 GeoPandas、shapely 及交互式工具進行空間連接、幾何運算、坐標轉換與地圖繪製。
HealthSim 跨產品數據持久化、SSN 實體關聯及 DuckDB 資料庫操作的基礎設施。
全方位的 PDF 處理工具包,支援文字與表格提取、文件合併/分割、旋轉以及 PDF 文件自動化生成與填寫,提供 Python 與命令列工具整合。