資料分析工程開發自動化
data-cleaning-pipeline-generator
為 pandas/polars/PySpark 生成數據清洗管道,處理缺失值、重複項、異常值、類型轉換及數據驗證。
瀏覽: 10★ 5
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 129 個技能
為 pandas/polars/PySpark 生成數據清洗管道,處理缺失值、重複項、異常值、類型轉換及數據驗證。
載入並預處理保險保單週度 CSV 資料,支援自動化週期檢測、多週載入、資料驗證與清理。
一個全方位的數據分析助手,支援載入數據集、執行統計計算、視覺化趨勢並生成專業的分析總結報告。
一個模組化的數據處理工具,用於清理、驗證和分析 CSV 檔案,支援自定義轉換及自動化依賴管理。
用於 LLM 後訓練(SFT/DPO/RLHF)的高品質數據集策劃指南,涵蓋數據格式、品質過濾與收集策略。
自動化移除程式碼中多餘或顯而易見的註解,同時保留重要的架構與邏輯說明,優化程式碼的可讀性與品質。
研究技術文件並自動生成可直接使用的 Markdown 格式軟體代理技能。
基於 scverse 最佳實踐的自動化單細胞 RNA-seq 品質控制工具。支援 .h5ad 與 .h5 格式,提供 MAD 離群值檢測、細胞過濾及統計視覺化分析。
實作強健的伺服器端與用戶端輸入驗證,運用清理與白名單機制,預防注入攻擊並確保資料完整性。
資料分析專員:進行探索性資料分析、統計建模、SQL 查詢與 Python 資料視覺化,透過嚴謹的量化方法將原始數據轉化為可操作的洞察。
使用 Lightkurve 進行天文光變曲線預處理與清潔。提供離群值移除、趨勢平滑化、去趨勢與資料品質標記處理工具,適用於天文時序資料分析。
為 Clawdbot 審核、清理與優化向量記憶體。防止 Token 浪費,清除無效垃圾資料,並透過 LanceDB 維護自動化記憶體清潔。