data_processor
一個多範式 ETL 管線代理,支援批次與串流資料處理、自動結構推論以及可設定的 DAG 轉換,適用於異質資料來源。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 121 個技能
一個多範式 ETL 管線代理,支援批次與串流資料處理、自動結構推論以及可設定的 DAG 轉換,適用於異質資料來源。
使用 Lightkurve 進行天文光變曲線預處理與清潔。提供離群值移除、趨勢平滑化、去趨勢與資料品質標記處理工具,適用於天文時序資料分析。
使用 scikit-learn 進行經典機器學習。適用於分類、迴歸、分群、降維、資料預處理、模型評估,以及構建 Python 機器學習流程。
資料分析專員:進行探索性資料分析、統計建模、SQL 查詢與 Python 資料視覺化,透過嚴謹的量化方法將原始數據轉化為可操作的洞察。
載入並預處理保險保單週度 CSV 資料,支援自動化週期檢測、多週載入、資料驗證與清理。
為 pandas/polars/PySpark 生成數據清洗管道,處理缺失值、重複項、異常值、類型轉換及數據驗證。
一個模組化的數據處理工具,用於清理、驗證和分析 CSV 檔案,支援自定義轉換及自動化依賴管理。
一個全方位的數據分析助手,支援載入數據集、執行統計計算、視覺化趨勢並生成專業的分析總結報告。
用於質譜數據處理的 Python 工具包。支援質譜文件導入 (mzML, MGF, MSP)、元數據標準化、峰值過濾,以及代謝組學中的光譜相似度評分(餘弦、修正餘弦)計算。
建構並協調從資料準備、模型訓練、驗證到自動化部署的端到端 MLOps 管線。
全方位 Python 醫療 AI 工具包,用於臨床數據處理、醫學編碼轉換,以及開發用於 EHR、生理訊號和臨床預測任務的深度學習模型(如 RETAIN 與 Transformer)。
用於 LLM 後訓練(SFT/DPO/RLHF)的高品質數據集策劃指南,涵蓋數據格式、品質過濾與收集策略。