工程開發資料分析研究
training-data-curation
用於 LLM 後訓練(SFT/DPO/RLHF)的高品質數據集策劃指南,涵蓋數據格式、品質過濾與收集策略。
瀏覽: 10★ 149
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 138 個技能
用於 LLM 後訓練(SFT/DPO/RLHF)的高品質數據集策劃指南,涵蓋數據格式、品質過濾與收集策略。
一個多範式 ETL 管線代理,支援批次與串流資料處理、自動結構推論以及可設定的 DAG 轉換,適用於異質資料來源。
戰略性測試數據生成、管理與隱私合規,用於構建可擴展、安全且逼真的品質工程工作流。
提供用於藥物開發的 AI 就緒數據集、基準測試與分子預測工具,涵蓋 ADME、毒性、藥物-目標交互作用及分子生成任務。
資料分析專員:進行探索性資料分析、統計建模、SQL 查詢與 Python 資料視覺化,透過嚴謹的量化方法將原始數據轉化為可操作的洞察。
高效能文件智慧程式庫,可從 91 種以上檔案格式中提取文字、表格、程式碼與後設資料,並支援 OCR 與 LLM 格式輸出。
使用 scikit-learn 進行經典機器學習。適用於分類、迴歸、分群、降維、資料預處理、模型評估,以及構建 Python 機器學習流程。
提升影像品質、解析度與清晰度,專為螢幕截圖與數位媒體設計。適用於專業文件、部落格與簡報。
使用結構化 JSON 提示詞與自動化 Python 腳本生成高品質的圖像、角色與場景,支援參考圖像以進行精確的視覺創作。
使用 Google Gemini 3 Pro 模型生成與編輯圖像、圖表和資訊圖表。支援文字轉圖像、風格轉換及數據準確的視覺化創作。
為 pandas/polars/PySpark 生成數據清洗管道,處理缺失值、重複項、異常值、類型轉換及數據驗證。
使用 ImageMagick 處理和操作圖像。支援調整大小、格式轉換、批次處理及檢索圖像元數據,適合開發人員與自動化工作流程。