工程開發資料分析研究
evaluation
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
瀏覽: 23★ 15,339
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 335 個技能
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
用於質譜數據處理的 Python 工具包。支援質譜文件導入 (mzML, MGF, MSP)、元數據標準化、峰值過濾,以及代謝組學中的光譜相似度評分(餘弦、修正餘弦)計算。
診斷、隔離並緩解 LLM 上下文故障(如中間丟失、中毒、干擾及衝突),提升 AI 代理的執行可靠性。
系統化的專案技術棧檢測、框架特定技能自動載入,以及針對 React + Go 等全端專案的多技術棧分析。
自動化建立隔離的 git worktree 環境,用於並行功能開發與環境設定。
自動化發票與收據整理,用於稅務準備。能讀取混亂的檔案、提取關鍵金融資訊、標準化檔名,並依照類別歸檔至邏輯資料夾。
自動保持 README 文件與代碼庫變更同步,涵蓋依賴項、新功能及配置更新。
llmemory 文件儲存與搜尋入門:涵蓋安裝、pgvector 資料庫設定、文件導入、混合/語義檢索,以及具備多租戶支援的 RAG 系統建構。
透過 7 步驟編輯框架系統性地優化行銷文案,提升清晰度、語氣與轉化率。
自動化 GitHub Issue 分析、分類與解決方案規劃工具,完全整合規格驅動開發 (SDD) 工作流程。
研究技術文件並自動生成可直接使用的 Markdown 格式軟體代理技能。
將工作階段的經驗轉化為可重用的智能基礎設施 (RII)。將一次性的修復與模式發現轉變為永久的代理執行知識,防止問題重現並加速後續開發。