工程開發資料分析研究
evaluation
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
瀏覽: 23★ 15,339
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 243 個技能
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
為 OpenClaw 技能開發提供多代理迭代優化與品質把關,透過標準化測試與生命週期管理提升技能效能。
驗證 n8n 表達式語法,執行上下文感知測試,檢測常見陷阱,並優化工作流程中的數據轉換。
indiiOS 的自動遞迴執行引擎,負責管理任務完成、狀態驗證與錯誤處理。
使用三個專門 AI 代理(正確性、程式碼健康度、UX)組成的團隊進行協作式 PR 審查,討論並達成共識後發布包含行內註解的結構化審查摘要。
分析 GA4 與 GSC 數據,透過自動化基準測試、狀態指標及可執行的內容優化建議,提升網站成效。
自動化會話清理與文件管理工具。主動更新 CLAUDE.md、偵測自動化模式、提取學習心得並整理待辦事項。
使用「升級時刻方法」重新設計 SaaS 付費牆與升級頁面,最大化轉換率。
驗證 dotfiles 是否正確建立符號連結與同步,確保開發環境設定狀態健康與一致性。
Neuropixels 神經記錄分析工具。提供從 SpikeGLX/OpenEphys 資料載入、Kilosort4 Spike Sorting、運動校正、質量指標計算到 AI 輔助單元篩選的端到端分析流程。
Home Assistant OS (HAOS) 營運技能。提供唯讀診斷、自動化設計、健康審計及安全優先的配置管理功能。
根據結構化規範架構企業 AI 代理,生成生產就緒程式碼、資料流圖以及適用於 ServiceNow、Salesforce 和 Snowflake 的平台特定邏輯。