工程開發資料分析研究
evaluation
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
瀏覽: 23★ 15,339
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 462 個技能
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
Shopify 整合工具,透過 Membrane CLI 管理電子商務數據、訂單、客戶資料與商店工作流程。
提供模型上下文協議 (MCP) 伺服器開發指南,涵蓋工具設計、資源處理及 AI/ML 整合模式。
基於 Model Context Protocol 的 AI 瀏覽器自動化伺服器,支援網頁互動、數據提取與深度研究。
為網站和應用程式生成具備一致視覺風格、線條粗細與密度的專業 SVG 圖示集,打造獨特的品牌 UI 識別。
管理、執行並更新 Gea 框架的 JS 框架基準測試,包含報告生成、HTML 結果刷新與效能比較。
生成、驗證並優化 Mermaid 圖表(如流程圖、時序圖、ERD 等),協助視覺化軟體系統架構與業務工作流程。
為小說家設計的結構化引導工具,涵蓋從創作憲法、故事規格到計畫、任務、撰寫與質量分析的七步創作方法論。
分析 Claude Code 聊天記錄以識別編程模式與技能差距,從 HackerNews 精選個人化學習資源,並將成長報告發送至 Slack。
專為 AI Agent 設計的網頁閱讀與搜索工具,透過 Jina AI Reader API 將網頁轉換為適合 LLM 閱讀的 Markdown、文字或 HTML 格式。
使用 Lightkurve 進行天文光變曲線預處理與清潔。提供離群值移除、趨勢平滑化、去趨勢與資料品質標記處理工具,適用於天文時序資料分析。
語言無關的後端架構模式,涵蓋 API 設計、身分驗證、安全性協定與資料庫建模。