evaluation
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 391 個技能
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
使用 ElevenLabs 將臨床文本轉換為自然且具同理心的語音,適用於病患衛教、服藥提醒及各類醫療輔助內容。
技術文件專業編寫團隊。透過 ORCHESTRATOR 原則調度專家,產出合規的產品指南、概念說明與 API 參考文件。
分析 Markdown 檔案以識別浪費 Token 的模式,並提供具體優化建議,以提高文件對 AI 的 Token 使用效率與清晰度。
Serena MCP 語義代碼分析指南。Serena MCP 連接時自動啟用,優先使用專用工具進行符號搜索、引用追蹤及代碼記憶,以優化分析效率與準確性。
PAI 的實體合成橋樑。生成藍圖、3D 列印代碼、雷射切割 SVG 路徑以及 CNC 加工 G-Code,將代理設計轉化為實體硬體。
分析搜尋結果 (SERP) 以進行使用者意圖分類、識別功能機會,並針對內容策略進行競爭情報分析。
透過 API 管理 YNAB 預算、追蹤支出並自動化財務報告。支援記帳、目標監控及自動化預算分析功能。
基於 Gemini 的進階網路搜尋外掛,具備智慧快取、子代理上下文隔離及自動查詢最佳化功能。
Archon 互動式整合工具,提供知識庫與專案管理功能。支援 RAG 語意搜尋、網站爬取、文件版本控制以及透過 REST API 進行階層式任務管理。
驗證並協調批次學習指南操作,透過強制執行模板相容性、檔案可用性及僅限來源政策,在代理程式執行前防止錯誤。
實作生產級 AI 代理。包含 LangGraph、工具調用護欄、SSE 串流、情節記憶與 pgvector。提供反模式分析與修正代碼。