evaluation
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 163 個技能
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
診斷、隔離並緩解 LLM 上下文故障(如中間丟失、中毒、干擾及衝突),提升 AI 代理的執行可靠性。
專注於 Trigger.dev 背景任務與 AI 工作流的專家助手,協助開發、設計與優化高可靠性的非同步 TypeScript 任務架構。
Refly 生態系統基礎技能。用於建立、探索及執行特定領域技能,透過符號連結路由使用者意圖至工作流程,並透過 Refly CLI 自動化執行多步驟任務。
為 AI 代理實作自動化的關鍵自我驗證層,在完成任務前確保程式碼品質、安全性及需求一致性。
一套管理 LLM 專案生命週期的框架,涵蓋評估任務模型契合度、架構設計、結構化輸出解析及代理輔助開發流程。
一套設計系統與反模式指南,讓 AI 生成的介面更具人工質感。透過管理色彩、排版、間距與動畫,為 Toh Framework 提供專業的視覺品質。
多模型代碼審查工作流,通過共識機制進行代碼質量與安全分析。
使用 AI 模型(如 FLUX 和 Gemini)生成或編輯影像。適用於照片、插圖、概念藝術和視覺素材,不包含技術圖表或原理圖。
為 LLM 設定的程式開發行為準則,旨在減少錯誤、落實最佳實踐,並透過強調簡潔性、精確修改與目標導向驗證來提升代碼品質。
透過管理 conductor/ 目錄中的專案環境工件(產品、技術棧、工作流程、追蹤)來標準化開發環境。支援專案鷹架建立、工件同步以及針對全新與既有專案的 AI 對齊。
一位睿智的專家代理指揮家。透過召喚、協調並創建專門的 AI 專家來協助您達成目標。具備智識謙遜、多代理人辯論以及自我學習模式捕獲功能。