evaluation
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 458 個技能
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
維護一個包含 Mermaid 圖表的集中式架構總覽,記錄系統邊界、模組依賴與介面契約,以利於專案導覽與重構。
從 DeepEar Lite 平台獲取即時金融訊號、傳導鏈推理及市場信心指標,協助 AI 代理進行深度市場分析。
客戶問題與調查研究工具,提供多來源資訊整合、事件追蹤、帳戶歷史紀錄查詢,並包含來源標註與信賴度評分。
自動化 LaTeX 編譯、錯誤診斷與 PDF 驗證流程,專為學術論文投稿設計。
OpenCode AI 專家指南:涵蓋 TUI 指令、CLI 操作、AGENTS.md 配置、自訂代理工作流程與專案設定。
為新創公司打造的 AI 原生產品管理工具。具備自動化競品研究、基於 WINNING 模型的缺口分析、PRD 文件生成,並整合 GitHub Issues 進行信號驅動的優先級規劃。
自動化臨床報告生成,包括符合 CARE 指南的病例報告、診斷總結、臨床試驗文件 (CSR/SAE) 及病人筆記,並確保法規合規性。
分析程式碼庫以產生層次分明的說明文件、入職指南與架構對應,協助團隊高效理解並記錄專案。
從 Terraform (.tf) 檔案自動生成雲端架構圖。解析 HCL 程式碼、對應資源依賴關係,並透過 Eraser 將基礎設施視覺化。
結構化推理工具,用於複雜問題分解、分步分析、一致性驗證以及帶有置信度評分的證據合成。
為代碼庫生成層級化的 AI 優化文檔結構 (AGENTS.md, agent.d),幫助 AI 編碼助手與開發者更高效地存取項目上下文、設置與導航。