工程開發資料分析研究
evaluation
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
瀏覽: 23★ 15,339
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 292 個技能
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
擷取 YouTube 與 Bilibili 影片字幕,支援自動摘要、問答與資訊提取,基於 yt-dlp 實作。
管理客戶關係、追蹤後續行動,並利用基於 Obsidian 的客戶資料自動草擬個人化電子郵件。
用於跨裝置與團隊管理代理技術的私人套件分發系統。透過中央庫目錄安裝、同步、新增與更新您的代理、技能與提示詞。
使用可靠的 Python 腳本將影像以 90 度為單位進行旋轉。支援 PNG、JPG、GIF、BMP 和 TIFF 格式,確保影像品質並提供自動化檔案處理。
適用於 MCP 的辯證推理與對抗式編碼代理,透過強制 LLM 解決內部矛盾,產出更高品質的推理與程式碼。
全面的 AI 文本檢測框架。透過詞彙分析、結構模式、模型指紋與技術後設資料比對,精準辨識 AI 生成內容與寫作痕跡。
一個高效能 Liquid 模板引擎,透過中間語言 (IL) 將模板編譯為最佳化的 Ruby 和機器碼。
React 19 單頁應用開發的架構治理與專案標準,確保技術堆疊整合、專案結構與代理執行規則的一致性。
OpenCode 代理的自我維護技能,用於更新文檔、捕捉學習成果並動態擴展工具與代理功能。
一鍵發佈 Markdown 文章至微信公眾號草稿箱,支援自動圖片上傳、多種佈景主題與程式碼高亮格式化。
透過 OpenAI Codex 與 Google Gemini 獲取架構、程式碼審查與除錯的專家觀點,並透明化呈現所有 AI 推論與建議。