evaluation
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 452 個技能
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
使用 Wayfinder 函式庫管理 Inertia.js React 前端組件中型別安全的 Laravel 後端路由。
專門用於建立、編輯和維護 .drawio 流程圖的技能。支援 XML 操作、排版優化、AWS 圖示整合,以及文件自動化 PNG 轉換。
AI 輔助代碼代理版本控制。透過 MemoV 自動追蹤提示詞、上下文與差異,確保完整可追溯性,且不污染 Git 歷史紀錄。
分析 C++ 程式碼中的即時安全性違規,包括音訊執行緒中的堆積記憶體分配、鎖定、阻塞呼叫及非確定性操作。
使用 Google Gemini API 進行深度影片分析:包含影片摘要、音訊轉錄、時間戳記提取、影片片段剪輯,並支援 YouTube 連結或本機檔案,適用於多種模型與長文本脈絡。
一套系統化的程式碼審計框架,用於識別軟體專案中的技術債、安全漏洞、無效程式碼及程式碼品質問題。
應用務實編碼標準:包含明確命名、單一職責函數、防禦性程式設計,以及確定性副作用,拒絕過度設計與臆測性功能。
將內容屬性與 GA4 和 GSC 指標進行關聯分析,以識別績效驅動因素並挖掘優化機會。
開發與維護 PWAFire 工具庫:編寫 PWA API 模組、處理功能檢測、管理測試,並遵循嚴格的同步/非同步模式與錯誤處理規範貢獻程式碼。
分析 Claude Code 會話歷史,以識別效率低下的模式、優化 Token 使用量並建議工作流程改進。
一個基於 Quartz v4 高度客製化的數位花園,支援增強型 Markdown 解析、縮放文字、TikZ 與偽代碼渲染,並整合了 Obsidian 插件生態。