evaluation
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 208 個技能
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
透過 prompts.chat 搜尋、發掘並優化 AI 提示詞。存取數千個專為 ChatGPT、Claude 等 AI 模型設計的社群精選提示詞。
進階視覺回歸測試工具,具備像素級與AI輔助差異分析、跨瀏覽器驗證及響應式設計檢查,有效防止CI/CD流程中的UI回歸問題。
利用 Azure OpenAI GPT Realtime Mini 模型與 WebSocket 串流技術,產生 AI 播客風格的音訊敘事,包含 PCM 轉 WAV 及前端播放整合。
產生 0 到 9999 之間的隨機幸運數字,適用於遊戲、決策或娛樂需求。
您的協作寫作夥伴,提供研究、大綱擬定、草稿撰寫與即時回饋。適用於技術文件、部落格文章及需引用的內容。
提取並記錄真實的寫作語氣。為 AI 訓練、代筆寫作及品牌一致性建立詳盡的語氣指南。
提升影像品質、解析度與清晰度,專為螢幕截圖與數位媒體設計。適用於專業文件、部落格與簡報。
專為 SaaS 創始人設計的行銷策略構思引擎。根據您的產品階段、預算與目標,生成切實可行且具備策略性的成長戰術、內容規劃與推廣方案。
透過 MCP 自動化 Discord 伺服器管理,包括訊息處理、頻道組織與身分組指派等操作。
執行「工程即行銷」增長策略:透過構建免費的 SEO 工具頁面獲取自然流量,將訪客轉化為付費用戶,實現零廣告預算下的高效成長。
透過 OpenAI Codex 與 Google Gemini 獲取架構、程式碼審查與除錯的專家觀點,並透明化呈現所有 AI 推論與建議。