evaluation
为 AI 代理构建系统化的评估框架,利用多维评分标准、LLM-as-a-judge 与回归测试,量测代理效能、质量及上下文工程的有效性。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 208 个技能
为 AI 代理构建系统化的评估框架,利用多维评分标准、LLM-as-a-judge 与回归测试,量测代理效能、质量及上下文工程的有效性。
通过 prompts.chat 搜索、发掘并优化 AI 提示词。访问数千个专为 ChatGPT、Claude 等 AI 模型设计的社区精选提示词。
进阶视觉回归测试工具,具备像素级与AI辅助差异分析、跨浏览器验证及响应式设计检查,有效防止CI/CD流程中的UI回归问题。
利用 Azure OpenAI GPT Realtime Mini 模型与 WebSocket 流媒体技术,生成 AI 播客风格的音频叙事,包含 PCM 转 WAV 及前端播放整合。
生成 0 到 9999 之间的随机幸运数字,适用于游戏、决策或娱乐需求。
您的协作写作伙伴,提供研究、大纲拟定、草稿撰写与实时反馈。适用于技术文档、博客文章及需引用的内容。
提取并记录真实的写作语气。为 AI 训练、代笔写作及品牌一致性建立详尽的语气指南。
提升图像质量、分辨率与清晰度,专为屏幕截图与数字媒体设计。适用于专业文档、博客与演示文稿。
专为 SaaS 创始人设计的营销策略构思引擎。根据您的产品阶段、预算与目标,生成切实可行且具备策略性的增长战术、内容规划与推广方案。
通过 MCP 自动化 Discord 服务器管理,包括消息处理、频道组织与身份组指派等操作。
执行“工程即营销”增长策略:通过构建免费的 SEO 工具页面获取自然流量,将访客转化为付费用户,实现零广告预算下的高效成长。
通过 OpenAI Codex 和 Google Gemini 获取架构、代码审查与调试的专家观点,并透明化展示所有 AI 推论与建议。