reflect-appworld-failure
分析 AppWorld 任务失败原因,提取具体的 API 模式并生成带有实现代码示例的可执行剧本要点。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 445 个技能
分析 AppWorld 任务失败原因,提取具体的 API 模式并生成带有实现代码示例的可执行剧本要点。
为核心研究集中的论文生成结构化、机器可读的笔记,以实现可靠的文献综述与证据导向的写作。
MassGen 自我开发指南,支持自动化测试与可视化 UI/UX 评估流程。
使用 BigCode Evaluation Harness 评估代码生成模型。涵盖 HumanEval、MBPP 和 MultiPL-E 等基准测试,提供多语言编码模型的 pass@k 指标评估。
基于 Gemini 的高级网络搜索插件,具备智能缓存、子代理上下文隔离及自动查询优化功能。
Next.js 13+ App Router 开发专家,支持 Server Components、嵌套布局、Suspense 流式渲染以及进阶数据获取模式的应用开发。
通过 nano-pdf 命令行工具,使用自然语言指令编辑与修改 PDF 文档。
将软件开发想法捕捉并形式化为 Hashbrown 存储库中的结构化设计文档,包含研究资料与概念草图。
将整个代码库打包成单一、适合 AI 阅读的文件。适用于为 Claude、ChatGPT 和 Gemini 提供代码上下文,以进行代码分析、安全审计与错误排查。
全球情报自动汇总工具,生成结构化市场、政经与 AI 新闻报告。支持 RSS 聚合、重大事件分级告警与智能推演,帮助用户高效掌握全球动态。
使用 Playwright 测试本地 Web 应用程序的工具组,支持服务器生命周期管理、自动化 DOM 检测与浏览器自动化工作流程。
结构化平行头脑风暴代理,专注于概念构思与扩展。通过多代理视角将模糊想法转化为实用愿景。仅限构思,不用于任务规划。