autoresearch
自动化多团队代码库改进代理,具备狭义(目标导向)、广义(假设发散)及全面(质量扫描)三种模式。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 190 个技能
自动化多团队代码库改进代理,具备狭义(目标导向)、广义(假设发散)及全面(质量扫描)三种模式。
通过 Codex MCP 使用外部 LLM 获取您的研究、论文草稿与实验设置的深度批判性评论(NeurIPS/ICML 等级)。
使用 BigCode Evaluation Harness 评估代码生成模型。涵盖 HumanEval、MBPP 和 MultiPL-E 等基准测试,提供多语言编码模型的 pass@k 指标评估。
针对 Go CLI 应用程序的专家级自动化代码审查,涵盖 Cobra/urfave 模式、安全性、性能、Go 惯用语法及完善的错误处理。
为 Python 代码提供 6 阶段只读分析的工作流程,根据项目类型(从 POC 到开源)检测设计原则违规、代码异味并建议现代化改善方案。
克劳德代码会话的正式评估框架,实施评估驱动开发(EDD)原则,用于保障 AI 代理的可靠性。
用于编排长期代理任务、证据导向交付以及遵循 Simon Willison 迭代循环的自动化 QA 门控的框架。
一套结构化的文件式待办事项追踪系统,用于管理技术债、协调代码审查工作流程,并直接在代码库内进行任务追踪。
自动化维护 CLAUDE.md 文件。监控代码库变化,确保项目记忆库与文件结构、构建指令及开发模式保持同步。
根据 litellm 注册表审核并同步 assets.py 中的支持 LLM 模型列表。
React 19 单页应用开发的架构治理与项目标准,确保技术栈集成、项目结构与代理执行规则的一致性。
通过 OpenAI Codex 和 Google Gemini 获取架构、代码审查与调试的专家观点,并透明化展示所有 AI 推论与建议。