工程开发自动化生产力
skill-reinforcement
一种自动化元学习技能,通过在每次任务执行后捕获模式、错误和捷径来改进代理工作流程。
浏览: 10★ 220
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 150 个技能
一种自动化元学习技能,通过在每次任务执行后捕获模式、错误和捷径来改进代理工作流程。
使用 Stable Baselines3 进行生产级强化学习。通过类 scikit-learn API 训练智能体、设计自定义环境、实现训练回调函数并优化工作流程。
通过 ReasoningBank 实现代理程序的自适应学习,进行模式识别、策略优化与持续改进。
基于 Notion 的推文性能追踪系统,通过强化学习原理实现数据驱动的内容实验与优化。
用于 LLM 后训练(SFT/DPO/RLHF)的高质量数据集策劃指南,涵盖数据格式、质量过滤与收集策略。
通过管理插件来自我修改 Milady 代理。编辑代码、重建并重新启动运行环境,以开发新功能或本地优化代理工作流程。
以小型、可验证的批次执行实施计划,并在每个阶段设置反馈暂停点,以防止偏离目标并确保代码质量。
一个受强化学习启发的 YouTube 绩效追踪工具,通过系统化记录来优化缩图、标题与视频钩子。
Epsimo AI 平台开发套件与 CLI,支持构建具有持久化状态、虚拟数据库、流式对话及 React UI 套件的智能体。
使用 AgentDB 的超快速向量后端实现 ReasoningBank 自适应学习。具备轨迹追踪、判定评估、记忆蒸馏与模式识别功能,适用于构建自我学习的自主智能体。
代码库自动化优化循环。根据特定目标与机械指标,自动修改、测量并迭代代码以提升效能。
Moltbot Arena AI 代理技能,适用于即时战略编程游戏。通过 REST API 管理单位、自动化资源采集、协调建筑并执行战术决策。