stable-baselines3
使用 Stable Baselines3 进行生产级强化学习。通过类 scikit-learn API 训练智能体、设计自定义环境、实现训练回调函数并优化工作流程。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 270 个技能
使用 Stable Baselines3 进行生产级强化学习。通过类 scikit-learn API 训练智能体、设计自定义环境、实现训练回调函数并优化工作流程。
通过文件桥接机制,让 Claude Code 控制 Unity 编辑器,执行测试、编译脚本、控制播放模式并获取控制台日志。
AWS DynamoDB 工程助手,专注于架构设计、查询优化、单表模式与使用 Boto3 及 AWS CLI 的基础设施管理。
用于跨时区获取当前时间以及进行精确时间转换与排程操作的实用工具。
创建、调试并优化 Cloudflare Durable Objects。支持状态协调、RPC、SQLite 存储、WebSocket 处理程序以及 Vitest 测试。
RivetKit 官方 React 客户端。提供 useActor 和 createRivetKit 等 Hook,协助开发连接 Rivet Actor 的实时 React 应用程序。
重置 .otto/ 目录中的工作流程组件。可安全移除任务、规格与浏览器会话,让开发流程重新开始。
使用 TemPad Dev MCP 将 Figma 设计转换为符合项目规范的 UI 代码,精确处理标记、样式与设计标记整合。
在独立会话中执行实施计划并进行审核检查点,确保逐项任务验证与代码质量。
基于真实代码审查的专家级 Rust 开发指南。适用于编写惯用语代码、性能调优、错误处理,并协助开发者避免 CLI 工具与生产环境中的常见陷阱。
为自主代理提供资金钱包、身份验证及付费 API 工具,支持搜索、AI 媒体生成、消息传递及远程通信功能。
利用费曼技巧、苏格拉底教学法与认知负载理论等大师级教学策略,将复杂概念转化为清晰易懂的解释。