glyphbox
一个基于 LLM 的 NetHack 代理框架,通过在安全沙盒中动态合成 Python 代码,利用高阶 API 执行复杂的地牢探索与游戏操作。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 246 个技能
一个基于 LLM 的 NetHack 代理框架,通过在安全沙盒中动态合成 Python 代码,利用高阶 API 执行复杂的地牢探索与游戏操作。
通过价值、易用性、可行性与运营可行性四个维度,利用多角度批判性思维对现有产品功能进行风险假设评估与压力测试。
通过引入代码变异并测量杀灭率,验证测试套件的有效性并找出薄弱断言。对于证明测试能真正捕捉错误,而非仅仅满足覆盖率指标至关重要。
在 AI 辅助开发过程中,保持技术规格、测试套件与源代码的完美同步。
使用 Browserbase 将无服务器浏览器自动化部署为云端函数。适用于定时任务、Webhook 端点以及在云端执行自动化脚本。
监控项目进度、分析活跃轨道并识别开发工作空间中的阻塞问题。
使用 OpenAI Agents SDK (Python) 构建 AI 代理。支持多代理协作、函数工具、状态化会话、流式传输以及通过 LiteLLM 进行 Azure OpenAI 集成。
用于构建高质量 MCP (Model Context Protocol) 服务器的指南,支持使用 Python 或 TypeScript 将外部 API 和服务集成到 LLM 工作流程中。
通过 CLI 提交 OpenAnt 已完成的任务。支持文本报告、文件上传(图片、文档、代码)及外部证明链接,确保交付成果可被验证。
通过先进的上下文压缩、结构化摘要与任务导向的状态管理,为长期运行的 AI 代理会话优化性能并降低 Token 使用量。
全方位 Python 医疗 AI 工具包,用于临床数据处理、医学编码转换,以及开发用于 EHR、生理信号和临床预测任务的深度学习模型(如 RETAIN 与 Transformer)。
为 AI 代理提供主动式上下文窗口管理,通过智能令牌监控、快照建立与选择性状态恢复,确保长会话期间的连续性。