evaluating-code-models
使用 BigCode Evaluation Harness 评估代码生成模型。涵盖 HumanEval、MBPP 和 MultiPL-E 等基准测试,提供多语言编码模型的 pass@k 指标评估。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 453 个技能
使用 BigCode Evaluation Harness 评估代码生成模型。涵盖 HumanEval、MBPP 和 MultiPL-E 等基准测试,提供多语言编码模型的 pass@k 指标评估。
当用户提示模糊、随意或需要创意决策时,通过塔罗牌占卜为规划过程注入随机性与灵感。
AI 驱动的微信消息助手。可直接通过 AI 对话获取联系人/群组的最新消息并发送文字消息。仅限 Windows 10/11。
自动化模式检测与技能推荐引擎,通过监控项目记忆、日志及任务列表,自动进化 AI 代理的能力。
一个高性能 Liquid 模板引擎,通过中间语言 (IL) 将模板编译为优化的 Ruby 和机器码。
通过 MCP 工具编排 Unity 编辑器。支持 AI 在 Unity 项目中创建游戏对象、编辑脚本、管理场景及自动化测试。
紫微斗数排盘与分层解读工具。通过 iztro 引擎进行命盘生成,提供本命、流年、流月、流日之系统化、证据导向的命理分析。
npm-agentskills 框架的测试工具,用于验证 Nuxt 模块整合与 AI Agent 技能发现机制。
使用 curl 从公开分享的 Google 文档中可靠地读取并提取内容,确保获取完整文件。
自动化移除代码中多余或显而易见的注释,同时保留重要的架构与逻辑说明,优化代码的可读性与质量。
Anthropic 结构化输出实现专家顾问。协助判断 JSON 模式与严格工具使用之间的取舍,确保 schema 合规性与 Agent 工作流的输入验证。
搜索并发现 Claude Code 技能与 MCP 服务器,从市场、GitHub 仓库及注册表获取资源,优化您的 AI 辅助开发工作流程。