evaluating-code-models
使用 BigCode Evaluation Harness 评估代码生成模型。涵盖 HumanEval、MBPP 和 MultiPL-E 等基准测试,提供多语言编码模型的 pass@k 指标评估。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 416 个技能
使用 BigCode Evaluation Harness 评估代码生成模型。涵盖 HumanEval、MBPP 和 MultiPL-E 等基准测试,提供多语言编码模型的 pass@k 指标评估。
基于 LangGraph 与 Claude Opus 4.5 的自动化 LinkedIn 内容营销多代理系统,涵盖趋势研究、内容生成、个人品牌语调分析与成效追踪。
Apple Final Cut Pro FCPXML 格式参考,涵盖时间轴结构、媒体素材、效果与项目自动化,适用于 FCP 10.4+。
AI 代理的即时技能发现引擎。通过 REST API 或 MCP 按需搜索并检索专业代理技能 (SKILL.md),将程序性知识即时注入到代理的上下文中。
管理项目单一事实来源 (SSOT)、内存及跨工具搜索。作为 Claude Code 的 decisions.md 与 patterns.md 守护者,用于维护上下文、同步内存及追踪决策。
Anthropic Claude 集成模式:流式传输、基于 pgvector 的 RAG、工具调用、模型选择(Haiku/Sonnet/Opus)、提示词缓存及 AI 工程成本管理。
React Native 开发最佳实践,适用于 Expo 与原生项目。涵盖项目结构、路由导航、NativeWind 样式、平台特定代码及 TypeScript 整合。
为 Next.js、Tailwind CSS 和 React 应用程序分析并实现实用且具目的性的 UI 动画,重点在于用户体验、性能与无障碍设计。
精通 iOS 人机界面指南 (HIG) 与 SwiftUI。提供原生 iOS 应用程序开发、界面设计、SwiftUI 组件实现与 Apple 平台设计原则的专业指导。
生成兼容 GitHub 的 Mermaid 图表,包含经测试的配色方案、本地 SVG/PNG 预览以及基于 Gist 的渲染预览。
Preact 与 Tailwind 的前端编码规范。适用于集群应用程序的网页 UI 组件开发。
一套专业工具集,用于在 Claude Code 环境中审核、评估、切分文档及构建生产级 RAG 管线。