evaluating-code-models
使用 BigCode Evaluation Harness 評估代碼生成模型。包含 HumanEval、MBPP 和 MultiPL-E 等基準測試,並提供多語言編碼模型的 pass@k 指標評估。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 416 個技能
使用 BigCode Evaluation Harness 評估代碼生成模型。包含 HumanEval、MBPP 和 MultiPL-E 等基準測試,並提供多語言編碼模型的 pass@k 指標評估。
基於 LangGraph 與 Claude Opus 4.5 的自動化 LinkedIn 內容行銷多代理系統,涵蓋趨勢研究、內容生成、個人品牌語氣分析與成效追蹤。
Apple Final Cut Pro FCPXML 格式參考,涵蓋時間軸結構、媒體素材、效果與專案自動化,適用於 FCP 10.4+。
AI 代理的即時技能發現引擎。透過 REST API 或 MCP 按需搜尋並檢索專業代理技能 (SKILL.md),將程序性知識即時注入到代理的上下文中。
管理專案單一事實來源 (SSOT)、記憶體及跨工具搜尋。作為 Claude Code 的 decisions.md 與 patterns.md 守護者,用於維護上下文、同步記憶及追蹤決策。
Anthropic Claude 整合模式:串流、使用 pgvector 的 RAG、工具使用、模型選擇(Haiku/Sonnet/Opus)、提示詞快取及 AI 工程成本管理。
React Native 開發最佳實踐,適用於 Expo 與原生專案。涵蓋專案結構、路由導航、NativeWind 樣式、平台特定代碼及 TypeScript 整合。
為 Next.js、Tailwind CSS 和 React 應用程式分析並實作實用且具目的性的 UI 動畫,重點在於使用者體驗、效能與無障礙設計。
精通 iOS 人機介面準則 (HIG) 與 SwiftUI。提供原生 iOS 應用程式開發、介面設計、SwiftUI 元件實作與 Apple 平台設計原則的專業指導。
生成相容於 GitHub 的 Mermaid 圖表,包含經測試的配色方案、本地 SVG/PNG 預覽以及基於 Gist 的渲染預覽。
Preact 與 Tailwind 的前端編碼規範。適用於叢集應用程式的網頁 UI 元件開發。
一套專業工具集,用於在 Claude Code 環境中審核、評估、切分文件及構建生產級 RAG 管線。