claude-rag-skills
一套专业工具集,用于在 Claude Code 环境中审核、评估、切分文档及构建生产级 RAG 管线。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 150 个技能
一套专业工具集,用于在 Claude Code 环境中审核、评估、切分文档及构建生产级 RAG 管线。
指导代理人记忆系统的实现,比较主流框架(Mem0、Zep、Letta、LangMem、Cognee),并设计用于跨会话知识保留的持久化架构。
用于 LLM 后训练(SFT/DPO/RLHF)的高质量数据集策劃指南,涵盖数据格式、质量过滤与收集策略。
防止 AI 幻觉,确保在分析代码、技术文档或提供建议时,输出具备证据支持且可验证的内容。
使用 BigCode Evaluation Harness 评估代码生成模型。涵盖 HumanEval、MBPP 和 MultiPL-E 等基准测试,提供多语言编码模型的 pass@k 指标评估。
一个专为模拟提示词注入攻击并验证 AI 代理技能安全扫描器而设计的测试工具。
为 AI 代理构建系统化的评估框架,利用多维评分标准、LLM-as-a-judge 与回归测试,量测代理效能、质量及上下文工程的有效性。
统一的 AI 网关,支持超过 100 种大语言模型,提供兼容 OpenAI 的 API、模型回退、负载均衡及企业级管理工具。
用于在 Claude Code 和 Gemini CLI 扩展之间转换及同步 AI 代理技能的通用 CLI 工具。
使用 TruLens 对 LLM 应用程序进行检测、评估与监控的系统化工作流程,支持 LangChain、LangGraph 与 LlamaIndex 等框架。
用于将任务分发给专业后台代理的智能编排系统,具备基于性能的路由与执行追踪功能。
为构建 Claude API 生产级应用提供专家指导,涵盖 SDK 使用、提示词缓存、批量处理、流式传输、工具调用及成本优化策略。