backend-rag-implementation
构建 RAG 系统以利用私有数据增强 LLM。包含向量数据库集成、嵌入策略、混合搜索及 FastAPI 后端的高级检索模式。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 128 个技能
构建 RAG 系统以利用私有数据增强 LLM。包含向量数据库集成、嵌入策略、混合搜索及 FastAPI 后端的高级检索模式。
使用向量数据库、语义搜索与 LangGraph 构建生产级 RAG 系统,为 LLM 提供外部知识基础。
智能 RAG 知识网关,将编程任务路由至专业的 Swift/iOS 领域知识。通过 MCP 从 100 多种索引技能中提取精准模式,优化开发上下文使用率。
使用计算机视觉相似度嵌入技术,在 FiftyOne 数据集中查找、查看并移除重复或高度相似的图像。
Upstash Vector DB 设置、语义搜索、命名空间与向量嵌入模型。专为在 Next.js 16 与 Vercel 项目中构建高性能向量搜索功能而设计。
使用 BigCode Evaluation Harness 评估代码生成模型。涵盖 HumanEval、MBPP 和 MultiPL-E 等基准测试,提供多语言编码模型的 pass@k 指标评估。
架构与优化生产级别的 RAG 系统。精通嵌入模型、向量数据库、分块策略及检索管线,提升 LLM 应用的精确度。
用于 Markdown 笔记、文档和代码库知识库的本地混合搜索引擎,旨在降低 Token 消耗并提升检索效率。
基于 Qdrant 和 Ollama 的本地 RAG 语义记忆系统。适用于高效检索工作区文件、笔记、决策记录与用户偏好,提供精确的向量语义搜索。
搜索并参考 Chromium 文档,包含设计文档、API 和开发指南。适用于定位、浏览或学习 Chromium 代码库中的架构、GPU、网络、安全和测试概念。
llmemory 文档存储与搜索入门:涵盖安装、pgvector 数据库配置、文档导入、混合/语义检索,以及构建具备多租户支持的 RAG 系统。
Supermemory 是 AI 代理的长期记忆基础设施,提供持久上下文、用户画像及跨多模态知识库的语义 RAG 搜索功能。