工程开发

rag-engineer

架构与优化生产级别的 RAG 系统。精通嵌入模型、向量数据库、分块策略及检索管线，提升 LLM 应用的精确度。

课程Vibe Coding & Tech Startup 创业课程结合 AI 辅助编程与创业思维：从灵感到原型、迭代到上线，一步步把想法做成可用的产品。前往课程页查看完整大纲、上课方式与报名／咨询渠道。查看课程大纲与详情 →

简介

RAG Engineer 技能为设计与维护检索增强生成 (RAG) 系统提供了强大的架构框架。它旨在协助软件工程师、数据科学家和 AI 架构师弥合原始非结构化数据与精确 LLM 生成之间的差距。该技能强调检索质量直接决定生成质量，主张以严谨且数据优先的方式构建搜索增强型 AI。

针对特定内容领域（包括代码、法律或技术文档）进行嵌入模型的专业选择与微调。
向量数据库架构的设计与管理，专注于扩展性与高性能的相似度搜索。
实现进阶分块策略，包括语义分块、阶层式检索，以及通过重叠 (overlaps) 维持上下文连续性。
使用 BM25、TF-IDF 与向量相似度结合倒数排名融合 (Reciprocal Rank Fusion) 的混合搜索系统开发。
整合查询扩充技术（例如假设性文档嵌入 HyDE 与多重查询检索）以提升系统召回率。
通过上下文压缩、元数据过滤及交叉编码器 (cross-encoders) 重排序来优化检索精确度。
当用户需要构建具备外部知识、领域专业背景或实时信息且超出 LLM 原始训练范围的 AI 代理时，应运用此技能。
输入要求包含原始文档语料库、查询日志及用于评估的相关性基准。
预期产出为具备高召回率/精确度比例且能将幻觉最小化的生产级检索管线。
实际限制包含平衡上下文窗口大小限制、管理嵌入模型的盲点，以及解决固定大小分块导致的碎片化技术债。
必须将检索管线视为独立的模块化组件；始终独立于最终生成输出的质量之外，评估命中率与 MRR 等检索指标。

仓库统计

Star 数: 35,783
Fork 数: 5,870
Open Issue 数: 0
主要语言: Python
默认分支: main
同步状态: 空闲
最近同步时间: 2026年4月30日 10:50

在 GitHub 查看