工程開發
rag-engineer
架構與優化生產級別的 RAG 系統。精通嵌入模型、向量資料庫、分塊策略及檢索管線,提升 LLM 應用的精確度。
簡介
RAG Engineer 技能為設計與維護檢索增強生成 (RAG) 系統提供了強大的架構框架。它旨在協助軟體工程師、資料科學家和 AI 架構師彌合原始非結構化數據與精確 LLM 生成之間的差距。該技能強調檢索品質直接決定生成品質,主張以嚴謹且數據優先的方式構建搜尋增強型 AI。
-
針對特定內容領域(包括代碼、法律或技術文件)進行嵌入模型的專業選擇與微調。
-
向量資料庫架構的設計與管理,專注於擴展性與高效能的相似度搜尋。
-
實作進階分塊策略,包括語意分塊、階層式檢索,以及透過重疊 (overlaps) 維持上下文連續性。
-
使用 BM25、TF-IDF 與向量相似度結合倒數排名融合 (Reciprocal Rank Fusion) 的混合搜尋系統開發。
-
整合查詢擴充技術(例如假設性文件嵌入 HyDE 與多重查詢檢索)以提升系統召回率。
-
透過上下文壓縮、元數據過濾及交叉編碼器 (cross-encoders) 重排序來優化檢索精確度。
-
當使用者需要構建具備外部知識、領域專業背景或即時資訊且超出 LLM 原始訓練範圍的 AI 代理時,應運用此技能。
-
輸入要求包含原始文件語料庫、查詢日誌及用於評估的相關性基準。
-
預期產出為具備高召回率/精確度比例且能將幻覺最小化的生產級檢索管線。
-
實際限制包含平衡上下文視窗大小限制、管理嵌入模型的盲點,以及解決固定大小分塊導致的碎片化技術債。
-
必須將檢索管線視為獨立的模組化組件;始終獨立於最終生成輸出的品質之外,評估命中率與 MRR 等檢索指標。
倉庫統計
- Star 數
- 35,783
- Fork 數
- 5,870
- Open Issue 數
- 0
- 主要語言
- Python
- 預設分支
- main
- 同步狀態
- 閒置
- 最近同步時間
- 2026年4月30日 上午10:50