工程開發

rag-engineer

架構與優化生產級別的 RAG 系統。精通嵌入模型、向量資料庫、分塊策略及檢索管線，提升 LLM 應用的精確度。

課程Vibe Coding & Tech Startup 創業課程結合 AI 輔助編程與創業思維：從靈感到原型、反覆迭代到真正上線，用清楚的步驟把想法做成可被使用的作品。前往課程頁查看完整大綱、上課方式與報名／諮詢方式。查看課程大綱與詳情 →

簡介

RAG Engineer 技能為設計與維護檢索增強生成 (RAG) 系統提供了強大的架構框架。它旨在協助軟體工程師、資料科學家和 AI 架構師彌合原始非結構化數據與精確 LLM 生成之間的差距。該技能強調檢索品質直接決定生成品質，主張以嚴謹且數據優先的方式構建搜尋增強型 AI。

針對特定內容領域（包括代碼、法律或技術文件）進行嵌入模型的專業選擇與微調。
向量資料庫架構的設計與管理，專注於擴展性與高效能的相似度搜尋。
實作進階分塊策略，包括語意分塊、階層式檢索，以及透過重疊 (overlaps) 維持上下文連續性。
使用 BM25、TF-IDF 與向量相似度結合倒數排名融合 (Reciprocal Rank Fusion) 的混合搜尋系統開發。
整合查詢擴充技術（例如假設性文件嵌入 HyDE 與多重查詢檢索）以提升系統召回率。
透過上下文壓縮、元數據過濾及交叉編碼器 (cross-encoders) 重排序來優化檢索精確度。
當使用者需要構建具備外部知識、領域專業背景或即時資訊且超出 LLM 原始訓練範圍的 AI 代理時，應運用此技能。
輸入要求包含原始文件語料庫、查詢日誌及用於評估的相關性基準。
預期產出為具備高召回率/精確度比例且能將幻覺最小化的生產級檢索管線。
實際限制包含平衡上下文視窗大小限制、管理嵌入模型的盲點，以及解決固定大小分塊導致的碎片化技術債。
必須將檢索管線視為獨立的模組化組件；始終獨立於最終生成輸出的品質之外，評估命中率與 MRR 等檢索指標。

倉庫統計

Star 數: 35,783
Fork 數: 5,870
Open Issue 數: 0
主要語言: Python
預設分支: main
同步狀態: 閒置
最近同步時間: 2026年4月30日上午10:50

在 GitHub 查看