qras
基於 Qdrant 和 Ollama 的本地 RAG 語義記憶系統。適用於高效檢索工作區文件、筆記、決策記錄與用戶偏好,提供精確的向量語義搜索。
簡介
QRAS 是一個高效能、本地優先的檢索增強生成 (RAG) 系統,專為代理程式與個人工作區設計,旨在成為智慧化的語義記憶層。透過 Qdrant 作為向量資料庫並結合 Ollama 進行嵌入生成,它使用戶能夠索引並查詢大量的非結構化數據,包括 Markdown 筆記、日誌與專案文件。QRAS 的架構架起了靜態文件存儲與主動記憶檢索之間的橋樑,確保代理程式能在不依賴雲端 API 或妥協隱私的情況下,獲取關於過去決策、人際關係與用戶偏好的上下文資訊。
-
進階語義向量搜索:利用高維向量嵌入來理解自然語言意圖,超越簡單的關鍵字匹配,精準捕捉查詢上下文。
-
混合搜索能力:結合向量相似度與基於關鍵字的過濾,兼顧概念相關性與術語精確度。
-
增量索引:支援透過選擇性重新索引文件進行即時更新,確保記憶庫保持最新狀態,無需重複全庫刷新。
-
LLM 優化輸出:提供專為 AI 代理設計的高效能檢索格式,最大化上下文窗口的利用效率。
-
開發者友好的 CLI:內建強大的命令列介面,用於處理索引任務、集合管理與互動式對話。
-
可擴展架構:基於 Python 並支援 Docker 容器化部署,適合本地端、邊緣伺服器或整合型工作環境。
-
主要應用場景:非常適合知識工作者、開發人員與需要可靠「第二大腦」的 AI 代理。可用於查詢「發票會議決策內容」、「用戶偏好的任務格式」或「找出所有關於 Qdrant 的參考文件」。
-
輸入與輸出:支援本地 Markdown 目錄與 JSON 資料集作為輸入。輸出結構化的上下文片段,可直接用於後續的 LLM 提示詞 (Prompt)。
-
部署限制:需在本地運行 Ollama 與 Qdrant 容器。用戶需確保有足夠的系統資源(CPU/RAM)來執行嵌入模型(如 bge-m3:567m)。
-
最佳實踐:建議將 QRAS 作為記憶查詢的首選工具,並維持清晰的 memory/ 目錄結構,以避免無關文件汙染索引內容。
倉庫統計
- Star 數
- 9
- Fork 數
- 0
- Open Issue 數
- 0
- 主要語言
- Python
- 預設分支
- main
- 同步狀態
- 閒置
- 最近同步時間
- 2026年5月3日 下午10:12