工程開發
qras avatar

qras

基於 Qdrant 和 Ollama 的本地 RAG 語義記憶系統。適用於高效檢索工作區文件、筆記、決策記錄與用戶偏好,提供精確的向量語義搜索。

簡介

QRAS 是一個高效能、本地優先的檢索增強生成 (RAG) 系統,專為代理程式與個人工作區設計,旨在成為智慧化的語義記憶層。透過 Qdrant 作為向量資料庫並結合 Ollama 進行嵌入生成,它使用戶能夠索引並查詢大量的非結構化數據,包括 Markdown 筆記、日誌與專案文件。QRAS 的架構架起了靜態文件存儲與主動記憶檢索之間的橋樑,確保代理程式能在不依賴雲端 API 或妥協隱私的情況下,獲取關於過去決策、人際關係與用戶偏好的上下文資訊。

  • 進階語義向量搜索:利用高維向量嵌入來理解自然語言意圖,超越簡單的關鍵字匹配,精準捕捉查詢上下文。

  • 混合搜索能力:結合向量相似度與基於關鍵字的過濾,兼顧概念相關性與術語精確度。

  • 增量索引:支援透過選擇性重新索引文件進行即時更新,確保記憶庫保持最新狀態,無需重複全庫刷新。

  • LLM 優化輸出:提供專為 AI 代理設計的高效能檢索格式,最大化上下文窗口的利用效率。

  • 開發者友好的 CLI:內建強大的命令列介面,用於處理索引任務、集合管理與互動式對話。

  • 可擴展架構:基於 Python 並支援 Docker 容器化部署,適合本地端、邊緣伺服器或整合型工作環境。

  • 主要應用場景:非常適合知識工作者、開發人員與需要可靠「第二大腦」的 AI 代理。可用於查詢「發票會議決策內容」、「用戶偏好的任務格式」或「找出所有關於 Qdrant 的參考文件」。

  • 輸入與輸出:支援本地 Markdown 目錄與 JSON 資料集作為輸入。輸出結構化的上下文片段,可直接用於後續的 LLM 提示詞 (Prompt)。

  • 部署限制:需在本地運行 Ollama 與 Qdrant 容器。用戶需確保有足夠的系統資源(CPU/RAM)來執行嵌入模型(如 bge-m3:567m)。

  • 最佳實踐:建議將 QRAS 作為記憶查詢的首選工具,並維持清晰的 memory/ 目錄結構,以避免無關文件汙染索引內容。

倉庫統計

Star 數
9
Fork 數
0
Open Issue 數
0
主要語言
Python
預設分支
main
同步狀態
閒置
最近同步時間
2026年5月3日 下午10:12
在 GitHub 查看