qras

簡介

QRAS 是一個高效能、本地優先的檢索增強生成 (RAG) 系統，專為代理程式與個人工作區設計，旨在成為智慧化的語義記憶層。透過 Qdrant 作為向量資料庫並結合 Ollama 進行嵌入生成，它使用戶能夠索引並查詢大量的非結構化數據，包括 Markdown 筆記、日誌與專案文件。QRAS 的架構架起了靜態文件存儲與主動記憶檢索之間的橋樑，確保代理程式能在不依賴雲端 API 或妥協隱私的情況下，獲取關於過去決策、人際關係與用戶偏好的上下文資訊。

進階語義向量搜索：利用高維向量嵌入來理解自然語言意圖，超越簡單的關鍵字匹配，精準捕捉查詢上下文。
混合搜索能力：結合向量相似度與基於關鍵字的過濾，兼顧概念相關性與術語精確度。
增量索引：支援透過選擇性重新索引文件進行即時更新，確保記憶庫保持最新狀態，無需重複全庫刷新。
LLM 優化輸出：提供專為 AI 代理設計的高效能檢索格式，最大化上下文窗口的利用效率。
開發者友好的 CLI：內建強大的命令列介面，用於處理索引任務、集合管理與互動式對話。
可擴展架構：基於 Python 並支援 Docker 容器化部署，適合本地端、邊緣伺服器或整合型工作環境。
主要應用場景：非常適合知識工作者、開發人員與需要可靠「第二大腦」的 AI 代理。可用於查詢「發票會議決策內容」、「用戶偏好的任務格式」或「找出所有關於 Qdrant 的參考文件」。
輸入與輸出：支援本地 Markdown 目錄與 JSON 資料集作為輸入。輸出結構化的上下文片段，可直接用於後續的 LLM 提示詞 (Prompt)。
部署限制：需在本地運行 Ollama 與 Qdrant 容器。用戶需確保有足夠的系統資源（CPU/RAM）來執行嵌入模型（如 bge-m3:567m）。
最佳實踐：建議將 QRAS 作為記憶查詢的首選工具，並維持清晰的 memory/ 目錄結構，以避免無關文件汙染索引內容。

創業課程

網上課程

實體課程

簡介

倉庫統計