qras
基于 Qdrant 和 Ollama 的本地 RAG 语义记忆系统。适用于高效检索工作区文件、笔记、决策记录与用户偏好,提供精确的向量语义搜索。
简介
QRAS 是一个高效能、本地优先的检索增强生成 (RAG) 系统,专为代理程序与个人工作区设计,旨在成为智能化的语义记忆层。通过 Qdrant 作为向量数据库并结合 Ollama 进行嵌入生成,它使用户能够索引并查询大量的非结构化数据,包括 Markdown 笔记、日志与项目文档。QRAS 的架构架起了静态文件存储与主动记忆检索之间的桥梁,确保代理程序能在不依赖云端 API 或妥协隐私的情况下,获取关于过去决策、人际关系与用户偏好的上下文信息。
-
进阶语义向量搜索:利用高维向量嵌入来理解自然语言意图,超越简单的关键词匹配,精准捕捉查询上下文。
-
混合搜索能力:结合向量相似度与基于关键词的过滤,兼顾概念相关性与术语精确度。
-
增量索引:支持通过选择性重新索引文件进行实时更新,确保记忆库保持最新状态,无需重复全库刷新。
-
LLM 优化输出:提供专为 AI 代理设计的高效能检索格式,最大化上下文窗口的利用效率。
-
开发者友好的 CLI:内置强大的命令行接口,用于处理索引任务、集合管理与交互式对话。
-
可扩展架构:基于 Python 并支持 Docker 容器化部署,适合本地端、边缘服务器或集成型工作环境。
-
主要应用场景:非常适合知识工作者、开发人员与需要可靠“第二大脑”的 AI 代理。可用于查询“发票会议决策内容”、“用户偏好的任务格式”或“找出所有关于 Qdrant 的参考文件”。
-
输入与输出:支持本地 Markdown 目录与 JSON 数据集作为输入。输出结构化的上下文片段,可直接用于后续的 LLM 提示词 (Prompt)。
-
部署限制:需在本地运行 Ollama 与 Qdrant 容器。用户需确保有足够的系统资源(CPU/RAM)来执行嵌入模型(如 bge-m3:567m)。
-
最佳实践:建议将 QRAS 作为记忆查询的首选工具,并维持清晰的 memory/ 目录结构,以避免无关文件污染索引内容。
仓库统计
- Star 数
- 9
- Fork 数
- 0
- Open Issue 数
- 0
- 主要语言
- Python
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年5月3日 22:12