工程开发
qras avatar

qras

基于 Qdrant 和 Ollama 的本地 RAG 语义记忆系统。适用于高效检索工作区文件、笔记、决策记录与用户偏好,提供精确的向量语义搜索。

简介

QRAS 是一个高效能、本地优先的检索增强生成 (RAG) 系统,专为代理程序与个人工作区设计,旨在成为智能化的语义记忆层。通过 Qdrant 作为向量数据库并结合 Ollama 进行嵌入生成,它使用户能够索引并查询大量的非结构化数据,包括 Markdown 笔记、日志与项目文档。QRAS 的架构架起了静态文件存储与主动记忆检索之间的桥梁,确保代理程序能在不依赖云端 API 或妥协隐私的情况下,获取关于过去决策、人际关系与用户偏好的上下文信息。

  • 进阶语义向量搜索:利用高维向量嵌入来理解自然语言意图,超越简单的关键词匹配,精准捕捉查询上下文。

  • 混合搜索能力:结合向量相似度与基于关键词的过滤,兼顾概念相关性与术语精确度。

  • 增量索引:支持通过选择性重新索引文件进行实时更新,确保记忆库保持最新状态,无需重复全库刷新。

  • LLM 优化输出:提供专为 AI 代理设计的高效能检索格式,最大化上下文窗口的利用效率。

  • 开发者友好的 CLI:内置强大的命令行接口,用于处理索引任务、集合管理与交互式对话。

  • 可扩展架构:基于 Python 并支持 Docker 容器化部署,适合本地端、边缘服务器或集成型工作环境。

  • 主要应用场景:非常适合知识工作者、开发人员与需要可靠“第二大脑”的 AI 代理。可用于查询“发票会议决策内容”、“用户偏好的任务格式”或“找出所有关于 Qdrant 的参考文件”。

  • 输入与输出:支持本地 Markdown 目录与 JSON 数据集作为输入。输出结构化的上下文片段,可直接用于后续的 LLM 提示词 (Prompt)。

  • 部署限制:需在本地运行 Ollama 与 Qdrant 容器。用户需确保有足够的系统资源(CPU/RAM)来执行嵌入模型(如 bge-m3:567m)。

  • 最佳实践:建议将 QRAS 作为记忆查询的首选工具,并维持清晰的 memory/ 目录结构,以避免无关文件污染索引内容。

仓库统计

Star 数
9
Fork 数
0
Open Issue 数
0
主要语言
Python
默认分支
main
同步状态
空闲
最近同步时间
2026年5月3日 22:12
在 GitHub 查看