basic-usage
llmemory 文档存储与搜索入门:涵盖安装、pgvector 数据库配置、文档导入、混合/语义检索,以及构建具备多租户支持的 RAG 系统。
简介
basic-usage 技能为将 llmemory 集成至 Python 应用程序提供了基础接口。此技能专为开发人员与工程师设计,涵盖了管理文档知识库的完整生命周期,从使用 pgvector 扩展功能进行初步 PostgreSQL 架构部署,到复杂的检索工作流程。它适用于构建检索增强生成 (RAG) 系统、企业搜索引擎,或需要高性能文档隔离的多租户 SaaS 应用程序。
-
完整的文档生命周期管理,包含文档创建、支持分页的列表查询、数据检索与删除。
-
高级检索功能,如混合搜索(结合向量嵌入与 BM25 全文搜索)、语义搜索,以及通过回答能力检测实现的自动查询路由。
-
采用基于拥有者范围 (owner-scoped) 隔离的多租户数据架构,确保不同客户或工作空间之间的文档集安全隔离。
-
与 PostgreSQL 的深度集成(通过 pgdbm 库),支持连接池管理、迁移控制及健康诊断。
-
支持可配置的切块策略、上下文检索以及重排序机制,以提升检索精确度。
-
在初始化之前,请确保已正确配置 PostgreSQL 14+ 及 pgvector 0.5.0+ 扩展功能。
-
将 LLMemory 类作为主要入口点,它负责处理数据库连接、OpenAI API 密钥及嵌入生成的内部协调。
-
请务必通过 async initialize() 方法初始化库,以确保底层数据库架构已正确迁移。
-
建议使用 SearchType.HYBRID 以取得语义理解与关键字精确度之间的最佳平衡。
-
针对对话式 AI 代理,建议使用 search_with_routing 来智能判定查询是否能从存储的文档中取得解答,再触发后续的检索流程。
-
在所有作业中使用 owner_id 参数来管理文档切块,以确保在多用户生产环境中维护严格的数据边界。
仓库统计
- Star 数
- 6
- Fork 数
- 1
- Open Issue 数
- 1
- 主要语言
- Python
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年5月3日 22:07