工程开发
basic-usage avatar

basic-usage

llmemory 文档存储与搜索入门:涵盖安装、pgvector 数据库配置、文档导入、混合/语义检索,以及构建具备多租户支持的 RAG 系统。

简介

basic-usage 技能为将 llmemory 集成至 Python 应用程序提供了基础接口。此技能专为开发人员与工程师设计,涵盖了管理文档知识库的完整生命周期,从使用 pgvector 扩展功能进行初步 PostgreSQL 架构部署,到复杂的检索工作流程。它适用于构建检索增强生成 (RAG) 系统、企业搜索引擎,或需要高性能文档隔离的多租户 SaaS 应用程序。

  • 完整的文档生命周期管理,包含文档创建、支持分页的列表查询、数据检索与删除。

  • 高级检索功能,如混合搜索(结合向量嵌入与 BM25 全文搜索)、语义搜索,以及通过回答能力检测实现的自动查询路由。

  • 采用基于拥有者范围 (owner-scoped) 隔离的多租户数据架构,确保不同客户或工作空间之间的文档集安全隔离。

  • 与 PostgreSQL 的深度集成(通过 pgdbm 库),支持连接池管理、迁移控制及健康诊断。

  • 支持可配置的切块策略、上下文检索以及重排序机制,以提升检索精确度。

  • 在初始化之前,请确保已正确配置 PostgreSQL 14+ 及 pgvector 0.5.0+ 扩展功能。

  • 将 LLMemory 类作为主要入口点,它负责处理数据库连接、OpenAI API 密钥及嵌入生成的内部协调。

  • 请务必通过 async initialize() 方法初始化库,以确保底层数据库架构已正确迁移。

  • 建议使用 SearchType.HYBRID 以取得语义理解与关键字精确度之间的最佳平衡。

  • 针对对话式 AI 代理,建议使用 search_with_routing 来智能判定查询是否能从存储的文档中取得解答,再触发后续的检索流程。

  • 在所有作业中使用 owner_id 参数来管理文档切块,以确保在多用户生产环境中维护严格的数据边界。

仓库统计

Star 数
6
Fork 数
1
Open Issue 数
1
主要语言
Python
默认分支
main
同步状态
空闲
最近同步时间
2026年5月3日 22:07
在 GitHub 查看