工程開發
basic-usage avatar

basic-usage

llmemory 文件儲存與搜尋入門:涵蓋安裝、pgvector 資料庫設定、文件導入、混合/語義檢索,以及具備多租戶支援的 RAG 系統建構。

簡介

basic-usage 技能為將 llmemory 整合至 Python 應用程式提供了基礎介面。此技能專為開發人員與工程師設計,涵蓋了管理文件知識庫的完整生命週期,從使用 pgvector 擴充功能進行初步 PostgreSQL 架構部署,到複雜的檢索工作流程。它適用於構建檢索增強生成 (RAG) 系統、企業搜尋引擎,或需要高效能文件隔離的多租戶 SaaS 應用程式。

  • 完整的文件生命週期管理,包含文件建立、支援分頁的列表查詢、資料檢索與刪除。

  • 進階檢索功能,如混合搜尋(結合向量嵌入與 BM25 全文搜尋)、語義搜尋,以及透過回答能力偵測實現的自動查詢路由。

  • 採用基於擁有者範圍 (owner-scoped) 隔離的多租戶資料架構,確保不同客戶或工作空間之間的文件集安全隔離。

  • 與 PostgreSQL 的深度整合(透過 pgdbm 函式庫),支援連線池管理、遷移控制及健康診斷。

  • 支援可配置的切塊策略、上下文檢索以及重排序機制,以提升檢索精確度。

  • 在初始化之前,請確保已正確配置 PostgreSQL 14+ 及 pgvector 0.5.0+ 擴充功能。

  • 將 LLMemory 類別作為主要入口點,它負責處理資料庫連線、OpenAI API 金鑰及嵌入生成的內部協調。

  • 請務必透過 async initialize() 方法初始化函式庫,以確保底層資料庫架構已正確遷移。

  • 建議使用 SearchType.HYBRID 以取得語義理解與關鍵字精確度之間的最佳平衡。

  • 針對對話式 AI 代理,建議使用 search_with_routing 來智慧判定查詢是否能從儲存的文件中取得解答,再觸發後續的檢索流程。

  • 在所有作業中使用 owner_id 參數來管理文件切塊,以確保在多使用者生產環境中維護嚴格的資料邊界。

倉庫統計

Star 數
6
Fork 數
1
Open Issue 數
1
主要語言
Python
預設分支
main
同步狀態
閒置
最近同步時間
2026年5月3日 下午10:07
在 GitHub 查看