backend-rag-implementation
建立 RAG 系統以運用專有數據增強 LLM。包含向量資料庫整合、嵌入策略、混合搜尋及 FastAPI 後端的高級檢索模式。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 138 個技能
建立 RAG 系統以運用專有數據增強 LLM。包含向量資料庫整合、嵌入策略、混合搜尋及 FastAPI 後端的高級檢索模式。
為 AI 代理提供主動式上下文視窗管理,透過智慧令牌監控、快照建立與選擇性狀態恢復,確保長會話期間的連續性。
使用智譜 (Zhipu) AI 網頁搜尋 API 進行網際網路搜尋,快速獲取即時資訊、新聞與最新數據。
使用 OpenAI Agents SDK (Python) 構建 AI 代理。支援多代理協作、函數工具、狀態化對話、串流傳輸以及透過 LiteLLM 進行 Azure OpenAI 集成。
維護並更新 MassGen 模型註冊表,包含後端能力、模型元數據、定價結構以及新舊 AI 模型的上下文窗口配置。
將整個代碼庫打包成單一、適合 AI 閱讀的文件。適用於為 Claude、ChatGPT 和 Gemini 提供程式碼上下文,以進行代碼分析、安全審計與錯誤排查。
基於 Google A2A 協議的多代理協作框架。實現了基於 CLI 的 AI 工具間的訊息傳遞、任務委派與自動化協調。
專為 AI Agent 設計的網頁閱讀與搜索工具,透過 Jina AI Reader API 將網頁轉換為適合 LLM 閱讀的 Markdown、文字或 HTML 格式。
分析本機硬體 (RAM, CPU, GPU/VRAM) 並獲取最佳化的本機 LLM 模型推薦、量化設定與效能預估。
統一的 AI 閘道,支援超過 100 種大語言模型,提供相容 OpenAI 的 API、模型備援、負載平衡及企業級管理工具。
Upstash Vector DB 設定、語意搜尋、命名空間與向量嵌入模型。專為在 Next.js 16 與 Vercel 專案中建構高效向量搜尋功能而設計。
GPT Researcher 是一個自主 AI 代理,專為全面的網頁與本地研究而設計,採用規劃-執行-發佈架構,可產出詳盡且具引用的研究報告。