backend-rag-implementation
构建 RAG 系统以利用私有数据增强 LLM。包含向量数据库集成、嵌入策略、混合搜索及 FastAPI 后端的高级检索模式。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 138 个技能
构建 RAG 系统以利用私有数据增强 LLM。包含向量数据库集成、嵌入策略、混合搜索及 FastAPI 后端的高级检索模式。
为 AI 代理提供主动式上下文窗口管理,通过智能令牌监控、快照建立与选择性状态恢复,确保长会话期间的连续性。
使用智谱 (Zhipu) AI 网页搜索 API 进行互联网搜索,快速获取即时资讯、新闻与最新数据。
使用 OpenAI Agents SDK (Python) 构建 AI 代理。支持多代理协作、函数工具、状态化会话、流式传输以及通过 LiteLLM 进行 Azure OpenAI 集成。
维护并更新 MassGen 模型注册表,包含后端能力、模型元数据、定价结构以及新旧 AI 模型的上下文窗口配置。
将整个代码库打包成单一、适合 AI 阅读的文件。适用于为 Claude、ChatGPT 和 Gemini 提供代码上下文,以进行代码分析、安全审计与错误排查。
基于 Google A2A 协议的多智能体协作框架。实现了基于 CLI 的 AI 工具间的消息传递、任务委派与自动化协调。
专为 AI Agent 设计的网页阅读与搜索工具,通过 Jina AI Reader API 将网页转换为适合 LLM 阅读的 Markdown、文本或 HTML 格式。
分析本地硬件 (RAM, CPU, GPU/VRAM) 并获取优化的本地 LLM 模型推荐、量化设置与性能预估。
统一的 AI 网关,支持超过 100 种大语言模型,提供兼容 OpenAI 的 API、模型回退、负载均衡及企业级管理工具。
Upstash Vector DB 设置、语义搜索、命名空间与向量嵌入模型。专为在 Next.js 16 与 Vercel 项目中构建高性能向量搜索功能而设计。
GPT Researcher 是一个自主 AI 代理,专为全面的网页与本地研究而设计,采用规划-执行-发布架构,可产出详尽且具引用的研究报告。