massive-context-mcp
通过递归分块、子查询与聚合结果处理超过 1,000 万 token 的大型文件和代码库,突破 LLM 上下文窗口限制。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 133 个技能
通过递归分块、子查询与聚合结果处理超过 1,000 万 token 的大型文件和代码库,突破 LLM 上下文窗口限制。
支持 Claude、GPT、Gemini 和 Ollama 的多模型 LLM 集成方案。涵盖 API 对接、提示工程、Token 管理及模型中立的编排架构。
使用 LlamaExtract 实现从 PDF、DOCX 和 PPTX 等非结构化文件中提取结构化数据的方案,并通过 Pydantic 定义数据架构。
使用 AI 模型(如 FLUX 和 Gemini)生成或编辑图像。适用于照片、插图、概念艺术和视觉素材,不包含技术图表或原理图。
一套用于构建稳健 LLM 集成的工具包:包含 API 模式、流式传输、函数调用、RAG 流水线及具成本效益的模型路由。
基于 Qdrant 和 Ollama 的本地 RAG 语义记忆系统。适用于高效检索工作区文件、笔记、决策记录与用户偏好,提供精确的向量语义搜索。
为 LangChain 应用程序提供统一接口,整合并管理 OpenAI、Anthropic、Google、Azure 和 Bedrock 等 LLM 聊天模型服务。
一个用于大语言模型代理生存记忆的微世界操作系统,将文件系统转化为可导航的房间,并将代码转化为可居住的世界。
分析本地硬件 (RAM, CPU, GPU/VRAM) 并获取优化的本地 LLM 模型推荐、量化设置与性能预估。
Anthropic Claude 集成模式:流式传输、基于 pgvector 的 RAG、工具调用、模型选择(Haiku/Sonnet/Opus)、提示词缓存及 AI 工程成本管理。
为构建 Claude API 生产级应用提供专家指导,涵盖 SDK 使用、提示词缓存、批量处理、流式传输、工具调用及成本优化策略。
维护并更新 MassGen 模型注册表,包含后端能力、模型元数据、定价结构以及新旧 AI 模型的上下文窗口配置。