工程开发
context-fundamentals
管理大语言模型上下文窗口、注意力预算及提示词架构的基础框架,旨在优化代理表现、降低成本并解决上下文退化问题。
简介
Context-fundamentals 是开发者与工程师构建生产级 AI 代理系统的必备基础技能。它建立了上下文工程的技术纪律,将 LLM 上下文窗口视为有限的注意力预算而非无限的存储空间。通过掌握此技能,用户能设计出能缓解“中间丢失”现象与 U 型注意力曲线退化的架构,这些问题在长文本任务中极为常见。
本技能提供系统提示词组织、工具定义设计及对话记录压缩的实作模式。它指导开发者如何应用“渐进式揭露”(仅在必要时载入信息)来维持模型专注度并降低 Token 成本。对于负责调试代理行为或优化复杂多轮对话效能的开发者而言,这是不可或缺的工具。
-
信息优先于详尽的原则,以最大化代理路径中的信噪比。
-
关键限制的位置感知放置指南,以利用高回忆区域(上下文开头与结尾)。
-
工具定义重构策略,包括处理参数预设值、使用情境及 JSON 序列化膨胀问题。
-
周期性优化对话历史以防止上下文饱和的方法。
-
观测遮罩技术,将冗长的工具输出替换为简洁的参照。
-
当启动新的代理架构设计或进行提示词链代码审查时启动此技能。
-
当代理出现行为偏移或因上下文超载而无法遵循指令时,将其用于事故响应。
-
输入需求包括当前的系统提示词、工具定义或推理踪迹片段。
-
输出提供结构性重构建议、注意力预算分析及启发式提示词优化。
-
请注意,大多数模型的有效容量通常仅为标称窗口的 60-70%;请据此规划以避免效能崩溃。
仓库统计
- Star 数
- 15,323
- Fork 数
- 1,203
- Open Issue 数
- 25
- 主要语言
- Python
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年4月28日 11:14