Context Engineering 上下文工程

模型每轮实际看到的上下文怎么拼、怎么省、怎么验。以 7 层次为主轴，把 CE 从「读过方法论」练成「能拆、能埋点、能算账」。

本模块回答一个被严重低估的问题：模型这一轮，到底看到了什么 token？是谁替你决定的？

你写的那段 prompt，从来不是模型实际收到的全部。框架默认值、对话历史、注入的记忆、工具 schema 都会被悄悄拼进去——这些「你以为没塞、实际塞了」的 token，就是上下文里的暗物质。Context Engineering（CE）不是把 system prompt 写长写细（那还是 Prompt Engineering），而是优化模型每一轮看到的整坨上下文怎么装配。

主轴是 7 层次：把模型每轮的上下文拆成系统提示、指令、结构化 IO、工具、记忆、历史等层，外加 cache 与可观测两道横切。学完你会拿到一套能力——让 7 层 100% 可见，再用一张 CONTEXT.md 把「设计账本」和「运行期对账单」对上，差额就是要排查的暗物质。

讲次编排：第 0 讲先建总览框架（7 层次 + 暗物质 + CE/PE/Harness 辨析），其后逐层深入——提示与指令、结构化 IO 与工具、记忆与 RAG、历史与压缩，最后两道横切（cache 工程、可观测与评估）收口。

适合：要把 LLM agent 做稳、做省、做得可验证的工程师与 PM——尤其是被「换了更强的模型还是不稳」「token 成本算不清」困住的人。

篇目

E · 0 上下文工程 · 第 0 篇

Context Engineering 上下文工程

篇目

为什么模型这一轮看到的，从来不是你写的那段 prompt

为什么你读到的那份 prompt 文件，常常不是模型真正收到的 system

为什么模型这一轮的输出，不该让它「既要念又要解析」

为什么记忆「注进去了」，模型却用错了

为什么对话历史会在你看不见的地方悄悄涨到爆

为什么静态前缀打了 cache 标记，还是每轮重新付费

为什么你说的「优化生效了」，不拿日志根本没人信